私見偏見独白

No.000-26 統計

日々のコロナ感染者数に一喜一憂する毎日です。
国際常識というか感染症対策の常識に反してPCR検査の大幅増に反対する政府や「専門家」は, 陽性率とか重症化する割合とかK値とか, 偽陽性とか擬陽性など統計学的な解説で自説を正当化していますが, データ処理の分野で「Junk in, Junk out」という言葉があります。
理論や数式が正しくても, ゴミデータ(正しくないデータ)を元にしたら価値のない結果しか出てこないという意味です。

統計を取る際に重要で困難なことは, サンプル数をどれだけとるか, サンプルをどのようにとるかという問題です。
たとえば陽性率などは, 症状を有している人を中心に検査をすれば簡単に上昇します。重症化率も同様です。 入院して呼吸器をつけている人を中心にすればはねあがります。
恣意的にならないように普通はランダムサンプリングをしますが, 今のコロナに対するPCR検査はランダムサンプリングにはなっていません。患者が発生したら, 患者とその周辺の人を中心に検査をしているからです。 小池都知事が言うところの「戦略的検査」ですね。
こんな検査をすれば普通は陽性率も重症化率も普通よりも高い値になるはずですが, 世界的に見てそれほど高い値にはなっていません。
ファクターXなどと呼ばれている未知の要因が影響しているかもしれませんが, それ以前にそもそもサンプル数が少なすぎると思います。
何しろ他国の数十分の一以下のレベルですから・・・

信頼性のない結果をもとにしては, どんな対策もほとんど無意味です。