2020年11月09日

なんで公表データはわかりにくいのか

スウェーデンのコロナ公式サイトをみた。そこで、これが国民に対して常時公開されているとしたら、細かな批判点はあるかもしれないが、おおむねよく開かれた社会環境があるらしいと感じた。持って回った言い方になったが、個人的にいろいろ調べて疑問点がないわけではないため、その部分を書きたくなるをの今は抑えているからこうなる。ともあれ国民にわかりやすく伝える努力は感じる。これは必要なことだ、と思った。
☆「スウェーデンのコロナ公式サイト」
https://experience.arcgis.com/experience/09f821667ce64bf7be6f9f87457ed9aa/page/page_0/
日本の公式データサイトのわかりにくさは最悪だ。以下は半年ほど前の記事だが、ブログ主と大体同じ不満が書かれており、多くの人が不満を持っているのがわかる。冒頭「これまで政府の公表データには修正が多く、わかりにくいとの指摘が絶えなかった」(本文引用以下「」内同様)とあり、専門家に「データや情報の公開に問題はないのか」と尋ねている。専門家はまず比較対象に韓国のデータを紹介。「信頼できる」根拠を示す。要約すると、韓国は「『一定のフレームワークで余力のある検査をやってきた』ということ。ランダムサンプリングではありませんが、それなりに信頼できる」という。第1波の感染拡大からピークアウトまで、一定の傾向を見出すことができることを指摘する。つまり、やたらPCRを増やさなくてもしっかり傾向を捉えることができるだけの検査をやっている、ということを示しているのだという。データから一定の流れを読み取り、やるべきことを明らかにし、それを具体的に実行するまでのプロセスを把握していける。それだけの検査をやっているか否かが、日本の場合に問われるということか。残念ながら日本のデータからはなかなか読み取りにくいのだそうな。
どうしてそうなるか。「日本の現状はデータから適切に把握できるのか。厚生労働省の公表データには注釈が多く、これまでには数字の修正も再三あった。5月9日には集計方法も変更。都道府県からの報告をまとめる方式だったのに、この日以降は都道府県のホームページに記載された公表情報を集計する形になった。また、PCR検査を受けにくいとの批判を受けて検査の目安を変更。『風邪の症状や37・5度以上の発熱が4日以上続いている』という記述も削除した。こうした実態を踏まえ、濱岡教授は『日本では陽性率を算出するときの母数である検査数や検査の方法が変動しているので、傾向を正しく判断することは今も難しい』と言い切った」。東洋経済オンラインも特設サイトを持っているという。しかし「このサイトは担当者がデータ入力をほとんど手作業でやっている。参照している厚労省のデータがPDFや画像のため自動化が難しく、頻繁に公開形式も変わる。結局、目で見て入力するのがいちばん速いからだ」しかも「政府や自治体が公表している数字は、定義がコロコロ変わるし、検査人数と検査件数が混在するなど集計方法もあいまいです。厚労省の専門家会議が出す数字も、どのように推定しているかが公開されていません」という。そして専門家は「推定した結果だけでなく、そのために用いたモデル、データを公開してもらわないと妥当性を検証できません。公開すれば、第三者が確認したり、もしかするとより良いものにできたりするかもしれない。何よりも、『数字が操作されているのではないか』といった変な臆測を呼ぶことも少なくなると思います」と指摘する。参照してなにかを考えたいのに、とにかくわかりにくい。わざとそうしているのではないかと思うほどひどい。個人がデータに接触してもしっかり理解するのはほぼ無理。東洋経済オンラインのように、担当者が手作業でデータ入力するのでなければデータを意味あるものにできない。「『数字が操作されているのではないか』といった変な臆測」が出てきても仕方ない状況といえる。この記事は半年前のものだが、いまはどうなんだろう。ブログ主はあきらめて、データをのぞくこともなくなってしまったのだが。
☆「日本のコロナ公表情報がどうにも頼りない理由 根拠となるデータの公開なしに判断できない」東洋経済5月17日
https://toyokeizai.net/articles/-/350610
posted by ガンコジージ at 00:20| Comment(0) | 時事 | このブログの読者になる | 更新情報をチェックする