NDB オープンデータをオープン化してみた話
開発本部の平山です。先日、社内勉強会「TechLunch」にて社外に公開できない内容の発表をしてしまいましたので、その代わりとして、厚生労働省が提供する「NDB オープンデータ」をオープン化した話について、ブログを書こうと思います。
NDB オープンデータとは?
www.mhlw.go.jp作成の背景
◆ レセプト情報・特定健診等情報データベース(NDB)は、悉皆性が高いレセプト情報、および検査値などの詳細な情報を有する特定健診等情報が含まれており、国民の医療動向を評価するうえで有用なデータだと考えられている。
◆ 2011 年度より、医療費適正化計画策定に資する目的以外での NDB データの利用が認められたが、NDB データの機微性の高さに鑑み、利用者に対しては高いレベルのセキュリティ要件を課したうえで、データ提供が行われてきた。
◆ 一方で、多くの研究者が必ずしも詳細な個票データを必要とするわけではないため、多くの人々が使用できるような、あらかじめ定式化された集計データを NDB データをもとに整備することが重要ではないか、という議論が有識者会議等でなされてきた。
◆ NDB の民間提供に関する議論でも、「レセプト情報等の提供に関するワーキンググループ」からの報告では、汎用性が高く様々なニーズに一定程度応えうる基礎的な集計表を作成し、公表していくことがむしろ適当である、という指摘がみられた。
作成の目的
◆ 多くの人々が NDB データに基づいた保健医療に関する知見に接することが出来るよう、NDB データを用いて基礎的な集計表を作成したうえで、公表する。
◆ NDB データに基づき、医療の提供実態や特定健診等の結果をわかりやすく示す。
要は皆さんが、病院に行った時にもらう明細書に記載されている初診〇〇点、外来診療料〇〇点のようなデータが個人情報が匿名化された状態で収集しその統計データを一般に公開する、といったところでしょうか。
このようなデータがオープンになっていることはとても意義のあることだと思いますし、公開にまでこぎつけた関係者の苦労が想像されます。しかし、このような画期的なデータ提供ではありますが、Excel ファイルでの提供となっており、かつ加工がしづらいデータ構造になっているため、データを細かくみてみようとすると非常に手間がかかるという問題があります。
NDB オープンデータのオープン化
そこで NDB オープンデータとして公開されている Excel ファイルを加工し、DB に格納し BI ツール(Redash)から参照させるようにしてみました。
1. データ加工 & DB 取り込み
公開サイトにある医科診療行為に関する Excel ファイルを取得し、ログテーブルとしてよくあるフォーマットに変換し DB に取り込む。
変換前
変換後
*************************** 1. row ***************************
id: 1
practice_category_code: A000
practice_category_name: 初診料
practice_code: 111000110
practice_name: 初診
practice_type: 外来
target: all
revision: 2014
prefecture:
sex:
age:
score: 251700771
created_at: 0000-00-00 00:00:00
updated_at: 0000-00-00 00:00:00
*************************** 2. row ***************************
id: 2
practice_category_code: A000
practice_category_name: 初診料
practice_code: 111000110
practice_name: 初診
practice_type: 外来
target: sex_age
revision: 2014
prefecture:
sex: 男性
age: 0~4 歳
score: 13158090
created_at: 0000-00-00 00:00:00
updated_at: 0000-00-00 00:00:00
*************************** 3. row ***************************
id: 3
practice_category_code: A000
practice_category_name: 初診料
practice_code: 111000110
practice_name: 初診
practice_type: 外来
target: sex_age
revision: 2014
prefecture:
sex: 男性
age: 5~9 歳
score: 12444947
created_at: 0000-00-00 00:00:00
updated_at: 0000-00-00 00:00:00
2. データの参照
変換したデータを取り込んだ DB を Redash から参照。分析したいデータを取得するためのクエリを書いてダッシュボード化。
NDB オープンデータの活用例
以下に簡単なデータ活用のサンプルを載せました。医薬診療行為だけでなく特定健診や薬剤のデータを使うともう少し面白い気付きがあるかもしれません。
いずれにせよ、このように加工可能な形でのデータ提供こそがオープンデータ提供の価値だと思うので、このような仕組みが加速すれば良いなと思います。
0-4 歳 男性 診療行為点数
90 歳以上 男性 診療行為点数
140023350 胃瘻より流動食点滴注入 都道府県別
150086210 角膜移植術 年齡別
まとめ
以上、NDB オープンデータをオープン化してみた話について書いてみました。
このように.go.jp から提供されるデータは一般的に Excel や PDF でのファイル提供が基本で、インターネットサービスのように API のような形で提供されることはありません。せっかく貴重なデータが提供されているにも関わらず、それが IT システムと連動しづらいことで、活用されない状況になっているのはとても残念なことに思います。Code for Americaの事例ではないですが、もっとインターネット系の人材がこのような取り組みに入り込んでいくようになれば、より合理的でスマートな仕組みが加速し、業界全体の IT 化も加速するのではないでしょうか。
お知らせ
メドレーでは、医師たちがつくるオンライン医療事典「MEDLEY」、オンライン診療アプリ「CLINICS」、医療介護の求人サイト「ジョブメドレー」、口コミで探せる介護施設の検索サイト「介護のほんね」などのプロダクトを提供しています。これらのサービスの拡大を受けて、その成長を支えるエンジニア・デザイナーを募集しています。
メドレーで一緒に医療体験を変えるプロダクト作りに関わりたい方のご連絡お待ちしております。
www.medley.jp