Medley Developer Blog

株式会社メドレーのエンジニア・デザイナーによるブログです

NDBオープンデータをオープン化してみた話

開発本部の平山です。先日、社内勉強会「TechLunch」にて社外に公開できない内容の発表をしてしまいましたので、その代わりとして、厚生労働省が提供する「NDBオープンデータ」をオープン化した話について、ブログを書こうと思います。 

NDBオープンデータとは?

www.mhlw.go.jp

作成の背景

◆ レセプト情報・特定健診等情報データベース(NDB)は、悉皆性が高いレセプト情報、および検査値などの詳細な情報を有する特定健診等情報が含まれており、国民の医療動向を評価するうえで有用なデータだと考えられている。

◆ 2011年度より、医療費適正化計画策定に資する目的以外でのNDBデータの利用が認められたが、NDBデータの機微性の高さに鑑み、利用者に対しては高いレベルのセキュリティ要件を課したうえで、データ提供が行われてきた。

◆ 一方で、多くの研究者が必ずしも詳細な個票データを必要とするわけではないため、多くの人々が使用できるような、あらかじめ定式化された集計データをNDBデータをもとに整備することが重要ではないか、という議論が有識者会議等でなされてきた。

◆ NDBの民間提供に関する議論でも、「レセプト情報等の提供に関するワーキンググループ」からの報告では、汎用性が高く様々なニーズに一定程度応えうる基礎的な集計表を作成し、公表していくことがむしろ適当である、という指摘がみられた。 

作成の目的

◆ 多くの人々がNDBデータに基づいた保健医療に関する知見に接することが出来るよう、NDBデータを用いて基礎的な集計表を作成したうえで、公表する。

◆ NDBデータに基づき、医療の提供実態や特定健診等の結果をわかりやすく示す。

 

要は皆さんが、病院に行った時にもらう明細書に記載されている初診〇〇点、外来診療料〇〇点のようなデータが個人情報が匿名化された状態で収集しその統計データを一般に公開する、といったところでしょうか。


このようなデータがオープンになっていることはとても意義のあることだと思いますし、公開にまでこぎつけた関係者の苦労が想像されます。しかし、このような画期的なデータ提供ではありますが、Excelファイルでの提供となっており、かつ加工がしづらいデータ構造になっているため、データを細かくみてみようとすると非常に手間がかかるという問題があります。

 

NDBオープンデータのオープン化

そこでNDBオープンデータとして公開されているExcelファイルを加工し、DBに格納しBIツール(Redash)から参照させるようにしてみました。

1. データ加工 & DB取り込み

公開サイトにある医科診療行為に関するExcelファイルを取得し、ログテーブルとしてよくあるフォーマットに変換しDBに取り込む。

変換前

f:id:medley_inc:20170721150757p:plain

変換後

*************************** 1. row ***************************
id: 1
practice_category_code: A000
practice_category_name: 初診料
practice_code: 111000110
practice_name: 初診
practice_type: 外来
target: all
revision: 2014
prefecture:
sex:
age:
score: 251700771
created_at: 0000-00-00 00:00:00
updated_at: 0000-00-00 00:00:00
*************************** 2. row ***************************
id: 2
practice_category_code: A000
practice_category_name: 初診料
practice_code: 111000110
practice_name: 初診
practice_type: 外来
target: sex_age
revision: 2014
prefecture:
sex: 男性
age: 0~4歳
score: 13158090
created_at: 0000-00-00 00:00:00
updated_at: 0000-00-00 00:00:00
*************************** 3. row ***************************
id: 3
practice_category_code: A000
practice_category_name: 初診料
practice_code: 111000110
practice_name: 初診
practice_type: 外来
target: sex_age
revision: 2014
prefecture:
sex: 男性
age: 5~9歳
score: 12444947
created_at: 0000-00-00 00:00:00
updated_at: 0000-00-00 00:00:00

2. データの参照

変換したデータを取り込んだDBをRedashから参照。分析したいデータを取得するためのクエリを書いてダッシュボード化。

 ※ お試し環境を構築したので興味のある人はさわってみてください(@gmail.comGoogleアカウントでログインできます)。

 

お試し環境(期間限定) -  http://sandbox.medley.jp/dashboard/ndb

f:id:medley_inc:20170721153210p:plain

f:id:medley_inc:20170726125246p:plain

NDBオープンデータの活用例

以下に簡単なデータ活用のサンプルを載せました。医薬診療行為だけでなく特定健診や薬剤のデータを使うともう少し面白い気付きがあるかもしれません。

いずれにせよ、このように加工可能な形でのデータ提供こそがオープンデータ提供の価値だと思うので、このような仕組みが加速すれば良いなと思います。

0-4歳 男性 診療行為点数

f:id:dev-medley:20170817101900p:plain

90歳以上 男性 診療行為点数

f:id:dev-medley:20170817101934p:plain

140023350 胃瘻より流動食点滴注入 都道府県別

f:id:dev-medley:20170817102021p:plain

150086210 角膜移植術 年齡別

f:id:dev-medley:20170817102100p:plain

まとめ

以上、NDBオープンデータをオープン化してみた話について書いてみました。

このように*.go.jp から提供されるデータは一般的にExcelやPDFでのファイル提供が基本で、インターネットサービスのようにAPIのような形で提供されることはありません。せっかく貴重なデータが提供されているにも関わらず、それがITシステムと連動しづらいことで、活用されない状況になっているのはとても残念なことに思います。Code for Americaの事例ではないですが、もっとインターネット系の人材がこのような取り組みに入り込んでいくようになれば、より合理的でスマートな仕組みが加速し、業界全体のIT化も加速するのではないでしょうか。

お知らせ

メドレーでは、医師たちがつくるオンライン医療事典「MEDLEY」、オンライン診療アプリ「CLINICS」、医療介護の求人サイト「ジョブメドレー」、口コミで探せる介護施設の検索サイト「介護のほんね」などのプロダクトを提供しています。これらのサービスの拡大を受けて、その成長を支えるエンジニア・デザイナーを募集しています。

メドレーで一緒に医療体験を変えるプロダクト作りに関わりたい方のご連絡お待ちしております。

www.medley.jp