電子カルテシステムの導入で診療記録が電子化されて保存されるようになったが、記載データの多くが自然言語によるテキストデータであり、非構造化データである。非構造化データは、書き手によって表現が多様であり、コンピュータで診断名や患者状態に関する情報を正確に抽出することは難しい。電子カルテの診療データから、医学的に有用な情報を抽出するためには、非構造化データをコンピュータが解析しやすい構造化データに変換する必要がある。本研究では、放射線レポートを対象として、自然言語処理技術を用いて、その内容を解析し、診断名や臨床ステージ等の重要な所見を構造化データとして抽出するアルゴルズムの開発を目指す。
本研究は、国立研究開発法人情報通信研究機構ユニバーサルコミュニケーション研究所データ駆動知能システム研究センター(センター長:鳥澤健太郎)との共同研究で行う。放射線検査レポートとがん登録データを匿名化処理し、国立研究開発法人情報通信研究機構ユニバーサルコミュニケーション研究所データ駆動知能システム研究センターの自然言語処理装置に取り込み、学習、評価を行う。
研究責任者: 松村泰志(大阪大学大学院医学系研究科医療情報学・教授)
研究実施施設・事務局: 大阪大学大学院医学系研究科 医療情報学
解析: 大阪大学大学院医学系研究科 医療情報学・
国立研究開発法人情報通信研究機構ユニバーサルコミュニケーション研究所
データ駆動知能システム研究センター
研究実施予定期間: 〜2019年3月31日
|