Item type |
SIG Technical Reports(1) |
公開日 |
2019-01-31 |
タイトル |
|
|
タイトル |
機械学習を用いた医療テキストからのPhenotyping手法の開発 |
タイトル |
|
|
言語 |
en |
|
タイトル |
Development of Phenotyping algorithm from Medical Text-based Data using Machine Learning Methods |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
言語処理応用 |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
九州大学病院メディカル・インフォメーションセンター |
著者所属 |
|
|
|
九州大学病院メディカル・インフォメーションセンター |
著者所属 |
|
|
|
九州大学情報基盤研究開発センター |
著者所属 |
|
|
|
九州大学病院メディカル・インフォメーションセンター |
著者所属(英) |
|
|
|
en |
|
|
Medical Information Center, Kyushu University Hospital |
著者所属(英) |
|
|
|
en |
|
|
Medical Information Center, Kyushu University Hospital |
著者所属(英) |
|
|
|
en |
|
|
Research Institute for Information Technology, Kyushu University |
著者所属(英) |
|
|
|
en |
|
|
Medical Information Center, Kyushu University Hospital |
著者名 |
山下, 貴範
伊豆倉, 理恵子
廣川, 佐千男
中島, 直樹
|
著者名(英) |
Takanori, Yamashita
Rieko, Izukura
Sachio, HIROKAWA Hirokawa
Naoki, Nakashima
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
病院情報システムに蓄積される医療データはリアルワールドデータと呼ばれ,その利活用により,これまでの臨床研究では分からなかった治療法や副作用検知,そして診療の効率化が期待されている.一方で,リアルワールドデータのデータ品質課題が注目されており,正確な病態 (phenotype) の患者群を一定のルールで再現性良く抽出する方法 (Phenotyping) の開発が重要となっている.医薬品や検査,病名,術式などは構造化データとして,整備されているが診療行為の理由や患者アウトカムについてはフリーテキストで記録されている.本研究では,問質性肺炎の症例を対象に非構造化テキストデータ (CT レポート) から Phenotyping 手法の開発を目的とした.ランダムサンプリングした 100 人の中から 48 人の真症例をラベル付けし,それを目的変数として 3 つの機械学習手法を組合わせて 6 つの特徴単語を抽出した.6 つのキーワードのいずれかを含む条件では PPV が 0.507,感度が 0.949 を達成した. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
Electronic medical records (EMRs) accumulated in the Hospital Information System (HIS) are called Real World Data (RWD). Utilization of RWD can help advance promising treatments, detect side effects detection, and improve the efficiency of previously-unknown medical treatment which were unknown in previous clinical research and intervention studies. We must develop some phenotyping algorithms to ensure high performance from RWD. Although drugs, laboratory tests, diagnoses and surgeries can be expressed as structured data, patient symptoms, the rationales for various medical treatments and the patient outcomes are often described in free-text format. In this research, we aimed to develop true Interstitial Pneumonia case extraction an algorithm from unstructured text-based data. 48 cases were diagnosed Interstitial pneumonia by chest physician from CT reports of sampling 100 cases. Three machine learning methods (Support Vector Machine, Feature Selection and Gradient Boosting Decision Tree) were combined for development of text corresponding phenotyping. We extracted 6 keywords as feature word from its score using machine learning methods, and PPV is 0.483 and sensitivity is 0.875 when one of them is included. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10114171 |
書誌情報 |
研究報告情報基礎とアクセス技術(IFAT)
巻 2019-IFAT-133,
号 11,
p. 1-5,
発行日 2019-01-31
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8884 |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |