Item type |
Trans(1) |
公開日 |
2023-07-15 |
タイトル |
|
|
タイトル |
発話者の潜在ニーズ予測とその可視化Word2Vecモデルを用いた機械学習モデルの精度改善に関する検討 |
タイトル |
|
|
言語 |
en |
|
タイトル |
Prediction and Visualization of Latent Needs: Improving the Accuracy of Machine Learning Models using the Word2Vec Model |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
[一般投稿論文] 潜在ニーズ, 機械学習, 可視化, ニューラルネットワーク, Word2Vec |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_6501 |
|
資源タイプ |
journal article |
著者所属 |
|
|
|
医薬基盤・健康・栄養研究所 |
著者所属 |
|
|
|
独立研究者 |
著者所属 |
|
|
|
千葉大学医学部附属病院 |
著者所属 |
|
|
|
医薬基盤・健康・栄養研究所 |
著者所属 |
|
|
|
医薬品医療機器総合機構 |
著者所属 |
|
|
|
医薬基盤・健康・栄養研究所 |
著者所属(英) |
|
|
|
en |
|
|
National Institutes of Biomedical Innovation, Health and Nutrition |
著者所属(英) |
|
|
|
en |
|
|
Independent Researcher |
著者所属(英) |
|
|
|
en |
|
|
Chiba University Hospital |
著者所属(英) |
|
|
|
en |
|
|
National Institutes of Biomedical Innovation, Health and Nutrition |
著者所属(英) |
|
|
|
en |
|
|
Pharmaceuticals and Medical Devices Agency |
著者所属(英) |
|
|
|
en |
|
|
National Institutes of Biomedical Innovation, Health and Nutrition |
著者名 |
種村, 菜奈枝
町井, 湧介
佐々木, 剛
荒木, 通啓
佐藤, 淳子
千葉, 剛
|
著者名(英) |
Nanae, Tanemura
Yusuke, Machii
Tsuyoshi, Sasaki
Michihiro, Araki
Junko, Sato
Tsuyoshi, Chiba
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
近年,市民参画型の必要性は健康政策のみならず,社会における場でも議論されている.しかし,日本はハイコンテクスト文化であり,一般市民がコンテクストに頼らずに意見を明確な言葉として表現するコミュニケーションには不慣れであり,一般市民の声を政策等へ反映することは容易ではない.本研究では,口語テキストから発話者の潜在的ニーズを予測するための機械学習モデル構築,およびニューラルネットワークを用いて単語をベクトル変換する手法であるWord2Vecモデルを用いて機械学習モデルの精度改善を検討した.予備検討では,機械学習モデルの精度比較を行い,最適なモデルを選択した.本調査では,Word2Vecモデルを用いて同義語辞書を作成し,この辞書を使用して同一の特徴量に変換し学習を行う新手法を検討した.新手法の適応の有無で機械学習モデルの精度比較を行った.予備検討でのモデル選定実験の結果,モデル精度はxgboostでF値0.54と最も高く,本調査では,モデル精度は同義語辞書ありでF値0.61,なしでF値0.54であり,Word2Vecモデルを用いた同義語辞書の適応が機械学習モデルの精度改善に寄与した. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
The need for public engagement has been deliberated in recent years. However, because of Japan's high context culture, Japanese people are not accustomed to communicating their opinions in clear. Therefore, it is not easy to reflect the voices of the general public in policy making. In the process of building a machine learning model for predicting the latent needs from spoken text, this study examined how to improve the accuracy of the model using the Word2Vec model, that uses a neural network to transform words into vectors. In this preliminary study, we compared the accuracy of machine learning models and selected the best model. We examined a new method that uses the Word2Vec model to create a synonym dictionary to convert the word clusters for identical features for learning. We compared the accuracy of machine learning models with and without adaptation of the dictionary. The results of model selection showed that xgboost had the highest model accuracy with an F value of 0.54. The model accuracy was 0.61 with the dictionary and 0.54 without. It showed that the adaptation of the synonym dictionary using the Word2Vec model can improve the accuracy of the model. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AA12894091 |
書誌情報 |
情報処理学会論文誌デジタルプラクティス(DP)
巻 4,
号 3,
p. 69-73,
発行日 2023-07-15
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2435-6484 |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |