Item type |
Journal(1) |
公開日 |
2021-10-15 |
タイトル |
|
|
タイトル |
用例文間の意味的な類似関係を用いた半教師あり語義曖昧性解消 |
タイトル |
|
|
言語 |
en |
|
タイトル |
Semi-supervised Word Sense Disambiguation Using Semantic Similarities between Examples |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
[一般論文] 語義曖昧性解消,グラフ構造,半教師あり学習,グラフニューラルネットワーク |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_6501 |
|
資源タイプ |
journal article |
ID登録 |
|
|
ID登録 |
10.20729/00213203 |
|
ID登録タイプ |
JaLC |
著者所属 |
|
|
|
株式会社日立産業制御ソリューションズ |
著者所属 |
|
|
|
茨城大学工学部情報工学科 |
著者所属(英) |
|
|
|
en |
|
|
Hitachi Industry & Control Solutions, Ltd. |
著者所属(英) |
|
|
|
en |
|
|
Ibaraki University |
著者名 |
谷田部, 梨恵
佐々木, 稔
|
著者名(英) |
Rie, Yatabe
Minoru, Sasaki
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
単語に対して前後の文などを手がかりとして適切な語義を判定する語義曖昧性解消は今日に至るまで様々なアプローチで研究が行われている.先行研究では,教師あり学習を用いた分類手法に対して誤り分析が行われ,主要な要因として語義ラベルを付与した用例文集合である訓練データの不足をあげている.そのため,語義曖昧性解消の精度を向上させるためにはさらに多くの用例文の追加やその他の有効な情報の追加が求められている.しかし,学習用のデータを新たに追加することは,語義識別に精通した専門家による正解ラベル付与が必要となるためコストがかかるという問題がある.そこで,本研究では用例文間の同義関係を用いた半教師あり語義曖昧性解消手法を提案する.この手法では,訓練データと語義ラベルなしの用例文集合から同義関係を表したグラフを作成し,このグラフと訓練データに対してグラフニューラルネットワークで学習して語義識別モデルを構築する.Semeval-2010日本語タスクのデータセットとSENSEVAL2 English Lexical Sampleタスクデータを用いて評価実験を行った結果,提案手法はグラフ構造を使わない手法や既存手法と比較して精度が向上し,グラフ構造の利用が有効であることを示した.また,提案手法は学習済み言語モデルのBERTを用いて同義かどうかを判定するパラメータ設定のないグラフ構築手法とパラメータ設定が必要なCosine類似度や相互k近傍グラフによるグラフ構築手法のどちらを用いても高い精度で語義を識別できることを示した. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
Word Sense Disambiguation (WSD) is a well-known problem in the natural language processing. In recent years, there has been increasing interest in applying neural networks and machine learning techniques to solve WSD problems. However, these previous approaches often suffer from the lack of manually sense-tagged examples of specific words due to costly annotation work. Therefore, we consider that more sense-tagged examples and some other useful information need to be added to improve the performance of the WSD model. In this study, we propose a semi-supervised WSD method using semantic similarities between example sentences. In this method, to represent a semantic similarity relation obtained from sense labeled examples and unlabeled examples, we also propose a graph construction method that does not require any parameters using BERT pre-trained model, as well as graph construction methods using cosine similarity and mutual k-neighborhood graphs. We construct a WSD classifier for the target word by using a graph convolutional network for training data and graph structure. The effectiveness of the proposed method was evaluated on the Semeval-2010 Japanese WSD task dataset and on the SENSEVAL-2 English lexical sample task. Experimental results show that the proposed method improves the performance of WSD compared to the method without graph structure. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN00116647 |
書誌情報 |
情報処理学会論文誌
巻 62,
号 10,
p. 1724-1736,
発行日 2021-10-15
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
1882-7764 |