| Item type |
SIG Technical Reports(1) |
| 公開日 |
2018-09-18 |
| タイトル |
|
|
タイトル |
依存構造に基づく単語から語義の分散表現への細分化 |
| 言語 |
|
|
言語 |
jpn |
| キーワード |
|
|
主題Scheme |
Other |
|
主題 |
言語処理応用 |
| 資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
| 著者所属 |
|
|
|
大阪大学大学院情報科学研究科 |
| 著者所属 |
|
|
|
大阪大学データビリティフロンティア機構 |
| 著者所属 |
|
|
|
大阪大学大学院情報科学研究科 |
| 著者所属 |
|
|
|
九州大学大学院言語文化研究院 |
| 著者名 |
芦原, 和樹
梶原, 智之
荒瀬, 由紀
内田, 諭
|
| 論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
多くの自然言語処理タスクにおいて単語分散表現が利用されている.しかし,各単語に 1 つの分散表現を割り当てるアプローチでは,多義語における各語義の情報が混在してしまう.この問題に対処するために,先行研究では品詞やトピックごとに異なる分散表現を割り当てたが,これらの手法には多義性を扱う粒度が粗いという課題がある.本研究では,単語間の依存関係を手がかりとして各単語に複数の分散表現を割り当てる手法を提案する.提案手法は,先行研究よりも細かい粒度で多義性を扱うことができる反面,データスパースネス問題が危惧される.そこで我々は,多義語における各分散表現の初期値として,語義を区別せずに事前学習した分散表現を用いることでこの問題に対処する.単語間の意味的類似度推定タスクおよび語彙的換言タスクにおける実験の結果,提案手法は各単語に複数の分散表現を割り当てる先行研究よりも高い性能を発揮した.また,各単語の出現頻度が与える影響についての分析の結果,事前学習した分散表現を用いることがデータスパースネス問題を解決するために有効であることも確認できた. |
| 書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10115061 |
| 書誌情報 |
研究報告自然言語処理(NL)
巻 2018-NL-237,
号 3,
p. 1-7,
発行日 2018-09-18
|
| ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8779 |
| Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
| 出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |