| Item type |
SIG Technical Reports(1) |
| 公開日 |
2018-08-30 |
| タイトル |
|
|
タイトル |
単語の分散表現に基づく専門用語辞書の拡張法 |
| タイトル |
|
|
言語 |
en |
|
タイトル |
Method to Extend Coverage of Domain Dictionary Based on Distributed Representations of Words |
| 言語 |
|
|
言語 |
jpn |
| キーワード |
|
|
主題Scheme |
Other |
|
主題 |
情報抽出 |
| 資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
| 著者所属 |
|
|
|
和歌山大学大学院システム工学研究科 |
| 著者所属 |
|
|
|
和歌山大学システム工学部 |
| 著者所属 |
|
|
|
(株)ホットリンク |
| 著者所属(英) |
|
|
|
en |
|
|
Graduate School of Systems Engineering, Wakayama University |
| 著者所属(英) |
|
|
|
en |
|
|
Faculty of Systems, Wakayama University |
| 著者所属(英) |
|
|
|
en |
|
|
Hotto Link Inc. |
| 著者名 |
高木, 涼太
風間, 一洋
榊, 剛史
|
| 著者名(英) |
Ryota, Takagi
Kazuhiro, Kazama
Takeshi, Sakaki
|
| 論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
本稿では,対象分野のシード単語リストから,word 2 vec で作成した単語の分散表現と,同じ分野の文書群から抽出された単語を用いて,専門用語辞書作成時の負荷を低減する手法を提案する.まず,単語の分散表現のコサイン類似度の重み付きの k - 近傍グラフを作成して,シード単語リストとの関連度に基づいて関連語を推薦する.その判定結果に基づいて,シード単語リストを拡張し,k - 近傍グラフ上の関連単語の探索を制御する.実際に,ソーシャルメディア分析企業が辞書作成に用いたデータを用いて試行単位の適合率と累積再現率を求めることで,少数の見出し語でも辞書作成者の真偽判定結果を逐次取り込むことによる見出し語候補の質の向上と網羅性を両立できているかを検証する. |
| 論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
In this paper, we proposed a method to support making a domain dictionary by using distributed representations of words, which are made by word2vec. At first, k-nearest neighbor graph, which edges are weighted by cosine similarity of word distributed representation, are created and related word candidates are recommended by using relative degree to a seed word list. Based on the judgement by a dictionary creator, a seed word list is extended and related word discovery on k-nearest neighbor graph are controlled. We evaluated precision and cumulative recall by using data, which is used for making a domain dictionary by a social media analysis company. In the result, we verified the quality and coverage of our proposed method. |
| 書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10539261 |
| 書誌情報 |
研究報告ドキュメントコミュニケーション(DC)
巻 2018-DC-110,
号 22,
p. 1-6,
発行日 2018-08-30
|
| ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8892 |
| Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
| 出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |