Item type |
Trans(1) |
公開日 |
2019-03-15 |
タイトル |
|
|
タイトル |
Word2Vecにおける加算型単語ベクトルの効果と応用 |
タイトル |
|
|
言語 |
en |
|
タイトル |
Effect and Application of Additional Vector in Word2Vec |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
[オリジナル論文] Word2Vec,分散表現,加算ベクトル,アナロジータスク,文書分類 |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_6501 |
|
資源タイプ |
journal article |
著者所属 |
|
|
|
名古屋大学大学院工学研究科 |
著者所属 |
|
|
|
名古屋大学大学院工学研究科 |
著者所属 |
|
|
|
名古屋大学大学院工学研究科 |
著者所属(英) |
|
|
|
en |
|
|
Graduate School of Engineering, Nagoya University |
著者所属(英) |
|
|
|
en |
|
|
Graduate School of Engineering, Nagoya University |
著者所属(英) |
|
|
|
en |
|
|
Graduate School of Engineering, Nagoya University |
著者名 |
内田, 脩斗
吉川, 大弘
古橋, 武
|
著者名(英) |
Shuto, Uchida
Tomohiro, Yoshikawa
Takeshi, Furuhashi
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
Word2Vecは,単語の分散表現を獲得する最も一般的な手法の1つであり,自然言語処理分野における構文解析や文書分類などに適用した研究も数多く報告され始め,その有用性が示唆されている.この手法では,2種類の分散表現が生成されるが,従来は一般的に,その一方のみを利用して単語の分散表現としている.一方で,それらを加算した単語ベクトルW ADDを利用することによる,意味関係性能の向上が報告されている.しかし,その際示された実験では,同時にパラメータのチューニングも行っており,性能向上の要因が不明瞭なものとなっている.また,W ADDを実タスクに応用した際に,精度への貢献が期待できるかどうかについては明示されていない.そこで本論文では,アナロジータスクにおいて分散表現の意味関係性能を評価し,観測的事実に基づいてW ADDの精度向上原因の解析を行う.加えて,文書分類タスクにおいて,各分散表現による分類精度の比較・検討を行い,その有用性について報告する. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
Word2Vec is one of the most common methods for acquiring a distributed representation of words. In the field of natural language processing, many studies applying Word2Vec to syntactic analysis and document classification have been reported and its usefulness is suggested. In this method, two kinds of distributed representations are generated, and generally, only one of them is actually used. On the other hand, the improvement of semantic relation performance has been reported by using the word vector W ADD generated by adding two kinds of distributed representations. However, in the experiment, other parameters are tuned at the same time, and factors of the improvement are not clear. Moreover, it is unknown whether the improvement of accuracy can be expected when W ADD is applied to real tasks. Therefore, in this study, we evaluate the semantic relation performance of distributed representations with analogy tasks and analyze the cause of improvement of W ADD based on observational facts. In addition, we conduct a document classification task using each distributed representation and report its usefulness. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AA11464803 |
書誌情報 |
情報処理学会論文誌数理モデル化と応用(TOM)
巻 12,
号 1,
p. 23-31,
発行日 2019-03-15
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
1882-7780 |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |