Item type |
SIG Technical Reports(1) |
公開日 |
2017-05-08 |
タイトル |
|
|
タイトル |
分散的意味表現学習のための単語意味ベクトル辞書Ver.2と日本語Twitter極性分析ベンチマークについて |
言語 |
|
|
言語 |
jpn |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
奈良先端科学技術大学院大学情報科学研究科 |
著者所属 |
|
|
|
奈良先端科学技術大学院大学情報科学研究科 |
著者所属 |
|
|
|
奈良先端科学技術大学院大学情報科学研究科 |
著者所属 |
|
|
|
シャープ株式会社IoT通信事業本部 |
著者所属 |
|
|
|
シャープ株式会社IoT通信事業本部 |
著者所属 |
|
|
|
奈良先端科学技術大学院大学情報科学研究科 |
著者名 |
芥子, 育雄
鈴木, 優
吉野, 幸一郎
大原, 一人
向井, 理朗
中村, 哲
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
自然言語処理の応用システムでは,大規模文書を対象に単語やパラグラフの意味を数 100 次元のベクトルに埋め込む分散的意味表現学習により精度向上が図られている.これらの応用システムの課題は,品質保証 ・ 改善に必要な分散表現の中身を解釈する手段が無いことである.本研究では,分散表現の可読性を向上させることを目的に人手により構築された単語意味ベクトル辞書 Ver.2 を提案する.単語意味ベクトル辞書とは,約 2 万語の基本単語に対して,関係のある特徴単語を列挙した辞書である.Ver.2 では特徴単語を 264 種類とし,日本語の単語意味ベクトル辞書を元にクラウドソーシングを利用して英語版を作成した.ツイートベクトルの可読性を高めるために,基本単語に付与された特徴単語を再帰的に展開することにより生成した多値ベクトルを分散的意味表現学習のシードベクトルとして用いる.この評価のため,日本語 Twitter を対象に製品,サービス,組織の全 8 カテゴリ,38,576 ツイートから構成される極性分析ベンチマークをクラウドソーシングを利用して作成した.本稿では,モニター公開を予定している日英単語意味ベクトル辞書 ver.2 および評判分析のための大規模かつ多様性のある日本語 Twitter 極性分析ベンチマークについて,ケーススタディと共に報告する. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10115061 |
書誌情報 |
研究報告自然言語処理(NL)
巻 2017-NL-231,
号 8,
p. 1-7,
発行日 2017-05-08
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8779 |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |