| Item type |
SIG Technical Reports(1) |
| 公開日 |
2008-05-15 |
| タイトル |
|
|
タイトル |
単語類似度ネットワークを通じた自動同義語獲得 |
| タイトル |
|
|
言語 |
en |
|
タイトル |
Automatic Synonym Acquisition through Word Similarity Network |
| 言語 |
|
|
言語 |
jpn |
| 資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
| 著者所属 |
|
|
|
東京大学情報基盤センター |
| 著者所属 |
|
|
|
東京大学情報基盤センター |
| 著者所属 |
|
|
|
東京大学情報基盤センター |
| 著者所属 |
|
|
|
東京大学情報基盤センター |
| 著者所属(英) |
|
|
|
en |
|
|
Information Technology Center, The University of Tokyo |
| 著者所属(英) |
|
|
|
en |
|
|
Information Technology Center, The University of Tokyo |
| 著者所属(英) |
|
|
|
en |
|
|
Information Technology Center, The University of Tokyo |
| 著者所属(英) |
|
|
|
en |
|
|
Information Technology Center, The University of Tokyo |
| 著者名 |
王, 玉馨
清水, 伸幸
吉田, 稔
中川, 裕志
|
| 著者名(英) |
Yuxin, Wang
Nobuyuki, Shimizu
Minoru, Yoshida
Hiroshi, Nakagawa
|
| 論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
コーパスから同義語の対を抽出するための一般的な方法では、通常二つ単語間の類似度 (例えば、cosine 類似度) が必要である。類似度を使用することで、特定のクエリ単語に対しての類似語ランキングが可能になり、同義語候補リストから正しい同義語が認定できる。この論文では、それに加えて、単語類似度ネットワークを分析する新しい方法を提案する。単語類似度ネットワークでは閾値以上の類似度をアークとして、単語をノードとして定義する。提案する自動同義語候補選択ためのランク閾値(Rank Threshold for synonym candidate Selection RTS) によって類似度の順位が閾値以内のアークが構成される単語類似度ネットワークはスケールフリーグラフである。 この性質に基づいて、我々は新しい同義語候補のリランキング手法を提案する。これを相互リランキング法 (Mutual Re-ranking Method MRM) と呼ぶ。同義語獲得における提案手法の有効性を示すために MRM 方法を Reuters-21578 に適用した。 実験結果によって、RTS と MRM が同義語抽出の品質の向上させることが示された。 |
| 論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
Popular methods for acquiring synonymous word pairs from a corpus usually require a similarity metric between two words, such as cosine similarity. This metric enables us to retrieve words similar to a query word, and we identify true synonyms from the list of synonym candidates. Instead of stopping at this point, we propose to go further by analyzing word similarity network that are induced by the similarity metric for the edges with the similarities that are ranked as top threshold number. By introducing the rank threshold for synonym candidate selection method (RTS), our analysis shows that the network exhibits a scale-free property. This insight obtained from the network leads us to a method for re-ranking the synonym candidates -a mutual re-ranking method (MRM). We apply our methods to Reuters-21578 to show the generality of the methods on synonym acquisition. The results show that RTS and MRM boosts the quality of acquired synonyms. |
| 書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10115061 |
| 書誌情報 |
情報処理学会研究報告自然言語処理(NL)
巻 2008,
号 46(2008-NL-185),
p. 7-14,
発行日 2008-05-15
|
| Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
| 出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |