WEKO3
アイテム
単語分布類似度を用いた類推による単語間の意味的関係獲得法
https://ipsj.ixsq.nii.ac.jp/records/73935
https://ipsj.ixsq.nii.ac.jp/records/7393529be8f48-597e-4df6-af82-f4f207d74067
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2011 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | Journal(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2011-04-15 | |||||||
タイトル | ||||||||
タイトル | 単語分布類似度を用いた類推による単語間の意味的関係獲得法 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Analogy-based Relation Acquisition Using Distributionally Similar Words | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 一般論文 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||||
資源タイプ | journal article | |||||||
著者所属 | ||||||||
情報通信研究機構/東京理科大学 | ||||||||
著者所属 | ||||||||
情報通信研究機構 | ||||||||
著者所属 | ||||||||
情報通信研究機構 | ||||||||
著者所属 | ||||||||
鳥取大学 | ||||||||
著者所属 | ||||||||
情報通信研究機構 | ||||||||
著者所属 | ||||||||
京都工芸繊維大学/早稲田大学総合研究機構 | ||||||||
著者所属 | ||||||||
東京理科大学 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
National Institute of Information and Communications Technology / Tokyo University of Science | ||||||||
著者所属(英) | ||||||||
en | ||||||||
National Institute of Information and Communications Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
National Institute of Information and Communications Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Tottori University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
National Institute of Information and Communications Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Kyoto Institute of Technology / Comprehensive Research Organization, Waseda University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Tokyo University of Science | ||||||||
著者名 |
土田, 正明
× 土田, 正明
|
|||||||
著者名(英) |
Masaaki, Tsuchida
× Masaaki, Tsuchida
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 情報爆発の時代に入り,大規模コーパスと計算機パワーの増大を背景に,構文的パターンに基づいて「因果関係」などの単語間の意味的関係の知識を獲得する研究が進められている.しかしながら,それらの研究は,文書中に直接的かつ明示的に書かれた知識を獲得するにとどまり,人間であれば解釈可能な間接的記述から獲得することや,文書に書かれていない知識を過去に蓄積された知識からの推論によって大規模に獲得することは行われていない.このような知識の獲得は,より大量の関係を獲得するためだけではなく,人類のイノベーションの加速にとっても重要である.本稿では,既存の構文的パターンに基づく方法で獲得された単語の意味的関係のデータベース,すなわち,特定の意味的関係を持つ単語対の集合を,類推によって大規模に拡張する方法を提案する.提案法は,入力された単語対の中の語を,ウェブから自動獲得した類似語に置換して大量の仮説を生成し,さらに単語間の類似度に基づいて仮説をランキングする.提案法は,従来法では困難な間接的記述からの意味的関係獲得を可能にして,さらには,そもそも文書に記述されている可能性が低い知識を獲得できる.約1億ページのウェブ文書を用いた実験によって,これらを検証するとともに,いくつかの意味的関係に関して,提案法で上位にランキングされた仮説では,最新の構文パターンに基づく獲得法とほぼ変わらない精度を達成できることを示す. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | With the advent of terabyte scale corpora in this information explosion age, extracting high-level semantic relations like causality using lexico-syntactic patterns has come of age. While such knowledge acquisition methods have matured greatly, they are necessarily limited to extracting relations mentioned explicitly in some text collection. Until now, inference-based methods for acquiring “indirect” or “implicit” relational knowledge from a corpus have never been investigated on the same scale as pattern-based methods. In this work we propose a method for extending a database of semantic relations acquired by existing pattern-based methods using analogical reasoning. This method uses lexical word similarities acquired automatically from the Web to generate and rank new relation instance candidates from its input. Not only can it acquire semantic relations from indirect descriptions in the corpus, which is exceedingly difficult for pattern-based methods, our method can acquire valid relational knowledge that is unlikely to be written down before. We validate these claims experimentally using a 108 Web page corpus, and show that for some relations our method exhibits precision figures indistinguishable from state-of-the-art pattern-based methods in top-ranked relation instances. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN00116647 | |||||||
書誌情報 |
情報処理学会論文誌 巻 52, 号 4, p. 1761-1776, 発行日 2011-04-15 |
|||||||
ISSN | ||||||||
収録物識別子タイプ | ISSN | |||||||
収録物識別子 | 1882-7764 |