WEKO3
アイテム
述語句統語的異形間の言い換えらしさの計算手法
https://ipsj.ixsq.nii.ac.jp/records/47763
https://ipsj.ixsq.nii.ac.jp/records/4776349c2781c-2e7d-48bd-9ecf-b0866f680cc8
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2007 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2007-11-19 | |||||||
タイトル | ||||||||
タイトル | 述語句統語的異形間の言い換えらしさの計算手法 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Computing Paraphrasability between Syntactic Variants of Predicate Phrases | |||||||
言語 | ||||||||
言語 | eng | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
名古屋大学大学院 工学研究科 | ||||||||
著者所属 | ||||||||
名古屋大学大学院 工学研究科 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Engineering, Nagoya University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Engineering, Nagoya University | ||||||||
著者名 |
藤田, 篤
× 藤田, 篤
|
|||||||
著者名(英) |
Atsushi, FUJITA
× Atsushi, FUJITA
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 近年,言い換えに関する知識を自動的に獲得する試みが多く報告されているが,そのような言い換え知識が保証するのは特定の文脈における同義性に過ぎない.このため,獲得した知識を用いる際に,言い換えの関係にない表現を誤って認識・生成してしまうことが問題となる.そこで本稿では,日本語述語句の統語的異形を対象とし,述語句とそこから自動的に生成された統語的異形の間の「言い換えらしさ」を計算する手法について検討する.ここで言う「言い換えらしさ」とは,(i) 各表現の文法的・意味的適格性,(ii) 二つの表現間の意味の同義性,(iii) 置換可能な文脈の存在性をまとめた概念を指す.提案手法では,語の類似度計算に用いられてきた分布類似度の考え方を述語句間の類似度計算に応用して,上記の「言い換えらしさ」を近似する.その際に用いる述語句の文脈的素性は,検索エンジンを通じて得られるウェブページの断片(スニペット)から抽出する.3種類の評価実験を通じて,各述語句の文脈的素性は語を対象とする場合よりも顕著に疎であるにもかかわらず,それらの分布を直接比較することが言い換えらしさを計算する上で有効であることを確認した. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | In a broad range of natural language processing tasks, large-scale knowledge-base of paraphrases is anticipated to improve their performance. The key issue in creating such a resource is to establish a practical method of computing semantic equivalence and syntactic substitutability, i.e., paraphrasability, between given pair of expressions. This paper addresses the issues of computing paraphrasability, focusing on syntactic variants of predicate phrases. Our model estimates paraphrasability based on traditional distributional similarity measures, where the Web snippets are used to overcome the data sparseness problem in handling predicate phrases. Several feature sets are evaluated through empirical experiments. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10115061 | |||||||
書誌情報 |
情報処理学会研究報告自然言語処理(NL) 巻 2007, 号 113(2007-NL-182), p. 23-30, 発行日 2007-11-19 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |