WEKO3
アイテム
意味解析に基づく照応解析システム ANASYS -EM アルゴリズムによる先行詞同定の学習の導入-
https://ipsj.ixsq.nii.ac.jp/records/62289
https://ipsj.ixsq.nii.ac.jp/records/622891f9864fc-034c-4160-ab0b-839e7ec892b0
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2009 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2009-05-14 | |||||||
タイトル | ||||||||
タイトル | 意味解析に基づく照応解析システム ANASYS -EM アルゴリズムによる先行詞同定の学習の導入- | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Anaphoric analysis system ANASYS based on semantic analysis - Antecedent identification by EM algorithm - | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
青山学院大学大学院理工学研究科 | ||||||||
著者所属 | ||||||||
ソニー株式会社 | ||||||||
著者所属 | ||||||||
青山学院大学理工学部情報テクノロジー学科 | ||||||||
著者所属 | ||||||||
青山学院大学理工学部情報テクノロジー学科 | ||||||||
著者名 |
西尾, 公秀
× 西尾, 公秀
|
|||||||
著者名(英) |
Masahide, Nishio
× Masahide, Nishio
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 我々は意味解析に基づく照応解析システム ANASYS を開発した.ANASYS は文内・文間照応を問わず,また文中に存在しない単語への外界照応も含めた照応解析を行う.本研究では先行詞候補に意味解析によって付与された EDR 辞書中での語意から計算した概念類似度,先行詞候補に係る深層格,文構造などを得点化して計 7 個の素性を用意した.これらの素性を持つ学習データから EM アルゴリズムを用いて混合正規分布のパラメータを推定することで各先行詞候補が正解先行詞になる確率モデルを同定した.この確率モデルを用いて NAIST テキストコーパス全 609 記事 (外界照応も含む照応詞 13967 個を含む) について精度実験を行った結果,適合率 33%,再現率 41% という結果になった. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | We developed anaphoric analysis system ANASYS based on the semantic analysis. ANASYS resolves the anaphoric correspondence including the exophoric correspondence to the word which does not exist in the sentence including the anaphora. In this research, to each antecedent candidate, seven features such as the concept similarity calculated from the meaning of a word given by the semantic analysis, the deep case representing the function of the antecedent candidate and the sentence structure, are given. By using the EM algorithm for the learning data having these seven features, we estimated the parameters of the contaminated normal distribution according to which each antecedent candidate becomes a correct antecedent. Experimentation using NAIST text corpus of 609 articles (including 13967 anaphora) resulted in precision 33% and recall 41%. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10115061 | |||||||
書誌情報 |
研究報告自然言語処理(NL) 巻 2009-NL-191, 号 5, p. 1-8, 発行日 2009-05-14 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |