WEKO3
アイテム
格パターンの多様性に頑健な日本語格フレーム構築
https://ipsj.ixsq.nii.ac.jp/records/146214
https://ipsj.ixsq.nii.ac.jp/records/146214be67698a-8743-4ea4-830e-a6526c3e8399
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2015 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|
公開日 | 2015-11-26 | |||||||||||
タイトル | ||||||||||||
タイトル | 格パターンの多様性に頑健な日本語格フレーム構築 | |||||||||||
言語 | ||||||||||||
言語 | jpn | |||||||||||
キーワード | ||||||||||||
主題Scheme | Other | |||||||||||
主題 | 辞書・概念 | |||||||||||
資源タイプ | ||||||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||||||
資源タイプ | technical report | |||||||||||
著者所属 | ||||||||||||
京都大学大学院情報学研究科/科学技術振興機構CREST | ||||||||||||
著者所属 | ||||||||||||
京都大学大学院情報学研究科 | ||||||||||||
著者所属 | ||||||||||||
京都大学大学院情報学研究科/科学技術振興機構CREST | ||||||||||||
著者名 |
林部, 祐太
× 林部, 祐太
× 河原, 大輔
× 黒橋, 禎夫
|
|||||||||||
論文抄録 | ||||||||||||
内容記述タイプ | Other | |||||||||||
内容記述 | 述語項構造のパターンである格フレームは構文・格解析,さらに照応・省略解析における重要な知識源である.従来の格フレーム構築の研究では,用例をクラスタリングして,述語の語義と格パターンの違いの両方をとらえようとしてきたが,格パターンの多様性に頑健ではないという問題があった.本稿では,用例を格の出現の仕方に基づいて 3 種類に分け,それぞれについて格フレームを構築してから最後に統合する手法を提案する.また,格パターンを正しく認識するために必要な格フレームの述語単位の定義と,可能動詞・サ変動詞の語彙の整備も行う.評価実験では,日本語ウェブテキスト 40 億文に対して提案手法を用いた格フレームを構築し,従来手法と比較して妥当な格フレームの割合が 72.5%(145/200) から 95.5%(191/200) に大きく改善したことを確認した. | |||||||||||
書誌レコードID | ||||||||||||
収録物識別子タイプ | NCID | |||||||||||
収録物識別子 | AN10115061 | |||||||||||
書誌情報 |
研究報告自然言語処理(NL) 巻 2015-NL-224, 号 14, p. 1-8, 発行日 2015-11-26 |
|||||||||||
ISSN | ||||||||||||
収録物識別子タイプ | ISSN | |||||||||||
収録物識別子 | 2188-8779 | |||||||||||
Notice | ||||||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||||||
出版者 | ||||||||||||
言語 | ja | |||||||||||
出版者 | 情報処理学会 |