WEKO3
アイテム
書き換え規則と文脈情報を用いた形態素解析後処理
https://ipsj.ixsq.nii.ac.jp/records/48855
https://ipsj.ixsq.nii.ac.jp/records/4885506b5756c-0811-402c-a2d5-f32bf76df02b
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 1998 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 1998-07-23 | |||||||
タイトル | ||||||||
タイトル | 書き換え規則と文脈情報を用いた形態素解析後処理 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Post - processing of Japanese Morphological Analysis Using Transformation Rules and Contextual Information | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
日立製作所基礎研究所 | ||||||||
著者所属 | ||||||||
日立製作所基礎研究所 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Advanced Research Laboratory, Hitachi, Ltd. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Advanced Research Laboratory, Hitachi, Ltd. | ||||||||
著者名 |
久光, 徹
× 久光, 徹
|
|||||||
著者名(英) |
Toru, Hisamitsu
× Toru, Hisamitsu
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 本報では,日本語形態素解析における誤りを,書き換え規則により修正する後処理方法について述べる.書き換え規則は,誤り主導型教師付き学習により生成する.すなわち,誤りを含む解析結果と正解の差分から,語彙的なルールから,字種や品詞だけを用いるルールまでを含む,さまざまな抽象度のルールを生成し,正解データに適用してそれらの信頼度を評価する.後処理は複数の文集合ごとに行い,上記ルールと,集合内の各文の解析結果の相互参照により,出力結果を修正する.実験では,後処理により解析精度を3%程度向上させることが確認できた. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | A method is proposed for the post-processing of Japanese morphological analysis using transformation rules and contextual Information. The method corrects both segmentation errors and part-of-speech tagging errors. The transformation rules are acquired automatically by error-driven supervised learning. The rules consist of various types, such as lexicalized rules and schematic rules. Each rule is assigned a value for reliability. The rules are not specifically tailored for detecting unregistered words, but can correct errors caused by unregistered words. In addition, we propose the use of contextual information obtained from the result of analysis of neighboring sentences. The information reinforces unregistered word detection and disambiguation. The post-processing improved the precision of the analysis of an open corpus by 3%. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10115061 | |||||||
書誌情報 |
情報処理学会研究報告自然言語処理(NL) 巻 1998, 号 63(1998-NL-126), p. 55-62, 発行日 1998-07-23 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |