WEKO3
-
RootNode
アイテム
コーパスから抽出された辞書を用いた表記誤り検出法
https://ipsj.ixsq.nii.ac.jp/records/131119
https://ipsj.ixsq.nii.ac.jp/records/131119cfbd53b7-eb70-47ff-94de-3849b30000fe
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
|
Item type | National Convention(1) | |||||
---|---|---|---|---|---|---|
公開日 | 1997-03-12 | |||||
タイトル | ||||||
タイトル | コーパスから抽出された辞書を用いた表記誤り検出法 | |||||
タイトル | ||||||
言語 | en | |||||
タイトル | A method of detecting spell errors with the dictionary extracted from corpus | |||||
言語 | ||||||
言語 | jpn | |||||
資源タイプ | ||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_5794 | |||||
資源タイプ | conference paper | |||||
著者所属 | ||||||
筑波大学 | ||||||
著者所属 | ||||||
筑波大学 | ||||||
著者所属(英) | ||||||
en | ||||||
College of Information Science, University of Tsukuba | ||||||
著者所属(英) | ||||||
en | ||||||
Institute of Information Sciences and Electronics, University of Tsukuba | ||||||
論文抄録 | ||||||
内容記述タイプ | Other | |||||
内容記述 | ワードプロセッサ等を用いて作成された日本語文書に含まれる各種の表記誤りを、計算機により校正するために様々な手法が提案されている。誤り検出ルールを用いた手法では、誤り検出ルールを人手によって作成しなくてはならず、手間がかかる。また、辞書を用いた形態素解析システムを使って、入力文を形態素解析した結果と準備しておいた形態素辞書とを比較する手法では、使用した形態素解析システムが誤った文を無理矢理正しい形態素の連続としてしまう可能性が強い。そこで我々は、文に対して辞書を用いない方法で分割位置を与えるシステムを用いて、正しい文から成ると考えられるコーパスから単語辞書を構築し、その辞書との比較によって表記誤りを検出する手法を提案する。一定の基準で入力文を分割するシステムを用いるため、英文スペルチェッカーで実用化されている手法が流用できるのではないかという期待ができる。また、正しい文からなるコーパスを用いれば、誤り検出用の辞書が自動で得られるというのも利点である。なお今回の実験で、本手法によってミスタイプとかな漢字変換誤りの一部を検出できるということが確かめられた。 | |||||
書誌レコードID | ||||||
収録物識別子タイプ | NCID | |||||
収録物識別子 | AN00349328 | |||||
書誌情報 |
全国大会講演論文集 巻 第54回, 号 人工知能と認知科学, p. 21-22, 発行日 1997-03-12 |
|||||
出版者 | ||||||
言語 | ja | |||||
出版者 | 情報処理学会 |