コーパスから抽出された辞書を用いた表記誤り検出法

WEKO3

インデックスツリー

RootNode

アイテム

コーパスから抽出された辞書を用いた表記誤り検出法

https://ipsj.ixsq.nii.ac.jp/records/131119

名前 / ファイル	ライセンス	アクション
KJ00001344867.pdf (195.2 kB)

Item type		National Convention(1)
公開日		1997-03-12
タイトル
	タイトル	コーパスから抽出された辞書を用いた表記誤り検出法
タイトル
	言語	en
	タイトル	A method of detecting spell errors with the dictionary extracted from corpus
言語
	言語	jpn
資源タイプ
	資源タイプ識別子	http://purl.org/coar/resource_type/c_5794
	資源タイプ	conference paper
著者所属
		筑波大学
著者所属
		筑波大学
著者所属(英)
		en
		College of Information Science, University of Tsukuba
著者所属(英)
		en
		Institute of Information Sciences and Electronics, University of Tsukuba
論文抄録
	内容記述タイプ	Other
	内容記述	ワードプロセッサ等を用いて作成された日本語文書に含まれる各種の表記誤りを、計算機により校正するために様々な手法が提案されている。誤り検出ルールを用いた手法では、誤り検出ルールを人手によって作成しなくてはならず、手間がかかる。また、辞書を用いた形態素解析システムを使って、入力文を形態素解析した結果と準備しておいた形態素辞書とを比較する手法では、使用した形態素解析システムが誤った文を無理矢理正しい形態素の連続としてしまう可能性が強い。そこで我々は、文に対して辞書を用いない方法で分割位置を与えるシステムを用いて、正しい文から成ると考えられるコーパスから単語辞書を構築し、その辞書との比較によって表記誤りを検出する手法を提案する。一定の基準で入力文を分割するシステムを用いるため、英文スペルチェッカーで実用化されている手法が流用できるのではないかという期待ができる。また、正しい文からなるコーパスを用いれば、誤り検出用の辞書が自動で得られるというのも利点である。なお今回の実験で、本手法によってミスタイプとかな漢字変換誤りの一部を検出できるということが確かめられた。
書誌レコードID
	収録物識別子タイプ	NCID
	収録物識別子	AN00349328
書誌情報		全国大会講演論文集巻第54回, 号人工知能と認知科学, p. 21-22, 発行日 1997-03-12
出版者
	言語	ja
	出版者	情報処理学会

戻る

views

See details

	Views

Versions

Ver.1

2025-01-20 23:52:18.754551

Show All versions

Cite as

1997: 情報処理学会, 21–22 p.

エクスポート

OAI-PMH

JPCOAR
DublinCore
DDI

Other Formats

JSON
BIBTEX

インデックスリンク

インデックスツリー

アイテム

コーパスから抽出された辞書を用いた表記誤り検出法

Versions

Share

Cite as

エクスポート