{"created":"2025-01-19T00:10:05.901421+00:00","updated":"2025-01-20T23:52:19.531122+00:00","metadata":{"_oai":{"id":"oai:ipsj.ixsq.nii.ac.jp:00131119","sets":["6504:8126:8129"]},"path":["8129"],"owner":"1","recid":"131119","title":["コーパスから抽出された辞書を用いた表記誤り検出法"],"pubdate":{"attribute_name":"公開日","attribute_value":"1997-03-12"},"_buckets":{"deposit":"33099911-3eb6-4c4c-b8fd-d47d45b7175d"},"_deposit":{"id":"131119","pid":{"type":"depid","value":"131119","revision_id":0},"owners":[1],"status":"published","created_by":1},"item_title":"コーパスから抽出された辞書を用いた表記誤り検出法","author_link":[],"item_titles":{"attribute_name":"タイトル","attribute_value_mlt":[{"subitem_title":"コーパスから抽出された辞書を用いた表記誤り検出法"},{"subitem_title":"A method of detecting spell errors with the dictionary extracted from corpus","subitem_title_language":"en"}]},"item_type_id":"22","publish_date":"1997-03-12","item_language":{"attribute_name":"言語","attribute_value_mlt":[{"subitem_language":"jpn"}]},"item_22_text_3":{"attribute_name":"著者所属","attribute_value_mlt":[{"subitem_text_value":"筑波大学"},{"subitem_text_value":"筑波大学"}]},"item_22_text_4":{"attribute_name":"著者所属(英)","attribute_value_mlt":[{"subitem_text_value":"College of Information Science, University of Tsukuba","subitem_text_language":"en"},{"subitem_text_value":"Institute of Information Sciences and Electronics, University of Tsukuba","subitem_text_language":"en"}]},"item_publisher":{"attribute_name":"出版者","attribute_value_mlt":[{"subitem_publisher":"情報処理学会","subitem_publisher_language":"ja"}]},"publish_status":"0","weko_shared_id":-1,"item_file_price":{"attribute_name":"Billing file","attribute_type":"file","attribute_value_mlt":[{"url":{"url":"https://ipsj.ixsq.nii.ac.jp/record/131119/files/KJ00001344867.pdf"},"date":[{"dateType":"Available","dateValue":"1997-03-12"}],"format":"application/pdf","filename":"KJ00001344867.pdf","filesize":[{"value":"195.2 kB"}],"mimetype":"application/pdf","accessrole":"open_date","version_id":"6959a791-40f0-466c-869b-5bca52c32994","displaytype":"detail","licensetype":"license_note"}]},"item_resource_type":{"attribute_name":"資源タイプ","attribute_value_mlt":[{"resourceuri":"http://purl.org/coar/resource_type/c_5794","resourcetype":"conference paper"}]},"item_22_source_id_9":{"attribute_name":"書誌レコードID","attribute_value_mlt":[{"subitem_source_identifier":"AN00349328","subitem_source_identifier_type":"NCID"}]},"item_22_description_7":{"attribute_name":"論文抄録","attribute_value_mlt":[{"subitem_description":"ワードプロセッサ等を用いて作成された日本語文書に含まれる各種の表記誤りを、計算機により校正するために様々な手法が提案されている。誤り検出ルールを用いた手法では、誤り検出ルールを人手によって作成しなくてはならず、手間がかかる。また、辞書を用いた形態素解析システムを使って、入力文を形態素解析した結果と準備しておいた形態素辞書とを比較する手法では、使用した形態素解析システムが誤った文を無理矢理正しい形態素の連続としてしまう可能性が強い。そこで我々は、文に対して辞書を用いない方法で分割位置を与えるシステムを用いて、正しい文から成ると考えられるコーパスから単語辞書を構築し、その辞書との比較によって表記誤りを検出する手法を提案する。一定の基準で入力文を分割するシステムを用いるため、英文スペルチェッカーで実用化されている手法が流用できるのではないかという期待ができる。また、正しい文からなるコーパスを用いれば、誤り検出用の辞書が自動で得られるというのも利点である。なお今回の実験で、本手法によってミスタイプとかな漢字変換誤りの一部を検出できるということが確かめられた。","subitem_description_type":"Other"}]},"item_22_biblio_info_10":{"attribute_name":"書誌情報","attribute_value_mlt":[{"bibliographicPageEnd":"22","bibliographic_titles":[{"bibliographic_title":"全国大会講演論文集"}],"bibliographicPageStart":"21","bibliographicIssueDates":{"bibliographicIssueDate":"1997-03-12","bibliographicIssueDateType":"Issued"},"bibliographicIssueNumber":"人工知能と認知科学","bibliographicVolumeNumber":"第54回"}]},"relation_version_is_last":true,"weko_creator_id":"1"},"id":131119,"links":{}}