WEKO3
アイテム
検索エンジンを用いた英文冠詞誤りの検出
https://ipsj.ixsq.nii.ac.jp/records/18770
https://ipsj.ixsq.nii.ac.jp/records/18770c709bce8-47f4-4e5c-8726-1000ad3cbc35
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2007 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2007-07-02 | |||||||
タイトル | ||||||||
タイトル | 検索エンジンを用いた英文冠詞誤りの検出 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Detecting Article Errors in English using Search Engines | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
早稲田大学大学院基幹理工学研究科 | ||||||||
著者所属 | ||||||||
早稲田大学大学院基幹理工学研究科/早稲田大学メディアネットワークセンター | ||||||||
著者所属 | ||||||||
早稲田大学理工学術院/国立情報学研究所 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Fundamental Science and Engineering, Waseda University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Fundamental Science and Engineering, Waseda University/Media Network Center, Waseda University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Science and Engineering, Waseda University/National Institute of Informatics | ||||||||
著者名 |
平野, 孝佳
× 平野, 孝佳
|
|||||||
著者名(英) |
Takayoshi, HIRANO
× Takayoshi, HIRANO
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 近年、英語の必要性はますます高くなっており、英作文を書く機会も増えてきている。本稿では、曰本人の英作文によく見られる冠詞誤りを、検索エンジンを用いて検出する手法を提案する。検索エンジンを用いる手法は、検索エンジンがインデックス化している膨大なウェブページのテキストデータを利用することができるため、従来のコーパスを用いた手法では検出できなかった誤りを検出することが可能である。検索エンジンを用いた従来手法として、単純なフレーズを用いてフレーズ検索する Lapata らの手法があるが、希出なパターンには対応できないという欠点があった。本稿では、冠詞前後の複数の単語について活用形を考慮したり、冠詞に影響を与えないと考えられる単語を除去するといった類似フレーズを用いた拡張を行い、パターンについても判定できるよう改善した。実験の結果、提案手法は Lapata らの手法より、一般的な文章で 0.04 ポイント、技術的な文章で 0.19 ポイント高い性能 (F-measure) で誤りを検出できることを確認した。 | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | Recently, both the necessity for English and opportunities to write English have became higher and higher among non-native English speakers. But most of Japanese people tend to made many errors in English article usage when they write English. In this paper, we propose a method for detecting article errors in English by using search engines. Since search engines index great amounts of text data on web pages, search engine based methods are able to detect undetectable errors which conventional corpus based method cannot detect. Lapata et al. proposed a method for detecting article errors based on search engines. But Lapata’s method using simple phase cannot detect low frequency words. Compared to the Lapata’s conventional method, our proposing method generates similar phases to improve F-measure value especially in technical texts. Our experimental results show that our method is able to improve F-measure value 0.04 point in general texts and 0.19 point in technical texts. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10112482 | |||||||
書誌情報 |
情報処理学会研究報告データベースシステム(DBS) 巻 2007, 号 65(2007-DBS-143), p. 139-144, 発行日 2007-07-02 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |