WEKO3
アイテム
漢字仮名変換を用いた仮名漢字変換率評価 -大規模テキストを対象とした仮名漢字変換評価システムの構成と性能評価-
https://ipsj.ixsq.nii.ac.jp/records/49365
https://ipsj.ixsq.nii.ac.jp/records/49365f77e94a4-db85-4787-9200-e2947e9156f7
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
Copyright (c) 1993 by the Information Processing Society of Japan
|
|
| オープンアクセス | ||
| Item type | SIG Technical Reports(1) | |||||||
|---|---|---|---|---|---|---|---|---|
| 公開日 | 1993-05-20 | |||||||
| タイトル | ||||||||
| タイトル | 漢字仮名変換を用いた仮名漢字変換率評価 -大規模テキストを対象とした仮名漢字変換評価システムの構成と性能評価- | |||||||
| タイトル | ||||||||
| 言語 | en | |||||||
| タイトル | On configuration and performance of Kana - kanji conversion evaluation system applicable for very large text corpus. | |||||||
| 言語 | ||||||||
| 言語 | jpn | |||||||
| 資源タイプ | ||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
| 資源タイプ | technical report | |||||||
| 著者所属 | ||||||||
| 国際電信電話株式会社研究所 | ||||||||
| 著者所属 | ||||||||
| 国際電信電話株式会社研究所 | ||||||||
| 著者所属 | ||||||||
| 国際電信電話株式会社研究所 | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| KDD R&D Laboratories | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| KDD R&D Laboratories | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| KDD R&D Laboratories | ||||||||
| 著者名 |
清水, 徹
橋本, 和夫
山本, 誠一
× 清水, 徹 橋本, 和夫 山本, 誠一
|
|||||||
| 著者名(英) |
Tohru, Shimizu
Kazuo, Hashimoto
Seiichi, Yamamoto
× Tohru, Shimizu Kazuo, Hashimoto Seiichi, Yamamoto
|
|||||||
| 論文抄録 | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | 従来、仮名漢字変換評価に用いられるテキストデータベースの規模は平仮名ベタ書き文章や文節区切り情報を記録したデータの整備が難しいために、比較的小さいものが多かった。本稿では、仮名漢字変換評価システム構成法について提案する。ここで提案する評価システムにおいては、漢字仮名交じり文章入力のみから形態素解析を処理を用いて平仮名ベタ書き文章と文節区切り情報を記録したデータを生成する。また、ここで提案する評価システムの評価能力について実験的な検証を行なった結果、仮名漢字変換率の評価誤差は0.4%以下で、仮名漢字変換方式や評価テキストに依存しないことが確かめられた。 | |||||||
| 論文抄録(英) | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | The size of text corpus, usable for Kana-Kanji conversion evaluation, has been relatively small, because of the difficulty of keeping the consistency of text databases. This paper, first, proposes a new system configuration for Kana-Kanji conversion evaluation. The proposed evaluation system requires an input only from Kanji-Kana text database, and generates Kana text data and phrase boundary data with Morphological analyzer. Second, the accuracy of Kana-Kanji conversion rate observed by the proposed system is examined throughly by experiment. The result shows that the proposed system can estimate Kana-Kanji conversion rate within 0.4% of error, independent of kinds of text corpus and conversion methods. | |||||||
| 書誌レコードID | ||||||||
| 収録物識別子タイプ | NCID | |||||||
| 収録物識別子 | AN10115061 | |||||||
| 書誌情報 |
情報処理学会研究報告自然言語処理(NL) 巻 1993, 号 41(1993-NL-095), p. 1-8, 発行日 1993-05-20 |
|||||||
| Notice | ||||||||
| SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
| 出版者 | ||||||||
| 言語 | ja | |||||||
| 出版者 | 情報処理学会 | |||||||