WEKO3
アイテム
確率的モデルによる仮名漢字変換
https://ipsj.ixsq.nii.ac.jp/records/12589
https://ipsj.ixsq.nii.ac.jp/records/12589b66b97d7-dec4-426c-acbb-6673ecb59415
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 1999 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | Journal(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 1999-07-15 | |||||||
タイトル | ||||||||
タイトル | 確率的モデルによる仮名漢字変換 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Kana - Kanji Conversion by a Stochastic Model | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 論文 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||||
資源タイプ | journal article | |||||||
その他タイトル | ||||||||
その他のタイトル | 自然言語処理 | |||||||
著者所属 | ||||||||
日本アイ・ビー・エム株式会社東京基礎研究所 | ||||||||
著者所属 | ||||||||
京都大学大学院情報学研究科 | ||||||||
著者所属 | ||||||||
松下電器産業株式会社マルチメディア開発センター | ||||||||
著者所属 | ||||||||
京都大学 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
IBM Research, Tokyo Research Laboratory, IBM Japan, Ltd | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Informatics, Kyoto University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Multimedia Development Center, Matsushita Electric Industrial Co., Ltd | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Kyoto University | ||||||||
著者名 |
森, 信介
× 森, 信介
|
|||||||
著者名(英) |
Shinsuke, Mori
× Shinsuke, Mori
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 本論文では 確率的モデルによる仮名漢字変換を提案する.これは 従来の規則とその重みに基づく仮名漢字変換と異なり 入力に対応する最も確率の高い仮名漢字混じり文を出力とする.この方法の有効性を確かめるため 片仮名列と仮名漢字混じり文を有するコーパスを用いた変換実験を行い 変換精度を測定した.変換精度は 第1変換候補と正解の最長共通部分列の文字数に基づく再現率と適合率である.この結果 我々の提案する手法による再現率は95.07%であり 適合率は93.94%であった.これは 市販の仮名漢字変換器の1つであるWnn6の同じテストコーパスに対する再現率(91.12%)と適合率(91.17%)を有意に上回っており 確率的モデルによる仮名漢字変換の有効性を示す結果となった. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | In this paper, we present a kana-kanji converter by a stochastic model. Given an input this method returns the most probable kana-kanji character sequence. For its evaluation, we converted kana sequences of a corpus containing kana-kanji sequences. The criterion we used is the ratio of the length of longest common subsequence. The recall and precision of our method are 95.07% and 93.94% respectively. This result is much better than that of Wnn6 (recall: 9l.l2%; precision: 91.17%). | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN00116647 | |||||||
書誌情報 |
情報処理学会論文誌 巻 40, 号 7, p. 2964-2953, 発行日 1999-07-15 |
|||||||
ISSN | ||||||||
収録物識別子タイプ | ISSN | |||||||
収録物識別子 | 1882-7764 |