WEKO3
アイテム
HMMを用いて分野適応する仮名漢字変換
https://ipsj.ixsq.nii.ac.jp/records/70310
https://ipsj.ixsq.nii.ac.jp/records/70310c7e78e0a-bf37-4e96-b714-4a77959e7dfa
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2010 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2010-09-09 | |||||||
タイトル | ||||||||
タイトル | HMMを用いて分野適応する仮名漢字変換 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Japanese Imput Method Adaptation Using Hidden Markov Model | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 語彙・オントロジー・知識獲得 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
東京大学総合文化研究科 | ||||||||
著者所属 | ||||||||
東京大学総合文化研究科 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of General Systems Studies,University of Tokyo | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of General Systems Studies,University of Tokyo | ||||||||
著者名 |
黒崎, 弘光
× 黒崎, 弘光
|
|||||||
著者名(英) |
Hiromitsu, Kurosaki
× Hiromitsu, Kurosaki
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 近年大規模なコーパスを用いた統計的仮名漢字変換が注目されている.しかし,一般的な分野の辞書を用いると対象分野特有の単語において仮名漢字変換の変換精度は低下してしまう.変換対象の分野に応じた辞書を使うと、仮名漢字変換の精度が向上するが,そのためには変換対象の分野を推定する必要がある。HMM を用いて単語ごとの分野の推定を行うと単語に関連性がない場合推定した分野が大きく変動してしまう.先行研究では 10 単語単位で状態を変化させていたものもあるが,若干の精度の向上にとどまった.そこで本研究では HMM の構造で単語間の関連性を表現して各単語の分野を推定する方法を提案する.HMM で文章の分野を推定し,分野に適した辞書を用いることによる仮名漢字変換の変換精度を調べたところ,適応分野における変換精度が向上した。 | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | Statistical approach to Japanese input method is popular these days. But it is difficult to convert in a specific domain. We consider a state as a topic of sentences, and estimate the states with Hidden Markov Model. In this paper, we improve a structure of HMM, because it is difficult to estimate the topics with the basic structure of HMM. We made experimental evaluation on a task of Japanese input method and observed an improvement in the accuracy. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10115061 | |||||||
書誌情報 |
研究報告自然言語処理(NL) 巻 2010-NL-198, 号 2, p. 1-7, 発行日 2010-09-09 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |