WEKO3
アイテム
シソーラスを用いた複層クラス n-gram モデル
https://ipsj.ixsq.nii.ac.jp/records/47845
https://ipsj.ixsq.nii.ac.jp/records/47845b970ef1e-2903-46c0-8832-adcabca6603b
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2007 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2007-03-28 | |||||||
タイトル | ||||||||
タイトル | シソーラスを用いた複層クラス n-gram モデル | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Multi-layer Class N-gram Model that Uses Noun Thesaurus | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
鳥取環境大学 環境情報学部 情報システム学科 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Information Systems, Tottori University of Environmental Studies | ||||||||
著者名 |
市丸, 夏樹
× 市丸, 夏樹
|
|||||||
著者名(英) |
Natsuki, ICHIMARU
× Natsuki, ICHIMARU
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 本稿では、携帯電話等における子音入力方式の正解率向上と打鍵数の削減のため、n-gram に名詞シソーラスを組み合わせた強力な優先付け機構を提案する。提案手法では、単語 n-gram の単語間の条件付き連接確率が、シソーラス中の様々な抽象度の先行クラス間の連接を前提条件として計算されるものと考える。一般的には、より具体的なクラス列に後接し、かつ生起頻度が高い単語候補が優先される。その結果、文節中に派生語や複合語が含まれる場合にも正しい漢字候補を自動的に選び出すことができるようになるものと考えられる。派生語変換の実験では、マルチタップ入力と品詞 bi-gram の場合と比較して、入力と変換を合わせた総合的な打鍵数を約 56%削減できることを示した。 | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | In this paper, we present a strong disambiguation method that combines class n-gram and a noun thesaurus, to improve accuracy and keystroke savings of consonant-kanji conversion method that is used on mobile phone. We presume that the preceding class sequence of a word can reside on any layers in a thesaurus. In general, a high frequency word that succeeds a specific class sequence has high priority. It is supposed that our method can automatically choose correct kanji candidates, even from a phrase that contains derivative word or compound word. As an experimental result of derivative conversion, we confirmed that the keystroke savings rate was about 56%. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10115061 | |||||||
書誌情報 |
情報処理学会研究報告自然言語処理(NL) 巻 2007, 号 35(2007-NL-178), p. 35-40, 発行日 2007-03-28 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |