WEKO3
アイテム
テキストコーパスを用いた漢字詳細読みの自動生成
https://ipsj.ixsq.nii.ac.jp/records/96766
https://ipsj.ixsq.nii.ac.jp/records/967668f28f457-3406-41e0-a26e-c14b7a29a3d6
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2013 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | Journal(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2013-12-15 | |||||||
タイトル | ||||||||
タイトル | テキストコーパスを用いた漢字詳細読みの自動生成 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Automatic Generation of Distinctive Explanation for Kanji Using Text Corpus | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | [一般論文] 視覚障害者,スクリーンリーダ,漢字詳細読み | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||||
資源タイプ | journal article | |||||||
著者所属 | ||||||||
東京工業大学 | ||||||||
著者所属 | ||||||||
東京工業大学 | ||||||||
著者所属 | ||||||||
東京工業大学 | ||||||||
著者所属 | ||||||||
東京工業大学 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Tokyo Institute of Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Tokyo Institute of Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Tokyo Institute of Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Tokyo Institute of Technology | ||||||||
著者名 |
川崎, 博章
× 川崎, 博章
|
|||||||
著者名(英) |
Hiroaki, Kawasaki
× Hiroaki, Kawasaki
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | スクリーンリーダは,コンピュータ上のテキスト情報を音声で読み上げるソフトウェアアプリケーションであり,視覚障害者がコンピュータを利用して情報にアクセスする際に重要な役割を果たす.スクリーンリーダに搭載されている重要な機能の1つに漢字詳細読みの出力がある.多くの漢字には同音異字が存在しており,漢字詳細読みには音声による説明のみでユーザに漢字を正しく想起させることが求められている.たとえば,一般的には“コウニュウ”という読みを持つ単語は“購入”しかないため,“購”という漢字は“コウニュウのコウ”という漢字詳細読みにより想起することが可能である.一方で,“コウバイ”という読みを持つ単語は“勾配”や“公売”などが存在するため,“コウバイのコウ”という漢字詳細読みから“購”という漢字を想起することは難しい.しかし,このような曖昧性を持つ漢字詳細読みは既存のスクリーンリーダの中にも存在しており,正しい漢字が想起できない要因の1つとなっている.また,漢字詳細読みで用いる単語はユーザに慣れ親しんだものであるべきだが,単語の親密度は時間の経過やユーザの背景により変化する.そこで,本論文では,同音異字の情報と単語の親密度を考慮に入れた,コーパスを用いた漢字詳細読みの自動生成法を提案する.さらに漢字想起実験により,提案手法はインタラクティブな要素を取り入れることで生成される漢字詳細読みの長さを既存のスクリーンリーダのものと同程度に抑えていること,および,提案手法により自動生成された漢字詳細読みの性能が既存のスクリーンリーダのものよりも高いことを示す. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | Screen readers are software applications that produce voice output of text on a computer screen. They play an important role when visually impaired people access the information using a computer. One essential function attached to screen readers in the kanji-using area is to generate distinctive explanation for kanji. Most kanji characters have their homophones, and the role of distinctive explanation is to enable users to identify a unique kanji character only by listening to the explanation. For example, “購”(kou) can be identified by a distinctive explanation “kou-nyu (購入, purchase) no kou, because “購入(purchase)” is the only word that has the reading “kou-nyu.” On the other hand, it is difficult to identify a unique kanji “購” by a distinctive explanation “kou-bai no kou (購買, purchase),” because there are multiple words with the reading “kou-bai,” such as “勾配(gradient)” and “公売(public auction).” Such confusing explanations for kanji are sometimes produced by the existing screen readers. In addition, although the words used in distinctive explanations have to be familiar to users, the familiarity of each word changes with the times and users' backgrounds. In this paper, we propose a corpus-based method for automatically generating distinctive explanations for kanji, in which information about familiarity and homophones of kanji is taken into consideration. Through the kanji-identification experiments, we show that the quality of the explanations generated by the proposed method is higher than that of the manually-crafted distinctive explanations. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN00116647 | |||||||
書誌情報 |
情報処理学会論文誌 巻 54, 号 12, p. 2481-2491, 発行日 2013-12-15 |
|||||||
ISSN | ||||||||
収録物識別子タイプ | ISSN | |||||||
収録物識別子 | 1882-7764 |