WEKO3
アイテム
人名辞書から名前読み付与規則を抽出するアルゴリズム
https://ipsj.ixsq.nii.ac.jp/records/12586
https://ipsj.ixsq.nii.ac.jp/records/125867a362cd0-4114-44c1-9c0d-88cb6dc0e710
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 1999 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | Journal(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 1999-07-15 | |||||||
タイトル | ||||||||
タイトル | 人名辞書から名前読み付与規則を抽出するアルゴリズム | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | An Algorithm that Extracts Alphabet - Kana Rules from Name Database | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 論文 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||||
資源タイプ | journal article | |||||||
その他タイトル | ||||||||
その他のタイトル | 自然言語処理 | |||||||
著者所属 | ||||||||
日本電信電話株式会社名古屋支店 | ||||||||
著者所属 | ||||||||
豊橋技術科学大学情報工学系 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Nippon Telegraph and Telephone, Nagoya Branch | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Information and Computer Sciences, Toyohashi University of Technology | ||||||||
著者名 |
増田, 恵子
× 増田, 恵子
|
|||||||
著者名(英) |
Keiko, Masuda
× Keiko, Masuda
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 日本人は外国語のカタカナ表記を知っていても その綴りを知らないことが多い.そこで アルファベット表記とカタカナ表記が対応する規則があると便利である.一方 外国人名のアルファベット表記とカタカナ表記が対応したデータベース(人名辞書)が存在し これは利用可能である.本稿では 人名辞書におけるアルファベット表記の部分文字列とカタカナ表記の部分文字列の組の出現頻度の変化から アルファベット表記とカタカナ表記の対応規則を自動的に得るアルゴリズムを提案する.本アルゴリズムは ローマ字綴りからなる仮想の対応規則を組み合わせたデータ集合から 規則を完全に再現することができる.人名辞書にアルゴリズムを適用して得られた対応規則をデータ検索システムで使われることを想定して評価した結果 正当率は80% 綴りの復元率は84% 読みの復元率は48.8%の精度を得た.また 人手によって規則を作る方法と比較した結果 本手法は人の知識を使用しない方法にもかかわらず人間の生成する規則を含む規則を得ることができた. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | It is often the case that Japanese people knows the words in Kana spelling but does not know its true spelling. It is useful if there are correspondence rules between alphabet and Kana spelling. In this paper, we propose an algorithm to extract automatically Alphabet-Kana correspondence rules from the pairs of alphabet of person names and their corresponding Kana spelling. We have checked the algorithm by the test rules that consisted of Romaji and its Kana spelling, and applied the algorithm to the data composed by this rules. We have confirmed that all of the test rules reappeared in extracting rules. We have applied the algorithm to the actual data and measured the correctness of the extracted rules, considering information retrieval application. As the result, we have obtained 80% as correctness of the rules, 84% as coverage of the rules and 48.8% as correctness of its replacement. Even if our method does not use human knowledge, we are able to get replacement rules which human generates. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN00116647 | |||||||
書誌情報 |
情報処理学会論文誌 巻 40, 号 7, p. 2927-2936, 発行日 1999-07-15 |
|||||||
ISSN | ||||||||
収録物識別子タイプ | ISSN | |||||||
収録物識別子 | 1882-7764 |