WEKO3
アイテム
カタカナ表記の統一方式 予備分類とグラフ比較によるカタカナ表記のゆらぎ検出法
https://ipsj.ixsq.nii.ac.jp/records/49350
https://ipsj.ixsq.nii.ac.jp/records/4935025b331b1-536b-42e4-9e46-5c676e74b55a
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 1993 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 1993-09-16 | |||||||
タイトル | ||||||||
タイトル | カタカナ表記の統一方式 予備分類とグラフ比較によるカタカナ表記のゆらぎ検出法 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | A Method of Detecting KATAKANA Variants in a Document | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
松下電器産業株式会社情報システム研究所 | ||||||||
著者所属 | ||||||||
松下電器産業株式会社情報システム研究所 | ||||||||
著者所属 | ||||||||
松下電器産業株式会社情報システム研究所 | ||||||||
著者所属 | ||||||||
松下電器産業株式会社ワープロ事業部 | ||||||||
著者所属 | ||||||||
松下電器産業株式会社情報システム研究所 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Information System Res. Lab. Matsushita Electric Industrial Co., Ltd | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Information System Res. Lab. Matsushita Electric Industrial Co., Ltd | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Information System Res. Lab. Matsushita Electric Industrial Co., Ltd | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Word Processor Division Matsushita Electric Industrial Co., Ltd | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Information System Res. Lab. Matsushita Electric Industrial Co., Ltd | ||||||||
著者名 |
久保田, 淳市
× 久保田, 淳市
|
|||||||
著者名(英) |
Jun-Ichi, Kubota
× Jun-Ichi, Kubota
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 文章中のカタカナ表現を統一する効率的なカタカナ表記不統一検出方式を開発した。従来、辞書の見出しと文章中のカタカナ表記をゆらぎを許容して比較し、不統一箇所を検出する方式が多く提案されたが、カタカナ語は外来語を中心に新語が多く、予め辞書を整備しておくことは困難である。本方式では、基本的には辞書を使わず、カタカナ文字列同士のゆらぎ規則を文章中のカタカナ語に適用し、カタカナ表記のゆらぎを検出する。事前分類したカタカナ表記を有向グラフ形式の中間形式に変換し、効率良く比較検出を行う。試作と実験を行った結果、再現率97.4% 適合率86.7%という結果を得た。 | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | A method to detect equivalents for approximate KATAKANA expressions from a Japanese document is proposed. As a Japanese phonetic symbol system (KATAKANA) cannot express precise pronunciation, a KATAKANA loan word can have many expressions. It is also difficult to maintain a dictionary with all KATAKANA expression items. To detect them without a dictionary, this algorithm transforms KATAKANA strings to directed graphs based on rewrite rules, then checks whether they have the same labeled path or not. This method can recall alternative KATAKANA expressions with an accuracy of 97.4%. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10115061 | |||||||
書誌情報 |
情報処理学会研究報告自然言語処理(NL) 巻 1993, 号 79(1993-NL-097), p. 111-117, 発行日 1993-09-16 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |