WEKO3
アイテム
木構造と文字列類似度に基づく言語の同一性判定
https://ipsj.ixsq.nii.ac.jp/records/70725
https://ipsj.ixsq.nii.ac.jp/records/70725a9f06f26-359a-49d6-bed6-c4c4b5994c0f
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2010 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | Trans(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2010-10-25 | |||||||
タイトル | ||||||||
タイトル | 木構造と文字列類似度に基づく言語の同一性判定 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Identifying Same Languages Based on Tree Structure and String Similarity | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | オリジナル論文 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||||
資源タイプ | journal article | |||||||
著者所属 | ||||||||
山口大学大学院理工学研究科 | ||||||||
著者所属 | ||||||||
山口大学大学院理工学研究科 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Science and Engineering, Yamaguchi University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Science and Engineering, Yamaguchi University | ||||||||
著者名 |
呉, 靭
× 呉, 靭
|
|||||||
著者名(英) |
Ren, Wu
× Ren, Wu
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | Yamamoto-Data と SilGIS-Data は異なる学者によって編成された世界諸言語に関するデータである.両データに含まれる言語の同一性を判定する際には,言語の別名の存在や表記ゆれなどに対応する必要がある.本研究は Yamamoto-Data と SilGIS-Data に含まれる同一言語を見つけ出すことを目的とし,言語名に加えて言語系統分類も取り入れた手法を提案する.本論文では,まず,系統分類がなす木構造に基づき,言語系統木を定義する.次に,言語名と言語系統分類の曖昧な性質に対し,文字列類似度に基づく言語名と系統分類の類似度を導入し,これらの類似度を用いた言語同一性判定の手法を述べる.さらに,Yamamoto-Data と SilGIS-Data について処理した結果を提示し,提案した類似度が有用かつ効果的であることを示す. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | Yamamoto-Data and SilGIS-Data are world's languages data individually provided by different language researchers. Because of the existence of alternative names of languages as well as their ambiguities, some identical languages are expressed by different writings in Yamamoto-Data and SilGIS-Data. Therefore, it is important to identify if two writings express the same language. In order to cope with this problem, we introduce a new method to absorb these ambiguities by applying string alignment technique. Our experimental result for the two language data shows that our proposed method is usefull and effective. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AA11464803 | |||||||
書誌情報 |
情報処理学会論文誌数理モデル化と応用(TOM) 巻 3, 号 3, p. 24-35, 発行日 2010-10-25 |
|||||||
ISSN | ||||||||
収録物識別子タイプ | ISSN | |||||||
収録物識別子 | 1882-7780 | |||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |