Item type |
Trans(1) |
公開日 |
2014-11-27 |
タイトル |
|
|
タイトル |
メタ文字を含む文字列に対するVantage-Point木を用いた類似文字列検索 |
タイトル |
|
|
言語 |
en |
|
タイトル |
An Approximate String Matching Method Which Uses Vantage-Point Tree for Strings Containing Meta-characters |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
[オリジナル論文] 編集距離,ハウスドルフ距離,VP木,メタ文字列,類似文字列検索 |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_6501 |
|
資源タイプ |
journal article |
著者所属 |
|
|
|
株式会社日立ソリューションズ東日本 |
著者所属 |
|
|
|
株式会社日立ソリューションズ東日本 |
著者所属 |
|
|
|
株式会社日立ソリューションズ東日本 |
著者所属(英) |
|
|
|
en |
|
|
Hitachi Solutions East Japan, Ltd. |
著者所属(英) |
|
|
|
en |
|
|
Hitachi Solutions East Japan, Ltd. |
著者所属(英) |
|
|
|
en |
|
|
Hitachi Solutions East Japan, Ltd. |
著者名 |
森川, 浩司
高梨, 勝敏
宗形, 聡
|
著者名(英) |
Kohji, Molikawa
Katsutoshi, Takanashi
Satoshi, Munakata
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
複数の数値から1つ選択することを表すメタ文字を含む文字列から,メタ文字を含まない文字列と類似した文字列を高速に抽出する技術を提案する.文字列類似度指標として編集距離を用い,検索の高速化のためにVantage-Point木を用いる.メタ文字に対応するために数字文字列を単位文字とする編集距離を定義した.木の構築では編集距離としてHausdorff距離を用い検索では上記定義の編集距離を用いることで検索の高速化を実現した.今回提案する技術は品番がさまざまな仕様の組合せで表現されている産業用製品・部品の品番管理と類似品番検索に有用な技術である. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
We propose an approximate string matching method for string containing meta-characters which mean selecting a single number from some choices, when query string does not contain the meta-characters. We use edit distance as similarity measure of strings and Vantage-Point tree for accelerating the search. We use Hausdorff distance as a distance metric for constructing Vantage-Point tree and a distance metric which treats a number string as a unit character for approximate matching of string containing the meta-characters for searching in Vantage-Point tree. The proposed method is valuable for managing and approximate search of industrial materials database whose item numbers are quite similar to each other. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AA11464803 |
書誌情報 |
情報処理学会論文誌数理モデル化と応用(TOM)
巻 7,
号 2,
p. 27-35,
発行日 2014-11-27
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
1882-7780 |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |