WEKO3
アイテム
メタ文字を含む文字列に対するVantage-Point木を用いた類似文字列検索
https://ipsj.ixsq.nii.ac.jp/records/98655
https://ipsj.ixsq.nii.ac.jp/records/986558b88c16d-4c84-4c02-bb10-d36c8ce9a2da
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2014 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2014-02-24 | |||||||
タイトル | ||||||||
タイトル | メタ文字を含む文字列に対するVantage-Point木を用いた類似文字列検索 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | An Approximate String Matching Method which Uses Vantage-Point Tree for Strings Containing Meta-Characters | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
(株)日立ソリューションズ東日本 | ||||||||
著者所属 | ||||||||
(株)日立ソリューションズ東日本 | ||||||||
著者所属 | ||||||||
(株)日立ソリューションズ東日本 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Hitachi Solutions East Japan, Ltd. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Hitachi Solutions East Japan, Ltd. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Hitachi Solutions East Japan, Ltd. | ||||||||
著者名 |
森川, 浩司
× 森川, 浩司
|
|||||||
著者名(英) |
Kohji, Molikawa
× Kohji, Molikawa
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 複数の数値から 1 つ選択することを表すメタ文字を含む文字列から,メタ文字を含まない文字列と類似した文字列を高速に抽出する技術を提案する.文字列類似度指標として編集距離を用い,検索の高速化のために Vantage-Point 木を用いる.メタ文字に対応するために数字文字列を単位文字とする編集距離を定義した.木の構築では編集距離として Hausdorff 距離を用い検索では上記定義の編集距離を用いることで検索の高速化を実現した.今回提案する技術は品番がさまざまな仕様の組み合わせで表現されている産業用製品・部品の品番管理と類似品番検索に有用な技術である. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | We propose an approximate string matching method for string containing meta-characters which mean selecting a single number from some choices, when query string does not contain the meta-characters. We use edit distance as similarity measure of strings and Vantage-Point tree for accelerating the search. We use Hausdorff distance as a distance metric for constructing Vantage-Point tree and a distance metric which treats a number string as a unit character for approximate matching of string containing the meta-characters for searching in Vantage-Point tree. The proposed method is valuable for managing and approximate search of industrial materials database whose item numbers are quite similar to each other. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10505667 | |||||||
書誌情報 |
研究報告数理モデル化と問題解決(MPS) 巻 2014-MPS-97, 号 11, p. 1-6, 発行日 2014-02-24 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |