WEKO3
アイテム
テキスト構文構造類似度を用いた類似文検索手法
https://ipsj.ixsq.nii.ac.jp/records/19128
https://ipsj.ixsq.nii.ac.jp/records/191280e3eaf57-16cb-4749-bd03-30b88cb17afe
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2005 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2005-05-19 | |||||||
タイトル | ||||||||
タイトル | テキスト構文構造類似度を用いた類似文検索手法 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | New methods to retrieve sentences based on syntactic similarity | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
東京工業大学 大学院情報理工学研究科 計算工学専攻 | ||||||||
著者所属 | ||||||||
東京工業大学 大学院情報理工学研究科 計算工学専攻 | ||||||||
著者所属 | ||||||||
東京工業大学 大学院情報理工学研究科 計算工学専攻 | ||||||||
著者所属 | ||||||||
中京大学 情報科学部 認知科学科 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Computer Science Graduate School of Information Science and Engineering Tokyo Institute of Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Computer Science Graduate School of Information Science and Engineering Tokyo Institute of Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Computer Science Graduate School of Information Science and Engineering Tokyo Institute of Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Cognitive Science Major Graduate School of Computer and Cognitive Sciences Chukyo University | ||||||||
著者名 |
市川, 宙
橋本, 泰一
徳永, 健伸
田中, 穂積
× 市川, 宙 橋本, 泰一 徳永, 健伸 田中, 穂積
|
|||||||
著者名(英) |
Hiroshi, Ichikawa
Taiichi, Hashimoto
Takenobu, Tokunaga
Hozumi, Tanaka
× Hiroshi, Ichikawa Taiichi, Hashimoto Takenobu, Tokunaga Hozumi, Tanaka
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 本論文では,構文木付きコーパスから,構文的に類似した文を検索する手法を提案した.構文的類似度の計算手法としてはTree Kernel (Collins)が提案されている.しかし,Tree Kernelの類似度計算は時間を要するため,これを類似文検索に応用すると,検索速度が問題になる.検索時間短縮のためには,予め検索対象のインデックスを作成しておくのが一般的だが,Tree Kernelではその性質上,検索対象のインデックス化が困難である.そこで,Tree Kernelを近似する高速な新しいアルゴリズムとしてTree OverlappingとSubpath Setを提案した.これらのアルゴリズムは,Tree Kernelとは異なり,検索対象のインデックス化が可能なため,高速な検索が可能である.本論文ではTree Kernel Tree Overlapping Subpath Setの3種類のアルゴリズムについて述べ,実験結果を示し,比較した. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | This paper proposes a method to retrieve sentences which have a similar syntactic structure to the syntax tree of the query sentence. Tree Kernel has been proposed by Collins as a method to calculate structural similarity. However, the similarity retrieval by Tree Kernel is not practicable because Tree Kernel computation requires significant resources. A general method to shorten the retrieving time and to reduce required computation is indexing the corpora beforehand. However, in case of Tree Kernel, it is too hard to index the corpora. Therefore, we propose faster approximation algorithms: Tree Overlapping and Subpath Set. These algorithms are faster than Tree Kernel because indexing is possible. This paper describes three algorithms: Tree Kernel, Tree Overlapping and Subpath Set, and shows the result of evaluations and algorithm comparison. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10112482 | |||||||
書誌情報 |
情報処理学会研究報告データベースシステム(DBS) 巻 2005, 号 42(2005-DBS-136), p. 39-46, 発行日 2005-05-19 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |