ログイン 新規登録
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. 研究報告
  2. 情報基礎とアクセス技術(IFAT)
  3. 2005
  4. 42(2005-FI-079)

テキスト構文構造類似度を用いた類似文検索手法

https://ipsj.ixsq.nii.ac.jp/records/40189
https://ipsj.ixsq.nii.ac.jp/records/40189
a38a688d-72ce-41ac-b2fe-0aa12a8e137c
名前 / ファイル ライセンス アクション
IPSJ-FI05079006.pdf IPSJ-FI05079006.pdf (302.9 kB)
Copyright (c) 2005 by the Information Processing Society of Japan
オープンアクセス
Item type SIG Technical Reports(1)
公開日 2005-05-19
タイトル
タイトル テキスト構文構造類似度を用いた類似文検索手法
タイトル
言語 en
タイトル New methods to retrieve sentences based on syntactic similarity
言語
言語 jpn
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_18gh
資源タイプ technical report
著者所属
東京工業大学 大学院情報理工学研究科 計算工学専攻
著者所属
東京工業大学 大学院情報理工学研究科 計算工学専攻
著者所属
東京工業大学 大学院情報理工学研究科 計算工学専攻
著者所属
中京大学 情報科学部 認知科学科
著者所属(英)
en
Department of Computer Science Graduate School of Information Science and Engineering Tokyo Institute of Technology
著者所属(英)
en
Department of Computer Science Graduate School of Information Science and Engineering Tokyo Institute of Technology
著者所属(英)
en
Department of Computer Science Graduate School of Information Science and Engineering Tokyo Institute of Technology
著者所属(英)
en
Cognitive Science Major Graduate School of Computer and Cognitive Sciences Chukyo University
著者名 市川, 宙 橋本, 泰一 徳永, 健伸 田中, 穂積

× 市川, 宙 橋本, 泰一 徳永, 健伸 田中, 穂積

市川, 宙
橋本, 泰一
徳永, 健伸
田中, 穂積

Search repository
著者名(英) Hiroshi, Ichikawa Taiichi, Hashimoto Takenobu, Tokunaga Hozumi, Tanaka

× Hiroshi, Ichikawa Taiichi, Hashimoto Takenobu, Tokunaga Hozumi, Tanaka

en Hiroshi, Ichikawa
Taiichi, Hashimoto
Takenobu, Tokunaga
Hozumi, Tanaka

Search repository
論文抄録
内容記述タイプ Other
内容記述 本論文では,構文木付きコーパスから,構文的に類似した文を検索する手法を提案した.構文的類似度の計算手法としてはTree Kernel (Collins)が提案されている.しかし,Tree Kernelの類似度計算は時間を要するため,これを類似文検索に応用すると,検索速度が問題になる.検索時間短縮のためには,予め検索対象のインデックスを作成しておくのが一般的だが,Tree Kernelではその性質上,検索対象のインデックス化が困難である.そこで,Tree Kernelを近似する高速な新しいアルゴリズムとしてTree OverlappingとSubpath Setを提案した.これらのアルゴリズムは,Tree Kernelとは異なり,検索対象のインデックス化が可能なため,高速な検索が可能である.本論文ではTree Kernel Tree Overlapping Subpath Setの3種類のアルゴリズムについて述べ,実験結果を示し,比較した.
論文抄録(英)
内容記述タイプ Other
内容記述 This paper proposes a method to retrieve sentences which have a similar syntactic structure to the syntax tree of the query sentence. Tree Kernel has been proposed by Collins as a method to calculate structural similarity. However, the similarity retrieval by Tree Kernel is not practicable because Tree Kernel computation requires significant resources. A general method to shorten the retrieving time and to reduce required computation is indexing the corpora beforehand. However, in case of Tree Kernel, it is too hard to index the corpora. Therefore, we propose faster approximation algorithms: Tree Overlapping and Subpath Set. These algorithms are faster than Tree Kernel because indexing is possible. This paper describes three algorithms: Tree Kernel, Tree Overlapping and Subpath Set, and shows the result of evaluations and algorithm comparison.
書誌レコードID
収録物識別子タイプ NCID
収録物識別子 AN10114171
書誌情報 情報処理学会研究報告情報学基礎(FI)

巻 2005, 号 42(2005-FI-079), p. 39-46, 発行日 2005-05-19
Notice
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc.
出版者
言語 ja
出版者 情報処理学会
戻る
0
views
See details
Views

Versions

Ver.1 2025-01-22 12:33:09.324573
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3