WEKO3
アイテム
日本語文書に対する新しい索引検索方式 : 索引作成と検索の原理
https://ipsj.ixsq.nii.ac.jp/records/127664
https://ipsj.ixsq.nii.ac.jp/records/1276645f29bb17-0070-4796-8f23-acfe414e3a18
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
|
Item type | National Convention(1) | |||||
---|---|---|---|---|---|---|
公開日 | 1995-03-15 | |||||
タイトル | ||||||
タイトル | 日本語文書に対する新しい索引検索方式 : 索引作成と検索の原理 | |||||
タイトル | ||||||
言語 | en | |||||
タイトル | New indices for Japanese text : The principle of making index and searching index | |||||
言語 | ||||||
言語 | jpn | |||||
資源タイプ | ||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_5794 | |||||
資源タイプ | conference paper | |||||
著者所属 | ||||||
松下電器産業(株) マルチメディアシステム研究所 | ||||||
著者所属 | ||||||
松下電器産業(株) マルチメディアシステム研究所 | ||||||
著者所属 | ||||||
松下電器産業(株) マルチメディアシステム研究所 | ||||||
著者所属 | ||||||
松下電器産業(株) マルチメディアシステム研究所 | ||||||
著者所属(英) | ||||||
en | ||||||
Matsusita Electric Industrial, Co.,Ltd. | ||||||
著者所属(英) | ||||||
en | ||||||
Matsusita Electric Industrial, Co.,Ltd. | ||||||
著者所属(英) | ||||||
en | ||||||
Matsusita Electric Industrial, Co.,Ltd. | ||||||
著者所属(英) | ||||||
en | ||||||
Matsusita Electric Industrial, Co.,Ltd. | ||||||
論文抄録 | ||||||
内容記述タイプ | Other | |||||
内容記述 | 近年,実用化が進んでいる大規模な全文検索システムにおいては,単純な文字列枚索では高速化に限界があるため,文字成分表などのシグニチャファイル方式,あるいはn-gramによる転置ファイル方式などの高速化手法が提案されている.更に高速化を図るためには,n-gramではなく,検索文字列として意味のある通常の単語による転置ファイルを用いることが考えられるが,膠着語である日本語文書に対してその手法を適用しようとすると,形態素解析などの単語切り出しを行なわねばならず,その単語切り出しが完全に行なわれない限り,検索もれが避けられない.筆者らは,上の問題を解決する,検索もれのない単語索引検索方式を考案した.本方式では,単語による索引ファイルを構成するため,n-gramによる転置ファイルに比べて,原理的に高速化が可能であり,更に索引ファイルの容量も低減できる.本稿では,その単語索引作成方法と索引検索方法の原理について報告する. | |||||
書誌レコードID | ||||||
収録物識別子タイプ | NCID | |||||
収録物識別子 | AN00349328 | |||||
書誌情報 |
全国大会講演論文集 巻 第50回, 号 ソフトウェア, p. 41-42, 発行日 1995-03-15 |
|||||
出版者 | ||||||
言語 | ja | |||||
出版者 | 情報処理学会 |