WEKO3
アイテム
文書構造と共起表現を用いた文書ランキング手法
https://ipsj.ixsq.nii.ac.jp/records/129700
https://ipsj.ixsq.nii.ac.jp/records/129700388f1f06-d2b5-4c62-8a87-234f292f9a33
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
|
Item type | National Convention(1) | |||||
---|---|---|---|---|---|---|
公開日 | 1996-03-06 | |||||
タイトル | ||||||
タイトル | 文書構造と共起表現を用いた文書ランキング手法 | |||||
タイトル | ||||||
言語 | en | |||||
タイトル | A Ranking Strategy Incorpolating Document Structure and Cooccurrence | |||||
言語 | ||||||
言語 | jpn | |||||
資源タイプ | ||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_5794 | |||||
資源タイプ | conference paper | |||||
著者所属 | ||||||
松下電器産業(株) マルチメデイアシステム研究所 | ||||||
著者所属 | ||||||
松下電器産業(株) マルチメデイアシステム研究所 | ||||||
著者所属(英) | ||||||
en | ||||||
Matsushita Electric Industrial, Co., Ltd. | ||||||
著者所属(英) | ||||||
en | ||||||
Matsushita Electric Industrial, Co., Ltd. | ||||||
論文抄録 | ||||||
内容記述タイプ | Other | |||||
内容記述 | ベクトル空間モデルなどの確率モデルなどの非完全一致モデルに基づく情報検索手法では,何らかの類似尺度によって文書のランキングを行うが,その類似計算には単語の頻度情報や分布情報といった統計的な情報を用いるものが一般的である. しかし,検索意図に適合する文書の弁別を,出現単語の統計量に現れた特徴のみで行うことには限界があるため,近年では,自然言語処理技術を用いて,文書に現れた構文的/意味的な情報(言語的情報)を抽出し,その情報を類似度計算にとり入れて,文書ランキングを高精度化しようとするアプローチが提案されている. 我々は,従来の統計的なアプローチに加え,文書の構造情報を用いて重要部分を判別し,さらに,その重要部分での単語の句内共起表現を抽出して利用することにより,文書ランキングを高精度化する手法を考案した.本稿では,その手法と,それを特許文書検索に対して適用した実験結果について述べる. | |||||
書誌レコードID | ||||||
収録物識別子タイプ | NCID | |||||
収録物識別子 | AN00349328 | |||||
書誌情報 |
全国大会講演論文集 巻 第52回, 号 データベース, p. 203-204, 発行日 1996-03-06 |
|||||
出版者 | ||||||
言語 | ja | |||||
出版者 | 情報処理学会 |