WEKO3
-
RootNode
アイテム
確率伝播法を用いた文書検索用キーワードの自動抽出
https://ipsj.ixsq.nii.ac.jp/records/47721
https://ipsj.ixsq.nii.ac.jp/records/4772183426989-e45f-4cff-9373-e22a77cb4640
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2008 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2008-03-27 | |||||||
タイトル | ||||||||
タイトル | 確率伝播法を用いた文書検索用キーワードの自動抽出 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Automatic Extraction of Keywords for Document Retrieval with Belief Propagation | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
三菱電機株式会社情報技術総合研究所 | ||||||||
著者所属 | ||||||||
三菱電機株式会社情報技術総合研究所 | ||||||||
著者所属 | ||||||||
三菱電機株式会社情報技術総合研究所 | ||||||||
著者所属 | ||||||||
三菱電機株式会社情報技術総合研究所 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Information Technology R&D Center, Mitsubishi Electric Corporation | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Information Technology R&D Center, Mitsubishi Electric Corporation;Information Technology R&D Center, Mitsubishi Electric Corporation | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Information Technology R&D Center, Mitsubishi Electric Corporation | ||||||||
著者名 |
三上, 崇志
相川, 勇之
平野, 敬
岡田, 康裕
× 三上, 崇志 相川, 勇之 平野, 敬 岡田, 康裕
|
|||||||
著者名(英) |
Takashi, Mikami
Takeyuki, Aikawa
Takashi, Hirano
Yasuhiro, Okada
× Takashi, Mikami Takeyuki, Aikawa Takashi, Hirano Yasuhiro, Okada
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | カーナビや携帯電話などの電子機器の高機能化に伴い,製品の操作説明書などを電子化して機器上で検索・閲覧するニーズが高まっている.そのためキーボードがなく文字入力が困難な機器上でも,簡単に文書を検索できるインターフェースが求められている.そこで本報告では,ユーザの読み入力に応じてキーワードを自動提示するインターフェースの実現を目的として,検索対象文書からキーワードを自動抽出する方式を提案する.本方式は対象文書の論理構造を利用したブートストラップ手法により重要語句を求め,確率伝播法を用いたスコア付けにより重要語句からキーワードを高精度に抽出する.機器の操作説明書を用いた評価の結果,人間が説明書を読んで人手で抽出したキーワードの84%を本方式により自動抽出できた.また,読みを1文字入力して得た上位20個のキーワードに対して70%の適合率を得た. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | Demand for retrieval and browsing of the electronic operating manuals on the multifunctional equipments such as the car navigation systems and the mobile phones is certainly booming.The interface to facilitate retrieval of the documents is required, that can work on the keyboard-less equipments whose character input is difficult. This report proposed a method for automatically extracting important phrases from the documents for retrieval, in order to achieve the interface that presents the keywords correspond to several characters input by the user. Our proposed method extracts the important phrases by the bootstrap procedure and calculates their score by belief propagation, then extracts keywords from them. We have applied our proposed method to an operating manual and have confirmed that 84 percent of keywords can be automatically extracted, compared with manually extracted keywords. We also have confirmed to achieve about 70 percent precision for 20 keywords correspond to one character input. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10115061 | |||||||
書誌情報 |
情報処理学会研究報告自然言語処理(NL) 巻 2008, 号 33(2008-NL-184), p. 1-6, 発行日 2008-03-27 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |