WEKO3
アイテム
文書の話題構成に基づく重要語の抽出
https://ipsj.ixsq.nii.ac.jp/records/40618
https://ipsj.ixsq.nii.ac.jp/records/4061807164c0e-5bd0-49b7-8633-64d29d54bc13
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 1998 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 1998-07-17 | |||||||
タイトル | ||||||||
タイトル | 文書の話題構成に基づく重要語の抽出 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Automatic Keyword Extraction based on the Topic Structure of a Text | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
富士通研究所 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Fujitsu Laboratories Ltd. | ||||||||
著者名 |
仲尾, 由雄
× 仲尾, 由雄
|
|||||||
著者名(英) |
Yoshio, Nakao
× Yoshio, Nakao
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 文書の概要把握の支援用の見出しの自動生成を目指して行った基礎的実験について報告する。長めの報告書の前書き部を除いた3節それぞれに対し、(a)情報検索で広く用いられているtf×idf法による評価の高い語を抽出する場合、(b)文書内単語出現確率に基づく単語の情報量の大きい語を抽出する場合、(c)節内単語出現確率が文書内単語出現確率より有意に高い語を抽出する場合を比較実験し、その性質を分析した。その結果、(1)対象節とその周辺の節との間の出現確率の異なり、(2)対象節内における単語の出現箇所の集中度、の両者の評価を組み合わせることが効果的であるとの結論を得た。tf×idf法と単語出現確率の統計モデルとの関係に関する考察も行っている。 | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | This paper reports an experiment made for automatic generation of headings, which are intended to be attached to an automatically generated summary of a text, especially of a long one. The experiment lists up words of high relative frequency in a text section in the order of significance, and examines their correlation with words taken from headings in the section. The result indicates two important factors to analyze word occurrence distribution: the difference of word density among through sections and the biased local distribution in a section. This paper also discusses the relation between an IR model of tf×idf and a stochastic model of likelihood ratio test of goodness-of-fit. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10114171 | |||||||
書誌情報 |
情報処理学会研究報告情報学基礎(FI) 巻 1998, 号 60(1998-FI-050), p. 1-8, 発行日 1998-07-17 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |