WEKO3
アイテム
話し言葉における出現位置情報を用いたキーワード抽出
https://ipsj.ixsq.nii.ac.jp/records/48032
https://ipsj.ixsq.nii.ac.jp/records/48032e4fe8b86-264e-48c1-b9b3-f6f2dee8288d
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2005 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2005-05-26 | |||||||
タイトル | ||||||||
タイトル | 話し言葉における出現位置情報を用いたキーワード抽出 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Keyword Extraction for Spomtameous Speech | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
東京理科大学大学院 理工学研究科 | ||||||||
著者所属 | ||||||||
東京理科大学大学院 理工学研究科 | ||||||||
著者所属 | ||||||||
東京理科大学大学院 理工学研究科 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Tokyo University of Science | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Tokyo University of Science | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Tokyo University of Science | ||||||||
著者名 |
福田, 雅志
× 福田, 雅志
|
|||||||
著者名(英) |
Masashi, Fukuda
× Masashi, Fukuda
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | テキスト内のキーワードを抽出する手法は従来から研究されており、重要文抽出や要約において数多く利用されている。キーワード抽出では、タイトルや段落や章などの文書構造を利用する手法が有効であると知られている。しかし、話し言葉には句読点など文書構造を示すものがなく、そのままでは書き言葉を対象とした手法を摘要することができない。そこで本稿では、話し言葉のキーワード抽出を目的とし、テキストを適切なブロックに分割する事で文書構造の利用を可能にする手法を提案する。ブロックへの区切りの推定には、ブロック毎の語句の出現傾向を利用する。本稿で提案した手法と文書前谷に対してTF-IDF重み付けを行う手法の正解率を比較した結果、本稿の手法の有効性が確認された。 | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | In this paper we propose a method for keyword extrraction from spontaneous speech texts. Document structure,shown by punctuation marks,chapters,etc.,is considered as an effective issue for keyword extraction.However,we can not use documento structure information in processing spomtameous speech.Thus we propose a method to devide a text into three blocks shich can be assumed asa document structure.We had experiments on keyword extraction and the results indicated that our method had better precision rate comparing to a simple TF-IDF method | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10115061 | |||||||
書誌情報 |
情報処理学会研究報告自然言語処理(NL) 巻 2005, 号 50(2005-NL-167), p. 1-6, 発行日 2005-05-26 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |