WEKO3
アイテム
GAを用いたWebニュースの時系列情報を考慮したトピック抽出に関する研究
https://ipsj.ixsq.nii.ac.jp/records/9506
https://ipsj.ixsq.nii.ac.jp/records/9506b06b6950-58ef-4505-8df2-ca9df55bbf11
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2008 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | Journal(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2008-07-15 | |||||||
タイトル | ||||||||
タイトル | GAを用いたWebニュースの時系列情報を考慮したトピック抽出に関する研究 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Research for Extracting Topic of Web News with Time Series Information Using GA | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 特集:21世紀の情報環境 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||||
資源タイプ | journal article | |||||||
その他タイトル | ||||||||
その他のタイトル | データマイニング | |||||||
著者所属 | ||||||||
関西大学大学院総合情報学研究科 | ||||||||
著者所属 | ||||||||
関西大学総合情報学部 | ||||||||
著者所属 | ||||||||
関西大学総合情報学部 | ||||||||
著者所属 | ||||||||
関西大学大学院総合情報学研究科 | ||||||||
著者所属 | ||||||||
関西大学大学院総合情報学研究科 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Informatics, Kansai University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Faculty of Informatics, Kansai University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Faculty of Informatics, Kansai University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Informatics, Kansai University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Informatics, Kansai University | ||||||||
著者名 |
中村, 健二
× 中村, 健二
|
|||||||
著者名(英) |
Kenji, Nakamura
× Kenji, Nakamura
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 近年,インターネットを利用した日常的な情報収集活動において,即時性と信頼性に優れたWebニュースは人々の情報源として広く活用されている.しかし,日々時々刻々と増加する膨大な数のWebニュースから特定のトピックだけを抽出することは困難である.そのため,文書間の類似度を利用してトピックを分類する研究や時系列的な特性に基づきトピックを抽出する研究が活発に行われている.しかし,これら既存研究では,文書中に出現する単語群に依存した分類しかできず,また任意の期間に発生するトピックに適切な単語を関連付けできないという課題がある.そこで,本研究では,時系列的な特性に基づいて抽出したバースト語を用いて,バースト語間の関連を考慮した最新のトピックを抽出する手法を提案する.そして,既研究の従来手法と比較実験を行い,本提案手法の有用性を実証する. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | A Web News that is very immediate and reliable is used as a news resource at practical activity of collecting information on Internet in recent years. However, it is difficult to extract specific topics from huge Web News that is increasing momentarily. Therefore, there are some researches which extract the topics depend on a feature of time series information or classified topics using the similarities between documents. However, these past researches have some problems. Firstly, Web News is classified by term frequency in the document set. Secondly, topics that occur over any term can not have links with words that are relevant to a unique topic. Thus, in this paper, we propose a method to extract hot topics based on a relation between burst words that are extracted based on a feature of time series information. Then, we evaluate the effectiveness to compare the proposed method with the existing methods of early researches. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN00116647 | |||||||
書誌情報 |
情報処理学会論文誌 巻 49, 号 7, p. 2480-2492, 発行日 2008-07-15 |
|||||||
ISSN | ||||||||
収録物識別子タイプ | ISSN | |||||||
収録物識別子 | 1882-7764 |