WEKO3
アイテム
テキストマイニングのための情報抽出
https://ipsj.ixsq.nii.ac.jp/records/40485
https://ipsj.ixsq.nii.ac.jp/records/40485f681010d-c954-4d76-b470-cdc1277e8071
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2000 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2000-09-27 | |||||||
タイトル | ||||||||
タイトル | テキストマイニングのための情報抽出 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Information Extraction for Text Mining | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
日本アイ・ビー・エム(株)東京基礎研究所 | ||||||||
著者所属 | ||||||||
日本アイ・ビー・エム(株)東京基礎研究所 | ||||||||
著者所属 | ||||||||
日本アイ・ビー・エム(株)東京基礎研究所 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
IBM Research, Tokyo Research Laboratory, IBM Japan | ||||||||
著者所属(英) | ||||||||
en | ||||||||
IBM Research, Tokyo Research Laboratory, IBM Japan | ||||||||
著者所属(英) | ||||||||
en | ||||||||
IBM Research, Tokyo Research Laboratory, IBM Japan | ||||||||
著者名 |
長野, 徹
× 長野, 徹
|
|||||||
著者名(英) |
Tohru, Nagano
× Tohru, Nagano
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | テキストマイニングは、膨大なテキストデータからの知識発見を目的としているが、データマイニングと異なり、自由に記述されたテキストが対象となる。そのため、個々のテキストからいかに適切な情報を含むデータを抽出するかが重要な課題である。本研究の対象であるテキストマイニングのシステムでは、単語レベルの情報に加え、係り受け関係の情報や意図表現から得られる情報を付加することで、より多くの情報を含んだデータを抽出することができる。その際、テキストデータからは多種多様な情報が抽出可能であり、抽出される内容の頻度や重要性もまちまちである。そのため、統計的な処理を行うマイニングという観点からは、抽出する語の単位を考慮する必要がある。本稿では、大量のテキストデータから語を取り出す際にどのような単位での抽出が有効であるか示し、実験結果から得られた知見を示す。 | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | The extraction of knowledge/information from vast amounts of textual data has been the focus of much research in recent years. Text mining technology aims to find hidden knowledge in textual data. The varied information/term can be extracted from textual data, however all of terms from textual data are not representative for Text Mining. Thus, Text Mining requires the identification of domain specific terms in order to successfully mine linguistic data to extract concept correlations and trends. This paper presents a method for the extraction of significant terms and their use in the representation of textual data specifically for the Text Mining application. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10114171 | |||||||
書誌情報 |
情報処理学会研究報告情報学基礎(FI) 巻 2000, 号 91(2000-FI-060), p. 31-38, 発行日 2000-09-27 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |