WEKO3
アイテム
複数製品の紹介記事からの製品情報抽出 -製品記述パターンの分析-
https://ipsj.ixsq.nii.ac.jp/records/48794
https://ipsj.ixsq.nii.ac.jp/records/487949842b4da-f813-47e0-a51b-ab9530106d31
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 1999 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 1999-01-20 | |||||||
タイトル | ||||||||
タイトル | 複数製品の紹介記事からの製品情報抽出 -製品記述パターンの分析- | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Information Extraction from Newspaper Articles of Multiple Products -classification of expression patterns- | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
九州工業大学情報工学部知能情報工学科 | ||||||||
著者所属 | ||||||||
九州工業大学情報工学部知能情報工学科 | ||||||||
著者所属 | ||||||||
九州工業大学情報工学部知能情報工学科 | ||||||||
著者所属 | ||||||||
九州工業大学情報工学部知能情報工学科 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Artificial Intelligence, Kyushu Institute of Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Artificial Intelligence, Kyushu Institute of Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Artificial Intelligence, Kyushu Institute of Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Artificial Intelligence, Kyushu Institute of Technology | ||||||||
著者名 |
高尾, 宜之
× 高尾, 宜之
|
|||||||
著者名(英) |
Yoshiyuki, Takao
× Yoshiyuki, Takao
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 我々は,抽出すべき情報とその周辺の文字列との関係を記した”テンプレート”を用いて,字面処理による情報抽出処理の研究を行っており,新聞の製品紹介記事を題材とした実験で,テンプレートを用いた抽出処理の有効性を確認してきた.従来の研究では,1記事中に1個の製品情報が紹介されているとして,テンプレートを作成し,情報抽出を行っていた.しかし,新聞記事中には1記事中に複数の製品を紹介している記事も存在する.この様な記事の場合,従来用いている手法で情報抽出を行っても正しく抽出できなかった.そこで,本論文では,複数の製品が紹介されている記事から情報抽出を行うため製品記述パターンを分析した.その分析をもとに,複数製品情報を扱うためのテンプレートの枠組を提案する. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | We have been researching a textual analysis method for information extraction from newspaper articles with templates which describe the relationship between information to be extracted and its surrounding strings and have confirmed the effectiveness of our method by experiments. In our previous research, it was assumed that information about only one product is described in an article. However, some newspaper articles describe information about multiple products and our system failed to extract correct product information from such articles. To extend our system to deal with multiple products, we explored the articles with multiple products and classified the pattern of expressions that describe multiple information items and correspondence among them. In this paper, we show the result of our classification and propose the new form of templates which are able to match consecutive sentences and identify the correspondence among information items. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10115061 | |||||||
書誌情報 |
情報処理学会研究報告自然言語処理(NL) 巻 1999, 号 2(1998-NL-129), p. 117-124, 発行日 1999-01-20 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |