WEKO3
アイテム
新聞記事からの用語集作成のためのテキスト分析
https://ipsj.ixsq.nii.ac.jp/records/48709
https://ipsj.ixsq.nii.ac.jp/records/487099052a46b-e658-488f-8582-c95a45adb088
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 1999 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 1999-11-25 | |||||||
タイトル | ||||||||
タイトル | 新聞記事からの用語集作成のためのテキスト分析 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Extraction patterns for automatic glossary generation from newspaper articles | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
計量計画研究所 | ||||||||
著者所属 | ||||||||
計量計画研究所/九州工業大学大学院 | ||||||||
著者所属 | ||||||||
富士通研究所 | ||||||||
著者所属 | ||||||||
富士通研究所 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
The Institute of Behavioral Sciences | ||||||||
著者所属(英) | ||||||||
en | ||||||||
The Institute of Behavioral Sciences/Kyushu Institute of Technology Graduate School | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Fujitsu Laboratories Ltd. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Fujitsu Laboratories Ltd. | ||||||||
著者名 |
木田, 敦子
× 木田, 敦子
|
|||||||
著者名(英) |
Atsuko, Kida
× Atsuko, Kida
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 新聞記事では、読者にとって未知の情報であっても、その内容がわかるように新語には定義や説明などが定型的な表現で記述されることが多い。我々は、このような定型表現を利用し、記事に含まれる語の定義、解説、性質に関する説明などの情報を抽出し、用語集の自動構築ができないかと考えている。抽出のための定型表現としては、係助詞「は」の題目提示機能による題目文を利用することが考えられるが、「は」は他にも多くの機能を持つため、題目文を絞り込むための制約条件が問題となる。国語学的知見から、「αはβ」の題目文に対する表層の条件を定義するのが難しいことは明らかである。そこで、本稿では分析結果から、()題目以外の「αはβ」文を定義するパターンを与えることで題目文を絞り込める、さらに絞り込んだ結果を分析することにより、()性質、説明などを表す表層の条件から、百科事典的な記述を含む文に絞り込める、という知見を得ることができた。本稿では、この分析過程および結果を中心に報告する。 | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | In newspaper articles, writers use a lot of typical expressions, which define, characterize and explain new information, to help the readers to understand the information. By applying the pattern analysis to the surface structure of these kinds of expressions, we assume it is possible to create a glossary automatically from texts such as newspaper articles. In this paper, we discuss about one of the functions of [α wa β] style sentences, where β often explains something about α. As it is difficult to give the patterns to select the function directly from the [α wa β] sentences, we define the patterns that exclude the other functions of 'wa'. The extraction results by applying these patterns include various information. To select the appropriate information for a glossary, we try to categorize these results and to clarify a class of information that shows some sort of characteristics of words. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10115061 | |||||||
書誌情報 |
情報処理学会研究報告自然言語処理(NL) 巻 1999, 号 95(1999-NL-134), p. 85-92, 発行日 1999-11-25 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |