WEKO3
アイテム
技術文書からの用語知識の自動獲得方式の検討
https://ipsj.ixsq.nii.ac.jp/records/40093
https://ipsj.ixsq.nii.ac.jp/records/40093f8a1114b-22de-466b-a65a-2735fc650997
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2007 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2007-03-27 | |||||||
タイトル | ||||||||
タイトル | 技術文書からの用語知識の自動獲得方式の検討 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Word Knowledge Acquisition from Engineering Document | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
三菱電機(株)情報技術総合研究所 音声・言語処理技術部 | ||||||||
著者所属 | ||||||||
三菱電機(株)情報技術総合研究所 音声・言語処理技術部 | ||||||||
著者所属 | ||||||||
三菱電機(株)情報技術総合研究所 音声・言語処理技術部 | ||||||||
著者所属 | ||||||||
三菱電機(株)情報技術総合研究所 音声・言語処理技術部 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Mitsubishi Electric Corporation Information Technology R & D Center Human Media Technology Dept. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Mitsubishi Electric Corporation Information Technology R & D Center Human Media Technology Dept. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Mitsubishi Electric Corporation Information Technology R & D Center Human Media Technology Dept. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Mitsubishi Electric Corporation Information Technology R & D Center Human Media Technology Dept. | ||||||||
著者名 |
今村, 誠
× 今村, 誠
|
|||||||
著者名(英) |
Makoto, IMAMURA
× Makoto, IMAMURA
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 用語の意味分類は、情報検索、テキストマイニング、業務依存の文書チェック/ガイダンスなどの自然言語処理の応用システムにおける重要な知識源である。本稿では、新聞記事等を中心に検証されてきた単語共起分布に基づく意味分類推定方式を、約1.5万文規模の FA (Factory Automation)の設計仕様書に適用した実験結果を報告する。実験の結果、部品名や装置名のような体言的意味分類では、共起関係として「係り受け先」と「文節内の後方」が有効であり、作用や現象のような用言的な意味分類では、「係り受け元」が有効であることを確認した。属性は、両者の間の性質をもつが、特性、材質、状態など種々の用語を含むため、抽出が難しかった。また、「係り受け共起における表層格の区別の有無の効果」、「文節内共起の前方・後方の区別の有無の効果」、および、「複数種別の共起関係を併用した方式」についても考察した。 | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | The words with classified senses are the important knowledge resource for application systems using natural language processing, such as information retrieval, textmining, and the work-dependent document check and guidance systems. The word sense disambiguation methods based on the cooccurrence distribution are traditionally examined for sentences in the newspaper articles. This paper describes an experimental result of the word sense disambiguation methods applied to about fifteen thousand sentences contained in the design specification documents in the factory automation domain. In the result of the experiment, the governing words and the forward words in the bunsetsu segment support the sense estimation for the nominal words such as part names and abstract objects. The governed words support estimation for the verbal words such as actions and phenomena. The estimation for the attributive words is difficult due to various sub sense variation in the class such as characteristics, material, status. We also report the effect of the surface cases in the cooccurrence dependency, and the issues of quantity and quality of the training data. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10114171 | |||||||
書誌情報 |
情報処理学会研究報告情報学基礎(FI) 巻 2007, 号 34(2007-FI-086), p. 25-32, 発行日 2007-03-27 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |