WEKO3
アイテム
語彙空間の構造に基づく専門用語抽出
https://ipsj.ixsq.nii.ac.jp/records/48219
https://ipsj.ixsq.nii.ac.jp/records/482191b96b22a-9ad3-4316-987d-39cae15904dc
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2004 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2004-01-14 | |||||||
タイトル | ||||||||
タイトル | 語彙空間の構造に基づく専門用語抽出 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Term Extraction based on the structure of terminology set | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
東京大学大学院総合文化研究科 | ||||||||
著者所属 | ||||||||
東京大学情報基盤センター | ||||||||
著者所属 | ||||||||
東京大学情報基盤センター | ||||||||
著者所属(英) | ||||||||
en | ||||||||
University of Tokyo, Graduate School of Arts and Sciences | ||||||||
著者所属(英) | ||||||||
en | ||||||||
University of Tokyo, Information Technology Center | ||||||||
著者所属(英) | ||||||||
en | ||||||||
University of Tokyo, Information Technology Center | ||||||||
著者名 |
辻河亨
× 辻河亨
|
|||||||
著者名(英) |
Tohru, Tsujikawa
× Tohru, Tsujikawa
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 文書中から用語抽出を行う手法としては様々なものが提案されているが,多くはコーパスにおける用語候補の使用における統計量を利用するものであった。本稿では,これまで光が当てられていなかった用語を構成する語基間の関係について,そのグラフ構造に着目する。まずグラフにおける局所的ないし大域的構造を反映する用語抽出の指標を新たに提案し,その上で提案した用語抽出のいくつかの指標,およびそれらの組み合わせを,複数のコーパスを用いて実験的に評価した結果について報告する。 | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | Many methods to evaluate termhood of word sequences extracted from documents have been proposed. The majority of them use the statistics of term candidates appearing the corpus. The ignored side, however, is the graph structure whose nodes are basic terms that consist of complex terms. That is exactly what we focus on in this paper. We propose term extraction algorithms which utilize this graph structure. More precisely, the proposed methods assume the whole set of compound terms as a graph and applies web mining method to term extraction. The nodes are element words, the edges coincide with modifying relations between words in the definition of graph, and the importance of terms are ones used to find web communities or in ranking pages by Web search engines. Finally we experimentally evaluate the proposed algorithms with terminology dictionaries on Web. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10115061 | |||||||
書誌情報 |
情報処理学会研究報告自然言語処理(NL) 巻 2004, 号 1(2003-NL-159), p. 155-162, 発行日 2004-01-14 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |