WEKO3
アイテム
候補の接続関係を考慮した複合語用語抽出
https://ipsj.ixsq.nii.ac.jp/records/66276
https://ipsj.ixsq.nii.ac.jp/records/6627619801557-7301-410a-8c59-3e4738f6d0d8
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2009 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2009-09-21 | |||||||
タイトル | ||||||||
タイトル | 候補の接続関係を考慮した複合語用語抽出 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Term Extraction based on the Forward and Backward Connectivities of Candidates | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 単語・複合語 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
国立情報学研究所 | ||||||||
著者所属 | ||||||||
岡山大学大学院自然科学研究科 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
National Institute of Informatics | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Natural Science and Technology, Okayama University | ||||||||
著者名 |
小山, 照夫
× 小山, 照夫
|
|||||||
著者名(英) |
Teruo, Koyama
× Teruo, Koyama
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | テキストコーパスからの複合語用語抽出においては、抽出精度を低下させることなく、出現頻度の低い候補まで抽出することが重要である。従来主として用いられてきた統計的手法では、特に低頻度の用語候補の抽出に問題があった。我々はこれまでに用語候補となる複合語を構成する形態素の細分類に応じた位置制約を設定することにより、低頻度の候補まで抽出する方法を提案して来た。今回の発表では、この手法を改善し、多くの用語は文書中に少なくとも一回は提題的な形で出現するという予測の下に、候補となる形態素並びの前後接続関係に制約を設ける方法を提案する。実際にこの方法を適用することによりさらに低頻度の候補まで、抽出精度を落とすことなく取り出せることを確認した。 | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | In composite term extraction problems, it is important to extract candidates of relatively low occurrences in the corpora, with enough precision. In previous works, we have developed a method which can extract term candidates of low occurrences, using the revised classification of Japanese morphemes. In this paper, we propose a improved method considering forward and backward connective relations of candidates. Using the method, composite term candidates of less occurrences can be extracted with high precision. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10115061 | |||||||
書誌情報 |
研究報告自然言語処理(NL) 巻 2009-NL-193, 号 13, p. 1-6, 発行日 2009-09-21 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |