WEKO3
-
RootNode
アイテム
連語辞書の自動作成と評価
https://ipsj.ixsq.nii.ac.jp/records/122373
https://ipsj.ixsq.nii.ac.jp/records/122373acf78148-2dda-41fd-a40e-8a05bce5c1df
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
|
Item type | National Convention(1) | |||||
---|---|---|---|---|---|---|
公開日 | 1992-09-28 | |||||
タイトル | ||||||
タイトル | 連語辞書の自動作成と評価 | |||||
タイトル | ||||||
言語 | en | |||||
タイトル | An Automatic Collocation Acqisition Method and its Estimation | |||||
言語 | ||||||
言語 | jpn | |||||
資源タイプ | ||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_5794 | |||||
資源タイプ | conference paper | |||||
著者所属 | ||||||
(NEC C&Cシステム研究所) | ||||||
著者所属 | ||||||
(NEC C&Cシステム研究所) | ||||||
著者所属(英) | ||||||
en | ||||||
C&C Systems Research Laboratories,NEC Corporation | ||||||
著者所属(英) | ||||||
en | ||||||
C&C Systems Research Laboratories,NEC Corporation | ||||||
論文抄録 | ||||||
内容記述タイプ | Other | |||||
内容記述 | 日本語解析に連語(単語の共起関係)を利用することで解析精度を向上させることができる。しかし、実際に連語を利用するにあたっては、連語のデータをどのようにして収集するかという点が大きな問題となる。田中は、技術文献・新聞記事などから手作業によって共起関係データを抽出している。手作業による作成はデータの信頼性が高いが、作成のためのコストが非常に大きいという問題がある。それを解決するために、テキストを解析し自動的に共起関係を抽出する方法も提案されている。この方法の問題は、解析の精度などの関係から誤ったデータが抽出されることにある。そこで誤りを減らすために、抽出対象として解析結果の曖昧さの少ない部分を使ったり、対象テキストを限定するなどの対策がとられている。筆者らは、かな漢字変換の解析精度を向上させるために大量の連語を用意するという方針を立てて検討を行っており、そのための手段のひとつとして形態素解析を利用した自動抽出方式を検討してきた。本方式では誤ったデータの抽出を抑さえるために、単語の品詞に基づいたヒューリスティックな規則を利用している。本稿では、ヒューリスティックな規則を用いた抽出方式を提案し、作成した辞書の評価結果について報告する。 | |||||
書誌レコードID | ||||||
収録物識別子タイプ | NCID | |||||
収録物識別子 | AN00349328 | |||||
書誌情報 |
全国大会講演論文集 巻 第45回, 号 人工知能及び認知科学, p. 183-184, 発行日 1992-09-28 |
|||||
出版者 | ||||||
言語 | ja | |||||
出版者 | 情報処理学会 |