WEKO3
アイテム
日本語意味解析システムSAGEの高速化・高精度化とコーパスによる精度評価
https://ipsj.ixsq.nii.ac.jp/records/11489
https://ipsj.ixsq.nii.ac.jp/records/11489a0f8ee95-7955-423d-ab4a-3d3458b5671e
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2002 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | Journal(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2002-09-15 | |||||||
タイトル | ||||||||
タイトル | 日本語意味解析システムSAGEの高速化・高精度化とコーパスによる精度評価 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Improvement of Speed and Accuracy of Japanese Semantic Analysis System SAGE and Its Accuracy Evaluation by Comparison with EDR Corpus | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 論文 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||||
資源タイプ | journal article | |||||||
その他タイトル | ||||||||
その他のタイトル | 自然言語処理 | |||||||
著者所属 | ||||||||
青山学院大学理工学部情報テクノロジー学科 | ||||||||
著者所属 | ||||||||
青山学院大学理工学研究科経営工学専攻/現在,株式会社NTTデータ | ||||||||
著者所属 | ||||||||
青山学院大学理工学研究科経営工学専攻/現在,日本電気株式会社 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Integrated Information Technology, Aoyama Gakuin University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Industrial and System Engineering, Aoyama Gakuin University/Presently with NTT Data Corporation | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Industrial and System Engineering, Aoyama Gakuin University/Presently with NEC Corporation | ||||||||
著者名 |
原田, 実
× 原田, 実
|
|||||||
著者名(英) |
Minoru, Harada
× Minoru, Harada
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 原田研究室ではこれまで,EDR電子化辞書に記載された情報を元に,日本語文を意味解析し格フレーム群に自動変換するシステムSAGE(Semantic frame Automatic GEnerator)を開発してきた.既存のSAGEは機能的には正しく動作するが,解析時間が文節数の指数オーダのため実利用するには問題があった.また解析精度に対する客観的な検証がされていなかった.そこで本研究では,Jiriらによる英文の構文木への語意割当て用の高速アルゴリズムの考え方をSAGEにおける係り受け木への語意と格決定用に適用して,SAGEの解析速度を向上させた.この結果,解析速度は文節数の線形オーダになった.また,EDRの解析済みコーパスを用いてSAGEの解析精度を自動的に評価するシステムを開発した.その結果,語意正解率は81.1%,格正解率は60.7%,格の宛先正解率は73.3%であった.これによってSAGEは速度面でも精度面でも意味解析システムとして実利用を開始できるレベルに至ったといえる. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | In the Harada laboratory,a semantic analysis system SAGE (Semantic frame Automatic GEnerator) has been developed,which converts a Japanese sentence into case frames based on the statistical information in the EDR electronic dictionary.Though SAGE operated correctly,there was such a problem in actual use that it requires the time of the exponential order of the number of clauses.In this research,based on Jiri's deterministic algorithm for assigning the word meaning to nodes of the parse tree of English sentence,the deterministic algorithm for deciding the meaning of words represented by nodes and the deep case of the relations among such nodes in the dependency tree of Japanese sentence is developed.As a result, the analytical speed became the linear order of the number of clauses.Moreover,the system to evaluate the analytical accuracy of SAGE is developed by using EDR analyzed Corpus.This evaluation revealed that the word meaning accuracy is 81.1%,the destination accuracy of case relation is 73.3% and the case relation accuracy is 60.7%.As a result,it can be said that SAGE has reached to the level that we can begin its acctual use for Japanese semantic analysis. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN00116647 | |||||||
書誌情報 |
情報処理学会論文誌 巻 43, 号 9, p. 2894-2902, 発行日 2002-09-15 |
|||||||
ISSN | ||||||||
収録物識別子タイプ | ISSN | |||||||
収録物識別子 | 1882-7764 |