WEKO3
アイテム
日本語文における名詞句の並列構造の推定およびその推敲支援への適用
https://ipsj.ixsq.nii.ac.jp/records/13365
https://ipsj.ixsq.nii.ac.jp/records/13365716246c3-4327-48c0-82e7-3da738b70c9f
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 1997 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | Journal(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 1997-07-15 | |||||||
タイトル | ||||||||
タイトル | 日本語文における名詞句の並列構造の推定およびその推敲支援への適用 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Analysis of Coordinate Structures in Japaness Documents, and Its Application to a Writing Tool | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 論文 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||||
資源タイプ | journal article | |||||||
その他タイトル | ||||||||
その他のタイトル | 自然言語処理 | |||||||
著者所属 | ||||||||
九州大学大学院システム情報科学研究科知能システム学専攻 | ||||||||
著者所属 | ||||||||
九州大学大学院工学研究科情報工学専攻/NTTデータ通信株式会社 | ||||||||
著者所属 | ||||||||
九州大学大学院システム情報科学研究科情報工学専攻 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Intelligent Systems, Kyushu University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Computer Science and Communication Engineering, Kyushu University/Presently with NTT Data Communications Systems | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Computer Science and Communication Engineering, Kyushu University | ||||||||
著者名 |
菅沼, 明
× 菅沼, 明
|
|||||||
著者名(英) |
Akira, Suganuma
× Akira, Suganuma
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 並列構造を含む文は,どの文節列とどの文節列が並列しているかという並列要素の認識において曖昧性を含みやすい.そのため,文章の書き手と読み手の間に食い違いが生じやすい.したがって,文章を推敲する観点から考えても,並列構造は無視できない.本研究は,名詞句の並列構造を推定し,書き手と読み手の間に食い違いが生じやすい並列構造を文章推敲の立場から指摘することを目的としている.本稿で述べる並列構造の推定法は,ユーザに煩わしさを感じさせない待ち時間で処理を行うために,字面の情報を主に利用する.表層的な情報を利用して文節に区切り,文節の性質と係り受け関係を推定する.それを用いて並列要素を推定する.並列要素の推定では,並列要素を決定する表層的な手がかり,構造的類似性および経験則に基づいて推定を行う.本手法の評価として,JICSTの抄録文(約5万字)を解析対象の文章として,並列構造の推定実験を行った.その結果,文章中に存在する並列のキーのうち97.3%を抽出できた.抽出した並列のキーのうち70.5%は,並列要素を正しく推定できた.また,SPARCstationELCを用いて処理時間を測定した結果,上記の抄録文中のすべての並列構造を推定するのに約7.1秒を要した.さらに,本手法を推敲支援へ適用するプロトタイプを作成した. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | In Japanese documents,sentences with some coordinate structures are often ambiguous when two components of the coordinate structure are recognized.It is often the case that the reader cannot recognize the coordinated components which the writer intends.As a result,some communication gaps occur between the writer and the reader.The writer must be careful about coordinate structures,so it is a useful function in writing to indicate the presence of coordinate structures in a sentence.In this paper,firstly,we describe the method for extracting coordinate structures consisting of noun phrases and estimating the coordinated components.Our method analyzes a Japanese document with only textual information,so that the writer can comfortably find information of coordinate structures in a few seconds.The method estimates the components using clues on Japanese characters,heuristics to determine the coordinate structure,and the structural similarity between two components.Secondly,we evaluate our method with JICST abstracts (about 50 thousand Japanese characters).This method extracts candidates of coordinate structures from the abstracts and estimates the coordinated components of each candidate.Consequently,97.3% of all the coordinate structures in the abstracts are extracted by this method.The precision,that is the proportion of the correctly estimated structures versus the extracted ones,is 70.5% Finally,we apply the method to a writing tool.We have implemented a prototype with this method. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN00116647 | |||||||
書誌情報 |
情報処理学会論文誌 巻 38, 号 7, p. 1296-1307, 発行日 1997-07-15 |
|||||||
ISSN | ||||||||
収録物識別子タイプ | ISSN | |||||||
収録物識別子 | 1882-7764 |