2024-03-29T06:24:50Zhttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_oaipmhoai:ipsj.ixsq.nii.ac.jp:001320812023-11-17T02:17:36Z06504:08134:08137
日英対訳コーパスを用いた文章外照応ゼロ代名詞解析規則の自動獲得Automatic Extraction of Rules for Anaphora Resolution of Japanese Zero Pronoun with Deictic Reference from Aligned Sentence Parisjpnhttp://id.nii.ac.jp/1001/00132266/Conference Paperhttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_action_common_download&item_id=132081&item_no=1&attribute_id=1&file_no=1NTTコミュニケーション科学研究所中岩, 浩巳自然言語では通常, 相手(読み手もしくは聞き手)に容易に判断できる要素は, 文章上表現しない場合が多い。特に, 日本語では格要素が省略される傾向が強いのに対し, 英語では訳出上必須要素となるため, 日英機械翻訳システムにおいては, この省略格要素(ゼロ代名詞)の照応解析技術は重要となる。日本語ゼロ代名詞の照応解析に関しては, 従来から様々な手法が提案されているが, 翻訳対象分野を限定しない機械翻訳への応用を考えると, 解析精度, 対象とする言語現象, 必要となる知識量の面で問題があった。これに対しては, 分類した用言の意味属性, 様相表現, 接続表現を用いて指示対象を決定する機械翻訳に適した照応解析手法が提案されている。しかしこれら従来手法では, 基本的に人間が照応解析規則を作成する必要があるため, 網羅的な照応解析規則の作成には, かなりの専門知識と労力が必要となる。さらに, 解析対象分野に応じて, 指示対象の傾向の異なるゼロ代名詞が存在するので, 分野に依存した規則を作成する必要がでてくるが, 分野毎に規則を作成することはその労力を考えると不可能である。よって, このゼロ代名詞の照応解析ルールを効率的に獲得する手法の実現が望まれている。近年, 既存のコーパスを用いて, コーパス中の言語現象を分析し, その結果を基に照応解析規則を抽出する手法が提案されている。しかし, それらの手法は解析対象言語のコーパスのみを使用するため, その言語ではほぼ常にゼロ化される要素への規則を抽出することは困難である。よって, 利用するコーパスとしては, 解析対象の言語と他の言語の対訳コーパス利用することが有望である, 特に, 日本語と英語のように言語族が異なる場合には, 省略現象の傾向が異なるため, ある言語の文ではゼロ化されている要素が, その文の対訳文では明記される場合が多々有り, その利用が有望である。本稿では, このような目的を達成するための第1段として, 対訳関係にある日英の対訳文からなる日英対訳コーパスから, 文章外照応ゼロ代名詞の照応解析規則を抽出する手法を提案する。AN00349328全国大会講演論文集第55回人工知能と認知科学45461997-09-242015-01-20