2024-03-29T00:54:17Zhttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_oaipmhoai:ipsj.ixsq.nii.ac.jp:000740642023-04-27T10:00:04Z01164:05159:06316:06416
Training MST Parsers from Partially Annotated Corpora部分的アノテーションから学習可能な係り受け解析器eng構文解析・検索・文法http://id.nii.ac.jp/1001/00074064/Technical Reporthttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_action_common_download&item_id=74064&item_no=1&attribute_id=1&file_no=1Copyright (c) 2011 by the Information Processing Society of Japan京都大学学術情報メディアセンター京都大学情報学研究科国立情報学研究所京都大学情報学研究科森, 信介Flannery, Daniel宮尾, 祐介Neubig, Graham本論文では、部分的アノテーションコーパスから学習することができる最大全域木に基づく係り受け解析を提案する。この枠組みにより、様々な言語資源が利用可能になる。この枠組みは、分野適応などの現実的な状況においてとりわけ重要である。日本語を対象とした係り受け解析の実験の結果、フルアノテーションコーパスのみから学習可能である従来手法と同程度の解析精度が得られることと部分的アノテーションコーパスの利用による分野適応が可能であることを確認した。We introduce a maximum spanning tree (MST) dependency parser that can be trained from partially annotated corpora, allowing us to maximize the use of available linguistic resources and reduce the costs of preparing new training data. This is especially important for domain adaptation in a real-world situation. Experiments on Japanese dependency parsing show that this approach allows for rapid training and achieves accuracy comparable to parsers trained on fully annotated data.AN10442647研究報告音声言語情報処理(SLP)2011-SLP-8613172011-05-092011-04-28