2024-03-29T23:48:15Zhttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_oaipmhoai:ipsj.ixsq.nii.ac.jp:000485212024-03-29T05:26:34Z01164:04179:04229:04233
話し言葉の形態素解析Morphological Analysis of Spoken Japanesejpnhttp://id.nii.ac.jp/1001/00048521/Technical Reporthttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_action_common_download&item_id=48521&item_no=1&attribute_id=1&file_no=1Copyright (c) 2001 by the Information Processing Society of Japan奈良先端科学技術大学院大学情報科学研究科千葉大学文学部行動科学科松本, 裕治伝, 康晴話し言葉研究のための基礎データとしてタグ付きコーパスの蓄積が進んでいる。言語データへの最も基本的なタグは単語わかち書きと品詞付与である。本稿では、書き起こされた話し言葉データへの形態素タグ付け自動化のための問題点について考察する。まず、書き言葉と対比して見られる話し言葉の特徴と問題点データが解析精度にどのように貢献するかを観察する。Tagged corpora are indispensable resource for linguistic research. Several projects are now under way for constructing spoken language corpora. The foundamental annotation to corpora is segmentation and part of speech tagging. In this paper, we examine the issues peculiar to spoken language annotation compared with written language. First, we summarize the characteristics and issues spoken language. We then report some experiments of automatic part of speech tagging based on statistical learning algorithm, through which we see how a small size of tagged corpus is effective in improving the accuracy of the automatic taggers.AN10115061情報処理学会研究報告自然言語処理(NL)200154(2001-NL-143)49542001-05-312009-06-30