@article{oai:ipsj.ixsq.nii.ac.jp:00102187, author = {田村, 晃裕 and 渡辺, 太郎 and 隅田, 英一郎 and 高村, 大也 and 奥村, 学 and Akihiro, Tamura and Taro, Watanabe and Eiichiro, Sumita and Hiroya, Takamura and Manabu, Okumura}, issue = {7}, journal = {情報処理学会論文誌}, month = {Jul}, note = {本稿では,統語情報に基づく機械翻訳の翻訳性能を向上させるため,ノンパラメトリックベイズ法により,単語間の係り受け構造から各単語の品詞を推定する手法を提案する.提案手法は,単言語における無限ツリーモデル(Infinite Tree Model)を,原言語と目的言語の両言語を考慮するバイリンガルなシナリオに拡張した手法である.提案モデルでは,原言語の係り受け木における各品詞を隠れ状態とし,各隠れ状態は,原言語の単語とともに,対応する目的言語の単語をシンボルとして出力する.本稿では,原言語の単語と目的言語の単語を結合させて出力する「結合モデル」と,別々に出力する「独立モデル」を提案する.NTCIR-9の日英特許翻訳タスクにおける評価実験を通じて,提案手法により推定した日本語の品詞タグを使うことにより,forest-to-string翻訳システムの性能を改善できることを示す.また,独立モデルは,結合モデルが抱えるシンボルのスパースネス問題を解決し,既存の品詞を使う従来の翻訳よりもBLEUで1%以上性能を改善できることを示す., This paper proposes a nonparametric Bayesian method for inducing Part-of-Speech (POS) tags in dependency trees to improve the performance of machine translation (MT). In particular, we extend the monolingual infinite tree model to a bilingual scenario: each hidden state (POS tag) of a source-side dependency tree emits a source word together with its aligned target word, either jointly (joint model), or independently (independent model). Evaluations of Japanese-to-English translation on the NTCIR-9 data show that our induced Japanese POS tags for dependency trees improve the performance of a forest-to-string MT system. Our independent model gains over 1 point in BLEU by resolving the sparseness problem introduced in the joint model.}, pages = {1665--1680}, title = {係り受け木における機械翻訳のための品詞の教師なし学習}, volume = {55}, year = {2014} }