Item type |
Journal(1) |
公開日 |
2014-07-15 |
タイトル |
|
|
タイトル |
係り受け木における機械翻訳のための品詞の教師なし学習 |
タイトル |
|
|
言語 |
en |
|
タイトル |
Unsupervised Learning of Part-of-Speech in Dependency Trees for Machine Translation |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
[一般論文(特選論文)] 統計的機械翻訳,品詞推定,ノンパラメトリックベイズ(論文賞受賞) |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_6501 |
|
資源タイプ |
journal article |
著者所属 |
|
|
|
情報通信研究機構/現在,日本電気株式会社 |
著者所属 |
|
|
|
情報通信研究機構 |
著者所属 |
|
|
|
情報通信研究機構 |
著者所属 |
|
|
|
東京工業大学 |
著者所属 |
|
|
|
東京工業大学 |
著者所属(英) |
|
|
|
en |
|
|
National Institute of Information and Communications Technology / Presently with NEC Corporation |
著者所属(英) |
|
|
|
en |
|
|
National Institute of Information and Communications Technology |
著者所属(英) |
|
|
|
en |
|
|
National Institute of Information and Communications Technology |
著者所属(英) |
|
|
|
en |
|
|
Tokyo Institute of Technology |
著者所属(英) |
|
|
|
en |
|
|
Tokyo Institute of Technology |
著者名 |
田村, 晃裕
渡辺, 太郎
隅田, 英一郎
高村, 大也
奥村, 学
|
著者名(英) |
Akihiro, Tamura
Taro, Watanabe
Eiichiro, Sumita
Hiroya, Takamura
Manabu, Okumura
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
本稿では,統語情報に基づく機械翻訳の翻訳性能を向上させるため,ノンパラメトリックベイズ法により,単語間の係り受け構造から各単語の品詞を推定する手法を提案する.提案手法は,単言語における無限ツリーモデル(Infinite Tree Model)を,原言語と目的言語の両言語を考慮するバイリンガルなシナリオに拡張した手法である.提案モデルでは,原言語の係り受け木における各品詞を隠れ状態とし,各隠れ状態は,原言語の単語とともに,対応する目的言語の単語をシンボルとして出力する.本稿では,原言語の単語と目的言語の単語を結合させて出力する「結合モデル」と,別々に出力する「独立モデル」を提案する.NTCIR-9の日英特許翻訳タスクにおける評価実験を通じて,提案手法により推定した日本語の品詞タグを使うことにより,forest-to-string翻訳システムの性能を改善できることを示す.また,独立モデルは,結合モデルが抱えるシンボルのスパースネス問題を解決し,既存の品詞を使う従来の翻訳よりもBLEUで1%以上性能を改善できることを示す. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
This paper proposes a nonparametric Bayesian method for inducing Part-of-Speech (POS) tags in dependency trees to improve the performance of machine translation (MT). In particular, we extend the monolingual infinite tree model to a bilingual scenario: each hidden state (POS tag) of a source-side dependency tree emits a source word together with its aligned target word, either jointly (joint model), or independently (independent model). Evaluations of Japanese-to-English translation on the NTCIR-9 data show that our induced Japanese POS tags for dependency trees improve the performance of a forest-to-string MT system. Our independent model gains over 1 point in BLEU by resolving the sparseness problem introduced in the joint model. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN00116647 |
書誌情報 |
情報処理学会論文誌
巻 55,
号 7,
p. 1665-1680,
発行日 2014-07-15
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
1882-7764 |