@techreport{oai:ipsj.ixsq.nii.ac.jp:02007732, author = {安永,真子 and 吉丸,直希 and 波多野,賢治}, issue = {6}, month = {Feb}, note = {現在の機械翻訳は大量の対訳コーパスを用いた手法が主流であるが,コーパス資源の乏しい低リソース言語への適用には限界がある.既存の教師なし翻訳や転移学習に基づく手法の多くは,依然として一定規模の単一言語データや類似言語の存在を必要とし,汎用的な展開に課題が残る.本研究では,少量の語彙と言語学的知識を統合する人間の翻訳プロセスに着目し,言語構造データベース(WALS)を活用したルールベースとニューラルモデルのハイブリッド手法を提案する.本手法では,1)WALSの統語的特徴に基づく構文テンプレートの構築,2)対訳辞書による語彙写像,3)事前学習済み言語モデルを用いた文法的補正,という三段階で構成される.約1,000万文字規模の単言語コーパスのみを用いた環境下で翻訳精度を測定したところ,chrF++ スコアにおいて標準的なSeq2Seqモデルを上回り,対訳コーパスに依存せず文法資源を活用するアプローチが低リソース環境下で有効であることを示した.}, title = {語の並び替えと文の補正に基づく低リソース言語のための機械翻訳}, year = {2026} }