WEKO3
-
RootNode
アイテム
話し言葉から書き言葉への変換における対訳単位分割
https://ipsj.ixsq.nii.ac.jp/records/164295
https://ipsj.ixsq.nii.ac.jp/records/1642955a368e88-c00d-420d-bbd3-347414c58913
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2015 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | National Convention(1) | |||||||||
---|---|---|---|---|---|---|---|---|---|---|
公開日 | 2015-03-17 | |||||||||
タイトル | ||||||||||
タイトル | 話し言葉から書き言葉への変換における対訳単位分割 | |||||||||
言語 | ||||||||||
言語 | jpn | |||||||||
キーワード | ||||||||||
主題Scheme | Other | |||||||||
主題 | 人工知能と認知科学 | |||||||||
資源タイプ | ||||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_5794 | |||||||||
資源タイプ | conference paper | |||||||||
著者所属 | ||||||||||
東工大 | ||||||||||
著者所属 | ||||||||||
東芝 | ||||||||||
著者名 |
下田, 裕晃
× 下田, 裕晃
× 住田, 一男
|
|||||||||
論文抄録 | ||||||||||
内容記述タイプ | Other | |||||||||
内容記述 | 統計的機械翻訳を用いて日本語の話し言葉を書き言葉に変換する。話し言葉は書き言葉にはない表現があり、また可読性が良くないという特徴がある。また、例えば機械翻訳は書き言葉向けに開発されてきたことから、音声認識結果を機械翻訳する場合は、話し言葉を書き言葉に整形することによって翻訳精度が向上する。本研究では、統計的機械翻訳のモデル学習で用いる対訳コーパスの対訳単位に着目した。発言単位で対応付けられた話し言葉と書き言葉との対訳コーパスに対して、文単位・文節単位など複数種類の対訳コーパスを生成した。これらの対訳コーパスを用いて話し言葉から書き言葉への変換に関する評価実験を行い、対訳単位の違いと変換精度の関係について検証を行った。 | |||||||||
書誌レコードID | ||||||||||
収録物識別子タイプ | NCID | |||||||||
収録物識別子 | AN00349328 | |||||||||
書誌情報 |
第77回全国大会講演論文集 巻 2015, 号 1, p. 203-204, 発行日 2015-03-17 |
|||||||||
出版者 | ||||||||||
言語 | ja | |||||||||
出版者 | 情報処理学会 |