WEKO3
アイテム
衛星放送用機械翻訳の辞書の改修 (慣用表現を中心に)
https://ipsj.ixsq.nii.ac.jp/records/132095
https://ipsj.ixsq.nii.ac.jp/records/13209577037ea9-a146-4fd3-a1e5-fd0091bf6dba
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
|
Item type | National Convention(1) | |||||
---|---|---|---|---|---|---|
公開日 | 1997-09-24 | |||||
タイトル | ||||||
タイトル | 衛星放送用機械翻訳の辞書の改修 (慣用表現を中心に) | |||||
タイトル | ||||||
言語 | en | |||||
タイトル | Improvement of NHK's MT Dictionary for News English :Idiomatic Expressions | |||||
言語 | ||||||
言語 | jpn | |||||
資源タイプ | ||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_5794 | |||||
資源タイプ | conference paper | |||||
著者所属 | ||||||
NHK放送技術研究所 | ||||||
著者所属 | ||||||
NHK放送技術研究所 | ||||||
著者所属 | ||||||
NHK放送技術研究所 | ||||||
著者所属(英) | ||||||
en | ||||||
NHK Science & Technical Research Laboratories | ||||||
著者所属(英) | ||||||
en | ||||||
NHK Science & Technical Research Laboratories | ||||||
著者所属(英) | ||||||
en | ||||||
NHK Science & Technical Research Laboratories | ||||||
論文抄録 | ||||||
内容記述タイプ | Other | |||||
内容記述 | 機械翻訳において, 訳語選択は構文解析と並ふ重要な要素技術である。筆者らはこれまで, 辞書の改良という形で訳語選択の精度を向上させてきた。今回は「慣用表現」を利用した辞書の改良を行ったので報告する。慣用表現を利用することで, 適切な日本語訳を出力することが可能である。慣用表現の収集には, BBI英和連語活用辞典(丸善発行, 以下BBI共起辞書と呼ふ)の使用権を得て利用した。BBI共起辞書から, 見出し語と用例を含めて抽出し, 抽出した名詞句, 前置詞句, 動詞句を分析して, 新規に登録できるもののみを用いた。改修の結果, 基本辞書の語彙数は99850語(新規登録20850語)になり, ニュース専門辞書, 翻訳者用辞書を合わせると約15万語になった。改修した辞書を用いて翻訳評価テストを行なった結果, 全体の約5%の文が新規登録語を用いていた。その中で, 翻訳結果が良くなったのが, 64%, ほとんど同じものが33%, 悪くなったものが4%であった。これより, 全体では3%の文の翻訳の質が向上したことになり, 慣用表現の登録が有効であることを確認した。本稿ではその概要を報告する。 | |||||
書誌レコードID | ||||||
収録物識別子タイプ | NCID | |||||
収録物識別子 | AN00349328 | |||||
書誌情報 |
全国大会講演論文集 巻 第55回, 号 人工知能と認知科学, p. 72-73, 発行日 1997-09-24 |
|||||
出版者 | ||||||
言語 | ja | |||||
出版者 | 情報処理学会 |