WEKO3
アイテム
非対訳コーパスを用いた訳語関係の抽出
https://ipsj.ixsq.nii.ac.jp/records/49155
https://ipsj.ixsq.nii.ac.jp/records/49155796c1f1a-03ce-41ac-b59e-c0c6488b3d8a
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 1995 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 1995-11-17 | |||||||
タイトル | ||||||||
タイトル | 非対訳コーパスを用いた訳語関係の抽出 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Extraction of Word Translations from Non - Alinged Corpus | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
東京大学工学部 | ||||||||
著者所属 | ||||||||
東京大学教育用計算機センター | ||||||||
著者所属(英) | ||||||||
en | ||||||||
The University of Tokyo Faculty of Engineering | ||||||||
著者所属(英) | ||||||||
en | ||||||||
The University of Tokyo Educational Computer Centre | ||||||||
著者名 |
田中, 久美子
× 田中, 久美子
|
|||||||
著者名(英) |
Kumiko, Tanaka
× Kumiko, Tanaka
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 対訳でない独立のコーパスを用いて訳語関係を抽出する手法を提案する。「第一言語で共起する二つの語の訳語は第二言語でも共起する」という仮定に基づき、第一言語の共起情報を第二言語に翻訳することを確率行列の枠組で形式化した。その上で、第一言語の共起情報の翻訳と、第二言語の元の共起情報が類似する様に翻訳行列を最適化する。最適である時は訳語関係の曖昧性が文脈に基づいて最も解消されている場合となる。まず、局所文脈に基づいた訳語の選択を行えることを同枠組で検証した。さらに、第一、二言語で非対訳コーパスから大域的に訳語関係を抽出するために、翻訳行列を逐次的に最適化する原理を示し、有効性を示す定性的な小実験を行なった。 | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | A method to extract word translations from non-aligned corpus is proposed. The assumption "translations of two co-occurring words in the source language also co-occur in the target" is adopted and is represented in the stochastic matrix formulation. The best translation matrix gives the co-occurring information translated from the source, which is close to the co-occurring information in the target, when the ambiguity of translational relation is resolved according to the non-alinged corpus. The algorithm to obtain the best translation matrix is introduced. Small experiences are performed to evaluate the effectiveness of ambiguity resolution and to obtain the best translation matrix. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10115061 | |||||||
書誌情報 |
情報処理学会研究報告自然言語処理(NL) 巻 1995, 号 110(1995-NL-110), p. 87-94, 発行日 1995-11-17 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |