WEKO3
アイテム
大規模コーパスの効率的な Bleu 値計算方法の提案
https://ipsj.ixsq.nii.ac.jp/records/61199
https://ipsj.ixsq.nii.ac.jp/records/61199065e25f1-e4c1-4af1-b7ba-68af8be45a34
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2009 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2009-01-15 | |||||||
タイトル | ||||||||
タイトル | 大規模コーパスの効率的な Bleu 値計算方法の提案 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Approach to Efficient Calculation of BLEU in Large Scale Corpora | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
創価大学 | ||||||||
著者所属 | ||||||||
秀明大学 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Soka University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Shumei University | ||||||||
著者名 |
岡田, 勇
× 岡田, 勇
|
|||||||
著者名(英) |
Isamu, Okada
× Isamu, Okada
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 本研究は、機械翻訳システムの品質評価を扱う。コーパスの規模と性能との予測が可能となることは、研究上また実用上、大きな意義を持つ。そこで、日英対訳特許文書から生成されたコーパスを用いて、機械翻訳の性能とコーパスの規模との関係に関する見通しを得ることを目的とする。我々は、大規模なコーパス文書対の全ての組み合わせに対する Bleu 値を計算するための効率的な手法を提案し、その実行結果について報告する。その結果、本研究で定義したコーパスの性能の推移は、規模がある程度以上の場合、コーパス規模の対数に関する線形回帰で表せることを確認した。 | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | This paper reports on a performance estimate of Machine Translation System.To clarify the relationship between a size of corpora and its performance would be one of the most interest research topics. We aim to gain some prospects for the relationship by using a corpus generated by public patent claims in Japanese and English. This paper proposes an efficient calculating method of BLEU values for all combinatorial sentences in the large scale corpus. As a result of implementation, we indicate that the performance of the corpus can explain the logarithm of its size with a linear regression model under the condition of a certain size level. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10115061 | |||||||
書誌情報 |
研究報告自然言語処理(NL) 巻 2009, 号 2(2009-NL-189), p. 1-6, 発行日 2009-01-15 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |