WEKO3
アイテム
日英新聞記事の自動記事対応付け
https://ipsj.ixsq.nii.ac.jp/records/49083
https://ipsj.ixsq.nii.ac.jp/records/49083fbaa9c12-6ac2-4a3a-8dc8-f1bf7d96fc8a
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 1996 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 1996-07-18 | |||||||
タイトル | ||||||||
タイトル | 日英新聞記事の自動記事対応付け | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Automatically Aligning Japanese & English Newspaper Articles | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
NTTコミュニケーション科学研究所 | ||||||||
著者所属 | ||||||||
NTTコミュニケーション科学研究所 | ||||||||
著者所属 | ||||||||
NTTコミュニケーション科学研究所 | ||||||||
著者所属 | ||||||||
鳥取大学 | ||||||||
著者所属 | ||||||||
NTTアドバンスドテクノロジ(株) | ||||||||
著者所属 | ||||||||
NTTアドバンスドテクノロジ(株) | ||||||||
著者所属(英) | ||||||||
en | ||||||||
NTT Communication Science Lab. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
NTT Communication Science Lab. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
NTT Communication Science Lab. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Tottori Univ | ||||||||
著者所属(英) | ||||||||
en | ||||||||
NTT Advanced Technology Co. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
NTT Advanced Technology Co. | ||||||||
著者名 |
高橋, 大和
× 高橋, 大和
|
|||||||
著者名(英) |
Takahashi, Y.
× Takahashi, Y.
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 機械翻訳などの自然言語処理技術を研究する上で、大量の対訳コーパスは非常に有用である。しかし、大量の一般的なデータの収集は困難である。本稿では、継続的なデータ収集を目的として、日英新聞記事を対象に、数値と名詞をキーワードとして利用し、その対応項目数により自動的な日英記事対応を行う手法を提案する。この手法を用いた実験により、一日平均90記事中38記事の正しい記事対応を自動的に得られることを確認した。 | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | Bilingual Corpora are very useful in natural language processing. Unfortunately they are difficult to compile. We have developed a method in which numerical values and proper nouns in the articles are used as keywords to align the Japanese and English newspaper articles automatically in order to develop a corpus. In addition, we have developed a way to evaluate the results. We correctly align automatically an average of 38 out of 90 pairs of articles daily. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10115061 | |||||||
書誌情報 |
情報処理学会研究報告自然言語処理(NL) 巻 1996, 号 65(1996-NL-114), p. 55-62, 発行日 1996-07-18 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |