WEKO3
アイテム
インターネット翻訳サービスにおけるユーザ辞書構築
https://ipsj.ixsq.nii.ac.jp/records/37199
https://ipsj.ixsq.nii.ac.jp/records/371995d75d31f-e78a-4ec0-91b3-dfbf00b9a142
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 1998 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 1998-05-15 | |||||||
タイトル | ||||||||
タイトル | インターネット翻訳サービスにおけるユーザ辞書構築 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Building User Dictionary in the Internet Translation Service | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
(株)東芝研究開発センター | ||||||||
著者所属 | ||||||||
(株)東芝研究開発センター | ||||||||
著者所属(英) | ||||||||
en | ||||||||
R&D Center, Toshiba Corporation | ||||||||
著者所属(英) | ||||||||
en | ||||||||
R&D Center, Toshiba Corporation | ||||||||
著者名 |
熊野, 明
× 熊野, 明
|
|||||||
著者名(英) |
Akira, Kumano
× Akira, Kumano
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 機械翻訳用ユーザ知識を翻訳ソフトの実ユーザから収集するために、インターネット上で翻訳サービスを公開した。ユーザは辞書登録によって自分のユーザ辞書を構築することができる。辞書登録は翻訳要求時に指定可能だが、翻訳サーバの用語抽出機能によって提示された情報を再翻訳時に利用することもできる。サーバは原文を翻訳すると同時に、原文中の未知語や辞書登録されていない複合語を抽出し、辞書登録の候補としてユーザに提示する。9か月間の無料サービスで、約6 700語の辞書データが収集できた。このうち約10%は用語抽出機能の抽出情報を利用したものであり、この機能が有効に利用されていることがわかった。ただし、抽出用語全体に対する辞書登録語の割合は2%にとどまり、ユーザに提示するデータの品質として改良する余地がある。ユーザ辞書構築機能を備えた翻訳サービスにおいて、この用語抽出機能が効率的に機能していることがわかった。 | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | We have provided an Internet translation service in order to collect the dictionary knowledge for machine translation (MT) from real users. Each user is allowed to build his/her user dictionary on the server. Once a user submits a translation, they can use the data extracted during translation in order to refine the translation output. The MT server identifies the unknown words and the compound terms in the original text, which are not registered in the dictionary, and then shows them to the users for dictionary registration. During a nine-month experiment, about 6,700 terms were collected. Of these terms, 10% were registered based on the extracted data, which shows the extraction function performed well. However, the rate of registration data to all the extracted data is only 2%, which indicates that this should be a priority for future improvement. We consider though that the function of word extraction worked effectively in the Internet MT service with user dictionary registration. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AA1221543X | |||||||
書誌情報 |
情報処理学会研究報告ヒューマンコンピュータインタラクション(HCI) 巻 1998, 号 35(1998-HI-078), p. 21-26, 発行日 1998-05-15 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |