WEKO3
アイテム
決定木を用いた中国語の疑問文の訳語選択ルールの生成
https://ipsj.ixsq.nii.ac.jp/records/47855
https://ipsj.ixsq.nii.ac.jp/records/47855353fb622-57ad-4c1b-9fb5-f95ddf6c59a3
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2007 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2007-01-26 | |||||||
タイトル | ||||||||
タイトル | 決定木を用いた中国語の疑問文の訳語選択ルールの生成 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Generating a Set of Rules to Determine the Translation of a Chinese Word "忽込(zenme)" Using Decision Tree Learning | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
東京農工大学工学部電子情報工学専攻 | ||||||||
著者所属 | ||||||||
東京農工大学工学部電子情報工学専攻 | ||||||||
著者所属 | ||||||||
東京農工大学工学部電子情報工学専攻 | ||||||||
著者所属 | ||||||||
東京農工大学工学部電子情報工学専攻 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Computer, Information and Communication Sciences Tokyo University of Agriculture and Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Computer, Information and Communication Sciences Tokyo University of Agriculture and Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Computer, Information and Communication Sciences Tokyo University of Agriculture and Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Computer, Information and Communication Sciences Tokyo University of Agriculture and Technology | ||||||||
著者名 |
古宮嘉那子
高虹
但馬, 康宏
小谷, 善行
× 古宮嘉那子 高虹 但馬, 康宏 小谷, 善行
|
|||||||
著者名(英) |
Kanako, Komiya
Gao, Hong
Yasuhiro, Tajima
Yoshiyuki, Kotani
× Kanako, Komiya Gao, Hong Yasuhiro, Tajima Yoshiyuki, Kotani
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 中国語の疑問文における「忽込」は,英語に翻訳すると,howやwhyなど,複数の結果が得られる.本論文では,「悠込」の使用法によってどのような訳語が適切であるかを決定する中英翻訳システムを作成し,その選択ルールを用例により決定木学習を用いて自動的に作成した.決定木の学習および評価に用いるデータは人手で309件の文と,属性,および結果を作成したものである.本研究での決定木は二分木であり,決定木学習のアルゴリズムにはC4.5を用いた実験の結果,最高値で99.7%の正解率で語を選択することが可能となった.また,作成した木により,自動的に訳語選択ルールを生成した.作成した木は,ヒューリスティックな決定木をほぼ再現した. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | A Chinese word "忽込(zenme)" in questions has some translations such as "how" and "why". The authors made a Chinese-English translation system to determine the suitable translation of "忽込(zenme)" in questions according to the usages. It generates a set of rules to determine them automatically, by decision tree learning. Training data and testing data are manually made. They are 309 sentences and their features, values and the results. The authors used binary tree and C4.5. The accuracy of the system was 99.7% and the decision tree derived from experiments is almost the same as the decision tree that are made manually. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10115061 | |||||||
書誌情報 |
情報処理学会研究報告自然言語処理(NL) 巻 2007, 号 7(2007-NL-177), p. 1-8, 発行日 2007-01-26 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |