WEKO3
アイテム
外国人の検索クエリに対する音訳手法の適用
https://ipsj.ixsq.nii.ac.jp/records/81867
https://ipsj.ixsq.nii.ac.jp/records/81867f83aad73-ac9e-426c-b5ba-0ed5df536bb8
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2012 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2012-05-03 | |||||||
タイトル | ||||||||
タイトル | 外国人の検索クエリに対する音訳手法の適用 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Transliteration of Alphabet Queries in Japanese Shopping Site | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 検索・要約・対話 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
東京農工大学 | ||||||||
著者所属 | ||||||||
東京農工大学 | ||||||||
著者所属 | ||||||||
東京農工大学 | ||||||||
著者所属 | ||||||||
東京農工大学 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Tokyo University of Agriculture and Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Tokyo University of Agriculture and Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Tokyo University of Agriculture and Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Tokyo University of Agriculture and Technology | ||||||||
著者名 |
辻, 理絵子
木村, 健
古宮, 嘉那子
小谷, 善行
× 辻, 理絵子 木村, 健 古宮, 嘉那子 小谷, 善行
|
|||||||
著者名(英) |
Rieko, Tsuji
Takeshi, Kimura
Kanako, Komiya
Yoshiyuki, Kotani
× Rieko, Tsuji Takeshi, Kimura Kanako, Komiya Yoshiyuki, Kotani
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 外国人の商外国人が日本語のショッピングサイトを利用する際日本語の商品名が分からず,商品が見つけられないことがある.本研究では,実際に外国人が日本のショッピングサイトで商品検索の際に失敗したクエリとその正しいクエリの対のコーパスを用いて,非日本語圏のユーザによる検索クエリの音訳を行った.ペアコーパスには,意訳によって修正されたクエリのように,音訳するにはノイズとなるデータが含まれているため,文字種によるフィルタリングを行って学習データを絞り込んだ.さらに,BIGRAM,HMM,CRF の 3 つの機械翻訳手法を比較した結果,検索クエリの音訳では HMM 手法が最適であった. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | There are some cases where the non-Japanese buyers are unable to find products they want through the Japanese shopping Web sites because it requires Japanese queries. We propose to transliterate the inputs of the non-Japanese user, i.e., search queries written in English alphabets, into Japanese Katakana to solve that problem. In this research, the pairs of the non-Japanese search queries which failed to get the right match obtained from a Japanese shopping website and its transcribed word given by volunteers were used for the training data. Since this corpus includes some noises for transliteration such as free translation, we used two different filters to filter out the query pairs that are not transliterated in order to improve the quality of the training data. In addition, we compared three methods, i.e., BIGRAM, HMM, and CRF, using these data to investigate which transliteration method is the best for query transliteration. The experiment revealed the HMM was the best. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10115061 | |||||||
書誌情報 |
研究報告自然言語処理(NL) 巻 2012-NL-206, 号 2, p. 1-6, 発行日 2012-05-03 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |