ログイン 新規登録
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. 研究報告
  2. 自然言語処理(NL)
  3. 2012
  4. 2012-NL-206

外国人の検索クエリに対する音訳手法の適用

https://ipsj.ixsq.nii.ac.jp/records/81867
https://ipsj.ixsq.nii.ac.jp/records/81867
f83aad73-ac9e-426c-b5ba-0ed5df536bb8
名前 / ファイル ライセンス アクション
IPSJ-NL12206002.pdf IPSJ-NL12206002.pdf (404.3 kB)
Copyright (c) 2012 by the Information Processing Society of Japan
オープンアクセス
Item type SIG Technical Reports(1)
公開日 2012-05-03
タイトル
タイトル 外国人の検索クエリに対する音訳手法の適用
タイトル
言語 en
タイトル Transliteration of Alphabet Queries in Japanese Shopping Site
言語
言語 jpn
キーワード
主題Scheme Other
主題 検索・要約・対話
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_18gh
資源タイプ technical report
著者所属
東京農工大学
著者所属
東京農工大学
著者所属
東京農工大学
著者所属
東京農工大学
著者所属(英)
en
Tokyo University of Agriculture and Technology
著者所属(英)
en
Tokyo University of Agriculture and Technology
著者所属(英)
en
Tokyo University of Agriculture and Technology
著者所属(英)
en
Tokyo University of Agriculture and Technology
著者名 辻, 理絵子 木村, 健 古宮, 嘉那子 小谷, 善行

× 辻, 理絵子 木村, 健 古宮, 嘉那子 小谷, 善行

辻, 理絵子
木村, 健
古宮, 嘉那子
小谷, 善行

Search repository
著者名(英) Rieko, Tsuji Takeshi, Kimura Kanako, Komiya Yoshiyuki, Kotani

× Rieko, Tsuji Takeshi, Kimura Kanako, Komiya Yoshiyuki, Kotani

en Rieko, Tsuji
Takeshi, Kimura
Kanako, Komiya
Yoshiyuki, Kotani

Search repository
論文抄録
内容記述タイプ Other
内容記述 外国人の商外国人が日本語のショッピングサイトを利用する際日本語の商品名が分からず,商品が見つけられないことがある.本研究では,実際に外国人が日本のショッピングサイトで商品検索の際に失敗したクエリとその正しいクエリの対のコーパスを用いて,非日本語圏のユーザによる検索クエリの音訳を行った.ペアコーパスには,意訳によって修正されたクエリのように,音訳するにはノイズとなるデータが含まれているため,文字種によるフィルタリングを行って学習データを絞り込んだ.さらに,BIGRAM,HMM,CRF の 3 つの機械翻訳手法を比較した結果,検索クエリの音訳では HMM 手法が最適であった.
論文抄録(英)
内容記述タイプ Other
内容記述 There are some cases where the non-Japanese buyers are unable to find products they want through the Japanese shopping Web sites because it requires Japanese queries. We propose to transliterate the inputs of the non-Japanese user, i.e., search queries written in English alphabets, into Japanese Katakana to solve that problem. In this research, the pairs of the non-Japanese search queries which failed to get the right match obtained from a Japanese shopping website and its transcribed word given by volunteers were used for the training data. Since this corpus includes some noises for transliteration such as free translation, we used two different filters to filter out the query pairs that are not transliterated in order to improve the quality of the training data. In addition, we compared three methods, i.e., BIGRAM, HMM, and CRF, using these data to investigate which transliteration method is the best for query transliteration. The experiment revealed the HMM was the best.
書誌レコードID
収録物識別子タイプ NCID
収録物識別子 AN10115061
書誌情報 研究報告自然言語処理(NL)

巻 2012-NL-206, 号 2, p. 1-6, 発行日 2012-05-03
Notice
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc.
出版者
言語 ja
出版者 情報処理学会
戻る
0
views
See details
Views

Versions

Ver.1 2025-01-21 19:14:05.389974
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3