WEKO3
アイテム
単語出現順序を考慮したトピックモデルによる言語モデル適応
https://ipsj.ixsq.nii.ac.jp/records/56618
https://ipsj.ixsq.nii.ac.jp/records/56618e31dddb9-b3aa-4269-a65c-608b3fb1996f
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2008 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2008-12-02 | |||||||
タイトル | ||||||||
タイトル | 単語出現順序を考慮したトピックモデルによる言語モデル適応 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Language Model Adaptation by Topic Model Based on Sequence of Words | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
神戸大学大学院自然科学研究科/神戸大学大学院工学研究科 | ||||||||
著者所属 | ||||||||
神戸大学大学院自然科学研究科/神戸大学大学院工学研究科 | ||||||||
著者所属 | ||||||||
神戸大学大学院自然科学研究科/神戸大学大学院工学研究科 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Guraduate School of Science and Technology, Kobe University / Guraduate School of Engineering, Kobe University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Guraduate School of Science and Technology, Kobe University / Guraduate School of Engineering, Kobe University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Guraduate School of Science and Technology, Kobe University / Guraduate School of Engineering, Kobe University | ||||||||
著者名 |
佐古, 淳
× 佐古, 淳
|
|||||||
著者名(英) |
Atsushi, Sako
× Atsushi, Sako
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 人間にとって不可解な認識誤りの低減や,単語の認識だけでなく,意味・内容の理解を行うためには semantics を考慮することが重要であると考えられる.現在, LSA や PLSA のように semantics を考慮するモデルは Bag-of-words に基づく手法であり,文書中の単語出現順序を考慮していないより高度な分析のためには,文書中の単語出現順序を考慮する必要があると考えられる.本研究では,Kernel PCA 及び Dynamic Time Alignment カーネルを用いることにより,単語順序を考慮した Latent Semantic 空間を構築する手法を提案する.予備実験では,右回り/左回りにプロットした時系列データが Latent Semantic 空間においてきれいに分離されることを確認した.また,言語コーパスを用いた評価実験では,パープレキシティの低下を確認することが出来た. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | It is important to consider semantics for reductions of recognition errors unlike humans or understanding meanings and contents. To accommodate these problems, Latent Semantic Analysis (LSA) or Probabilistic LSA have been proposed. However these methods are based on Bag-of-words techniques. For more sophisticated analysis, it needs to consider a sequence of words in a document. In this paper, we propose the method based on Kernel PCA and Dynamic Time Alignment Kernel in order to consider a sequence of words. Preliminary experimental results shows the proposed method can separete clearly a sequence of right turn/left turn prots data. Moreover, experimental results of language corpus shows the reduction of perplexity. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10442647 | |||||||
書誌情報 |
情報処理学会研究報告音声言語情報処理(SLP) 巻 2008, 号 123(2008-SLP-074), p. 249-254, 発行日 2008-12-02 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |