WEKO3
アイテム
多次元尺度構成法による音響空間の2次元可視化
https://ipsj.ixsq.nii.ac.jp/records/36838
https://ipsj.ixsq.nii.ac.jp/records/368382748ca43-5754-4cdf-bf02-111ab840df22
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2004 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2004-07-17 | |||||||
タイトル | ||||||||
タイトル | 多次元尺度構成法による音響空間の2次元可視化 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Two - dimensional Visualization of Acoustic Space by Multidimensional Scaling | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
旭化成株式会社情報技術研究所 | ||||||||
著者所属 | ||||||||
旭化成株式会社情報技術研究所 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Asahi Kasei Corporation, Information Technology Laboratory | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Asahi Kasei Corporation, Information Technology Laboratory | ||||||||
著者名 |
庄境, 誠
× 庄境, 誠
|
|||||||
著者名(英) |
Makoto, Shozakai
× Makoto, Shozakai
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | MLLRなどの話者適応手法により有効な効果を得るためには,十分な量の音声サンプルをユーザから取得する必要があるが,実用化の現場では困難な場合が多い.音声認識システムを初めて使う瞬間から高い認識性能を確保するには,十分高い認識性能を提供する,精密な音響モデルライブラリの事前開発が重要である.一般に,多次元ベクトルの正規分布で表現されるHMM音響モデルを分析することは,困難である.音響モデルを2次元平面上に可視化し,人間の視覚分析能力を利用した,精細な音響モデルライブラリの開発を支援する手法として,COSMOS(aCOustic Space Map Of Sound)法を提案する.性別,信号雑音比,タスク,発話様式などの分析を例に取り,音響空間の分析手法としての提案法の有効性を示す. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | In order to achieve sufficient results in speaker-adaptive techniques as represented by the MLLR method, it is essential to obtain adequate voice samples of the user, rendering the application of the method difficult in practical applications. To ensure recognition performance matching up to the level of required practicality from the outset, prior development of highly precise acoustic model libraries for the voice recognition systems are necessary. The analysis of HMM acoustic models expressed as Gaussian distributions of multi-dimensional vectors is typically a difficult task. The COSMOS (aCOustic Space Map Of Sound) method featuring the visualization of the distribution of the acoustic models in a two dimensional diagram by use of multi-dimensional linear measurement is proposed as a technique to support the analysis through the utilization of human visual perception. The effectiveness of the proposed technique as a method of analyzing the acoustic distribution is reviewed based on examples of differences in sample gender, signal-to-noise ratio, tasks and styles of speech. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AA1221543X | |||||||
書誌情報 |
情報処理学会研究報告ヒューマンコンピュータインタラクション(HCI) 巻 2004, 号 74(2004-HI-109), p. 129-136, 発行日 2004-07-17 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |