WEKO3
アイテム
波形包絡を用いた音節核の自動抽出とそれを用いた構造的表象による単語獲得プロセスのモデル化の初期検討
https://ipsj.ixsq.nii.ac.jp/records/87737
https://ipsj.ixsq.nii.ac.jp/records/87737405e3e1d-0ea6-48e8-a0b4-3baaba7f90a9
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]()
2100年1月1日からダウンロード可能です。
|
Copyright (c) 2012 by the Institute of Electronics, Information and Communication Engineers
This SIG report is only available to those in membership of the SIG. |
|
SLP:会員:¥0, DLIB:会員:¥0 |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2012-12-13 | |||||||
タイトル | ||||||||
タイトル | 波形包絡を用いた音節核の自動抽出とそれを用いた構造的表象による単語獲得プロセスのモデル化の初期検討 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Syllable nucleus detection using waveform envelopes and modeling of the word acquisition process using word structures and syllable nuclei | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | ポスターセッション | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
東京大学 | ||||||||
著者所属 | ||||||||
東京大学 | ||||||||
著者所属 | ||||||||
東京大学 | ||||||||
著者所属 | ||||||||
昭和音楽大学 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
The University of Tokyo | ||||||||
著者所属(英) | ||||||||
en | ||||||||
The University of Tokyo | ||||||||
著者所属(英) | ||||||||
en | ||||||||
The University of Tokyo | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Showa University of Music | ||||||||
著者名 |
尾崎, 洋輔
峯松, 信明
広瀬, 啓吉
Donna, Erickson
× 尾崎, 洋輔 峯松, 信明 広瀬, 啓吉 Donna, Erickson
|
|||||||
著者名(英) |
Yousuke, Ozaki
Nobuaki, Minematsu
Keikichi, Hirose
Donna, Erickson
× Yousuke, Ozaki Nobuaki, Minematsu Keikichi, Hirose Donna, Erickson
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 幼児の音声言語獲得の過程を計算機上で模擬する研究が盛んに行われており,発達心理学や脳科学で示された仮説やモデルの妥当性が構成論的に検証されている.これらの研究では (1) 連続音声からの単語発見及び単語分節, (2) 話者・環境によって異なる音声の正規化,を未解決の問題として捉えることが多く,本研究でも後者を主たる対象とする.既に筆者らの一部はこの問題に対し,非言語的情報を音声から削除し,言語的情報だけを表象することを目的として音声の構造的表象を提案し,それに基づく音声モデリングを検討してきた.本稿では新たに,幼児が有する言語リズムへの敏感さに着眼し,波形包絡を用いた音節核自動抽出を行い構造的単語テンプレートと入力音声との照合過程に音節核位置情報を用いることを試みた.単語認識実験の結果,提案手法の有効性が示された. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | Simulation of language acquisition processes is an active research area in speech and computer science. Here, models and hypotheses proposed in developmental psychology play important roles. Problems addressed in simulation studies may be broadly classified into two categories: (1) How to segment a continuous speech stream into words? (2) How to normalize the acoustic features that vary based on speaker and environment? The main focus of this study is put on the second problem. In our previous studies, we proposed a new speech modeling technique, called speech structures, where the non-linguistic aspect of speech is cancelled well from speech acoustics and only the linguistic aspect is represented in the model. In this study, by considering infants' good sensitivity to rhythmic structure of language, automatic detection of syllable nuclei are technically implemented using waveform envelopes. Then, the detected nuclei are used in the matching module of a structure-based word recognition system. Results show that the validity of using the syllable nuclei to improve the performance. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10442647 | |||||||
書誌情報 |
研究報告音声言語情報処理(SLP) 巻 2012-SLP-94, 号 20, p. 1-6, 発行日 2012-12-13 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |