ログイン 新規登録
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. 研究報告
  2. 音声言語情報処理(SLP)
  3. 2016
  4. 2016-SLP-114

1次元畳み込みニューラルネットワークによる特徴抽出を用いた話者認識

https://ipsj.ixsq.nii.ac.jp/records/176391
https://ipsj.ixsq.nii.ac.jp/records/176391
f9742025-2f1f-465d-8024-c7daf8a0456c
名前 / ファイル ライセンス アクション
IPSJ-SLP16114005.pdf IPSJ-SLP16114005.pdf (499.6 kB)
Copyright (c) 2016 by the Institute of Electronics, Information and Communication Engineers This SIG report is only available to those in membership of the SIG.
SLP:会員:¥0, DLIB:会員:¥0
Item type SIG Technical Reports(1)
公開日 2016-12-13
タイトル
タイトル 1次元畳み込みニューラルネットワークによる特徴抽出を用いた話者認識
タイトル
言語 en
タイトル Speaker Recognition Based on Features through 1-Dimensional Convolutional Neural Network
言語
言語 jpn
キーワード
主題Scheme Other
主題 音声認識,話者認識
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_18gh
資源タイプ technical report
著者所属
早稲田大学大学院先進理工学研究科電機・情報生命専攻
著者所属
早稲田大学大学院先進理工学研究科電機・情報生命専攻
著者所属
早稲田大学大学院先進理工学研究科電機・情報生命専攻
著者所属(英)
en
Department of Electrical Engineering and Bioscience, Graduate School of Adavanced Science and Engineering. Waseda University
著者所属(英)
en
Department of Electrical Engineering and Bioscience, Graduate School of Adavanced Science and Engineering. Waseda University
著者所属(英)
en
Department of Electrical Engineering and Bioscience, Graduate School of Adavanced Science and Engineering. Waseda University
著者名 園田, 祥平

× 園田, 祥平

園田, 祥平

Search repository
笠原, 勇布

× 笠原, 勇布

笠原, 勇布

Search repository
井上, 真郷

× 井上, 真郷

井上, 真郷

Search repository
著者名(英) Shohei, Sonoda

× Shohei, Sonoda

en Shohei, Sonoda

Search repository
Yufu, Kasahara

× Yufu, Kasahara

en Yufu, Kasahara

Search repository
Masato, Inoue

× Masato, Inoue

en Masato, Inoue

Search repository
論文抄録
内容記述タイプ Other
内容記述 話者認識法の多くは,メル周波数ケプストラム係数 (MFCC) ,i-vector といった声の特徴量を利用している.これらの特徴量は,どのように音を聞いているのか,という知見に基づいて抽出される. しかし,脳内での正確な認識プロセスは,未だ解明されていない.本稿では,機械学習,その中でもデイープラーニングの手法である 1 次元畳み込みニューラルネットワークによる,新たな声の特徴量の抽出方法を提案する.その結果,提案手法は認識精度の大幅に改善した.また,提案手法が話者を認識するためのより良い特徴量が抽出することに成功したことを示す.
論文抄録(英)
内容記述タイプ Other
内容記述 Most of the speaker recognition methods utilize the voice features of the mel-frequency cepstrum coefficients (MFCCs) and the i-vector. These features are extracted based on the knowledge how human recognize voices, but the exact recognition process in our brain is still under the question. In this paper, we propose a new method to extract voice features by using machine learning techniques, especially, the deep learning by an 1-dimensional convolutional neural network. As a result, the proposed method showed significant improvement of recognition accuracy, which implies successful extraction of the better speaker recognition features.
書誌レコードID
収録物識別子タイプ NCID
収録物識別子 AN10442647
書誌情報 研究報告音声言語情報処理(SLP)

巻 2016-SLP-114, 号 5, p. 1-5, 発行日 2016-12-13
ISSN
収録物識別子タイプ ISSN
収録物識別子 2188-8663
Notice
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc.
出版者
言語 ja
出版者 情報処理学会
戻る
0
views
See details
Views

Versions

Ver.1 2025-01-20 05:52:35.582492
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3