ログイン 新規登録
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. 全国大会
  2. 86回
  3. 人工知能と認知科学

声質変換を用いたデータ拡張に基づく咽喉マイク音声認識

https://ipsj.ixsq.nii.ac.jp/records/236021
https://ipsj.ixsq.nii.ac.jp/records/236021
e375bd39-bbac-426c-a5a4-3fd0ad3acc4f
名前 / ファイル ライセンス アクション
IPSJ-Z86-1R-02.pdf IPSJ-Z86-1R-02.pdf (830.7 kB)
Copyright (c) 2024 by the Information Processing Society of Japan
Item type National Convention(1)
公開日 2024-03-01
タイトル
タイトル 声質変換を用いたデータ拡張に基づく咽喉マイク音声認識
言語
言語 jpn
キーワード
主題Scheme Other
主題 人工知能と認知科学
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_5794
資源タイプ conference paper
著者所属
静岡大
著者所属
静岡大
著者所属
愛知産大
著者名 塚越, 駿大

× 塚越, 駿大

塚越, 駿大

Search repository
西田, 昌史

× 西田, 昌史

西田, 昌史

Search repository
西村, 雅史

× 西村, 雅史

西村, 雅史

Search repository
論文抄録
内容記述タイプ Other
内容記述 近年、雑音環境下における音声認識の需要が高まっている。咽喉マイクは外部雑音の影響を抑制するが、一般的な接話型マイクとは音響特性が異なるため既存の音声認識モデルでは認識精度が著しく低下する。また、咽喉マイク用の音声認識モデルを学習するだけの大規模な咽喉マイク音声のコーパスは存在しない。そこで本研究ではDNNに基づく声質変換技術を利用し、既存の大規模な音声コーパスを咽喉マイク音声に変換することを試みた。これを少量の咽喉マイク収録音声とともに事前学習された自己教師あり学習モデルのFine tuningに利用することで認識率の改善が得られたので報告する。
書誌レコードID
収録物識別子タイプ NCID
収録物識別子 AN00349328
書誌情報 第86回全国大会講演論文集

巻 2024, 号 1, p. 357-358, 発行日 2024-03-01
出版者
言語 ja
出版者 情報処理学会
戻る
0
views
See details
Views

Versions

Ver.1 2025-01-19 09:25:33.561541
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3