WEKO3
アイテム
音声・動画コンテンツ内のナレーションを高齢者が聞き取りやすい話し方に変換するAIパイプラインの開発
https://ipsj.ixsq.nii.ac.jp/records/237325
https://ipsj.ixsq.nii.ac.jp/records/2373256bbaee87-e655-4505-9db2-c85d47b24c65
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
2026年7月15日からダウンロード可能です。
|
Copyright (c) 2024 by the Information Processing Society of Japan
|
|
| 非会員:¥660, IPSJ:学会員:¥330, HCI:会員:¥0, DLIB:会員:¥0 | ||
| Item type | SIG Technical Reports(1) | |||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 公開日 | 2024-07-15 | |||||||||||||
| タイトル | ||||||||||||||
| タイトル | 音声・動画コンテンツ内のナレーションを高齢者が聞き取りやすい話し方に変換するAIパイプラインの開発 | |||||||||||||
| 言語 | ||||||||||||||
| 言語 | jpn | |||||||||||||
| キーワード | ||||||||||||||
| 主題Scheme | Other | |||||||||||||
| 主題 | 教育技術と学習支援 | |||||||||||||
| 資源タイプ | ||||||||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||||||||
| 資源タイプ | technical report | |||||||||||||
| 著者所属 | ||||||||||||||
| 北海道大学 | ||||||||||||||
| 著者所属 | ||||||||||||||
| 北海道大学 | ||||||||||||||
| 著者所属 | ||||||||||||||
| 北海道大学 | ||||||||||||||
| 著者所属 | ||||||||||||||
| 北海道大学 | ||||||||||||||
| 著者名 |
宮下, 拓磨
× 宮下, 拓磨
× 阿部, 優樹
× 坂本, 大介
× 小野, 哲雄
|
|||||||||||||
| 論文抄録 | ||||||||||||||
| 内容記述タイプ | Other | |||||||||||||
| 内容記述 | 福祉従事者など高齢者との会話に慣れた人は,高齢者と話す際に発話速度をゆっくりにし,単語をはっきり発音する.この話し方は「スピーチアコモデーション」と呼ばれ,高齢者にとって聞き取りやすいと知られている.しかし,従来のラジオや動画メディアのナレーターは幅広い視聴者を対象としているため,この話し方を採用することが難しく,これは高齢者の音声・動画コンテンツへのアクセシビリティを低下させてきた.一方で,音声合成モデルの発展により声色を保ちながら発話速度やアクセントを変換できる技術が登場したことから,音声・動画コンテンツ内のナレーターの発話もスピーチアコモデーションに変換することができると着想した.そこで本研究では,高齢者福祉従事者のスピーチアコモデーションの特徴を事前に学習した音声合成モデルを用い,音声・動画コンテンツ内のナレーターの話し方をスピーチアコモデーションに変換する AI パイプラインを開発した.本研究報告では,システムの概要とそれを適用したラジオと動画の例を紹介することで,その可能性と課題を明らかにし,高齢者にとって理解しやすいメディア体験の実現に貢献する. | |||||||||||||
| 書誌レコードID | ||||||||||||||
| 収録物識別子タイプ | NCID | |||||||||||||
| 収録物識別子 | AA1221543X | |||||||||||||
| 書誌情報 |
研究報告ヒューマンコンピュータインタラクション(HCI) 巻 2024-HCI-209, 号 10, p. 1-8, 発行日 2024-07-15 |
|||||||||||||
| ISSN | ||||||||||||||
| 収録物識別子タイプ | ISSN | |||||||||||||
| 収録物識別子 | 2188-8760 | |||||||||||||
| Notice | ||||||||||||||
| SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||||||||
| 出版者 | ||||||||||||||
| 言語 | ja | |||||||||||||
| 出版者 | 情報処理学会 | |||||||||||||