WEKO3
アイテム
日本語話し言葉コーパスを用いた音響モデル
https://ipsj.ixsq.nii.ac.jp/records/223570
https://ipsj.ixsq.nii.ac.jp/records/223570b606ff1e-c9db-45e1-b852-6e6ad08317c5
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
Copyright (c) 2023 by the Information Processing Society of Japan
|
|
| オープンアクセス | ||
| Item type | SIG Technical Reports(1) | |||||||
|---|---|---|---|---|---|---|---|---|
| 公開日 | 2023-01-19 | |||||||
| タイトル | ||||||||
| タイトル | 日本語話し言葉コーパスを用いた音響モデル | |||||||
| タイトル | ||||||||
| 言語 | en | |||||||
| タイトル | Acoustic Modeling Using Corpus of Spontaneous Japanese | |||||||
| 言語 | ||||||||
| 言語 | jpn | |||||||
| キーワード | ||||||||
| 主題Scheme | Other | |||||||
| 主題 | 招待講演 | |||||||
| 資源タイプ | ||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
| 資源タイプ | technical report | |||||||
| 著者所属 | ||||||||
| 東京工業大学 | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Tokyo Institute of Technology | ||||||||
| 著者名 |
篠崎, 隆宏
× 篠崎, 隆宏
|
|||||||
| 著者名(英) |
Takahiro, Shinozaki
× Takahiro, Shinozaki
|
|||||||
| 論文抄録 | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | 深層学習技術の発展で今日ではあらゆる分野で統計的モデル化の有用性が当たり前のように認められるようになり,大規模なデータを用いたニューラルネットモデルの学習が行われている.しかし古井先生が東京工業大学にご着任された 25 年ほど昔を振り返れば,統計的なアプローチは今日ほど一般的なものではなかった.研究者自身がモデル化の対象を深く理解し抽象化した結果を明示的にプログラムするというそれ以前のスタイルからすると,データからの学習に頼る統計的なアプローチはともするといい加減な方法とみなされることも多かった.音声言語情報処理は歴史的に早期から統計的アプローチの重要性を認識し研究が進められてきた分野であるが,それでも学習に利用できるデータや計算機の性能が限られていたこともあり,統計的なアプローチでどこまで音声認識の性能が上げられるのかについて音声認識の専門家でもそれほど確信を持てない時代であった.そのような時代背景の下で古井先生は早くから統計的なアプローチの重要性を強調され,平成 11 年度 (1999年度) より科学技術振興調整費を財源とした「話し言葉の言語的・パラ言語的構造の解明に基づく『話し言葉工学』の構築」プロジェクトを主導された.私が修士学生として古井先生の研究室に配属されたのが丁度この年であり,話し言葉工学プロジェクトに携わる貴重な経験をさせていただいた.本講演では当時の研究室の様子なども思い起こしつつ,古井先生のご指導の元取り組んだ音声認識のための音響モデルの研究について紹介する. | |||||||
| 論文抄録(英) | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | With the development of deep learning technology, the usefulness of statistical modeling has come to be widely recognized in various fields. However, looking back some 25 years, when Professor Furui arrived at the Tokyo Institute of Technology, statistical approaches were less common than they are today. Compared to the previous style in which researchers deeply understood what they were modeling and explicitly programmed the abstracted results, statistical approaches tended to be even seen as sloppy methods. However, Professor Furui emphasized their importance early on and led a Japanese national project on spontaneous speech corpus and processing technology started in 1999. That year, I joined his lab. In this talk, I will introduce the research on acoustic models for speech recognition that I worked on under the project. | |||||||
| 書誌レコードID | ||||||||
| 収録物識別子タイプ | NCID | |||||||
| 収録物識別子 | AN10442647 | |||||||
| 書誌情報 |
研究報告音声言語情報処理(SLP) 巻 2023-SLP-145, 号 5, p. 1-1, 発行日 2023-01-19 |
|||||||
| ISSN | ||||||||
| 収録物識別子タイプ | ISSN | |||||||
| 収録物識別子 | 2188-8663 | |||||||
| Notice | ||||||||
| SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
| 出版者 | ||||||||
| 言語 | ja | |||||||
| 出版者 | 情報処理学会 | |||||||