Item type |
SIG Technical Reports(1) |
公開日 |
2023-02-23 |
タイトル |
|
|
タイトル |
第3回機械読唇チャレンジ報告 |
タイトル |
|
|
言語 |
en |
|
タイトル |
Report on the 3rd Lip-Reading Challenge |
言語 |
|
|
言語 |
jpn |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
九州工業大学 |
著者所属 |
|
|
|
リコー |
著者所属 |
|
|
|
リコー |
著者所属 |
|
|
|
リコー |
著者所属 |
|
|
|
リコー |
著者所属 |
|
|
|
メルコイン |
著者所属 |
|
|
|
岐阜大学 |
著者所属 |
|
|
|
岐阜大学 |
著者所属 |
|
|
|
岐阜大学 |
著者所属 |
|
|
|
岐阜大学 |
著者所属 |
|
|
|
岐阜大学 |
著者所属 |
|
|
|
岐阜大学 |
著者所属 |
|
|
|
九州工業大学 |
著者所属(英) |
|
|
|
en |
|
|
Kyushu Institute of Technology |
著者所属(英) |
|
|
|
en |
|
|
Ricoh Company, Ltd. |
著者所属(英) |
|
|
|
en |
|
|
Ricoh Company, Ltd. |
著者所属(英) |
|
|
|
en |
|
|
Ricoh Company, Ltd. |
著者所属(英) |
|
|
|
en |
|
|
Ricoh Company, Ltd. |
著者所属(英) |
|
|
|
en |
|
|
Mercoin, Inc. |
著者所属(英) |
|
|
|
en |
|
|
Gifu University |
著者所属(英) |
|
|
|
en |
|
|
Gifu University |
著者所属(英) |
|
|
|
en |
|
|
Gifu University |
著者所属(英) |
|
|
|
en |
|
|
Gifu University |
著者所属(英) |
|
|
|
en |
|
|
Gifu University |
著者所属(英) |
|
|
|
en |
|
|
Gifu University |
著者所属(英) |
|
|
|
en |
|
|
Kyushu Institute of Technology |
著者名 |
齊藤, 剛史
後藤, 悠斗
長野, 紘之
加藤, 暁浩
能勢, 将樹
平元, 尚貴
服部, 智大
青山, 椎耶
加藤, 夕祐
戸嶋, 隆太
長脇, 拓海
田村, 哲嗣
荒金, 大清
|
著者名(英) |
Takeshi, Saitoh
Yuto, Goto
Hiroyuki, Nagano
Akihiro, Kato
Masaki, Nose
Naoki, Hiramoto
Tomohiro, Hattori
Shiiya, Aoyama
Yusuke, Katoh
Ryuta, Toshima
Takumi, Nagawaki
Satoshi, Tamura
Taiki, Arakane
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
計算機を利用して音声情報を用いずに映像情報のみを用いて発話内容を推定する機械読唇技術がある.40 年以上の工学的な解析があるにも関わらず,未だ実用化に至っていない.そこで機械読唇研究分野の活性化を目的として「機械読唇チャレンジ」を企画した.2018 年および 2019 年に第 1 回および第 2 回の機械読唇チャレンジを開催した際,日本語 25 単語の分類問題をタスクに設定した.第 2 回機械読唇チャレンジで高い精度が達成されたため,3 回目となる 2022 年は日本語文章の音素ラベル列を推定する問題をタスクとして開催した.本稿では,コンペティションの開催概要,データベース,ベースラインおよび参加 3 チームのモデル,結果について報告する. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
There is a machine lip-reading technology that uses a computer to estimate the utterance content using only visual information without using audio information. Despite more than 40 years of engineering analysis, it has not yet been put to practical use. Therefore, we planned the “machine lip-reading challenge” for the purpose of revitalizing the field of machine lip-reading research. When we held the 1st and 2nd machine lip-reading challenges in 2018 and 2019, we set the classification problem of 25 Japanese words as a task. Since high accuracy was achieved in the 2nd challenge, in 2022, the 3rd challenge, we held the problem of estimating the phoneme label sequence of Japanese sentences as a task. In this paper, we report on the overview of the competition, the database, the models of the baseline and the three participating teams, and the results. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AA11131797 |
書誌情報 |
研究報告コンピュータビジョンとイメージメディア(CVIM)
巻 2023-CVIM-233,
号 23,
p. 1-5,
発行日 2023-02-23
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8701 |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |