ログイン 新規登録
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. 研究報告
  2. コンピュータビジョンとイメージメディア(CVIM)
  3. 2023
  4. 2023-CVIM-233

第3回機械読唇チャレンジ報告

https://ipsj.ixsq.nii.ac.jp/records/224589
https://ipsj.ixsq.nii.ac.jp/records/224589
1d35311f-aabe-4c8d-b919-f1e3feee2b13
名前 / ファイル ライセンス アクション
IPSJ-CVIM23233023.pdf IPSJ-CVIM23233023.pdf (1.3 MB)
Copyright (c) 2023 by the Institute of Electronics, Information and Communication Engineers This SIG report is only available to those in membership of the SIG.
CVIM:会員:¥0, DLIB:会員:¥0
Item type SIG Technical Reports(1)
公開日 2023-02-23
タイトル
タイトル 第3回機械読唇チャレンジ報告
タイトル
言語 en
タイトル Report on the 3rd Lip-Reading Challenge
言語
言語 jpn
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_18gh
資源タイプ technical report
著者所属
九州工業大学
著者所属
リコー
著者所属
リコー
著者所属
リコー
著者所属
リコー
著者所属
メルコイン
著者所属
岐阜大学
著者所属
岐阜大学
著者所属
岐阜大学
著者所属
岐阜大学
著者所属
岐阜大学
著者所属
岐阜大学
著者所属
九州工業大学
著者所属(英)
en
Kyushu Institute of Technology
著者所属(英)
en
Ricoh Company, Ltd.
著者所属(英)
en
Ricoh Company, Ltd.
著者所属(英)
en
Ricoh Company, Ltd.
著者所属(英)
en
Ricoh Company, Ltd.
著者所属(英)
en
Mercoin, Inc.
著者所属(英)
en
Gifu University
著者所属(英)
en
Gifu University
著者所属(英)
en
Gifu University
著者所属(英)
en
Gifu University
著者所属(英)
en
Gifu University
著者所属(英)
en
Gifu University
著者所属(英)
en
Kyushu Institute of Technology
著者名 齊藤, 剛史

× 齊藤, 剛史

齊藤, 剛史

Search repository
後藤, 悠斗

× 後藤, 悠斗

後藤, 悠斗

Search repository
長野, 紘之

× 長野, 紘之

長野, 紘之

Search repository
加藤, 暁浩

× 加藤, 暁浩

加藤, 暁浩

Search repository
能勢, 将樹

× 能勢, 将樹

能勢, 将樹

Search repository
平元, 尚貴

× 平元, 尚貴

平元, 尚貴

Search repository
服部, 智大

× 服部, 智大

服部, 智大

Search repository
青山, 椎耶

× 青山, 椎耶

青山, 椎耶

Search repository
加藤, 夕祐

× 加藤, 夕祐

加藤, 夕祐

Search repository
戸嶋, 隆太

× 戸嶋, 隆太

戸嶋, 隆太

Search repository
長脇, 拓海

× 長脇, 拓海

長脇, 拓海

Search repository
田村, 哲嗣

× 田村, 哲嗣

田村, 哲嗣

Search repository
荒金, 大清

× 荒金, 大清

荒金, 大清

Search repository
著者名(英) Takeshi, Saitoh

× Takeshi, Saitoh

en Takeshi, Saitoh

Search repository
Yuto, Goto

× Yuto, Goto

en Yuto, Goto

Search repository
Hiroyuki, Nagano

× Hiroyuki, Nagano

en Hiroyuki, Nagano

Search repository
Akihiro, Kato

× Akihiro, Kato

en Akihiro, Kato

Search repository
Masaki, Nose

× Masaki, Nose

en Masaki, Nose

Search repository
Naoki, Hiramoto

× Naoki, Hiramoto

en Naoki, Hiramoto

Search repository
Tomohiro, Hattori

× Tomohiro, Hattori

en Tomohiro, Hattori

Search repository
Shiiya, Aoyama

× Shiiya, Aoyama

en Shiiya, Aoyama

Search repository
Yusuke, Katoh

× Yusuke, Katoh

en Yusuke, Katoh

Search repository
Ryuta, Toshima

× Ryuta, Toshima

en Ryuta, Toshima

Search repository
Takumi, Nagawaki

× Takumi, Nagawaki

en Takumi, Nagawaki

Search repository
Satoshi, Tamura

× Satoshi, Tamura

en Satoshi, Tamura

Search repository
Taiki, Arakane

× Taiki, Arakane

en Taiki, Arakane

Search repository
論文抄録
内容記述タイプ Other
内容記述 計算機を利用して音声情報を用いずに映像情報のみを用いて発話内容を推定する機械読唇技術がある.40 年以上の工学的な解析があるにも関わらず,未だ実用化に至っていない.そこで機械読唇研究分野の活性化を目的として「機械読唇チャレンジ」を企画した.2018 年および 2019 年に第 1 回および第 2 回の機械読唇チャレンジを開催した際,日本語 25 単語の分類問題をタスクに設定した.第 2 回機械読唇チャレンジで高い精度が達成されたため,3 回目となる 2022 年は日本語文章の音素ラベル列を推定する問題をタスクとして開催した.本稿では,コンペティションの開催概要,データベース,ベースラインおよび参加 3 チームのモデル,結果について報告する.
論文抄録(英)
内容記述タイプ Other
内容記述 There is a machine lip-reading technology that uses a computer to estimate the utterance content using only visual information without using audio information. Despite more than 40 years of engineering analysis, it has not yet been put to practical use. Therefore, we planned the “machine lip-reading challenge” for the purpose of revitalizing the field of machine lip-reading research. When we held the 1st and 2nd machine lip-reading challenges in 2018 and 2019, we set the classification problem of 25 Japanese words as a task. Since high accuracy was achieved in the 2nd challenge, in 2022, the 3rd challenge, we held the problem of estimating the phoneme label sequence of Japanese sentences as a task. In this paper, we report on the overview of the competition, the database, the models of the baseline and the three participating teams, and the results.
書誌レコードID
収録物識別子タイプ NCID
収録物識別子 AA11131797
書誌情報 研究報告コンピュータビジョンとイメージメディア(CVIM)

巻 2023-CVIM-233, 号 23, p. 1-5, 発行日 2023-02-23
ISSN
収録物識別子タイプ ISSN
収録物識別子 2188-8701
Notice
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc.
出版者
言語 ja
出版者 情報処理学会
戻る
0
views
See details
Views

Versions

Ver.1 2025-01-19 13:05:28.151266
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3