ログイン 新規登録
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. 研究報告
  2. アクセシビリティ(AAC)
  3. 2026
  4. 2026-AAC-30

Data-Centricな手話コーパス構築に向けた動画選別:部分的アノテーションによる言語的特性の評価

https://ipsj.ixsq.nii.ac.jp/records/2008201
https://ipsj.ixsq.nii.ac.jp/records/2008201
475f24b8-b79c-40d1-913d-77f793b83f1f
名前 / ファイル ライセンス アクション
IPSJ-AAC26030024.pdf IPSJ-AAC26030024.pdf (371.6 KB)
 2028年3月8日からダウンロード可能です。
Copyright (c) 2026 by the Information Processing Society of Japan
非会員:¥660, IPSJ:学会員:¥330, AAC:会員:¥0, DLIB:会員:¥0
Item type SIG Technical Reports(1)
公開日 2026-03-08
タイトル
言語 ja
タイトル Data-Centricな手話コーパス構築に向けた動画選別:部分的アノテーションによる言語的特性の評価
タイトル
言語 en
タイトル Data-Centric Sign Language Corpus Construction: Video Selection via Partial Annotation for Evaluating Linguistic Characteristics
言語
言語 jpn
キーワード
主題Scheme Other
主題 聴覚障害
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_18gh
資源タイプ technical report
著者所属
筑波技術大学
著者所属
筑波技術大学
著者所属
筑波技術大学
著者所属
筑波技術大学
著者所属(英)
en
Tsukuba University of Technology
著者所属(英)
en
Tsukuba University of Technology
著者所属(英)
en
Tsukuba University of Technology
著者所属(英)
en
Tsukuba University of Technology
著者名 船山,滉介

× 船山,滉介

船山,滉介

Search repository
米山,文雄

× 米山,文雄

米山,文雄

Search repository
加藤,伸子

× 加藤,伸子

加藤,伸子

Search repository
白石,優旗

× 白石,優旗

白石,優旗

Search repository
著者名(英) Kosuke Funayama

× Kosuke Funayama

en Kosuke Funayama

Search repository
Fumio Yoneyama

× Fumio Yoneyama

en Fumio Yoneyama

Search repository
Nobuko Kato

× Nobuko Kato

en Nobuko Kato

Search repository
Yuhki Shiraishi

× Yuhki Shiraishi

en Yuhki Shiraishi

Search repository
論文抄録
内容記述タイプ Other
内容記述 大規模言語モデルの発展に伴い,手話認識研究でもYouTube-SL-25等の大規模Webデータセットの活用が進んでいる.これらは量的資源として有用だが,Data-Centric AIの観点からは,混在する多様な手話形式が存在する日本の手話(日本手話,中間型手話,日本語対応手話)から,学習目的に合致した日本の手話を適切に整理し,データの整合性を確保するプロセスが喫緊の課題である.著者らは先行研究において,外形的特徴に基づくフィルタリングを実施した.本稿では次段階として,各動画に含まれる「日本の手話」を効率的に評価する部分的アノテーション手法の妥当性を検討する.具体的には,選別された単独出演動画の中央部20秒間を抽出し,ろう者アノテーターがELANを用いて,手指動作(Gloss)に加え,非手指要素,分類詞,役割交代等の言語学的特徴を多層的に記述する.予備的検討では,本手法により日本手話に特徴的な文法構造が顕著なデータと,他の手話形式との差異が記述的に確認された.本稿では,この選別プロセスの詳細と,高品質な基盤モデル構築に向けた方法論としての有効性を論じる.
論文抄録(英)
内容記述タイプ Other
内容記述 With the rapid progress of large language models, sign language recognition research has increasingly leveraged large-scale web datasets such as YouTube-SL-25. While these resources are valuable in terms of scale, web videos in Japan often contain mixed sign language varieties, including Japanese Sign Language (JSL), intermediate varieties, and Japanese-based Signed Japanese (MSS). From a data-centric AI perspective, such heterogeneity can undermine dataset consistency and interpretability, making purpose-driven selection and organization essential. In this paper, we examine a partial-annotation approach for efficiently characterizing the ”Japanese sign language” contained in each video. We extract a 20-second segment from the middle of each selected single-signer video, and Deaf annotators use ELAN to provide multi-layer, time-aligned descriptions of linguistic features, including glosses, classifiers, mouth actions, non-manual markers, and role shift. A preliminary investigation suggests that this approach can descriptively identify segments in which grammatical structures characteristic of JSL are salient and can document differences from other varieties. We discuss the selection workflow and its implications for constructing higher-quality corpora and foundation models.
書誌レコードID
収録物識別子タイプ NCID
収録物識別子 AA12752949
書誌情報 研究報告アクセシビリティ(AAC)

巻 2026-AAC-30, 号 24, p. 1-7, 発行日 2026-03-08
ISSN
収録物識別子タイプ ISSN
収録物識別子 2432-2431
Notice
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc.
出版者
言語 ja
出版者 情報処理学会
戻る
0
views
See details
Views

Versions

Ver.1 2026-03-02 07:32:38.946529
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3