WEKO3
アイテム
複数人対話の文字起こしデータを用いた話者名推定手法に関する検討
https://ipsj.ixsq.nii.ac.jp/records/218702
https://ipsj.ixsq.nii.ac.jp/records/21870285423f62-9042-4c59-8889-d9c6916ec0f4
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
Copyright (c) 2022 by the Information Processing Society of Japan
|
|
| オープンアクセス | ||
| Item type | SIG Technical Reports(1) | |||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 公開日 | 2022-06-22 | |||||||||||
| タイトル | ||||||||||||
| タイトル | 複数人対話の文字起こしデータを用いた話者名推定手法に関する検討 | |||||||||||
| 言語 | ||||||||||||
| 言語 | jpn | |||||||||||
| キーワード | ||||||||||||
| 主題Scheme | Other | |||||||||||
| 主題 | 対話 | |||||||||||
| 資源タイプ | ||||||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||||||
| 資源タイプ | technical report | |||||||||||
| 著者所属 | ||||||||||||
| NTTデジタルツインコンピューティング研究センタ | ||||||||||||
| 著者所属 | ||||||||||||
| NTTデジタルツインコンピューティング研究センタ | ||||||||||||
| 著者所属 | ||||||||||||
| NTTデジタルツインコンピューティング研究センタ | ||||||||||||
| 著者所属(英) | ||||||||||||
| en | ||||||||||||
| NTT DTC research center | ||||||||||||
| 著者所属(英) | ||||||||||||
| en | ||||||||||||
| NTT DTC research center | ||||||||||||
| 著者所属(英) | ||||||||||||
| en | ||||||||||||
| NTT DTC research center | ||||||||||||
| 著者名 |
松尾, 和哉
× 松尾, 和哉
× 能登, 肇
× 深山, 篤
|
|||||||||||
| 論文抄録 | ||||||||||||
| 内容記述タイプ | Other | |||||||||||
| 内容記述 | 複数の深層学習モデル(顔認識や音声合成など)から成るヒトデジタルツイン(ヒト DT)を元の人間(フィジカルツイン:PT)らしく振舞わせるためには,PT からしか取得できないデータを収集・意味づけし,そのデータを DT に学習させる必要がある.しかし,一つのモデルを作るためには学習データが大量に必要であり,かつその大量のデータが PT ごとに必要になるため,手動で学習データを作成することは非現実的である.そこで本研究では,この学習データの自動生成を目指す.本稿ではまず,顔画像に名前が付与されたデータを映像データから自動的に作成することを目的とし,複数人の対話を文字起こししたデータから,各話者名を推定する手法を提案する.提案手法では,人名が含まれる発言の内容の解析結果と,当該発言の直前直後のターン・テイキングを応用して,話者名を推定する.提案手法の性能を,2 種類の会話コーパスを用いて定量評価を行った. | |||||||||||
| 書誌レコードID | ||||||||||||
| 収録物識別子タイプ | NCID | |||||||||||
| 収録物識別子 | AN10115061 | |||||||||||
| 書誌情報 |
研究報告自然言語処理(NL) 巻 2022-NL-252, 号 12, p. 1-7, 発行日 2022-06-22 |
|||||||||||
| ISSN | ||||||||||||
| 収録物識別子タイプ | ISSN | |||||||||||
| 収録物識別子 | 2188-8779 | |||||||||||
| Notice | ||||||||||||
| SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||||||
| 出版者 | ||||||||||||
| 言語 | ja | |||||||||||
| 出版者 | 情報処理学会 | |||||||||||