@techreport{oai:ipsj.ixsq.nii.ac.jp:00218702,
 author = {松尾, 和哉 and 能登, 肇 and 深山, 篤},
 issue = {12},
 month = {Jun},
 note = {複数の深層学習モデル（顔認識や音声合成など）から成るヒトデジタルツイン（ヒト DT）を元の人間（フィジカルツイン：PT）らしく振舞わせるためには，PT からしか取得できないデータを収集・意味づけし，そのデータを DT に学習させる必要がある．しかし，一つのモデルを作るためには学習データが大量に必要であり，かつその大量のデータが PT ごとに必要になるため，手動で学習データを作成することは非現実的である．そこで本研究では，この学習データの自動生成を目指す．本稿ではまず，顔画像に名前が付与されたデータを映像データから自動的に作成することを目的とし，複数人の対話を文字起こししたデータから，各話者名を推定する手法を提案する．提案手法では，人名が含まれる発言の内容の解析結果と，当該発言の直前直後のターン・テイキングを応用して，話者名を推定する．提案手法の性能を，2 種類の会話コーパスを用いて定量評価を行った．},
 title = {複数人対話の文字起こしデータを用いた話者名推定手法に関する検討},
 year = {2022}
}