WEKO3
アイテム
講義の自動アーカイブ化のためのスライドと発話の対応付け
https://ipsj.ixsq.nii.ac.jp/records/57027
https://ipsj.ixsq.nii.ac.jp/records/57027a22d230b-cf7e-41b1-a4fb-83c70c61e4b7
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
Copyright (c) 2005 by the Information Processing Society of Japan
|
|
| オープンアクセス | ||
| Item type | SIG Technical Reports(1) | |||||||
|---|---|---|---|---|---|---|---|---|
| 公開日 | 2005-02-05 | |||||||
| タイトル | ||||||||
| タイトル | 講義の自動アーカイブ化のためのスライドと発話の対応付け | |||||||
| タイトル | ||||||||
| 言語 | en | |||||||
| タイトル | Automatic Alignment of Speech Transcriptions with Viewgraph Slides for Lecture Archiving | |||||||
| 言語 | ||||||||
| 言語 | jpn | |||||||
| 資源タイプ | ||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
| 資源タイプ | technical report | |||||||
| 著者所属 | ||||||||
| 京都大学 情報学研究科 知能情報学専攻 | ||||||||
| 著者所属 | ||||||||
| 京都大学 情報学研究科 知能情報学専攻 | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| School of Informatics, Kyoto University | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| School of Informatics, Kyoto University | ||||||||
| 著者名 |
北出, 祐
河原, 達也
× 北出, 祐 河原, 達也
|
|||||||
| 著者名(英) |
Tasuku, Kitade
Tatsuya, Kawahara
× Tasuku, Kitade Tatsuya, Kawahara
|
|||||||
| 論文抄録 | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | 講義の自動アーカイブ化を目的として,講義音声の書き起こしの各発話と講義に用いられたスライドを自動的に対応付ける手法を提案する.スライドのテキストからキーワードを抽出し,発話との関連度を定義した.その際に単一のスライドへの対応付けが困難である場合もあるので,複数のスライドからなるトピック単位も構成した.また,発話直前のポーズ長や談話標識の出現に着目し,話題の遷移尤度を定義した.これらの尺度を用いてスライドまたはトピックを状態とするマルコフモデルを構築し,スライドやトピック単位に発話の対応付けを行った.実際の大学の講義に対して自動対応付けの実験を行ったところ,F値が0.681であった. | |||||||
| 論文抄録(英) | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | Automatic alignment of speech transcriptions with a sequence of viewgraph slides used in a lecture is addressed. We extracted the keywords from the text of the slides and define the similarity with utterances. Here, we introduce a topic unit consisting of multimple slides for more stable and flexible matching. In addition, we use the information of pauses and discourse markers for defining the likelihood of transition between slides or topics. Based on these measures, we set up a Markov model to be matched with utterances. Experimental results using two lectures confirm the effectiveness of the method. | |||||||
| 書誌レコードID | ||||||||
| 収録物識別子タイプ | NCID | |||||||
| 収録物識別子 | AN10442647 | |||||||
| 書誌情報 |
情報処理学会研究報告音声言語情報処理(SLP) 巻 2005, 号 12(2004-SLP-055), p. 59-64, 発行日 2005-02-05 |
|||||||
| Notice | ||||||||
| SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
| 出版者 | ||||||||
| 言語 | ja | |||||||
| 出版者 | 情報処理学会 | |||||||