2024-03-29T10:01:36Zhttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_oaipmhoai:ipsj.ixsq.nii.ac.jp:000127102022-10-21T05:24:51Z00581:00703:00712
発話検証に基づく音声操作プロジェクタとそれによる講演の自動ハイパーテキスト化Voice -Operated Projector Using Utterance Verification and Its Application to Hyper- text Generation of Lecturesjpn特集:音声言語情報処理http://id.nii.ac.jp/1001/00012710/Journal Articlehttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_action_common_download&item_id=12710&item_no=1&attribute_id=1&file_no=1Copyright (c) 1999 by the Information Processing Society of Japan音声・マルチモーダルインタフェースと応用京都大学大学院情報学研究科知能情報学専攻京都大学大学院情報学研究科知能情報学専攻京都大学大学院情報学研究科知能情報学専攻河原, 達也石塚健太郎堂下修司音声認識技術を一般の機器操作に用いるためには コマンド発話以外の音声を正しく棄却できる必要がある. 本研究では 使用される状況に依存した話し言葉の特徴をとらえた発話検証用モデルを用いることを提案し 講演をしながら音声で操作できるスライドプロジェクタを設計・実装した. 検証用モデルは 講演の書き起こしテキストからドメインに依存した名詞を除去しながら 頻出音節系列を抽出することにより学習した. このモデルにより 従来の音節連接モデルに基づく手法に比べて はるかに高い発話検証性能を得ることができ 音声操作プロジェクタの安定な動作を実現した. さらにこのプロジェクタにより 講演音声をオンラインスライドテキストと対応づけた形式で自動ハイパーテキスト化するシステムを作成した.In order to apply speech recognition to operation of electronic devices, the system needs capability to correctly reject irrelevant in puts. We propose a verification model depending on the speaking-style when the device is used, and then develop a slide projector that can be operated via voice commands during a lecture. The verification model is trained with transcription text of oral presentations by extracting frequent syllable sequences after filtering out topic-dependent nouns. It achieves much better verification performance than the conventional methods, thus makes the voice-operated projector practical. Furthermore, we develop a system that automatically generates hyper-text of lecture speech by aligning it with the on-line slides.AN00116647情報処理学会論文誌404149114981999-04-151882-77642009-06-29