2024-03-28T18:23:45Zhttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_oaipmhoai:ipsj.ixsq.nii.ac.jp:001304552023-11-17T02:17:36Z06504:08117:08120
図像情報を利用した講演調音声のディクテーションDictation of Spoken Language in Lecture Style using Diagramatic Informationjpnhttp://id.nii.ac.jp/1001/00130640/Conference Paperhttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_action_common_download&item_id=130455&item_no=1&attribute_id=1&file_no=1京都大学大学院工学研究科情報工学専攻京都大学大学院工学研究科情報工学専攻京都大学大学院工学研究科情報工学専攻池田, 徹志荒木, 雅弘堂下, 修司人間は自分の思考内容を他人に伝達するために,音声・図・ジェスチャ等複数のモードを適切に用いている.また,モードを組み合わせることにより,効率の良い伝達や,信頼性の高い伝達を行なっている.近年,このようなモードの統合の現象に興味を持った研究がさかんに行なわれている.しかし,図像に表現されている深い意味を音声認識に積極的に利用する試みはない.本研究では,図像を指示しながら行なわれる口頭発表の音声のディクテーションをタスクとして設定する.OHPに代表される図像の作成はコンピュータ上で行なわれるのが主流になってきており,提示される図像の情報として誤りのないものを利用できると考えられる. さらに本研究で利用する図像は,図像の意味する内容をも含む高次の表現がなされていると仮定する.これは作成者が図像の深い意味を指定しながら作図を行なうような,高度な作図システムを利用することで可能となる.我々はそのような作図システムの研究も並行して行なっている.AN00349328全国大会講演論文集第53回人工知能と認知科学3573581996-09-042015-01-20