WEKO3
アイテム
[招待論文] 筆記録作成のための話し言葉処理技術
https://ipsj.ixsq.nii.ac.jp/records/56865
https://ipsj.ixsq.nii.ac.jp/records/5686576bc601b-2bbc-4bdb-b4a2-08f596985891
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2006 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2006-12-22 | |||||||
タイトル | ||||||||
タイトル | [招待論文] 筆記録作成のための話し言葉処理技術 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Intelligent Transcription using Spontaneous Speech Processing | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
京都大学学術情報メディアセンター | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Kyoto University, School of Informatics | ||||||||
著者名 |
河原, 達也
× 河原, 達也
|
|||||||
著者名(英) |
Tatsuya, KAWAHARA
× Tatsuya, KAWAHARA
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 話し言葉の音声認識技術の発展に伴い、筆記録(講演録や会議録)の作成支援が有望なアプリケーションとして考えられるようになってきた。その際には、音声認識だけでなく、言い淀みの整形、口語的表現の修正、文などのセグメンテーションを含めて検討を行う必要がある。本稿では、このような処理を含めて自動書き起こしを行うシステムに関する研究について紹介する。まず、話し言葉音声の書き起こしを対象とした主要プロジェクトを概観し、著者らが提案している高次書き起こしシステムの概要を述べる。そして、文境界の検出と自己修復部(言い直し)の検出について解説する。最後に、今後の課題について述べる。 | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | With improvement of the spontaneous speech recognition technology, semi-automatic generation of transcripts of document records of lectures and meetings has become one of its promising applications. For this purpose, we need to take into account post-processing that includes cleaning of verbatim transcripts and segmentation into sentence/paragraph units. This article first gives a brief overview of major research activities on spontaneous speech processing, followed by the proposed statistical framework of an intelligent transcription system. Then, several approaches to sentence unit detection and disfluency detection are described. Finally, future works are discussed. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10442647 | |||||||
書誌情報 |
情報処理学会研究報告音声言語情報処理(SLP) 巻 2006, 号 136(2006-SLP-064), p. 209-214, 発行日 2006-12-22 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |