WEKO3
アイテム
講演ディクテーションのための話題独立言語モデルと話題適応
https://ipsj.ixsq.nii.ac.jp/records/57611
https://ipsj.ixsq.nii.ac.jp/records/57611a0ed48f8-643b-4935-a02b-0c2b0799d29a
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
Copyright (c) 1999 by the Information Processing Society of Japan
|
|
| オープンアクセス | ||
| Item type | SIG Technical Reports(1) | |||||||
|---|---|---|---|---|---|---|---|---|
| 公開日 | 1999-05-28 | |||||||
| タイトル | ||||||||
| タイトル | 講演ディクテーションのための話題独立言語モデルと話題適応 | |||||||
| タイトル | ||||||||
| 言語 | en | |||||||
| タイトル | Topic Independent Language Model and its Adaptation for Dictation of Lecture Speech | |||||||
| 言語 | ||||||||
| 言語 | jpn | |||||||
| 資源タイプ | ||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
| 資源タイプ | technical report | |||||||
| 著者所属 | ||||||||
| 京都大学大学院情報学研究科知能情報学専攻 | ||||||||
| 著者所属 | ||||||||
| 京都大学大学院情報学研究科知能情報学専攻 | ||||||||
| 著者所属 | ||||||||
| 京都大学大学院情報学研究科知能情報学専攻 | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Graduate School of Informatics Kyoto University | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Graduate School of Informatics Kyoto University | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Graduate School of Informatics Kyoto University | ||||||||
| 著者名 |
加藤, 一臣
李晃伸
河原, 達也
× 加藤, 一臣 李晃伸 河原, 達也
|
|||||||
| 著者名(英) |
Kazuomi, Kato
Akinobu, Lee
Tatsuya, Kawahara
× Kazuomi, Kato Akinobu, Lee Tatsuya, Kawahara
|
|||||||
| 論文抄録 | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | 講演音声ディクテーションのための話し言葉のモデル化とその話題適応の方法を提案する。まず多数の話題からなる講演録を利用して、話題と出現単語の相互情報量に基づいて話題独立語の選択を行い、この語彙によって話題独立の言語モデルとした。このモデルを講演の予稿テキストから構築した言語モデルと重み付け混合することで話題適応を行い、当該講演の言語モデルを構築した。実際に男性話者1名の約10分間の口頭発表に対してディクテーションを行った結果、単語認識精度77.5%という結果が得られた。最後に、間投詞に対処したモデルを用いた結果、80.5%まで単語認識精度を向上できた。 | |||||||
| 論文抄録(英) | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | We present a method to construct a language model for the dictation of lecture speech. Topic independent lexicon is selected based on mutual informaton between the topics and a word using transcriptions of various lectures. This model is adapted to a specific lecture to be transcribed. Specifcally it is mixed with the language model which is built from the preprint paper of the lecture. We have evaluated the model by dictation of oral presentation of the paper. The word accuracy was 77.5%. And by dealing with filler words, the accuracy was improved to 80.5%. | |||||||
| 書誌レコードID | ||||||||
| 収録物識別子タイプ | NCID | |||||||
| 収録物識別子 | AN10442647 | |||||||
| 書誌情報 |
情報処理学会研究報告音声言語情報処理(SLP) 巻 1999, 号 49(1999-SLP-026), p. 9-16, 発行日 1999-05-28 |
|||||||
| Notice | ||||||||
| SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
| 出版者 | ||||||||
| 言語 | ja | |||||||
| 出版者 | 情報処理学会 | |||||||