WEKO3
アイテム
音声とテキストを用いた認識単語辞書の自動構築
https://ipsj.ixsq.nii.ac.jp/records/9481
https://ipsj.ixsq.nii.ac.jp/records/9481ca65fd7d-c5e2-4c0e-9626-4804d6b98c49
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2008 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | Journal(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2008-08-15 | |||||||
タイトル | ||||||||
タイトル | 音声とテキストを用いた認識単語辞書の自動構築 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Unsupervised Construction of Speech Recognition Lexicon from Speech and Text | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 一般論文 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||||
資源タイプ | journal article | |||||||
その他タイトル | ||||||||
その他のタイトル | 言語メディア処理と情報コンテンツ | |||||||
著者所属 | ||||||||
日本アイ・ビー・エム株式会社東京基礎研究所 | ||||||||
著者所属 | ||||||||
京都大学学術情報メディアセンター | ||||||||
著者所属 | ||||||||
日本アイ・ビー・エム株式会社東京基礎研究所 | ||||||||
著者所属 | ||||||||
日本アイ・ビー・エム株式会社東京基礎研究所 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
IBM Research, Tokyo Research Laboratory, IBM Japan Ltd. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Academic Center for Computing and Media Studies, Kyoto University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
IBM Research, Tokyo Research Laboratory, IBM Japan Ltd. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
IBM Research, Tokyo Research Laboratory, IBM Japan Ltd. | ||||||||
著者名 |
倉田, 岳人
× 倉田, 岳人
|
|||||||
著者名(英) |
Gakuto, Kurata
× Gakuto, Kurata
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 大語彙連続音声認識(LVCSR)システムを新しい分野に導入する場合,その分野特有の単語を認識単語辞書に追加しなければならないが,計算量や認識単語辞書のメンテナンスを考慮すると,必要な分野特有の単語とその正しい読みのみを選択的に追加することが望ましい.しかし,日本語は,単語間に空白が置かれず,読みにもあいまい性があるため,対象分野のテキストデータのみから分野特有の単語とその読みを正しく自動的に獲得することは困難である.本論文では,対象分野のテキストデータに加えて,音声データも利用することで,対象分野特有の単語とその読みを含む小さいサイズの認識単語辞書を自動構築する方法を提案する.提案手法では,最初にテキストデータから再現率を重視した方法で大きいサイズの認識単語辞書を作成した後,その中から,音声データを利用して必要な単語と読みを選択し,小さいサイズの認識単語辞書を構築する.実験により,音声データを利用することで,最初の認識単語辞書のサイズの10%以下の小さい認識単語辞書の追加で,対象分野のLVCSRシステムを構築することができ,それが従来手法と比較して良い認識精度を示すことを確認した. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | When introducing a Large Vocabulary Continuous Speech Recognition (LVCSR) system to a specific domain, it is preferable to add the necessary domain-specific words and their correct pronunciations selectively to the lexicon. In this paper, we propose an unsupervised method of building a domainspecific lexicon in the Japanese language, where no spaces exist between words. In our method, by taking advantage of the speech of the target domain, we selected the domain-specific words from among an enormous number of word candidates extracted from the raw corpora. The experiments showed that by exploiting the acquired lexicon, whose size was negligible, an LVCSR system for the target domain was constructed efficiently and its performance was superior to the performance achieved by the conventional method, in which new words were acquired based on the results of automatic word segmentation. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN00116647 | |||||||
書誌情報 |
情報処理学会論文誌 巻 49, 号 8, p. 2900-2909, 発行日 2008-08-15 |
|||||||
ISSN | ||||||||
収録物識別子タイプ | ISSN | |||||||
収録物識別子 | 1882-7764 |