WEKO3
アイテム
音声対話システム用クラスN-gramモデルによるドメイン固有語の認識率向上
https://ipsj.ixsq.nii.ac.jp/records/89456
https://ipsj.ixsq.nii.ac.jp/records/89456ec961368-9405-4521-8267-99ba24fcf3fd
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2013 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2013-01-25 | |||||||
タイトル | ||||||||
タイトル | 音声対話システム用クラスN-gramモデルによるドメイン固有語の認識率向上 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Improving ASR Accuracy of Domain-Specific Words by Class N-gram Model for Spoken Dialogue Systems | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 音声対話システム基盤技術 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
名古屋大学大学院工学研究科 | ||||||||
著者所属 | ||||||||
名古屋大学大学院工学研究科 | ||||||||
著者所属 | ||||||||
名古屋大学大学院工学研究科 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Engineering, Nagoya University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Engineering, Nagoya University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Engineering, Nagoya University | ||||||||
著者名 |
森, 祥二郎
駒谷, 和範
佐藤, 理史
× 森, 祥二郎 駒谷, 和範 佐藤, 理史
|
|||||||
著者名(英) |
Shojiro, Mori
Kazunori, Komatani
Satoshi, Sato
× Shojiro, Mori Kazunori, Komatani Satoshi, Sato
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | データベース検索型音声対話システムでは,地名等のドメイン固有語の認識が重要である.本研究では,これをクラスとしたクラス N-gram モデルの構築を行う.これにはコーパスへのクラス付与が不可欠であり,ドメイン固有語を正しく認識するためには,ドメイン固有語が出現する文脈として適切な箇所にクラスを付与する必要がある.本研究では,機械学習を用いて適切な文脈にクラスを付与する.まず,データベース中のドメイン固有語とコーパスを組み合わせ,学習データを作成する.このデータからドメイン固有語が出現する文脈を学習してコーパスへクラスを付与し,これに基づきクラス N-gram モデルを構築する.評価実験ではドメイン固有語とコーパスの文字列マッチングによって作成したクラス N-gram モデルと比較し,ドメイン固有語の認識率向上を示す. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | Domain-specific words such as proper nouns must be correctly recognized in spoken dialogue systems. We construct a class N-gram model to recognize user utterances containing such domain-specific words. In order to recognize domain-specific words, it is necessary to assign semantic classess to appropriate context in a large-scale corpus. We assign semantic classes to the context by means of machine learning. First, we make training data by combining domain-specific words in target relational database for retrieval with a corpus. Next, we construct a class N-gram model from a large-scale corpus to which semantic classes are assigned by machine learning. The experimental evaluation showed that our proposed framework improves ASR accuracy of domain-specific words. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AA1221543X | |||||||
書誌情報 |
研究報告ヒューマンコンピュータインタラクション(HCI) 巻 2013-HCI-151, 号 1, p. 1-8, 発行日 2013-01-25 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |