WEKO3
アイテム
ドメインとスタイルを考慮したWebテキストの選択による対話システム用言語モデルの構築
https://ipsj.ixsq.nii.ac.jp/records/56871
https://ipsj.ixsq.nii.ac.jp/records/5687147034b27-b10c-414c-9145-32fcceb7ff7c
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2006 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2006-12-22 | |||||||
タイトル | ||||||||
タイトル | ドメインとスタイルを考慮したWebテキストの選択による対話システム用言語モデルの構築 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Efficient Language Model Construction for Spoken Dialog Systems by Web Text Selection Considering Domain and Utterance Style | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
京都大学知能情報学専攻 | ||||||||
著者所属 | ||||||||
京都大学知能情報学専攻 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
School of Informatics, Kyoto University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
School of Informatics, Kyoto University | ||||||||
著者名 |
翠, 輝久
× 翠, 輝久
|
|||||||
著者名(英) |
Teruhisa, MISU
× Teruhisa, MISU
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 音声対話システムにおいて、ユーザの多様な発話を頑健に認識するためには、タスクドメインに合致した十分な量のテキストデータで N-gram 言語モデルを学習することが望ましい。しかし、新たに音声対話システムを作成する際に、ユーザが入力すると想定される発話を大量に用意することは困難である。そこで本研究では、Webから学習データを収集・選択することにより効率よく言語モデルを構築する手法を提案する。Webの検索クエリは、対話システムが対象とするドメインについて記述された文書から作成して、Webを検索する。このようにして収集されたWebテキストの多くは、対話システムのユーザの発話スタイルとマッチしたものではなく、言語モデルの学習データとしてこれらのすべてを使用するのは適切でない。そこで、別の対話システムで収集されたユーザ発話コーパスを併用することで、発話スタイルの近い文を選択する。ソフトウェアサポートと観光案内の2つのドメインにおいて評価を行った結果、音声認識精度の有意な改善が得られた。また実験結果の分析により、Webテキストを選択する際に、テキストのスタイルを考慮することの重要性が確認された。 | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | This paper proposes a bootstrapping method of constructing statistical language models for new spoken dialog systems by collecting and selecting sentences from the World Wide Web (WWW). To make effective search queries that cover the target domain in full detail, we exploit the document set described about the target domain as seeding data. An important issue is hoe to filter the retrieved Web pages, since all of the retrieved Web texts are not necessarily suitable as training data. We induct an existing dialog corpus of different domain to prefer the texts of spoken style. The proposed method was evaluated on two different tasks of software support and sightseeing guidance, and significant reduction of the word error rate was achieved. We show that it is vital to incorporate the dialog corpus, though not relevant to the target domain, in the text selection phase. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10442647 | |||||||
書誌情報 |
情報処理学会研究報告音声言語情報処理(SLP) 巻 2006, 号 136(2006-SLP-064), p. 245-250, 発行日 2006-12-22 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |