WEKO3
アイテム
用法の違いを考慮した類似単語の置換による学習データ生成とそれを用いた主題の違いに頑健な言語モデルの構築
https://ipsj.ixsq.nii.ac.jp/records/69513
https://ipsj.ixsq.nii.ac.jp/records/6951382634367-61d4-4802-a4d4-f3dad1843291
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2010 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2010-05-20 | |||||||
タイトル | ||||||||
タイトル | 用法の違いを考慮した類似単語の置換による学習データ生成とそれを用いた主題の違いに頑健な言語モデルの構築 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Training of robust language models by automatic sentence generation based on word replacing words with respect to their contexts | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 学生セッション2 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
東京大学 | ||||||||
著者所属 | ||||||||
東京大学 | ||||||||
著者所属 | ||||||||
東京大学 | ||||||||
著者所属 | ||||||||
東京大学 | ||||||||
著者所属 | ||||||||
東京大学 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
The University of Tokyo | ||||||||
著者所属(英) | ||||||||
en | ||||||||
The University of Tokyo | ||||||||
著者所属(英) | ||||||||
en | ||||||||
The University of Tokyo | ||||||||
著者所属(英) | ||||||||
en | ||||||||
The University of Tokyo | ||||||||
著者所属(英) | ||||||||
en | ||||||||
The University of Tokyo | ||||||||
著者名 |
清水, 信哉
× 清水, 信哉
|
|||||||
著者名(英) |
Shinya, Shimizu
× Shinya, Shimizu
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 話し言葉の言語モデルを構築する際には,タスクにマッチした学習データが十分量得られないことが多い.そのデータの不足を補うため,学習データ中の単語を類似単語に置換することにより新たに学習データを生成するという手法を提案する.しかし,単語は文脈によって意味が変わるため,単に置換する単語のペアをあらかじめ決めておくことは適切ではない.そこで本稿では,係り受け関係に着目し,文脈に依存して置換する単語が変化するような指標を提案する.さらに,CSJ (日本語話し言葉コーパス) を用いた評価実験を行い,本手法の有効性を示した. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | In some cases, a sufficient amount of training data is not available to build language models, especially those for spontaneous speech.To solve this problem, this paper proposes a new method of automatic generation of in-domain sentences based on word replacement. However, we cannot adopt a simple and static strategy for replacing words because the meaning of words easily vary depending on its context. Which word to be replaced with which word? Adequate sets of word pairs should be changed dynamically. Therefore, in this paper we propose a method of using a local dependency structure within a sentence as context, which can adequately select words to replace a given word with. Experimental results using CSJ (Corpus of Spontaneous Japanese) show the validity of the proposed method. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10115061 | |||||||
書誌情報 |
研究報告自然言語処理(NL) 巻 2010-NL-196, 号 9, p. 1-6, 発行日 2010-05-20 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |