2024-03-29T03:35:03Zhttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_oaipmhoai:ipsj.ixsq.nii.ac.jp:000567172023-04-27T10:00:04Z01164:05159:05168:05170
フィラーの書き起こしのないコーパスからのフィラー付き言語モデルの構築Construction of Language Model with Fillers from Corpus without Fillersjpnhttp://id.nii.ac.jp/1001/00056717/Technical Reporthttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_action_common_download&item_id=56717&item_no=1&attribute_id=1&file_no=1Copyright (c) 2007 by the Information Processing Society of Japan豊橋技科大豊橋技科大豊橋技科大太田, 健吾土屋, 雅稔中川, 聖一フィラーを含まないコーパスから,フィラー予測モデルを利用してフィラー付き言語モデルを作成する方法を提案する.フィラー予測モデルは,周辺コンテキストを用いてフィラー挿入個所を推定するフィラー挿入モデルと,推定された箇所に挿入すべきフィラーを周辺のコンテキストに基づいて予測するフィラー選択モデルの2つのモデルからなる.日本語話し言葉コーパスと国会会議録に対する評価実験の結果,本提案手法は,フィラーを含む正確な話し言葉コーパスから作成した3-gramモデルにきわめて近い言語モデルを再現できることを示す.This paper proposes a novel method to construct a spoken language model with fillers using a filler prediction model from a corpus without fillers. The filler prediction model consists of two models: a filler insertion model which predicts places where fillers should be inserted, and a filler selection model which predicts appropriate fillers for given places. The experiments against the corpus of spontaneous Japanese and Japanese National Diet Record show that language models constructed by the proposed method achieve quite near performance of the traditional 3-gram language model constructed from the exact spontaneous speech corpus including fillers.AN10442647情報処理学会研究報告音声言語情報処理(SLP)200775(2007-SLP-067)162007-07-202009-06-30