WEKO3
アイテム
局所的話速変化検出を指向した簡易セグメンテーション手法と実環境音声への適用について
https://ipsj.ixsq.nii.ac.jp/records/56330
https://ipsj.ixsq.nii.ac.jp/records/56330abac5d85-4ff3-4360-8a8a-9fff826ea76d
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 1999 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 1999-02-18 | |||||||
タイトル | ||||||||
タイトル | 局所的話速変化検出を指向した簡易セグメンテーション手法と実環境音声への適用について | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | A simple method of phoneme segmentation for detection of local speech rate variation and its application to speech data recorded in real environment | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
北海道大学工学部 | ||||||||
著者所属 | ||||||||
北海道大学工学部 | ||||||||
著者所属 | ||||||||
北海道大学工学部 | ||||||||
著者所属 | ||||||||
北海道大学工学部 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Engineering Hokkaido University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Engineering Hokkaido University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Engineering Hokkaido University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Engineering Hokkaido University | ||||||||
著者名 |
佐々木, 淳一
広重, 真人
宮永, 喜一
栃内, 香次
× 佐々木, 淳一 広重, 真人 宮永, 喜一 栃内, 香次
|
|||||||
著者名(英) |
Junichi, Sasaki
Makoto, Hiroshige
Yoshikazu, Miyanaga
Koji, Tochinai
× Junichi, Sasaki Makoto, Hiroshige Yoshikazu, Miyanaga Koji, Tochinai
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 本報告では、自発音声の局所的話速変化自動検出を目的とした簡易セグメンテーション手法について述べる。一般に話速変化に乏しいと言われる日本語音声では、まれに現れる話速変化箇所が強い表現力を持つ可能性があると考えられる。本手法は話速変化情報を音素の認識以前に得ることを目的とし、将来的に連続音声認識や言語的復元・意味理解等の各処理に有益な情報を提供することを想定している。本報告では、話者の意図と対応をとりやすい意味的な「まとまり区間」ごとに音素変化回数を算出することにより話速変化を表現することを試みる。また、話速変化を豊富に含むと考えられる自発音声を実環境において収録し、話速変化検出実験を行なった結果について述べる。 | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | In this report, a simple method of phoneme segmentation for detection of local speech rate variation is described. It is said that Japanese speech contains less variation of speech rate than other languages. Thus if there is a large variation of speech rate, such portion of speech may contain speaker's strong intention. The speech rate obtained with this method is expected to supply useful information to speech recognition system, recognition error correction system, or speech understanding system. In this report, we express speech rate variation by calculating the number of phoneme changes within a particular time duration that is selected to easily express speaker's intention. Spontaneous speech data which may contain large amount of rate variation are recorded in real environment. The results of rate detection experiments for the recorded speech data are described. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10438388 | |||||||
書誌情報 |
情報処理学会研究報告音楽情報科学(MUS) 巻 1999, 号 16(1998-MUS-029), p. 95-102, 発行日 1999-02-18 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |