WEKO3
アイテム
局所的な係り受けの情報を用いた話し言葉の節・文境界の推定
https://ipsj.ixsq.nii.ac.jp/records/9273
https://ipsj.ixsq.nii.ac.jp/records/9273a4268b99-92a4-41fc-bbf0-b13841f8245d
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2009 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | Journal(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2009-02-15 | |||||||
タイトル | ||||||||
タイトル | 局所的な係り受けの情報を用いた話し言葉の節・文境界の推定 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Clause and Sentence Boundary Detection for Spontaneous Speech Using Local Syntactic Dependency Information | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 特集:音声ドキュメント処理 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||||
資源タイプ | journal article | |||||||
その他タイトル | ||||||||
その他のタイトル | 情報抽出、構造化 | |||||||
著者所属 | ||||||||
京都大学大学院情報学研究科,現在,日本電気株式会社共通基盤ソフトウェア研究所 | ||||||||
著者所属 | ||||||||
京都大学大学院情報学研究科,京都大学学術情報メディアセンター | ||||||||
著者所属 | ||||||||
京都大学学術情報メディアセンター | ||||||||
著者所属 | ||||||||
京都大学大学院情報学研究科 | ||||||||
著者所属 | ||||||||
京都大学大学院情報学研究科,京都大学学術情報メディアセンター | ||||||||
著者所属(英) | ||||||||
en | ||||||||
School of Informatics, Kyoto Univesity,Presently with Common Platform Software Res. Laboratories, NEC Corporation | ||||||||
著者所属(英) | ||||||||
en | ||||||||
School of Informatics, Kyoto Univesity,Academic Center for Computing and Media Studies, Kyoto University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Academic Center for Computing and Media Studies, Kyoto University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
School of Informatics, Kyoto Univesity | ||||||||
著者所属(英) | ||||||||
en | ||||||||
School of Informatics, Kyoto Univesity,Academic Center for Computing and Media Studies, Kyoto University | ||||||||
著者名 |
西光, 雅弘
秋田, 祐哉
高梨, 克也
尾嶋, 憲治
河原, 達也
× 西光, 雅弘 秋田, 祐哉 高梨, 克也 尾嶋, 憲治 河原, 達也
|
|||||||
著者名(英) |
Masahiro, Saikou
Yuya, Akita
Katsuya, Takanashi
Kenji, Ojima
Tatsuya, Kawahara
× Masahiro, Saikou Yuya, Akita Katsuya, Takanashi Kenji, Ojima Tatsuya, Kawahara
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 講演などの話し言葉音声における節·文境界推定のために,局所的な係り受け情報を用いた段階的チャンキング手法を提案する.節·文境界推定を行ううえで係り受け情報は有効な特徴と考えられるが,話し言葉の文は必ずしも文法的ではなく,またフィラーやいいよどみなどの非流暢現象が含まれている.さらに音声認識器の出力には必然的に認識誤りが含まれており,このようなテキストにおける自動的な係り受け解析は困難である.このため,本研究では隣接する文節間の局所的な係り受けに着目し,サポートベクタマシン(SVM)に基づく段階的テキストチャンキングにおいてこの局所的係り受けを用いた節·文境界の候補の絞り込みを導入する.『日本語話し言葉コーパス』(CSJ)の講演音声における評価において,局所的な係り受けの情報が音声認識結果に対しても頑健に機能し,精度の改善が得られることが示された. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | For robust detection of sentence and clause units in spontaneous speech such as lectures, we propose a novel cascaded chunking strategy which incorporates local syntactic information. Application of general syntactic parsing is difficult for spontaneous speech having ill-formed sentences and disfluencies, especially for erroneous transcripts generated by ASR systems. Therefore, we focus on the local syntactic dependency of adjacent words and phrases, and use this information to limit candidates of clause/sentence boudaries, which are detected by classifiers based on SVM (Support Vector Machines). An experimental evaluation using spontaneous talks of the CSJ (Corpus of Spontaneous Japanese) demonstrates that the proposed dependency analysis can be robustly performed and is effective for clause/sentence unit detection in ASR outputs. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN00116647 | |||||||
書誌情報 |
情報処理学会論文誌 巻 50, 号 2, p. 544-552, 発行日 2009-02-15 |
|||||||
ISSN | ||||||||
収録物識別子タイプ | ISSN | |||||||
収録物識別子 | 1882-7764 |