WEKO3
アイテム
読点の用法的分類に基づく自動読点挿入
https://ipsj.ixsq.nii.ac.jp/records/69512
https://ipsj.ixsq.nii.ac.jp/records/69512844f17c1-23d5-4b33-95ee-3591c763bec4
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2010 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2010-05-20 | |||||||
タイトル | ||||||||
タイトル | 読点の用法的分類に基づく自動読点挿入 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Automatic Comma Insertion based on Usage Classification of Commas | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 学生セッション2 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
名古屋大学大学院情報科学研究科 | ||||||||
著者所属 | ||||||||
名古屋大学大学院国際開発研究科 | ||||||||
著者所属 | ||||||||
名古屋大学大学院情報科学研究科 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Science, Nagoya University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of International Development, Nagoya University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Science, Nagoya University | ||||||||
著者名 |
村田, 匡輝
× 村田, 匡輝
|
|||||||
著者名(英) |
Masaki, Murata
× Masaki, Murata
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 本論文では,日本語テキストにおける読点の自動挿入手法を提案する.読点は,文中の語や句などの構成要素を区切るために重要な役割を果たす.本手法は,音声認識や機械翻訳などの文生成モジュールや日本語の非母語話者のための文作成支援ツールの要素技術として利用できる.本研究では,読点の用法を分類し,用法ごとに読点の出現傾向を調査した.本手法では,形態素,係り受け,節境界,読点間の距離などの情報を素性とする統計的手法によって読点の挿入位置を同定する.テキストコーパスを使用した実験によって本手法の有効性を確認した. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | This paper proposes a method of automatically inserting commas into Japanese texts. In Japanese, commas play important roles in explicitly separating constituents, such as word, phrase and clause, within a sentence. The method can be used as an elemental technology in natural language generation applications such as speech recognition and machine translation, or in writingsupport tools for nonnative speakers. We categorized the usages of commas and investigated the appearance tendency for each category. In this method, the points into which commas should be inserted are decided based on a machine learning approach. We conducted a comma insertion experiment using a text corpus and confirmed the effectiveness of our method. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10115061 | |||||||
書誌情報 |
研究報告自然言語処理(NL) 巻 2010-NL-196, 号 8, p. 1-8, 発行日 2010-05-20 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |