WEKO3
アイテム
素性頻度ファイルと部分的アノテーションコーパスからの単語分割器の学習
https://ipsj.ixsq.nii.ac.jp/records/82924
https://ipsj.ixsq.nii.ac.jp/records/8292466c9945e-0991-4f26-842b-476a88f93d32
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
Copyright (c) 2012 by the Information Processing Society of Japan
|
|
| オープンアクセス | ||
| Item type | SIG Technical Reports(1) | |||||||
|---|---|---|---|---|---|---|---|---|
| 公開日 | 2012-07-19 | |||||||
| タイトル | ||||||||
| タイトル | 素性頻度ファイルと部分的アノテーションコーパスからの単語分割器の学習 | |||||||
| タイトル | ||||||||
| 言語 | en | |||||||
| タイトル | Training a Word Segmenter from a Feature Frequency File and Partially Annotated Corpora | |||||||
| 言語 | ||||||||
| 言語 | jpn | |||||||
| キーワード | ||||||||
| 主題Scheme | Other | |||||||
| 主題 | 語彙 | |||||||
| 資源タイプ | ||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
| 資源タイプ | technical report | |||||||
| 著者所属 | ||||||||
| 京都大学学術情報メディアセンター | ||||||||
| 著者所属 | ||||||||
| 京都大学学術情報メディアセンター | ||||||||
| 著者所属 | ||||||||
| 奈良先端科学技術大学院大学 | ||||||||
| 著者所属 | ||||||||
| 京都大学学術情報メディアセンター | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Kyoto University, Academic Center for Computing and Media Studies | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Kyoto University, Academic Center for Computing and Media Studies | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Nara Institute of Science and Technology | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Kyoto University, Academic Center for Computing and Media Studies | ||||||||
| 著者名 |
笹田, 鉄郎
森, 信介
Graham, Neubig
河原, 達也
× 笹田, 鉄郎 森, 信介 Graham, Neubig 河原, 達也
|
|||||||
| 著者名(英) |
Tetsuro, Sasada
Shinsuke, Mori
Graham, Neubig
Tatsuya, Kawahara
× Tetsuro, Sasada Shinsuke, Mori Graham, Neubig Tatsuya, Kawahara
|
|||||||
| 論文抄録 | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | 本論文では、素性頻度ファイルと部分的アノテーションコーパスを用いて単語分割器を学習する枠組みについて提案する。一般分野のコーパスから作成した素性頻度ファイルを参照すると、そのコーパスを直接参照しているかのように単語分割器を再学習することが可能である。また、部分的アノテーションコーパスの作成により、低い人的コストで高い分野適応性を実現できる。提案する枠組みを用いて分野適応を行った結果、単語分割の精度が改善されることを確認した。 | |||||||
| 論文抄録(英) | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | This paper propose a framework of training a word segmenter from a feature frequency file and partially annotated corpora. A feature frequency file enable users to rebuild a word segmenter as if they use the original corpora. Patially annotated corpora make it possible to achieve domain adaptation with a minimum amount of annotation. In a domain adaptation experiment, we observed an improvement in the word segmentation accuracy. | |||||||
| 書誌レコードID | ||||||||
| 収録物識別子タイプ | NCID | |||||||
| 収録物識別子 | AN10115061 | |||||||
| 書誌情報 |
研究報告自然言語処理(NL) 巻 2012-NL-207, 号 8, p. 1-5, 発行日 2012-07-19 |
|||||||
| Notice | ||||||||
| SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
| 出版者 | ||||||||
| 言語 | ja | |||||||
| 出版者 | 情報処理学会 | |||||||