| Item type |
Journal(1) |
| 公開日 |
2009-06-15 |
| タイトル |
|
|
タイトル |
日本語単語分割の分野適応のための部分的アノテーションを用いた条件付き確率場の学習 |
| タイトル |
|
|
言語 |
en |
|
タイトル |
Training Conditional Random Fields Using Partial Annotations for Domain Adaptation of Japanese Word Segmentation |
| 言語 |
|
|
言語 |
jpn |
| キーワード |
|
|
主題Scheme |
Other |
|
主題 |
一般論文(論文賞受賞) |
| 資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_6501 |
|
資源タイプ |
journal article |
| 著者所属 |
|
|
|
日本アイ・ビー・エム株式会社 |
| 著者所属 |
|
|
|
京都大学 |
| 著者所属 |
|
|
|
日本アイ・ビー・エム株式会社 |
| 著者所属 |
|
|
|
NTTソフトウェア株式会社 |
| 著者所属 |
|
|
|
奈良先端科学技術大学院大学 |
| 著者所属(英) |
|
|
|
en |
|
|
IBM Japan, Ltd. |
| 著者所属(英) |
|
|
|
en |
|
|
Kyoto University |
| 著者所属(英) |
|
|
|
en |
|
|
IBM Japan, Ltd. |
| 著者所属(英) |
|
|
|
en |
|
|
NTT Software Corporation |
| 著者所属(英) |
|
|
|
en |
|
|
Nara Institute of Science and Technology |
| 著者名 |
坪井, 祐太
森, 信介
鹿島, 久嗣
小田, 裕樹
松本, 裕治
|
| 著者名(英) |
Yuta, Tsuboi
Shinsuke, Mori
Hisashi, Kashima
Hiroki, Oda
Yuji, Matsumoto
|
| 論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
本研究では文の一部にのみ単語分割情報を付与する部分的アノテーションに注目する.重要な部分や作業負荷の少ない部分にのみアノテーションをすることにより,新しい分野に対応するための学習データを効率的に作成できる.この部分的アノテーションを使用して条件付き確率場(CRF)を学習する方法を提案する.CRFは単語分割および自然言語処理の様々な問題でその有効性が示されている手法であるが,その学習には文全体へのアノテーションが必要であった.提案法は周辺尤度を目的関数にすることで部分的アノテーションを用いたCRFのパラメータ推定を可能にした.日本語単語分割器の分野適応実験において部分的アノテーションによって効果的に性能を向上させることが可能であったことを報告する. |
| 論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
In this paper, we address word-boundary annotations which are done only on part of sentences. By limiting our focus on crucial part of sentences, we can effectively create a training data for each new target domain by conducting such partial annotations. We propose a training algorithm for Conditional Random Fields (CRFs) using partial annotations. It is known that CRFs are wellsuited to word segmentation tasks and many other sequence labeling problems in NLP. However, conventional CRF learning algorithms require fully annotated sentences. The objective function of the proposed method is a marginal likelihood function, so that the CRF model incorporates such partial annotations. Through experiments, we show our method effectively utilizes partial annotations on a domain adaptation task of Japanese word segmentation. |
| 書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN00116647 |
| 書誌情報 |
情報処理学会論文誌
巻 50,
号 6,
p. 1622-1635,
発行日 2009-06-15
|
| ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
1882-7764 |