WEKO3
アイテム
ライフサイエンス分野を対象とした低レベルのテキスト処理
https://ipsj.ixsq.nii.ac.jp/records/48215
https://ipsj.ixsq.nii.ac.jp/records/482150686b19c-d4d6-4368-9311-b05c3e7b1831
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2004 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2004-01-14 | |||||||
タイトル | ||||||||
タイトル | ライフサイエンス分野を対象とした低レベルのテキスト処理 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Low - level Text Processing for Life Science | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
理化学研究所ゲノム総合科学センターゲノム情報科学グループ | ||||||||
著者所属 | ||||||||
理化学研究所ゲノム総合科学センターゲノム情報科学グループ | ||||||||
著者所属 | ||||||||
北陸先端科学技術大学院大学知識科学研究科知識科学研究科 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Bioinformatics Group, Genome Sciences Center, RIKEN | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Bioinformatics Group, Genome Sciences Center, RIKEN | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Knowledge Science, Japan Advanced Institute of Science and Technology | ||||||||
著者名 |
山本, 薫
× 山本, 薫
|
|||||||
著者名(英) |
Kaoru, Yamamoto
× Kaoru, Yamamoto
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | ライフサイエンス分野テキストに特有な言語現象を調査し、分析結果を足掛かりに、GENIA Corpus 3.02 のわかち書き仕様と品詞体系の変更箇所を提案し、統計的自然言語処理の手法を用いて形態素解析システム「cocab」を実現した。予備実験で、今回提案した仕様でタグ付与したコーパスから学習したモデルは、GENIA Corpus 3.02 から直接学習したモデルより、誤り率が改善されることを確認した。 | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | We investigate language phenomena specific to PubMed abstracts, propose positive modifications to tokenization and part-of-speech tagging guidelines in GENIA Corpus 3.02, and implement morphological analyzer ``cocab'' using statistical natural language processing techniques. Preliminary experiments show that the model trained from the modified corpus has improved the error rate from the original corpus. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10115061 | |||||||
書誌情報 |
情報処理学会研究報告自然言語処理(NL) 巻 2004, 号 1(2003-NL-159), p. 123-130, 発行日 2004-01-14 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |