Item type |
SIG Technical Reports(1) |
公開日 |
2015-05-18 |
タイトル |
|
|
タイトル |
複数ジャンルを対象とした基本固有表現タグ付きコーパスの作成 |
タイトル |
|
|
言語 |
en |
|
タイトル |
Constructing a Japanese Basic Named Entity Corpus of Various Genres |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
言語処理 |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
株式会社富士通研究所 |
著者所属 |
|
|
|
首都大学東京 |
著者所属 |
|
|
|
首都大学東京 |
著者所属 |
|
|
|
東京工業大学 |
著者所属 |
|
|
|
茨城大学 |
著者所属 |
|
|
|
茨城大学 |
著者名 |
岩倉, 友哉
平田, 亜衣
立花, 竜一
山崎, 舞子
市原, 正陽
古宮, 嘉那子
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
本稿では,BCCWJ の複数ジャンルの文書を対象とした固有表現タグ付きコーパスを紹介する.本コーパスは,BCCWJ のコアデータに含まれる Yahoo! 知恵袋,白書,Yahoo! ブログ,書籍,雑誌,新聞の 6 分野,136 文書から構成されており,IREX で定義された 8 種類の固有表現タグが合計 2,464 表現に付与されている. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
This paper introduces a Japanese Named Entity (NE) corpus of various genres. We annotated 136 documents in the Balanced Corpus of Contemporary Written Japanese with the eight types of NE tags defined by IREX. The NE corpus consists of six types of genres of documents such as blogs, magazines, white papers, and so on. The corpus contains 2,464 NE tags in total. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10442647 |
書誌情報 |
研究報告音声言語情報処理(SLP)
巻 2015-SLP-106,
号 13,
p. 1-5,
発行日 2015-05-18
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8663 |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |