WEKO3
アイテム
日本語エンティティリンキングのための行政機関ウェブ文書コーパスの構築
https://ipsj.ixsq.nii.ac.jp/records/235101
https://ipsj.ixsq.nii.ac.jp/records/2351012d0c56be-51b2-4fc0-819b-8eda6211f282
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]()
2026年6月21日からダウンロード可能です。
|
Copyright (c) 2024 by the Information Processing Society of Japan
|
|
非会員:¥660, IPSJ:学会員:¥330, NL:会員:¥0, DLIB:会員:¥0 |
Item type | SIG Technical Reports(1) | |||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|
公開日 | 2024-06-21 | |||||||||||
タイトル | ||||||||||||
タイトル | 日本語エンティティリンキングのための行政機関ウェブ文書コーパスの構築 | |||||||||||
言語 | ||||||||||||
言語 | jpn | |||||||||||
キーワード | ||||||||||||
主題Scheme | Other | |||||||||||
主題 | 言語資源 (1) | |||||||||||
資源タイプ | ||||||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||||||
資源タイプ | technical report | |||||||||||
著者所属 | ||||||||||||
情報通信研究機構 | ||||||||||||
著者所属 | ||||||||||||
情報通信研究機構 | ||||||||||||
著者所属 | ||||||||||||
情報通信研究機構 | ||||||||||||
著者所属(英) | ||||||||||||
en | ||||||||||||
NICT | ||||||||||||
著者所属(英) | ||||||||||||
en | ||||||||||||
NICT | ||||||||||||
著者所属(英) | ||||||||||||
en | ||||||||||||
NICT | ||||||||||||
著者名 |
東山, 翔平
× 東山, 翔平
× 出内, 将夫
× 内山, 将夫
|
|||||||||||
論文抄録 | ||||||||||||
内容記述タイプ | Other | |||||||||||
内容記述 | エンティティリンキングは,言語表現と,実世界の事物・概念を表す知識ベース上のエントリとを対応づけるタスクである.同タスクのための言語資源の構築は,英語を中心に行われており,日本語のシステムの評価に利用できる言語資源は限定的である.本研究では,タスク定義上の論点を踏まえて設計方針を定め,日本特有の事物を指す言語表現を豊富に含む,日本語エンティティリンキングシステムの学習・評価のためのアノテーションコーパスを構築した.アノテーション作業者間一致率の評価から,本コーパスにおけるアノテーションの一貫性の高さを確認し,文字列一致による曖昧性解消の予備実験から,本コーパスを有用な評価ベンチマークとして活用できる可能性を示した. | |||||||||||
書誌レコードID | ||||||||||||
収録物識別子タイプ | NCID | |||||||||||
収録物識別子 | AN10115061 | |||||||||||
書誌情報 |
研究報告自然言語処理(NL) 巻 2024-NL-260, 号 10, p. 1-15, 発行日 2024-06-21 |
|||||||||||
ISSN | ||||||||||||
収録物識別子タイプ | ISSN | |||||||||||
収録物識別子 | 2188-8779 | |||||||||||
Notice | ||||||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||||||
出版者 | ||||||||||||
言語 | ja | |||||||||||
出版者 | 情報処理学会 |