WEKO3
アイテム
文字情報と図版情報を有する近世版本コーパスの構築とその応用
https://ipsj.ixsq.nii.ac.jp/records/192450
https://ipsj.ixsq.nii.ac.jp/records/19245004eeb816-a29a-4e88-91e5-abe152b6065b
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
Copyright (c) 2018 by the Information Processing Society of Japan
|
|
| オープンアクセス | ||
| Item type | Symposium(1) | |||||||
|---|---|---|---|---|---|---|---|---|
| 公開日 | 2018-11-24 | |||||||
| タイトル | ||||||||
| タイトル | 文字情報と図版情報を有する近世版本コーパスの構築とその応用 | |||||||
| タイトル | ||||||||
| 言語 | en | |||||||
| タイトル | The Construction and Application of a Corpus Annotated with Information on Orthography and Inset Figures Sourced from Books Published in Edo-period | |||||||
| 言語 | ||||||||
| 言語 | jpn | |||||||
| キーワード | ||||||||
| 主題Scheme | Other | |||||||
| 主題 | corpus\n | |||||||
| キーワード | ||||||||
| 主題Scheme | Other | |||||||
| 主題 | books published in Edo-period\n | |||||||
| キーワード | ||||||||
| 主題Scheme | Other | |||||||
| 主題 | construction\n | |||||||
| キーワード | ||||||||
| 主題Scheme | Other | |||||||
| 主題 | annotation\n | |||||||
| キーワード | ||||||||
| 主題Scheme | Other | |||||||
| 主題 | Hentaigana\n | |||||||
| キーワード | ||||||||
| 主題Scheme | Other | |||||||
| 主題 | Unicode\n | |||||||
| キーワード | ||||||||
| 主題Scheme | Other | |||||||
| 主題 | content development | |||||||
| 資源タイプ | ||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_5794 | |||||||
| 資源タイプ | conference paper | |||||||
| 著者所属 | ||||||||
| 国立国語研究所 | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| National Institute for Japanese Language and Linguistics | ||||||||
| 著者名 |
間淵, 洋子
× 間淵, 洋子
|
|||||||
| 著者名(英) |
MABUCHI, Yoko
× MABUCHI, Yoko
|
|||||||
| 論文抄録 | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | 国立国語研究所では,江戸時代後期の版本を対象としたコーパスを構築している.このコーパスは,表記や図版の情報を中心に,原典の版面の情報に関して詳細なアノテーションを施したもので,新奇的な試みとなるものである.本稿では,このコーパスの特長とデータの仕様について紹介すると共に,構築と研究利用の実践報告として,表記アノテーションの方法とアノテーション試行結果の提示を行う.更に,本コーパスの応用として開発を進めている,字母とUnicodeとで層別した字形(文字画像)データベースと,前近代の書物に親しむ契機として提供する一般向けWebサイトの構想について述べる. | |||||||
| 論文抄録(英) | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | The National Institute for Japanese Language and Linguistics has constructed a corpus of books printed in the late Edo period. This corpus is a novel undertaking with detailed annotation on information in the original text, focusing on orthography and graphics. In this report, I introduce the features of this corpus and the specifications for its data. I also present details about orthographic annotation and annotation trial results, as a practical report on construction and research utilization. In addition, I describe the conceptualization of two applications of this corpus: a database of images of characters indexed by base form and by Unicode ID, and a website for the lay-person to familiarize themselves with pre-modern Japanese texts. | |||||||
| 書誌情報 |
じんもんこん2018論文集 巻 2018, p. 109-116, 発行日 2018-11-24 |
|||||||
| 出版者 | ||||||||
| 言語 | ja | |||||||
| 出版者 | 情報処理学会 | |||||||