@inproceedings{oai:ipsj.ixsq.nii.ac.jp:00090144,
 author = {近藤, 明日子 and 小木曽, 智信 and 加藤, 文明子 and Asuko, Kondo and Toshinobu, Ogiso and Fumiko, Kato},
 book = {じんもんこん2010論文集},
 issue = {15},
 month = {Dec},
 note = {明治期から昭和期にかけて設置された高等小学校で用いられた,国定の国語科教科書『高等小学読本』の全文コーパス「高等小学読本コーパス」の概要について報告する。本コーパスは一般に公開する予定である。本コーパスはXMLを用いて,本文テキストにその言語的階層構造や表記等に関する情報を併せて記述する。特に,形態素解析辞書「近代文語UniDic」による形態素解析結果に基づく形態論情報の付与に特長がある。また,本コーパスを簡便に利用してもらうため,全文検索システム「ひまわり」に搭載した形式も用意する。「ひまわり」では本文テキストに対する文字列検索だけでなく,形態論情報に対する検索も可能である。最後に,本コーパスの形態論情報を用いた語彙分析の例を紹介する。, In this paper, we describe the corpus of "Koto Shogaku Tokuhon (高等小学読本)": Japanese textbooks used in higher elementary schools from the Meiji era to the Showa era. This corpus is characterized by morphological annotations based on Kindai Bungo UniDic: an electronic dictionary for morphological analysis which aims to modern Japanese language written in classical style. Moreover, this corpus is included in the full text searching system Himawari, in order to make it easy for users to look up characters and words in it. In addition, we show an analysis of the vocabulary of this corpus using annotations of it.},
 pages = {189--194},
 publisher = {情報処理学会},
 title = {『高等小学読本』の形態論情報付きコーパス},
 volume = {2010},
 year = {2010}
}