WEKO3
アイテム
コーパス管理ツール「茶器」による単語情報付き古典語コーパスの活用
https://ipsj.ixsq.nii.ac.jp/records/79416
https://ipsj.ixsq.nii.ac.jp/records/7941623c94365-2960-48eb-b491-77a3c0bdbc6b
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2011 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | Symposium(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2011-12-09 | |||||||
タイトル | ||||||||
タイトル | コーパス管理ツール「茶器」による単語情報付き古典語コーパスの活用 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Application of the corpus management tool ChaKi to morphologically annotated corpora of classical Japanese | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_5794 | |||||||
資源タイプ | conference paper | |||||||
著者所属 | ||||||||
人間文化研究機構国立国語研究所言語資源研究系/奈良先端科学技術大学院大学情報科学研究科 | ||||||||
著者所属 | ||||||||
奈良先端科学技術大学院大学情報科学研究科 | ||||||||
著者所属 | ||||||||
奈良先端科学技術大学院大学情報科学研究科 | ||||||||
著者所属 | ||||||||
奈良先端科学技術大学院大学情報科学研究科 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Corpus Studies, National Institute for Japanese Language and Linguisics, National Institutes for the Humanities / Graduate School of Information Science, Nara Institute of Science and Techno | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Science, Nara Institute of Science and Techno | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Science, Nara Institute of Science and Techno | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Science, Nara Institute of Science and Techno | ||||||||
著者名 |
小木曽, 智信
× 小木曽, 智信
|
|||||||
著者名(英) |
Toshinobu, Ogiso
× Toshinobu, Ogiso
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 近年、古典文学などの歴史的な日本語テキストの自動形態素解析が可能になった。しかし、一般的な日本語研究者にとって、言語学的な研究のために形態素解析済みのコーパスを利用することは困難であった。これは主として、検索や集計、統計的な分析のための十分なツールが存在しなかったためである。だが、形態素解析済みのコーパスを作成・検索するための汎用コーパス管理ツール「茶器」が開発された。「茶器」は形態素解析や係り受け解析などの多様な言語学的アノテーションを扱うことが可能であり、その機能は歴史的な日本語資料の言語学的研究に十分なものとなってきている。そこで、我々は「茶器」を形態素解析済みの歴史的なテキストに応用した。これにより歴史的な日本語資料を対象にした自由度の高い検索や、n グラムやMI スコアなどを用いた統計的な分析が可能になる。 | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | Recently, automatic morphological analysis for historical Japanese texts has become practical. However, it is difficult for general Japanese linguists to use automatically tagged corpora for their linguistic research. This is chiefly because there do not exist effective tools for search, summarization and statistical analysis on linguistic corpus. Nevertheless, a general corpus management tool ChaKi was developed for creating and searching annotated corpora. Since ChaKi can deal with various linguistic annotations including morphological analysis and dependency relation, its function is sufficient for linguistic research of historical Japanese texts. Accordingly, we adopted ChaKi to morphologically analyzed texts of historical Japanese. It allows flexible search and statistical analysis such as n-gram frequencies, mutual information (MI) scores, and frequent sequence mining on historical Japanese. | |||||||
書誌情報 |
じんもんこん2011論文集 巻 2011, 号 8, p. 255-260, 発行日 2011-12-03 |
|||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |