Item type |
Journal(1) |
公開日 |
2024-02-15 |
タイトル |
|
|
タイトル |
『昭和・平成書き言葉コーパス』の設計・構築・公開 |
タイトル |
|
|
言語 |
en |
|
タイトル |
Design, Construction and Publication of the Showa-Heisei Corpus of Written Japanese |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
[特集:人文科学とコンピュータ] コーパス,日本語学,形態論情報,著作権,コンコーダンサ |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_6501 |
|
資源タイプ |
journal article |
ID登録 |
|
|
ID登録 |
10.20729/00232292 |
|
ID登録タイプ |
JaLC |
著者所属 |
|
|
|
人間文化研究機構国立国語研究所 |
著者所属 |
|
|
|
東京大学 |
著者所属 |
|
|
|
明治大学 |
著者所属 |
|
|
|
和洋女子大学 |
著者所属(英) |
|
|
|
en |
|
|
National Institute for Japanese Language and Linguistics, National Institutes for the Humanities |
著者所属(英) |
|
|
|
en |
|
|
The University of Tokyo |
著者所属(英) |
|
|
|
en |
|
|
Meiji University |
著者所属(英) |
|
|
|
en |
|
|
Wayo Women's University |
著者名 |
小木曽, 智信
近藤, 明日子
髙橋, 雄太
間淵, 洋子
|
著者名(英) |
Toshinobu, Ogiso
Asuko, Kondo
Yuta, Takahashi
Yoko, Mabuchi
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
日本語の歴史的変化を研究するための基礎資料として昭和・平成期の雑誌・ベストセラー書籍・新聞を収録した『昭和・平成書き言葉コーパス』を構築しオンラインで公開した.このコーパスは1933年から2013年までの間,8年おきに11カ年分,合計約3,340万語を収録した大規模なもので,明治・大正期までの『日本語歴史コーパス』の後を承け,現代に至るまでの日本語の成り立ちを探ることのできる資料として,日本語研究に重要な役割を果たすことが期待される.本稿はこのコーパスの設計と構築方法,公開形態について論じ,さらにこのコーパスを応用した研究例の一端を示す. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
The “Showa-Heisei Corpus of Written Japanese,” which contains magazines, best-selling books, and newspapers from the Showa and Heisei eras, has been constructed and made available online as a basic resource for research on the historical changes in the Japanese language. This is a large-scale corpus that contains a total of approximately 33.4 million words for 11 years, every 8 years from 1933 to 2013, and is expected to play an important role in Japanese language research as a resource for exploring the origins of the Japanese language up to the present day, succeeding the “Corpus of Historical Japanese” that contains materials up to the Meiji and Taisho eras. This paper discusses the design and construction of this corpus, the form in which it is published, and provides some examples of research that has applied this corpus. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN00116647 |
書誌情報 |
情報処理学会論文誌
巻 65,
号 2,
p. 278-291,
発行日 2024-02-15
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
1882-7764 |
公開者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |