@techreport{oai:ipsj.ixsq.nii.ac.jp:00083197, author = {美馬, 秀樹 and 丹治, 信 and 増田, 勝也 and 太田, 晋 and Hideki, Mima and Makoto, Tanji and Katsuya, Masuda and Susumu, Ota}, issue = {4}, month = {Jul}, note = {本研究の目的は,1921年に創刊された岩波書店『思想』90年分(約1000号,約8600論文,約16万ページ)を題材とし,電子化・構造化を行うことで,a)『思想』という知の集積,分析により20世紀日本の哲学・思想史を明らかにすること,b)分析結果の学部・大学院教育での活用の方法論構築を進めること,及びc)歴史的文献テキストの電子化,アーカイブ化に関する方法論を確立すること,である.本稿では,上記『思想』のデジタルアーカイブ化とテキストマイニングに関し,『思想』雑誌の電子化・構造化の手順とその問題点を報告し,特に,OCRによる文字認識精度の向上,自動化・システム化に向けたレイアウト解析ソフトウェアの開発について,現状の取り組みと予備的に行った実験評価について報告する., The purpose of this study is to reveal Japanese modern history of philosophy by structuring Iwanami shoten's journal “Shisou” (Thoughts) using MIMA Search structuring knowledge system in which natural language processing (NLP), text mining and visualization are integrated. Iwanami shoten's “Shisou” is one of the represent journals of philosophy in Japan, which has almost 90 years history from 1921 to the present-day, about 8,600 papers / more than 160,000 pages textual data. By digitalizing and analyzing the huge historical textual data using optical character recognition (OCR), NLP and the MIMA Search, we expect to discover new knowledge on Japanese historical flow of thinking during one of the most important eras, from before the World War II to the present-day.}, title = {近代文献のデジタルアーカイブ化とテキストマイニング―岩波書店「思想」を題材に}, year = {2012} }