@techreport{oai:ipsj.ixsq.nii.ac.jp:00141778, author = {王, 一凡 and Yifan, Wang}, issue = {8}, month = {May}, note = {大正新脩大蔵経所収 『一切経音義』 は,活字本でありながら多様な差異を有する膨大な異体字群を内包している.当資料を適切にデジタル化・UCS 符号化するためには,活字の異同を検討したうえで用字に関する体系的な理解を得る必要があるが,総字数 100 万字超,異なり活字約 3 万種と推定される本文を直接点検しながら,一貫性のある分析を行うことは困難である.したがって,活字の集計を省力化する手段が求められる.本報告では,オープンソースライブラリ OpenCV による自動処理を適用することでこれを実現する試みを紹介し,もって特定分野への汎用ライブラリの応用の可能性を提示する., Yiqiejing Yinyi in Taisho Tripitaka is a document embraces a vast range of character variants contrary to its letterpress nature. Accurate digitalization and UCS proposal of its characters require correct understanding of its internal writing system through empirical and consistent research, which would be prohibitively onerous against a book which contains over one million characters and est. 30,000 of different character types. This report seeks a solution by automatic image processing using an open-source library OpenCV, as a case study on application of general-purpose library to a specific humanities field and objective.}, title = {OpenCVを利用した活字画像の切り出し―大正新脩大藏經『一切経音義』の活字字形研究に向けて―}, year = {2015} }