@techreport{oai:ipsj.ixsq.nii.ac.jp:00239738, author = {赤池, 英夫 and 赤澤, 紀子 and 角田, 博保 and 中山, 泰一}, issue = {2}, month = {Sep}, note = {我々は高等学校共通教科情報科に対する,用語ベースでの知識体系を明確化し構築することを目指している.これまでに,情報科の教科書の索引に掲載された用語からボトムアップに知識体系が構築可能であることを示したものの,個々の用語は知識体系を構成するグラフ構造の頂点に過ぎず,有用な知識体系構築のためには,用語に属性を付加し,用語間に成り立つさまざまな関係を辺としなくてはならない.そのためには教科書本文にあたる必要がある.そこで,まずはスキャンした教科書をもとに,各ページを構成する見出し,説明文,図・表,脚注などの領域指定を画像上で行い,テキストを含む領域に対しては OCR 処理を施すシステムを作成した.本システムを使用して教科書本文の電子化を行ったのち,手作業による誤変換のチェックと修正を行うことで調査対象の電子データを得ることにした.このデータから,各用語の出現状況や頻度,用語間の出現順や共起関係などの調査を行ったので報告する., We aim to clarify and construct a body of knowledge (BoK) for the common high school curriculum “Informatics” based on terminology. Although we have shown that it is possible to construct such BoK from the terms listed in the index of the Informatics textbook, each term is simply a vertex in the graph structure that forms the core of the BoK, and in order to make it valuable, it is necessary to add useful attributes to each vertex and add various relationships between terms as edges in the graph. To do this, it is necessary to refer to textbooks. Therefore, we first created application software that specified the areas of scanned textbook pages that contained headings, explanations, diagrams, tables, footnotes, etc., and then applied OCR processing to the areas that contained text. Using this software, we digitized the textbook text and we attempted to obtain electronic data by manually checking and correcting any mistranslations. Based on this data, we will report on our investigation of the occurrence and frequency of each term, the order of occurrence between terms, co-occurrence relationships, and so on.}, title = {高等学校共通教科情報科の知識体系構築に向けた教科書本文調査}, year = {2024} }