@techreport{oai:ipsj.ixsq.nii.ac.jp:00055557, author = {桶谷, 猪久夫 and Ikuo, Oketani}, issue = {20(1990-CH-008)}, month = {Mar}, note = {既存のデータベース処理、情報検索システムは分類された特性データを対象とするが、本システムは書籍などの文書(テキスト情報)のような特別に加工されていない一次情報を対象とする。我々は文書データの情報構造に着目し、その物理的な操作対象であるページという物理的な構成と、章、節、項などの論理的な構成を利用者の操作対象とする。文書データベースの機能は、目次検索機能、通覧機能と索引機能からなり、特に効率のよい検索にとって重要な索引機能について述べる。キーワードの抽出において、不要語除去方式を使用した自動キーワード抽出方式と形態素解析の有効性について報告する。, Existing database and information retrieval systems in general are built upon classified data, but this system handles the primary information in the form of documents such as books (text information). We examine the information structure of the document data, and have two types of operational clues in the document database, which are (1) the physical composition, such as the individual pages which separate the document physically and (2) the logical composition, such as chapters and paragraphs. The functions of the document database consist of content retrieval, browsing and indexing functions. We describe in detail the indexing function required for effective retrieval. We describe two automatic keyword extraction methods; one is by morpheme analysis and the other is by the tool based on stop-word removal method.}, title = {文書データベースの設計と構築}, year = {1991} }