WEKO3
アイテム
文書の見出し記号の解析に基づく木状論理構造生成の一手法
https://ipsj.ixsq.nii.ac.jp/records/120433
https://ipsj.ixsq.nii.ac.jp/records/12043313657bb9-378d-46a4-b577-8fa80d4b7cad
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
|
Item type | National Convention(1) | |||||
---|---|---|---|---|---|---|
公開日 | 1991-02-25 | |||||
タイトル | ||||||
タイトル | 文書の見出し記号の解析に基づく木状論理構造生成の一手法 | |||||
タイトル | ||||||
言語 | en | |||||
タイトル | AN EXTRACION METHOD OF DOCUMENT LOGICAL STRUCTURES BY ANALYZING MARKS | |||||
言語 | ||||||
言語 | jpn | |||||
資源タイプ | ||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_5794 | |||||
資源タイプ | conference paper | |||||
著者所属 | ||||||
(株)日立製作所 中央研究所 | ||||||
著者所属 | ||||||
(株)日立製作所 中央研究所 | ||||||
著者所属 | ||||||
(株)日立製作所 中央研究所 | ||||||
著者所属 | ||||||
(株)日立製作所 中央研究所 | ||||||
著者所属(英) | ||||||
en | ||||||
Central Research Lbaratory, Hitachi, Ltd. | ||||||
著者所属(英) | ||||||
en | ||||||
Central Research Lbaratory, Hitachi, Ltd. | ||||||
著者所属(英) | ||||||
en | ||||||
Central Research Lbaratory, Hitachi, Ltd. | ||||||
著者所属(英) | ||||||
en | ||||||
Central Research Lbaratory, Hitachi, Ltd. | ||||||
論文抄録 | ||||||
内容記述タイプ | Other | |||||
内容記述 | 紙に印刷されている科学技術文献は膨大な量に及び、これをワークステーション等の計算機上に移しデータベース化するには多くの時間と人手を必要とする。このため、文献データベースの構築においては、紙面に印刷されている科学技術文献の文字を認識し、文字列の内容を解析し、所定の形式で自動的に登録することが期待されている。特に、科学技術文献では、文書の章、節、項といった論理的な構成も技術情報においては重要である。そのため、紙上の要素のレイアウトを基に、章、節の文書の論理的な構成を自動的に抽出することを行なっている。また、文書の構成要素を関係リンクで結合したハイパーテキストがテキストデータベースの知的システムとして注目されている。対象とする科学技術文献の論理構造では、章、節を表わす見出し記号に記載上のばらつきが文献ごとに存在するという問題があり、表記の上でのあいまい性、多様性を解消する必要がある。本研究の目的は、このような表記上のゆれがある章、節等の見出し文字列から文書の論理構造を自動的に生成することである。ここでは、本文中の章、節、項に対応した見出しを解析し、ツリー状の論理構造を自動的に生成するものであり、一次元に並んだ文字列で表現されているテキストファイルを階層的な木構造に変換することができ、文献データベースやハイパーテキストの自動構築に有効な技術である。 | |||||
書誌レコードID | ||||||
収録物識別子タイプ | NCID | |||||
収録物識別子 | AN00349328 | |||||
書誌情報 |
全国大会講演論文集 巻 第42回, 号 ソフトウェア, p. 187-188, 発行日 1991-02-25 |
|||||
出版者 | ||||||
言語 | ja | |||||
出版者 | 情報処理学会 |