WEKO3
アイテム
JreitTableSet: J-REITの投資物件に関する表構造認識のためのデータセットの構築
https://ipsj.ixsq.nii.ac.jp/records/241534
https://ipsj.ixsq.nii.ac.jp/records/241534fe04c24f-cb29-4f7f-a907-43183b6a21bf
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
Copyright (c) 2024 by the Information Processing Society of Japan
|
|
| オープンアクセス | ||
| Item type | Symposium(1) | |||||||
|---|---|---|---|---|---|---|---|---|
| 公開日 | 2024-11-30 | |||||||
| タイトル | ||||||||
| タイトル | JreitTableSet: J-REITの投資物件に関する表構造認識のためのデータセットの構築 | |||||||
| タイトル | ||||||||
| 言語 | en | |||||||
| タイトル | JreitTableSet: Construction of a Dataset for Table Structure Recognition of J-REIT's Investment Properties | |||||||
| 言語 | ||||||||
| 言語 | jpn | |||||||
| キーワード | ||||||||
| 主題Scheme | Other | |||||||
| 主題 | 有価証券報告書,表構造認識,データセット,J-REIT,物件情報,大規模言語モデル | |||||||
| 資源タイプ | ||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_5794 | |||||||
| 資源タイプ | conference paper | |||||||
| 著者所属 | ||||||||
| 株式会社日本取引所グループ/東京大学大学院 | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Japan Exchange Group, Inc./The University of Tokyo | ||||||||
| 著者名 |
土井, 惟成
× 土井, 惟成
|
|||||||
| 著者名(英) |
Nobushige, Doi
× Nobushige, Doi
|
|||||||
| 論文抄録 | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | 日本の証券取引所に上場している不動産投資信託(J-REIT)の発行体である不動産投資法人は,上場会社と同様に,有価証券報告書をPDF形式またはHTML形式で開示している.有価証券報告書における投資物件情報は,表形式で提供されているものの,そのフォーマットは統一化されておらず,また,データの構造化のためのタグも付与されていない.そのため,J-REIT間で投資物件情報の横断的な比較は困難である.そこで,本研究では,J-REITの投資物件情報に関する表構造認識を支援するための新しいデータセットとして,PNG形式の画像とHTML形式のテキストの表データと,それらをJSON形式で記述した構造化データで構成される,「JreitTableSet」を構築した. | |||||||
| 論文抄録(英) | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | Real estate investment corporations, issuers of Real Estate Investment Trusts listed on the Japanese stock exchanges (J-REIT), disclose their securities reports in PDF or HTML formats, similar to listed companies. Although the information on each of their investment properties in securities reports is provided in tabular form, the formats are not standardized, and there are no tags for structuring this data. This lack of uniformity makes comparing property information across different J-REITs difficult. To address this challenge, this study developed a new dataset, "JreitTableSet," that consists of PNG image data, HTML text data, and data describing these in JSON format to support table structure recognition for J-REIT property information. | |||||||
| 書誌情報 |
じんもんこん2024論文集 巻 2024, p. 233-240, 発行日 2024-11-30 |
|||||||
| 出版者 | ||||||||
| 言語 | ja | |||||||
| 出版者 | 情報処理学会 | |||||||