@inproceedings{oai:ipsj.ixsq.nii.ac.jp:00241534, author = {土井, 惟成 and Nobushige, Doi}, book = {じんもんこん2024論文集}, month = {Nov}, note = {日本の証券取引所に上場している不動産投資信託(J-REIT)の発行体である不動産投資法人は,上場会社と同様に,有価証券報告書をPDF形式またはHTML形式で開示している.有価証券報告書における投資物件情報は,表形式で提供されているものの,そのフォーマットは統一化されておらず,また,データの構造化のためのタグも付与されていない.そのため,J-REIT間で投資物件情報の横断的な比較は困難である.そこで,本研究では,J-REITの投資物件情報に関する表構造認識を支援するための新しいデータセットとして,PNG形式の画像とHTML形式のテキストの表データと,それらをJSON形式で記述した構造化データで構成される,「JreitTableSet」を構築した., Real estate investment corporations, issuers of Real Estate Investment Trusts listed on the Japanese stock exchanges (J-REIT), disclose their securities reports in PDF or HTML formats, similar to listed companies. Although the information on each of their investment properties in securities reports is provided in tabular form, the formats are not standardized, and there are no tags for structuring this data. This lack of uniformity makes comparing property information across different J-REITs difficult. To address this challenge, this study developed a new dataset, "JreitTableSet," that consists of PNG image data, HTML text data, and data describing these in JSON format to support table structure recognition for J-REIT property information.}, pages = {233--240}, publisher = {情報処理学会}, title = {JreitTableSet: J-REITの投資物件に関する表構造認識のためのデータセットの構築}, volume = {2024}, year = {2024} }