@article{oai:ipsj.ixsq.nii.ac.jp:00209074, author = {馬場, 弘樹 and 関口, 知子 and 清田, 陽司 and 清水, 千弘 and Hiroki, Baba and Tomoko, Sekiguchi and Yoji, Kiyota and Chihiro, Shimizu}, issue = {1}, journal = {情報処理学会論文誌データベース(TOD)}, month = {Jan}, note = {不動産取引の網羅的な捕捉にあたって有力な情報源となる不動産募集広告情報は,多数の不動産仲介業者によって作成されているため,情報の重複や精度など,利用にあたって解決すべき課題がある.特に,都市部の賃貸市場において大多数を占める集合住宅物件(マンション・アパートなど)の情報には多数の重複がみられ,同一の部屋(住戸)を集約する作業が必須である.本論文では,同一物件である可能性の高い住戸情報を集約するタスクを,データ工学におけるレコード同定問題の一種として定義し,文献・個人・商品などの集約タスクとの性質の違いを示したうえで,クラスタリングなどの既知のデータ処理手法を適用することで,実用的な精度が達成できるかどうかを検証した結果を報告する., Real estate information database, an influential data source for comprehensive understanding of real estate transactions, has some problems, since the database is created by multiple real estate intermediary agents. Particularly, we confirm that there are substantial duplication in condominiums and apartments, and thus, it is necessary to integrate the duplicate records together. We regard the task as one of record linkage problems, and develop the model integrating the high likelihood of dwellings with the application to existing data handling techniques such as hierarchical clustering. We then validate whether the integrated records by the proposed method achieve practical recall and precision.}, pages = {18--29}, title = {不動産取引データベースの網羅性向上を目的とした不動産募集広告情報のレコード同定}, volume = {14}, year = {2021} }