@article{oai:ipsj.ixsq.nii.ac.jp:00223508, author = {松田, 裕貴 and 榊原, 太一 and 松田, 裕貴 and 水本, 旭洋 and 安本, 慶一 and Hiroki, Matsuda and Taichi, Sakakibara and Yuki, Matsuda and Teruhiro, Mizumoto and Keiichi, Yasumoto}, issue = {1}, journal = {情報処理学会論文誌デジタルプラクティス(TDP)}, month = {Jan}, note = {近年,各テレビ放送局において,個人を特定しない形式で,インターネット接続されたテレビから視聴開始時刻や視聴終了時刻等を含む非特定視聴履歴データを収集し,利活用する取り組みが進められている.しかし,各放送局は自局の非特定視聴履歴データしか利用できないため,膨大なデータを蓄積しているにも関わらず,有用な知見を得るまでに至っていないのが現状である.さらに,非特定視聴履歴データの収集方式やデータ粒度は,各社各様となっており,各局が蓄積したデータを統合し,利用することもできていない.そこで本稿では,各局が独自の方式で取得している非特定視聴履歴データを放送局間でマッチングする手法を提案し,データ統合を行う.提案手法では,視聴履歴データ収集時に集めているIPアドレス・郵便番号・メーカID・ブラウザメジャーバージョン・ブラウザマイナーバージョンの5項目とチャンネル遷移タイミングが一致するテレビを同一テレビと推定する.在阪放送局4社にて,放送局間での非特定視聴履歴データ連携が技術的に可能か検証した「テレビ視聴データ連携に関する共同技術検証実験」において本手法を適用した結果,各放送局で取得された約376万台分のデータのうち約267万台分(約71.0%)のテレビをマッチングできることを確認した., Recently, TV broadcasters have been collecting and utilizing non-personal TV viewing log data, including start and end times of viewing, from TVs connected to the Internet in a format that does not identify individual viewers. However, since each broadcaster can only use its own non-personal TV viewing log data, it has not yet been able to obtain useful knowledge despite the vast amount of data it has accumulated. In addition, the collection methods and data granularity of non-personal TV viewing log data vary from station to station, and the data accumulated by each station cannot be integrated and used. In this paper, we propose a method for matching non-personal TV viewing log data collected by each broadcaster using its own method, and integrate the data. In the proposed method, TVs whose channel transition timing matches five items collected at the time of non-personal TV viewing log data collection (IP address, ZIP code, TV receiver manufacturer ID, browser major version, and browser minor version) are presumed to be the same TV. This method was applied to a “joint technology verification experiment on TV viewing log data linkage” conducted by four broadcasters in Osaka to verify the technical feasibility of linking non-personal TV viewing log data among broadcasters. We confirmed that we were able to match approximately 2.67 million TV sets, which corresponds to 71.0% of the 3.76 million unique TV sets acquired by each broadcaster.}, pages = {34--44}, title = {放送局を横断する大規模テレビ視聴履歴データの統合手法の提案と実践}, volume = {4}, year = {2023} }