@article{oai:ipsj.ixsq.nii.ac.jp:00147432, author = {山田, 渉 and 菊地, 悠 and 落合, 桂一 and 鳥居, 大祐 and 稲村, 浩 and 太田, 賢 and Wataru, Yamada and Haruka, Kikuchi and Keiichi, Ochiai and Daisuke, Torii and Hiroshi, Inamura and Ken, Ohta}, issue = {1}, journal = {情報処理学会論文誌}, month = {Jan}, note = {本論文では,大量かつ広範な話題が投稿されるマイクロブログのTwitterからイベント情報を自動的に抽出する技術を提案する.従来,イベントの自動抽出にはジオタグが付与された投稿件数の急上昇を検知することでイベントを発見する手法が用いられていた.しかし,この手法で検知できるイベントは開催中のイベントに限られており,イベントの名称や開催期間等の詳細情報や,開催中のものだけでなく将来に開催されるイベント情報は抽出できなかった.そこで本研究ではTwitterにおけるイベントの告知に関する投稿に着目し,機械学習を利用してイベントの名称,開催場所,開催期間の情報を抽出する.本手法は次の4段階の処理で構成されている.(1)あらかじめ用意した地名のリストを用いて,ツイートと呼ばれるユーザの投稿文と地名を関連付ける.(2)地名と関連付けられたツイートの中から,Support Vector Machineを用いてイベントの告知に関するツイートを抽出する.(3) Conditional Random Fieldsを用いてイベントの名称と開催期間を抽出する.(4)イベント名称の類似度と開催場所を用いて,表記揺れのある重複したイベント情報の名寄せをする.提案手法の有効性を確認するため,提案手法の再現率と適合率およびイベントの開催期間に対する抽出日について評価をした.その結果,従来法と比較して高い適合率でイベント情報が抽出可能なうえ,現在開催中のイベントだけなく将来のイベント情報も抽出可能なことを確認した., This paper describes a method to extract local event information from the micro-blog service Twitter that holds innumerable user-posted short messages. Previous methods detect event by using surge of geo-tagged user-posted message. However, the approach is only able to detect that event occurs and impossible to extract future event information or detailed event information such as name and holding time. This paper extract event name, venues and holding time of event information from tweets related to local event using machine learning. Our approach composed of four steps: (1) relate user-posted message called tweet to venue by using list of venue, longitude and longitude, (2) extract tweets related to local events from local tweets by Support Vector Machine (SVM) approach, (3) identify and extract names and times of local event from tweets related to local event by applying Conditional Random Fields (CRF), (4) aggregate duplicated local event information by using venues and similarity of names. We implemented the proposed method and evaluate it. As a result, we confirmed that it can extract not only local event information in session but also future one with higher precision than conventional method.}, pages = {123--132}, title = {マイクロブログを用いたイベント情報抽出技術}, volume = {57}, year = {2016} }