@techreport{oai:ipsj.ixsq.nii.ac.jp:00183370,
 author = {福山, 怜史 and 若林, 啓},
 issue = {17},
 month = {Sep},
 note = {Twitter においてバースト現象が確認されたハッシュタグを収集することは,現実世界で流行している話題を抽出する上で重要なアプローチである.しかしハッシュタグには表記揺れや抽象度が曖昧な性質が存在するため,同じ話題を指し示しているタグが重複したり,バーストしていないタグでもバーストしたタグと同じ話題を示すタグが存在する可能性がある.この問題を解決するためにハッシュタグのクラスタリングが必要であるが,全てのタグのクラスタリング処理は計算コストが高いため,効率的な手法が必要となる.本研究では,以上の問題を効率的に解決することを目的として,バーストしたハッシュタグのみクラスタリングを行い,得られたクラスタにバーストしていないハッシュタグを割り当てる手法を提案する.これによりクラスタリングのサンプル数はバーストしたハッシュタグだけになるため,クラスタリングに掛かる処理時間が短縮できる.提案手法では,移動平均線収束拡散法によってハッシュタグのバーストの強さを数値化し,異常値を持つとして検出されたハッシュタグをバーストしたハッシュタグとみなす.そして,バーストしたハッシュタグを k 平均法によってクラスタリングし,バーストしていないハッシュタグを生成したクラスタに割り当てる.本稿では,先行研究の手法によって生成されたクラスタと比較して,提案手法によるクラスタが,話題に対するハッシュタグの網羅性が高く,クラスタリングにかかる処理時間が大幅に短縮されることを報告する.},
 title = {バースト現象を考慮したハッシュタグのクラスタリング手法の提案},
 year = {2017}
}