@techreport{oai:ipsj.ixsq.nii.ac.jp:00079346, author = {酒井, 敏彦 and 芦川, 将之 and 廣川, 佐千男 and Toshihiko, Sakai and Masayuki, Ashikawa and Sachio, Hirokawa}, issue = {3}, month = {Dec}, note = {Web 上には様々なメディアがあり,新たな言葉が生み出されている.特に,Facebook,Twitter などの CGM(Consumer Generated Media) は多くのユーザがコミュニケーションツールとして利用しており,膨大なテキスト情報が増え続けている.これらのテキストの形態素解析には辞書が用いられる.しかし辞書は新語や省略された単語などの未知語の解析に弱いという欠点がある.そこで本稿では,Twitter のデータを利用して辞書の語彙を増やす方法を提案する.まず,Twitter の文章を形態素解析し,未知語と判定されたものから略語候補を抽出する.次に,Crowdsourcing System を用いて,略語か否かの判定,略語の読み付け及び略語に対する正式な言葉への変換を行う., New words and abbreviated words are being born every day in CGM(consumer generated media) on the Web, such as Facebook and Twitter. Those words are not in the standard dictionaries and cause many difficulties in morphological analysis. This paper proposes a method to increase vocabularies from Twitter using Crowdsourcing. At the first stage, unknown words are chosen as candidates of new abbreviated words using a standard morphological analysis. At the second stage, Crowdsourcing System is used to determine if a word is an abbreviated word. Couwdsourcing System is used at the third stage to obtain the correct reading and the proper word.}, title = {Crowdsourcing System を用いた略語の推定手法の提案}, year = {2011} }