@techreport{oai:ipsj.ixsq.nii.ac.jp:00018864,
 author = {三枝, 優一 and 古井, 陽之助 and 速水, 治夫 and Yuichi, SAEGUSA and Younosuke, FURUI and Haruo, HAYAMI},
 issue = {6(2007-DBS-141)},
 month = {Jan},
 note = {辞書を用いる形態素解析においては,時代の流れと共に現われ変遷していく口語表現・省略表現・若者言葉等の新語を速やかに辞書に取り入れることで解析精度を高められると期待できる.そこで本研究では,Web上のblogを中心とした文書集合を字種別に切り分け新語候補とし,それらの出現頻度を既に辞書に登録されている語のそれと照合し評価することにより,新語を抽出する手法を提案する.実験では,カタカナのみ,あるいは漢字のみで構成される新語は,複合語を含め80%以上の精度で抽出することができた.また,出現頻度の低い新語についても一部抽出することができた.今後の課題としては,収集した新語の動的な品詞同定と,新語を辞書に取り入れることによる形態素解析精度向上の検証が挙げられる., We believe that a dictionary promptly adopting neologisms produced by new generations will achieve higher precision in morpheme analysis. Therefore, we propose a new method that collects text data from the Web (mainly from blogs), separates the text into candidates of neologisms, and estimates the frequency of each candidate in comparison with that of the words in the dictionary, to determine neologisms.In our experiment, the precision reached 80 percents or higher, concerning neologisms only of Katakana, only of Kanji, and their compounds. In addition, this method also extracted some of neologisms of low frequency. The future work includes investigation of speech identification and experimental evaluation of morpheme analysis improved by the dictionary that adopts neologisms.},
 title = {Webから新語を動的に獲得する形態素解析用辞書拡張方式},
 year = {2007}
}