@techreport{oai:ipsj.ixsq.nii.ac.jp:00079220, author = {延澤, 志保 and 佐野, 智久 and 菊地, 弘晶 and 松原, 正樹 and 岡本, 紘幸 and 斎藤, 博昭 and Shiho, HoshiNobesawa and Tomohisa, Sano and Hiroaki, Kikuchi and Masaki, Matsubara and Hiroyuki, Okamoto and Hiroaki, Saito}, issue = {14}, month = {Nov}, note = {本稿では,固有名詞の表層情報のみを用いてその属性推定を行うことを目的に,地名および人名の表層情報の特徴の差異について検証,考察を行う.ここで対象とする表層情報は,文字単位,単語単位の長さ情報と,n-gramなどの頻度情報である.地名および人名,さらにこれらを混合した3種類のコーパスを11ヶ国について用意し,これらに対して,表層情報のみに基づくシンプルな所属国推定実験を行った結果,11ヶ国から平均1.6国程度まで出力を絞り込むことに成功し,平均90%の再現率を得た., Area identification for proper nouns is an attribute estimation task in the field of unknown word processing. Our aim is to validate the effectiveness of surface information such as length data and n-gram data for area identification task of proper nouns, both toponyms and person names. Empirical results showed that a simple area identification method based on surface information succeeded in reducing area candidate from 11 to 1.6 on average, with 90% recall rate. Mixture corpora of toponyms and person names also obtained fair results.}, title = {固有名詞の所属国推定における表層情報の利用}, year = {2011} }