@techreport{oai:ipsj.ixsq.nii.ac.jp:00048576, author = {白井, 清昭 and 柏野, 和佳子 and 橋本, 三奈子 and 徳永, 健伸 and 有田, 英一 and 井佐原, 均 and 荻野, 紫穂 and 小船, 隆一 and 高橋, 裕信 and 長尾, 確 and 橋田, 浩一 and 村田, 真樹 and Shirai, Kiyoaki and Kashino, Wakako and Hashimoto, Minako and Tokunaga, Takenobu and Arita, Eiichi and Isahara, Hitoshi and Ogino, Shiho and Kobune, Ryuichi and Takahashi, Hironobu and Nagao, Katashi and Hasida, KÔIti and Murata, Masaki}, issue = {9(2000-NL-141)}, month = {Jan}, note = {本論文では,我々が作成した語義タグ付きテキストデータベースの概要について述べる.テキストは毎日新聞の3 000個の記事である.888 000形態素のうち,名詞,動詞,形容詞あわせて149 556形態素を語義タグを付与する対象とした.語義タグは岩波国語辞典によって定義される.すなわち,岩波国語辞典の語釈をそのまま形態素に与える語義タグとする.対象形態素の97.9%は,岩波国語辞典の語釈の中から適切な語義を選ぶことができた.最終的には,今回与えた語義情報と,形態素情報,統語情報,照応・共参照情報をGDA(Global Document Annotation)タグによって統合したテキストデータベースを作成する予定である., In this paper, we describe the overview of the word sense tagged text database we currently construct. As target words to which word sense tags would be assigned, we chose 149,556 words, which are nouns, verbs or adjectives, from 888,000 words in the 3,000 newspaper articles excerpted from Mainiti Shinbun. We used word sense description in Iwanami Kokugo Jiten, which is a published Japanese dictionary, as word sense tags. For 97.9% of target words, the appropriate word sense description were found in Iwanami Kokugo Jiten. In addition to these word sense tags, we will annotate the text with morphological, syntactic, anaphoric and coreference information in GDA (Global Document Annotation) tag format in future.}, title = {岩波国語辞典を利用した語義タグ付きテキストデータベースの作成}, year = {2001} }