@techreport{oai:ipsj.ixsq.nii.ac.jp:00047723, author = {梅木, 定博 and 森本, 貴之 and 後藤智範 and Sadahiro, Umeki and Takayuki, Morimoto and Tomonori, Gotoh}, issue = {33(2008-NL-184)}, month = {Mar}, note = {日本語のテキストにおいて、主要な概念・テーマは漢字熟語または漢字熟語を含む名詞句に表現されることが多い。特に数文字以上の漢字熟語は、学術論文や特許文書おいてこの傾向が強い。数文字以上の漢字熟語はより短い漢字熟語、すなわち語基(word base)から構成され、統語的、意味的構造を有している。大規模な漢字熟語集合について、これらの構造を分析することは漢字熟語の造語構造、形態素解析、関連語の選定、未知語の推定など様々な自然言語解析に有用な基礎データを提供するものと考えられる。本研究は、一般辞書および専門用語辞書の見出し語から6文字の漢字熟語を対象に、構成語基の観点から品詞列パターンおよび構成語基の係り受けパターンについて調査・分析した。, Kanji compound words or noun phrase consisted in them intend to explain key concepts or themes in Japanese texts.. Especially long kanji compound words have these characteristics in academic papers or patent documents. Long kanji compound words, which have five letters more consists of short word bases and have syntactical and semantical structures. It should be much beneficial to survey to a large set of long kanji words based on word base sequence patterns.Our research examines the patterns of the large set of six-kanji compound words which are contained in entry terms of the various kinds of dictionaries. This paper reports the occurrences of kanji compound words and the number of parts of speech sequence per a word base sequence pattern.}, title = {辞書見出し語の6文字漢字熟語を対象とした語基構成の解析}, year = {2008} }