WEKO3
アイテム
漢字シソーラスの構築と語句解析への応用
https://ipsj.ixsq.nii.ac.jp/records/129472
https://ipsj.ixsq.nii.ac.jp/records/129472bac3b7a2-ec3e-479f-96b3-ff39075ede76
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
|
Item type | National Convention(1) | |||||
---|---|---|---|---|---|---|
公開日 | 1996-03-06 | |||||
タイトル | ||||||
タイトル | 漢字シソーラスの構築と語句解析への応用 | |||||
タイトル | ||||||
言語 | en | |||||
タイトル | Construction of KANJI-thesaurus for Syntactic Analysis of Japanese Documents | |||||
言語 | ||||||
言語 | jpn | |||||
資源タイプ | ||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_5794 | |||||
資源タイプ | conference paper | |||||
著者所属 | ||||||
埼玉大学工学部情報システム工学科 | ||||||
著者所属 | ||||||
埼玉大学工学部情報システム工学科 | ||||||
著者所属 | ||||||
埼玉大学工学部情報システム工学科 | ||||||
著者所属 | ||||||
埼玉大学工学部情報システム工学科 | ||||||
著者所属 | ||||||
埼玉大学工学部情報システム工学科 | ||||||
著者所属(英) | ||||||
en | ||||||
Department of Information & Computer Sciences, SAITAMA University | ||||||
著者所属(英) | ||||||
en | ||||||
Department of Information & Computer Sciences, SAITAMA University | ||||||
著者所属(英) | ||||||
en | ||||||
Department of Information & Computer Sciences, SAITAMA University | ||||||
著者所属(英) | ||||||
en | ||||||
Department of Information & Computer Sciences, SAITAMA University | ||||||
著者所属(英) | ||||||
en | ||||||
Department of Information & Computer Sciences, SAITAMA University | ||||||
論文抄録 | ||||||
内容記述タイプ | Other | |||||
内容記述 | 本研究の目的は、漢字1字単位の電子化漢字シソーラスを構築し、それを日本語文章の語句解析へ利用することである。従来の日本語電子化シソーラスは、名詞を中心に単語別に分類したものが多い。人間の大人の平均的な語彙数は約4万語であり、大量の新語が毎年生ずることを合わせて考えてみると、そのシソーラスのサイズは莫大なものとなる。そこで、我々は日本語の単語を構成する文字、特に漢字に注目した。漢字は表意文字であり、1字のみで最小の単語の役目を持っている。通常、文章で使われる漢字の総数はJIS第1水準で約3000字であり、これは英米語の基本単語数とほぼ一致する。同時に漢字は、日本語文章において仮名と組み合わせることによって、名詞・用言などの自立語を構成できる柔軟性がある。さらに、漢字には訓読みが与えられており、和語として日本語の語彙を広範に表現できる。その漢字の造語能力の高さが、大量の新語が生ずる原因ともなっているが、新しい漢字の発生とその利用の固定は滅多に起きず、安定した語の集合を保っている。この理由は、漢字の使い方に名詞・動詞・形容詞・副詞など、品詞別の用途に規則があるからである。漢字の有するこれらの特長を利用できれば、日本語文章の解析に役立つと我々は考えた。また、外国人への日本語教育、とりわけ漢字を教育する時の利用も考慮している。漢字1文字に複数の読み方が与えられており、それが外国人が漢字を学習するに当たって困難さを増している。読み方が解らないために、辞書を引くこともままならないという事態が発生する。そのため、漢字仮名混じり文から読みだけでも解れば、有用なものとなると我々は考えた。以下、第2章で今回構築した漢字シソーラスの概要を示し、第3章でそれを日本語文章の語句解析へ利用したものの一例を述べる。最後にまとめを第4章として示す。 | |||||
書誌レコードID | ||||||
収録物識別子タイプ | NCID | |||||
収録物識別子 | AN00349328 | |||||
書誌情報 |
全国大会講演論文集 巻 第52回, 号 人工知能と認知科学, p. 61-62, 発行日 1996-03-06 |
|||||
出版者 | ||||||
言語 | ja | |||||
出版者 | 情報処理学会 |