WEKO3
アイテム
単語の長さの情報に基づいた文章のパターンの分類
https://ipsj.ixsq.nii.ac.jp/records/125009
https://ipsj.ixsq.nii.ac.jp/records/1250095498cb5e-6b42-4a96-b113-79c71da97287
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
|
Item type | National Convention(1) | |||||
---|---|---|---|---|---|---|
公開日 | 1994-03-07 | |||||
タイトル | ||||||
タイトル | 単語の長さの情報に基づいた文章のパターンの分類 | |||||
タイトル | ||||||
言語 | en | |||||
タイトル | Classifiction of Styles by Information of Word Length | |||||
言語 | ||||||
言語 | jpn | |||||
資源タイプ | ||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_5794 | |||||
資源タイプ | conference paper | |||||
著者所属 | ||||||
総合研究大学院大学統計科学 | ||||||
著者所属(英) | ||||||
en | ||||||
Department of Statiaticl Science, The Graduate University for Advanced Studies | ||||||
論文抄録 | ||||||
内容記述タイプ | Other | |||||
内容記述 | 著者不明の文章の著者の推定などを行なう際、文章の中のどんな情報を用いるかが鍵である。著者の個性が十分含まれていない情報では、有効な方法でも著者の推定、著者別の文章の分類が正しくできないのは言うまでもない。欧米における文章については長年にかけ多くの研究が行なっているが、日本文の場合は著者の推定などに用いる情報に関しては研究が十分行なっていない。本文では品詞別にわけていない場合と品詞別に分けた場合の単語の長さの情報に基づいて著者別の文章の分類について分析を行なった。分類がもっとも良いのは動詞の長さの情報で、品詞別に分けていない、すべての単語の長さの情報を用いた場合よりはるかに良い。分析の手法としては群内距離と最小の群間の距離との差の大小を統計量・分散比で評価し、分散比が大きいほど分類が良いと判断した。分類結果を視覚化する手法としては主成分分析を用いた。 | |||||
書誌レコードID | ||||||
収録物識別子タイプ | NCID | |||||
収録物識別子 | AN00349328 | |||||
書誌情報 |
全国大会講演論文集 巻 第48回, 号 基礎理論及び基礎技術, p. 111-112, 発行日 1994-03-07 |
|||||
出版者 | ||||||
言語 | ja | |||||
出版者 | 情報処理学会 |