WEKO3
アイテム
共起情報を利用した文書の自動分類について
https://ipsj.ixsq.nii.ac.jp/records/131345
https://ipsj.ixsq.nii.ac.jp/records/1313459e6322b0-1756-4c5a-aa7b-a13e8017ba6d
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
|
Item type | National Convention(1) | |||||
---|---|---|---|---|---|---|
公開日 | 1997-03-12 | |||||
タイトル | ||||||
タイトル | 共起情報を利用した文書の自動分類について | |||||
タイトル | ||||||
言語 | en | |||||
タイトル | An Automatic Document Classification Using Lexical Co-occurrences | |||||
言語 | ||||||
言語 | jpn | |||||
資源タイプ | ||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_5794 | |||||
資源タイプ | conference paper | |||||
著者所属 | ||||||
三菱電機株式会社 情報技術総合研究所 音声・言語インタフェース技術部 | ||||||
著者所属 | ||||||
三菱電機株式会社 情報技術総合研究所 音声・言語インタフェース技術部 | ||||||
著者所属 | ||||||
三菱電機株式会社 情報技術総合研究所 音声・言語インタフェース技術部 | ||||||
著者所属 | ||||||
三菱電機株式会社 情報技術総合研究所 音声・言語インタフェース技術部 | ||||||
著者所属(英) | ||||||
en | ||||||
Human Media Technology Dept. Information Technology R&D Center, Mitsubishi Electric Corp. | ||||||
著者所属(英) | ||||||
en | ||||||
Human Media Technology Dept. Information Technology R&D Center, Mitsubishi Electric Corp. | ||||||
著者所属(英) | ||||||
en | ||||||
Human Media Technology Dept. Information Technology R&D Center, Mitsubishi Electric Corp. | ||||||
著者所属(英) | ||||||
en | ||||||
Human Media Technology Dept. Information Technology R&D Center, Mitsubishi Electric Corp. | ||||||
論文抄録 | ||||||
内容記述タイプ | Other | |||||
内容記述 | 近年大量のテキスト情報がインターネットなどを通じてアクセス可能となるにつれて, 文書の自動ファイリングやユーザの要求を満足させる自動配信のための文書自動分類技術への要求か高まっている. そのための技術として, ベクトル空間モデルがある. ベクトル空間モデルによる自動分類は自動学習可能であり, 大量かつ幅広い分野のテキストデータを扱う場合に適している. しかし, 分類精度が良くないため, 精度向上の様々な手法が取り入れられている. 例えば, 河合は単語の意味属性を用いて分類精度が向上することを示し, 湯浅は単語共起による単語のベクトルを利用した分類方法を提案した. 我々は,[1]で指摘されているように単語の多義性を解消すれば, 精度が向上するであろうと予測した. ただし, 従来の言語学で言われる「多義語」を多義解消するのではなく, 複数分類項目で頻繁に出現する単語(例えば「首相」という単語は「政治」や「経済」といった複数の分類項目で頻繁に出現する)を「分類多義語」と定義し, 「分類多義語」の多義性解消を試みた. すなわち, 「分類多義語」に対して分類項目別に学習情報の頻度と重み付けを再学習し, 分類対象文書の「分類多義語」の頻度を共起情報を利用して分類項目別に計算して分類先を決定した. | |||||
書誌レコードID | ||||||
収録物識別子タイプ | NCID | |||||
収録物識別子 | AN00349328 | |||||
書誌情報 |
全国大会講演論文集 巻 第54回, 号 データベースとメディア, p. 41-42, 発行日 1997-03-12 |
|||||
出版者 | ||||||
言語 | ja | |||||
出版者 | 情報処理学会 |