2024-03-29T06:19:44Zhttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_oaipmhoai:ipsj.ixsq.nii.ac.jp:000943512023-04-27T10:00:04Z01164:03500:06967:07223
webコンテンツのジャンル推定に向いた実用的な2段階SVMの構築Practical 2-stage SVMs for Genre Estimation of Web Contentsjpn文書分類・行動パターン抽出http://id.nii.ac.jp/1001/00094332/Technical Reporthttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_action_common_download&item_id=94351&item_no=1&attribute_id=1&file_no=1Copyright (c) 2013 by the Institute of Electronics, Information and Communication EngineersThis SIG report is only available to those in membership of the SIG.KDDI研究所KDDI研究所KDDI研究所KDDI研究所松本, 一則服部, 元小川, 圭介橋本, 真幸web サイトの内容や分野を表すジャンルコードを計算機で推定するジャンル推定技術がマーケティング分野で重要になってきている.一般的に同技術の場合,ジャンル推定に適した単語をあらかじめ求めておき,推定対象ページに現れるそれらの語の出現頻度を基とした特徴ベクトルでジャンル判定を行う.しかし必要な単語数は膨大で識別器の学習は通常困難である.そこで,情報量基準で選択した最小限の単語数でジャンル別 SVM を構築し,同 SVM の各識別結果から総合判定を行う 2 段階 SVM を実現した.さらにエラー識別に役立つ語を学習させた SVM を第 1 段に追加する工夫で精度を向上させた。Automatic genre estimation for specified web sites or web pages is important for web marketing. In general, bag of words (BOWs) extracted from specified web pages are inputted to the genre discriminator. However, the number of necessary words is huge for the discriminator. Thus authors propose genre-specific words extraction based on Information Criteria, and a practical 2-stage SVMs which are ensemble with genre-specific SVMs. We also show SVMs discriminating errors of another SVM improve the accuracy of the estimation.AN10114171研究報告情報基礎とアクセス技術(IFAT)2013-IFAT-11122132013-07-152013-07-05