| Item type |
SIG Technical Reports(1) |
| 公開日 |
2015-05-04 |
| タイトル |
|
|
タイトル |
HTML構造解析と機械学習に基づくイベント情報抽出システムの提案 |
| タイトル |
|
|
言語 |
en |
|
タイトル |
A Proportion of Event Data Extraction based on HTML Structure Analysis and Machine Learning |
| 言語 |
|
|
言語 |
jpn |
| キーワード |
|
|
主題Scheme |
Other |
|
主題 |
機械学習 |
| 資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
| 著者所属 |
|
|
|
名古屋大学大学院工学研究科 |
| 著者所属 |
|
|
|
名古屋大学未来社会創造機構 |
| 著者所属 |
|
|
|
名古屋大学大学院工学研究科 |
| 著者所属 |
|
|
|
名古屋大学大学院工学研究科/名古屋大学未来社会創造機構 |
| 著者所属(英) |
|
|
|
en |
|
|
Graduate School of Engineering, Nagoya University |
| 著者所属(英) |
|
|
|
en |
|
|
Institute of Innovation for Future Society, Nagoya University |
| 著者所属(英) |
|
|
|
en |
|
|
Graduate School of Engineering, Nagoya University |
| 著者所属(英) |
|
|
|
en |
|
|
Graduate School of Engineering, Nagoya University / Institute of Innovation for Future Society, Nagoya University |
| 著者名 |
廖, 宸一
廣井, 慧
梶, 克彦
河口, 信夫
|
| 著者名(英) |
Chenyi, Liao
Kei, Hiroi
Katsuhiko, Kaji
Nobuo, Kawaguchi
|
| 論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
本研究は,店舗のホームページやブログからクーポンやキャンペーンなどのイベント情報を抽出する方法を提案する.この方法を利用してユーザはをひとつひとつの店舗のホームページの閲覧を必要とせず,イベント情報抽出の網羅性と効率性を支援できる.本提案は Web ページブロック分割およびイベント情報認識の二つのタスクから構成される.一つ目のタスクでは Web ページをタイトルや説明文や日付などのイベント情報を含むブロックに分割する.従来の研究は特定なタグ,画面構成あるいはブロックの機能などを特徴量として Web ページを分割することが多く,半構造化データのイベント情報抽出が難しかった.本研究では HTML 構造解析に基づいて Web ページをブロックに分割する.二つ目のタスクとは分割されたブロックから不用な情報を取り除くため,イベント情報を識別する.本研究では機械学習の手法を用いてイベント情報の識別を実現する.名古屋駅地下街 「エスカ」 と 「ユニモール」 にある店舗 96 軒を対象として行った検証実験とその結果を示す. |
| 書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AA11838947 |
| 書誌情報 |
研究報告ユビキタスコンピューティングシステム(UBI)
巻 2015-UBI-46,
号 13,
p. 1-7,
発行日 2015-05-04
|
| ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8698 |
| Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
| 出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |