WEKO3
アイテム
抽象型要約における教師なしドメイン適応のためのデータ拡張
https://ipsj.ixsq.nii.ac.jp/records/210632
https://ipsj.ixsq.nii.ac.jp/records/21063251c6e2ac-2572-49e4-824e-9d950e1b959d
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
Copyright (c) 2021 by the Information Processing Society of Japan
|
|
| オープンアクセス | ||
| Item type | SIG Technical Reports(1) | |||||||||
|---|---|---|---|---|---|---|---|---|---|---|
| 公開日 | 2021-03-22 | |||||||||
| タイトル | ||||||||||
| タイトル | 抽象型要約における教師なしドメイン適応のためのデータ拡張 | |||||||||
| 言語 | ||||||||||
| 言語 | jpn | |||||||||
| 資源タイプ | ||||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||||
| 資源タイプ | technical report | |||||||||
| 著者所属 | ||||||||||
| 東京農工大学工学部情報工学科 | ||||||||||
| 著者所属 | ||||||||||
| 東京農工大学大学院工学研究院先端情報科学部門 | ||||||||||
| 著者所属(英) | ||||||||||
| en | ||||||||||
| Department of Computer and Information Sciences, Faculty of Engineering, Tokyo University of Agriculture and Technology | ||||||||||
| 著者所属(英) | ||||||||||
| en | ||||||||||
| Presently with Division of Advanced Information Technology and Computer Science, Institute of Engineering, Tokyo University of Agriculture and Technology | ||||||||||
| 著者名 |
名原, 光洋
× 名原, 光洋
× 藤田, 桂英
|
|||||||||
| 論文抄録 | ||||||||||
| 内容記述タイプ | Other | |||||||||
| 内容記述 | 自然言語処理 (NLP) タスクの 1 つである自動要約タスクでは,他の NLP タスクと同様に大規模なデータによる事前学習を行ったモデルを,小規模なターゲットドメインにドメイン適応させることができる.これにより様々なドメインの文書に対して,自動要約を行うことが可能である.自動要約タスクはその手法によって抽出型と抽象型の 2 つに大別することができ,その中でも抽象型要約は被要約文書の表現に捉われることなく柔軟かつ完成度の高い要約文を生成する.抽象型要約は深層学習に基づいており,その学習には正解データとなる要約が付与された大量のデータが必要になる.このような大規模な抽象要約に適したデータセットはドメインが限られているため,抽象要約が実現できるドメインも限られている.抽象要約で使われるデータセットの 1 つである CNN - Daily Mail コーパス (CNN-DM) はニュース記事とその要約になるいくつかの文からなる見出しがセットになっているデータセットである.本研究ではニュース記事とは性質を大きく異にするレビューサイトに寄せられたレビューの抽象要約に注目する.小規模な教師なしレビューデータセットの抽象要約を実現するために大規模データセットで事前学習したモデルのドメイン適応を前提としたデータ拡張手法を提案する.文脈を考慮した単語の置き換えによるデータ拡張よって,ROUGE において既存手法を上回る精度を確認した. | |||||||||
| 書誌レコードID | ||||||||||
| 収録物識別子タイプ | NCID | |||||||||
| 収録物識別子 | AA11135936 | |||||||||
| 書誌情報 |
研究報告知能システム(ICS) 巻 2021-ICS-202, 号 8, p. 1-6, 発行日 2021-03-22 |
|||||||||
| ISSN | ||||||||||
| 収録物識別子タイプ | ISSN | |||||||||
| 収録物識別子 | 2188-885X | |||||||||
| Notice | ||||||||||
| SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||||
| 出版者 | ||||||||||
| 言語 | ja | |||||||||
| 出版者 | 情報処理学会 | |||||||||