| Item type |
SIG Technical Reports(1) |
| 公開日 |
2022-09-02 |
| タイトル |
|
|
タイトル |
BERT を用いた文書分類タスクにおけるストップワードの有効性の検証 |
| タイトル |
|
|
言語 |
en |
|
タイトル |
An Analysis of Stopwords in Document Classification Tasks with BERT |
| 言語 |
|
|
言語 |
jpn |
| 資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
| 著者所属 |
|
|
|
岐阜大学工学部 |
| 著者所属 |
|
|
|
岐阜大学工学部 |
| 著者所属(英) |
|
|
|
en |
|
|
Faculty of Engineering, Gifu University |
| 著者所属(英) |
|
|
|
en |
|
|
Faculty of Engineering, Gifu University |
| 著者名 |
桑原, 悠希
鈴木, 優
|
| 著者名(英) |
Yuki, Kuwabara
Yu, Suzuki
|
| 論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
研究者やシステム開発者は,文書分類を行う際に,効果の検証をしないまま精度の向上を図ってストップワードを使用することがある.そこで我々は,BERT を用いた文書分類タスクにおいてストップワードが分類精度を向上させるのに有効か検証した.本研究では,ストップワードとして除去する単語を変えて文書分類を行い,精度を比較した.実験の結果から,ストップワードの除去による有意な精度の向上は見られなかった.したがって,BERT を用いた文書分類タスクにおいて,今回使用したストップワードリストは分類精度を向上させるために有効であるとはいえないことが分かった.今後,BERT を用いた文書分類で分類精度を向上させるために有効なストップワードリストを構築したいと考えている. |
| 論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
When researchers classify documents, they sometimes use stopwords to improve accuracy without checking their effectiveness. We tested the effectiveness of stopwords in improving accuracy in document classification tasks with BERT. We classified documents using different stopwords. We compared the accuracy of the document classification tasks. We did not see a significant improvement in accuracy by removing stopwords.We found that the stopwords we used were not effective for document classification tasks with BERT. We would like to find stopwords that are effective in improving accuracy in document classification tasks with BERT. |
| 書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10112482 |
| 書誌情報 |
研究報告データベースシステム(DBS)
巻 2022-DBS-175,
号 41,
p. 1-6,
発行日 2022-09-02
|
| ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-871X |
| Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
| 出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |