ログイン 新規登録
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. 研究報告
  2. データベースシステム(DBS)※2025年度よりデータベースとデータサイエンス(DBS)研究会に名称変更
  3. 2022
  4. 2022-DBS-175

BERT を用いた文書分類タスクにおけるストップワードの有効性の検証

https://ipsj.ixsq.nii.ac.jp/records/219994
https://ipsj.ixsq.nii.ac.jp/records/219994
a15192c7-dc70-4879-86ad-cf6c52fca983
名前 / ファイル ライセンス アクション
IPSJ-DBS22175041.pdf IPSJ-DBS22175041.pdf (909.4 kB)
Copyright (c) 2022 by the Institute of Electronics, Information and Communication Engineers This SIG report is only available to those in membership of the SIG.
DBS:会員:¥0, DLIB:会員:¥0
Item type SIG Technical Reports(1)
公開日 2022-09-02
タイトル
タイトル BERT を用いた文書分類タスクにおけるストップワードの有効性の検証
タイトル
言語 en
タイトル An Analysis of Stopwords in Document Classification Tasks with BERT
言語
言語 jpn
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_18gh
資源タイプ technical report
著者所属
岐阜大学工学部
著者所属
岐阜大学工学部
著者所属(英)
en
Faculty of Engineering, Gifu University
著者所属(英)
en
Faculty of Engineering, Gifu University
著者名 桑原, 悠希

× 桑原, 悠希

桑原, 悠希

Search repository
鈴木, 優

× 鈴木, 優

鈴木, 優

Search repository
著者名(英) Yuki, Kuwabara

× Yuki, Kuwabara

en Yuki, Kuwabara

Search repository
Yu, Suzuki

× Yu, Suzuki

en Yu, Suzuki

Search repository
論文抄録
内容記述タイプ Other
内容記述 研究者やシステム開発者は,文書分類を行う際に,効果の検証をしないまま精度の向上を図ってストップワードを使用することがある.そこで我々は,BERT を用いた文書分類タスクにおいてストップワードが分類精度を向上させるのに有効か検証した.本研究では,ストップワードとして除去する単語を変えて文書分類を行い,精度を比較した.実験の結果から,ストップワードの除去による有意な精度の向上は見られなかった.したがって,BERT を用いた文書分類タスクにおいて,今回使用したストップワードリストは分類精度を向上させるために有効であるとはいえないことが分かった.今後,BERT を用いた文書分類で分類精度を向上させるために有効なストップワードリストを構築したいと考えている.
論文抄録(英)
内容記述タイプ Other
内容記述 When researchers classify documents, they sometimes use stopwords to improve accuracy without checking their effectiveness. We tested the effectiveness of stopwords in improving accuracy in document classification tasks with BERT. We classified documents using different stopwords. We compared the accuracy of the document classification tasks. We did not see a significant improvement in accuracy by removing stopwords.We found that the stopwords we used were not effective for document classification tasks with BERT. We would like to find stopwords that are effective in improving accuracy in document classification tasks with BERT.
書誌レコードID
収録物識別子タイプ NCID
収録物識別子 AN10112482
書誌情報 研究報告データベースシステム(DBS)

巻 2022-DBS-175, 号 41, p. 1-6, 発行日 2022-09-02
ISSN
収録物識別子タイプ ISSN
収録物識別子 2188-871X
Notice
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc.
出版者
言語 ja
出版者 情報処理学会
戻る
0
views
See details
Views

Versions

Ver.1 2025-01-19 14:42:20.501409
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3