@techreport{oai:ipsj.ixsq.nii.ac.jp:00213147, author = {酒井, 敏彦 and 三宅, 悠介 and 栗林, 健太郎}, issue = {5}, month = {Sep}, note = {自然言語処理の技術は,EC サイトで扱うテキストデータを対象とする,質問応答や商品の分類などのタスクに活用されている.ハンドメイド作品を扱う EC サイトにおける自然言語処理の課題は (1) 人手でタスクを解くのは困難,(2) ハンドメイド作品を扱う EC サイトの作品が多様,(3) ハンドメイド作品を扱う EC サイトの構造的な変化への追従が困難,の 3 つが挙げられる.本研究では,各課題に対して (1) 機械的にタスクを解くことができる,(2) 扱う作品が多様であっても作品の特徴を捉えられる,(3) 汎用的なモデルから fine-tuning することで構造的な変化へ追従可能,という理由から BERT+fine-tuning のモデルに着眼した.本報告では,ハンドメイド作品を扱う EC サイトの課題を含むタスクのうち,商品分類のタスクにおいて,比較評価を行った.ベースライン手法は従来から一般的に用いられる TF-IDF と分類器を用いた.結果として,上記の課題を解決し,BERT+fine-tuning のモデルが F1-score で良い分類性能であることを示した.今後は他のタスクへの応用を検討していく.}, title = {ハンドメイド作品を扱うECサイトに特化したBERTを用いた言語モデル構築に向けた取り組み}, year = {2021} }