@inproceedings{oai:ipsj.ixsq.nii.ac.jp:00236261, author = {三谷, 一真 and 松井, くにお}, book = {第86回全国大会講演論文集}, issue = {1}, month = {Mar}, note = {大規模言語モデル(LLM)の普及に伴い、独自の言語資源を活用するニーズが生まれた。しかし、言語モデルは事前学習時に扱えるトークンの種類が決まるため、独自の言語データを扱う際に、ドメイン固有の単語が不自然に分割されるという課題がある(例: BE}, pages = {857--858}, publisher = {情報処理学会}, title = {事前学習済みBERTに適する新トークン表現獲得手法の開発と評価}, volume = {2024}, year = {2024} }