@techreport{oai:ipsj.ixsq.nii.ac.jp:00232620, author = {鈴木, 維浩 and 深澤, 佑介 and Masahiro, Suzuki and Yusuke, Fukazawa}, issue = {16}, month = {Feb}, note = {本論文では,大規模言語モデル(LLM)を用いたシェアサイクルの各ステーションの状況データから次の 24 時間の一時間ごとの利用可能台数を予測する手法を提案する.まず,シェアサイクルの過去データの言語化を行う.学習データとして,ステーション ID,年月日,時間 (一時間毎),時間帯情報,曜日,平日休日祝日フラグ,気温,季節,天気予報,ステーションの場所 (緯度・経度),自転車置き場が設置されてからの経過日数,ステーションの地域への浸透度,一日の過ごしやすさ,風速・降水量表現,を結合したテキストデータを準備する.教師ラベルは,各ステーションにおける各時間のシェアサイクル利用可能台数であり,これを各学習データに付与する.そして,教師ラベルを出力するよう,大規模言語モデル BERT を追加学習する.本アプローチにおいて,機械学習による需要予測結果に比べ,BERT は RMSE が 0.2 程度向上した.この結果から,シェアサイクルの過去データを言語化し大規模言語モデルを追加学習することで,シェアサイクル需要予測に関する知識を獲得できる可能性を示した., In this paper, we propose a method to predict the number of available vehicles per hour for the next 24 hours from the status data of each station of a bikeshare system using the Large Language Model (LLM). First, we convert historical data of bikeshare stations into text. The training data includes station ID, date, hour, time zone information, day of the week, weekday, holiday, and national holiday flags, temperature, season, weather forecast, station location (latitude and longitude), number of days since the station was established, locality of the station, ease of spending the day, wind speed and precipitation expression. We combined those data into text data. The teacher labels are the number of available shared bicycles at each station for each hour. Then, we finetune Large Language Model, BERT, to output the teacher labels. In this approach, proposed method improves the RMSE by about 0.2 compared to the traditional machine learning approach. These results indicate that it is possible to acquire knowledge about bikeshare demand forecast by converting historical bikeshare data into text and finetuning LLM.}, title = {大規模言語モデルを用いたシェアサイクルの需要予測}, year = {2024} }