<?xml version='1.0' encoding='UTF-8'?>
<OAI-PMH xmlns="http://www.openarchives.org/OAI/2.0/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/ http://www.openarchives.org/OAI/2.0/OAI-PMH.xsd">
  <responseDate>2026-04-17T11:38:41Z</responseDate>
  <request verb="GetRecord" metadataPrefix="oai_dc" identifier="oai:ipsj.ixsq.nii.ac.jp:00213275">https://ipsj.ixsq.nii.ac.jp/oai</request>
  <GetRecord>
    <record>
      <header>
        <identifier>oai:ipsj.ixsq.nii.ac.jp:00213275</identifier>
        <datestamp>2025-01-19T17:12:36Z</datestamp>
        <setSpec>934:1022:10454:10703</setSpec>
      </header>
      <metadata>
        <oai_dc:dc xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:oai_dc="http://www.openarchives.org/OAI/2.0/oai_dc/" xmlns="http://www.w3.org/2001/XMLSchema" xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/oai_dc/ http://www.openarchives.org/OAI/2.0/oai_dc.xsd">
          <dc:title>分布型強化学習を用いたポートフォリオマネジメントにおける低リスク投資行動の学習</dc:title>
          <dc:title>Learning Low-risk Investment Actions Using Distributional Reinforcement Learning for Portfolio Management Problem</dc:title>
          <dc:creator>佐藤, 葉介</dc:creator>
          <dc:creator>張, 建偉</dc:creator>
          <dc:creator>Yosuke, Sato</dc:creator>
          <dc:creator>Jianwei, Zhang</dc:creator>
          <dc:subject>[研究論文] 時系列データ，分布型強化学習，低リスク投資行動，ポートフォリオマネジメント</dc:subject>
          <dc:description>近年，金融市場における投資行動を深層学習により獲得する研究がさかんである．金融市場は景気や政局など多くの複雑な要因により変動するため，確実な取引戦略の構築が困難である．一方，分布型強化学習（DRL）は強化学習における行動価値関数を離散分布に拡張した手法で，とりうる行動により期待されるQ値を分布で表すことで単一のQ値よりも高い表現力を持つ．本研究では，ポートフォリオマネジメントにおいて保有する資産価値が低下するリスクを防ぎつつ利益を最大化させるような投資行動をDRLを用いて学習する手法を提案する．10年分の日経225に含まれる銘柄のヒストリカルデータを用いて実験を行い，DRLを用いた提案手法の方が比較手法のDQNより評価値の標準偏差について優れていたため，低リスクな投資行動を学習できたといえる．</dc:description>
          <dc:description>In recent years, investment strategies on the financial market using deep learning have attracted a significant amount of research attention. Since the financial market is influenced by complex factors (e.g., economy, politics), it is difficult to construct a certain investment strategy. On the other hand, Distributional Reinforcement Learning (DRL) expands the action-value function to a discrete distribution in reinforcement learning, which expresses expected Q values for all actions as a distribution and thus has higher representation power than single Q values. In this study, we focus on the portfolio management problem and apply DRL to construct an investment trading model that is low-risk and maximizes profit. This model has been backtested on Nikkei 225 dataset over ten years and compared with Deep Q Network (DQN). The experimental results show that the proposed DRL-based method can learn low-risk actions outperforming the compared DQN-based method in terms of the standard deviations of evaluation values.</dc:description>
          <dc:description>journal article</dc:description>
          <dc:publisher>情報処理学会</dc:publisher>
          <dc:date>2021-10-14</dc:date>
          <dc:format>application/pdf</dc:format>
          <dc:identifier>情報処理学会論文誌データベース（TOD）</dc:identifier>
          <dc:identifier>4</dc:identifier>
          <dc:identifier>14</dc:identifier>
          <dc:identifier>61</dc:identifier>
          <dc:identifier>69</dc:identifier>
          <dc:identifier>1882-7799</dc:identifier>
          <dc:identifier>AA11464847</dc:identifier>
          <dc:identifier>https://ipsj.ixsq.nii.ac.jp/record/213275/files/IPSJ-TOD1404008.pdf</dc:identifier>
          <dc:language>jpn</dc:language>
        </oai_dc:dc>
      </metadata>
    </record>
  </GetRecord>
</OAI-PMH>
