<?xml version='1.0' encoding='UTF-8'?>
<OAI-PMH xmlns="http://www.openarchives.org/OAI/2.0/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/ http://www.openarchives.org/OAI/2.0/OAI-PMH.xsd">
  <responseDate>2026-03-11T10:52:28Z</responseDate>
  <request metadataPrefix="oai_dc" verb="GetRecord" identifier="oai:ipsj.ixsq.nii.ac.jp:00220233">https://ipsj.ixsq.nii.ac.jp/oai</request>
  <GetRecord>
    <record>
      <header>
        <identifier>oai:ipsj.ixsq.nii.ac.jp:00220233</identifier>
        <datestamp>2025-01-19T14:38:19Z</datestamp>
        <setSpec>1164:4179:10952:11016</setSpec>
      </header>
      <metadata>
        <oai_dc:dc xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:oai_dc="http://www.openarchives.org/OAI/2.0/oai_dc/" xmlns="http://www.w3.org/2001/XMLSchema" xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/oai_dc/ http://www.openarchives.org/OAI/2.0/oai_dc.xsd">
          <dc:title>疑似訓練データを用いたBERTによる同形異音語の読み推定</dc:title>
          <dc:creator>小林, 汰一郎</dc:creator>
          <dc:creator>古宮, 嘉那子</dc:creator>
          <dc:creator>新納, 浩幸</dc:creator>
          <dc:subject>解析</dc:subject>
          <dc:description>日本語には読みに曖昧性を持つ単語が多数存在する．例えば「辛い」は「カライ」のほかに「ツライ」と読むこともできる．このような単語を同形異音語と呼ぶ．本論文では，BERT を用いて同形異音語の読み推定を行う．訓練・テストデータには現代日本語書き言葉均衡コーパス (BCCWJ) と日本語話し言葉コーパス (CSJ) を利用した．BCCWJ の大半を占める非コアデータの読みは，形態素解析システム MeCab により機械的に割り振られたものである．また，BCCWJ は書き言葉であり，CSJ は話し言葉なので，ドメインのずれが想定される．CSJ をターゲット領域としたとき，通常はこの領域の訓練事例を用いて読み推定のモデルを学習・構築すればよいが，訓練事例の構築コストが高いという問題がある．本研究では自動的に付与されたドメイン外の大量の疑似データ (BCCWJ のデータ) を利用することで，本来必要としたターゲットの領域の訓練事例の量を大幅に削減することができた．</dc:description>
          <dc:description>technical report</dc:description>
          <dc:publisher>情報処理学会</dc:publisher>
          <dc:date>2022-09-22</dc:date>
          <dc:format>application/pdf</dc:format>
          <dc:identifier>研究報告自然言語処理（NL）</dc:identifier>
          <dc:identifier>3</dc:identifier>
          <dc:identifier>2022-NL-253</dc:identifier>
          <dc:identifier>1</dc:identifier>
          <dc:identifier>5</dc:identifier>
          <dc:identifier>2188-8779</dc:identifier>
          <dc:identifier>AN10115061</dc:identifier>
          <dc:identifier>https://ipsj.ixsq.nii.ac.jp/record/220233/files/IPSJ-NL22253003.pdf</dc:identifier>
          <dc:language>jpn</dc:language>
        </oai_dc:dc>
      </metadata>
    </record>
  </GetRecord>
</OAI-PMH>
