<?xml version='1.0' encoding='UTF-8'?>
<OAI-PMH xmlns="http://www.openarchives.org/OAI/2.0/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/ http://www.openarchives.org/OAI/2.0/OAI-PMH.xsd">
  <responseDate>2026-03-13T23:14:21Z</responseDate>
  <request metadataPrefix="jpcoar_1.0" verb="GetRecord" identifier="oai:ipsj.ixsq.nii.ac.jp:00212218">https://ipsj.ixsq.nii.ac.jp/oai</request>
  <GetRecord>
    <record>
      <header>
        <identifier>oai:ipsj.ixsq.nii.ac.jp:00212218</identifier>
        <datestamp>2025-01-19T17:34:13Z</datestamp>
        <setSpec>1164:3500:10466:10598</setSpec>
      </header>
      <metadata>
        <jpcoar:jpcoar xmlns:datacite="https://schema.datacite.org/meta/kernel-4/" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:dcndl="http://ndl.go.jp/dcndl/terms/" xmlns:dcterms="http://purl.org/dc/terms/" xmlns:jpcoar="https://github.com/JPCOAR/schema/blob/master/1.0/" xmlns:oaire="http://namespace.openaire.eu/schema/oaire/" xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:rioxxterms="http://www.rioxx.net/schema/v2.0/rioxxterms/" xmlns:xs="http://www.w3.org/2001/XMLSchema" xmlns="https://github.com/JPCOAR/schema/blob/master/1.0/" xsi:schemaLocation="https://github.com/JPCOAR/schema/blob/master/1.0/jpcoar_scm.xsd">
          <dc:title>Web上の画像から意味のある式を抽出するための数式フィルタの作成</dc:title>
          <jpcoar:creator>
            <jpcoar:creatorName>山田, 奉子</jpcoar:creatorName>
          </jpcoar:creator>
          <jpcoar:creator>
            <jpcoar:creatorName>村上, 晴美</jpcoar:creatorName>
          </jpcoar:creator>
          <jpcoar:subject subjectScheme="Other">テキストの処理と理解</jpcoar:subject>
          <datacite:description descriptionType="Other">数学情報検索（MIR）に関する研究は多数あるが，MathML や TeX で表された数式を解析するものがほとんどである．一方で，Web 上には数式画像を含む文書が多数存在するが，数式画像に関する研究は少ない．本研究は，Web 上の HTML 文書から，fh(x) = 1/nhΣni = 1K(x-xi/h) のような「コンパクトに表現された単独で意味のある数式」を抽出するものである．文書中の画像を教師あり機械学習の手法で，意味のある数式とそうでないものに二値分類する．深層学習以外の機械学習の手法と畳み込みネットワーク（CNN）の手法を比較した結果，VGG16 を用いた転移学習とファインチューニングを行った CNN の手法が一番良く，マシューズ相関係数（MCC）が 0.771，F 値が 0.814 であった．さらに応用事例として，数学用語をクエリとして Web 検索を行い，その用語と関連する数式を上位 10 件提示するという先行研究に対して，先行研究で使用した SVM による分類器を本研究で最も性能が良い CNN に置き換えたところ，F 値・MAP・MRR のいずれも先行研究を上回った．</datacite:description>
          <dc:publisher xml:lang="ja">情報処理学会</dc:publisher>
          <datacite:date dateType="Issued">2021-07-23</datacite:date>
          <dc:language>jpn</dc:language>
          <dc:type rdf:resource="http://purl.org/coar/resource_type/c_18gh">technical report</dc:type>
          <jpcoar:identifier identifierType="URI">https://ipsj.ixsq.nii.ac.jp/records/212218</jpcoar:identifier>
          <jpcoar:sourceIdentifier identifierType="ISSN">2188-8884</jpcoar:sourceIdentifier>
          <jpcoar:sourceIdentifier identifierType="NCID">AN10114171</jpcoar:sourceIdentifier>
          <jpcoar:sourceTitle>研究報告情報基礎とアクセス技術（IFAT）</jpcoar:sourceTitle>
          <jpcoar:volume>2021-IFAT-143</jpcoar:volume>
          <jpcoar:issue>3</jpcoar:issue>
          <jpcoar:pageStart>1</jpcoar:pageStart>
          <jpcoar:pageEnd>6</jpcoar:pageEnd>
          <jpcoar:file>
            <jpcoar:URI label="IPSJ-IFAT21143003.pdf">https://ipsj.ixsq.nii.ac.jp/record/212218/files/IPSJ-IFAT21143003.pdf</jpcoar:URI>
            <jpcoar:mimeType>application/pdf</jpcoar:mimeType>
            <jpcoar:extent>445.0 kB</jpcoar:extent>
            <datacite:date dateType="Available">2023-07-23</datacite:date>
          </jpcoar:file>
        </jpcoar:jpcoar>
      </metadata>
    </record>
  </GetRecord>
</OAI-PMH>
