ログイン 新規登録
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. 研究報告
  2. 情報基礎とアクセス技術(IFAT)
  3. 2021
  4. 2021-IFAT-143

Web上の画像から意味のある式を抽出するための数式フィルタの作成

https://ipsj.ixsq.nii.ac.jp/records/212218
https://ipsj.ixsq.nii.ac.jp/records/212218
f4fb8aac-2779-4688-87ae-d2e30e95d505
名前 / ファイル ライセンス アクション
IPSJ-IFAT21143003.pdf IPSJ-IFAT21143003.pdf (445.0 kB)
Copyright (c) 2021 by the Information Processing Society of Japan
オープンアクセス
Item type SIG Technical Reports(1)
公開日 2021-07-23
タイトル
タイトル Web上の画像から意味のある式を抽出するための数式フィルタの作成
言語
言語 jpn
キーワード
主題Scheme Other
主題 テキストの処理と理解
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_18gh
資源タイプ technical report
著者所属
大阪市立大学
著者所属
大阪市立大学
著者所属(英)
en
Osaka City University
著者所属(英)
en
Osaka City University
著者名 山田, 奉子

× 山田, 奉子

山田, 奉子

Search repository
村上, 晴美

× 村上, 晴美

村上, 晴美

Search repository
論文抄録
内容記述タイプ Other
内容記述 数学情報検索(MIR)に関する研究は多数あるが,MathML や TeX で表された数式を解析するものがほとんどである.一方で,Web 上には数式画像を含む文書が多数存在するが,数式画像に関する研究は少ない.本研究は,Web 上の HTML 文書から,fh(x) = 1/nhΣni = 1K(x-xi/h) のような「コンパクトに表現された単独で意味のある数式」を抽出するものである.文書中の画像を教師あり機械学習の手法で,意味のある数式とそうでないものに二値分類する.深層学習以外の機械学習の手法と畳み込みネットワーク(CNN)の手法を比較した結果,VGG16 を用いた転移学習とファインチューニングを行った CNN の手法が一番良く,マシューズ相関係数(MCC)が 0.771,F 値が 0.814 であった.さらに応用事例として,数学用語をクエリとして Web 検索を行い,その用語と関連する数式を上位 10 件提示するという先行研究に対して,先行研究で使用した SVM による分類器を本研究で最も性能が良い CNN に置き換えたところ,F 値・MAP・MRR のいずれも先行研究を上回った.
書誌レコードID
収録物識別子タイプ NCID
収録物識別子 AN10114171
書誌情報 研究報告情報基礎とアクセス技術(IFAT)

巻 2021-IFAT-143, 号 3, p. 1-6, 発行日 2021-07-23
ISSN
収録物識別子タイプ ISSN
収録物識別子 2188-8884
Notice
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc.
出版者
言語 ja
出版者 情報処理学会
戻る
0
views
See details
Views

Versions

Ver.1 2025-01-19 17:34:12.168247
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3