Item type |
SIG Technical Reports(1) |
公開日 |
2021-02-25 |
タイトル |
|
|
タイトル |
Feature Fusion Networksを導入した多様な医療画像に対するVisual QAシステム |
タイトル |
|
|
言語 |
en |
|
タイトル |
Visual QA system with Feature Fusion Networks for various medical images |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
セッション3-2 |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
豊橋技術科学大学博士前期課程情報・知能工学専攻 |
著者所属 |
|
|
|
豊橋技術科学大学情報・知能工学系 |
著者所属(英) |
|
|
|
en |
|
|
Computer Science and Engineering, Toyohashi University of Technology |
著者所属(英) |
|
|
|
en |
|
|
Computer Science and Engineering, Toyohashi University of Technology |
著者名 |
馬田, 英雄
青野, 雅樹
|
著者名(英) |
Hideo, Umada
Masaki, Aono
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
近年,コンピュータビジョンや自然言語処理の分野で深層学習の研究が著しく成長しており,様々な分野で人工知能の応用について期待が高まっている.それに伴いコンピュータビジョンと自然言語処理の双方の技術が要求される研究である Visual QA を医療分野に応用した VQA-Med タスクに対する研究需要が高まっている.医療画像には X 線画像,MRI 画像,CT 画像などの多様なモダリティの画像が存在する.本研究では QA 問題を分類問題とみなし,多様な医療画像に対して効果的な特徴量を得るための手法と,画像と質問のマルチモーダルな関係を学習する際に用いる特徴量合成手法である Feature Fusion Networks を提案する.VQA-Med2020 データセットを用いて,システムの実験・評価を行った結果,新たな知見が得られたのでこれを報告する. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
In recent years, there has been a remarkable growth in research on deep learning in the fields of computer vision and natural language processing, and there are growing expectations about the application of artificial intelligence in various fields. As a result, there is a growing demand for research on the VQA-Med task, which is an application of Visual QA, a research that requires both computer vision and natural language processing techniques, to the medical field. Medical images include images from various modalities such as X-ray images, MRI images, and CT images. In this study, we consider QA problems as classification problems and propose a method for obtaining effective features for a variety of medical images and a feature synthesis method, Feature Fusion Networks, for learning multimodal relationships between images and questions. Using the VQA-Med2020 dataset, we experimented with and evaluated the system, and reported on the new findings. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AA11131797 |
書誌情報 |
研究報告コンピュータビジョンとイメージメディア(CVIM)
巻 2021-CVIM-225,
号 23,
p. 1-6,
発行日 2021-02-25
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8701 |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |