| Item type |
SIG Technical Reports(1) |
| 公開日 |
2025-01-14 |
| タイトル |
|
|
タイトル |
正規化によるExplainableな画像識別を目指して |
| タイトル |
|
|
言語 |
en |
|
タイトル |
Toward Explainable Recognition by Image Normalization |
| 言語 |
|
|
言語 |
jpn |
| 資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
| 著者所属 |
|
|
|
和歌山大学大学院システム工学研究科 |
| 著者所属 |
|
|
|
和歌山大学大学院システム工学研究科 |
| 著者所属 |
|
|
|
和歌山大学大学院システム工学研究科 |
| 著者所属(英) |
|
|
|
en |
|
|
Graduate School of Systems Engneering, Wakayama University |
| 著者所属(英) |
|
|
|
en |
|
|
Graduate School of Systems Engneering, Wakayama University |
| 著者所属(英) |
|
|
|
en |
|
|
Graduate School of Systems Engneering, Wakayama University |
| 著者名 |
廣田, 悠人
菅間, 幸司
和田, 俊和
|
| 著者名(英) |
Haruto, Hirota
Koji, Kamma
Toshikazu, Wada
|
| 論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
入力画像をクラス固有のパターンに正規化することができれば,同一パターンに正規化される入力は同一クラスに属すると判断でき,認識が行えたことになる.その意味では認識の本質は「正規化」であると見なすことができる.この観点から見ると,従来の画像識別は,入力画像を特徴空間に写像し,そこで分類を行うという枠組みが用いられてきた.この特徴空間への写像は,次元圧縮とともに,クラスごとに互いに近接した特徴に写像することを目的としている.このことは,同一クラスに属する入力画像の変動を抑えるという意味で「特徴空間内での正規化」であるとみなせる.この過程では,画像に含まれる色やテクスチャなどの細かな様相が失われてしまい,分類結果の説明や認識後に入力の様相を問うことが困難になる.本報告では,特徴空間を経由せず,入力画像を直接変形してクラスの代表パターンへ変形する新手法を提案する.この手法により,画像の細かな情報を保持したまま識別を行い,識別の根拠が視覚的に説明可能になることを示した. |
| 論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
If the input image can be normalized to a class-specific pattern, inputs normalised to the same pattern are regarded belonging to the same class, and thus, classification can be realized. In this sense, the essence of recognition can be regarded as ‘normalization’. From this point of view, conventional image classification has used a framework in which the input image is mapped to a feature space and classification is performed there. This mapping to the feature space, together with dimensionality reduction, aims to map features belonging to the same class are close to each other. This can be regarded as ‘normalization in the feature space’, because it suppresses the variation of input images belonging to the same class. In this process, detailed aspects such as colors and textures in the images are lost, making it difficult to explain the classification results or to question the aspect of the input after recognition. In this report, we propose a new method that transforms the input image directly into a representative pattern of the class, without going through the feature space. It is shown that this method enables identification while preserving the detailed information of the image, and the basis for identification can be visually explained. |
| 書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AA11131797 |
| 書誌情報 |
研究報告コンピュータビジョンとイメージメディア(CVIM)
巻 2025-CVIM-240,
号 23,
p. 1-6,
発行日 2025-01-14
|
| ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8701 |
| Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
| 出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |