ログイン 新規登録
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. 研究報告
  2. オーディオビジュアル複合情報処理(AVM)
  3. 2023
  4. 2023-AVM-123

ハードウェアを活用した高速な高能率画像処理

https://ipsj.ixsq.nii.ac.jp/records/231480
https://ipsj.ixsq.nii.ac.jp/records/231480
3ad7dd7e-85d8-4dcc-a3e1-76a5a6287443
名前 / ファイル ライセンス アクション
IPSJ-AVM23123004.pdf IPSJ-AVM23123004.pdf (802.7 kB)
Copyright (c) 2023 by the Institute of Electronics, Information and Communication Engineers This SIG report is only available to those in membership of the SIG.
AVM:会員:¥0, DLIB:会員:¥0
Item type SIG Technical Reports(1)
公開日 2023-12-04
タイトル
タイトル ハードウェアを活用した高速な高能率画像処理
タイトル
言語 en
タイトル High-Performance Image Processing Utilizing Hardware
言語
言語 jpn
キーワード
主題Scheme Other
主題 CS 特別招待講演
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_18gh
資源タイプ technical report
著者所属
名古屋工業大学
著者所属(英)
en
Nagoya Institute of Technology
著者名 福嶋, 慶繁

× 福嶋, 慶繁

福嶋, 慶繁

Search repository
著者名(英) Norishige, Fukushima

× Norishige, Fukushima

en Norishige, Fukushima

Search repository
論文抄録
内容記述タイプ Other
内容記述 画像信号処理の高速化は,様々な環境でのアプリケーション実現のために重要である.限られた計算資源の中で画像処理を一定時間以内に終わらせるためには,画像処理アルゴリズムの選択から,そのハードウェア実装まで総合的に考える必要がある.しかしながら,ハードウェアの特性まで含めてプログラムを記述すると非常に冗長になりハードウェア特化毎に特化したプログラムの記述は煩雑である.加えて,近年は,CPU の SIMD 機能やマルチコア並列化,GPU の超並列コアに加えて,行列演算ユニット(Intel AMX, NVIDIA TensorCores, TPU など)様々なアクセラレータがありこれらを有効活用しなければ高速なコード生成は不可能である.加えて,並列計算機にとってアルゴリズムの選択も重要でありアルゴリズムの並列性とハードウェアの組み合わせ,ハードウェアにとって適切な計算順序を選ぶ必要がある.また,次世代計算機として期待される量子計算機の登場も待たれつつあり,ますます複雑性していくことが予想される.そのため,これらを実現するためには人手でプログラムを最適化するには困難になってきている.本稿では,これらを解決するための並列アルゴリズム,ハードウェア最適化,それらを考慮するためのプログラミング言語やコンパイラについて述べ,高効率な画像処理計算を実現するためのアプローチを紹介する.
論文抄録(英)
内容記述タイプ Other
内容記述 High-perfomance image signal processing is important to realize applications in various environments. To complete image processing within a certain time with limited computing resources, it is necessary to compre- hensively consider everything from the selection of image processing algorithms to their hardware implementation. However, writing a program that includes hardware characteristics is extremely verbose, and writing specialized programs for each hardware is cumbersome. In recent years, in addition to SIMD functions and multi-core parallelization of CPUs and massively parallel cores of GPUs, there are various accelerators such as matrix operation units (Intel AMX, NVIDIA TensorCores, TPU, etc.), and high-performance code generation is impossible without effectively utilizing these accelerators. Moreover, the selection of algorithms is also important for parallel computers, and it is necessary to select a combination of algorithm parallelism and hardware, as well as an appropriate compu- tation sequence for the hardware. In addition, quantum computers are expected to emerge as the next generation of computers, and are expected to become increasingly complex. Therefore, it is becoming difficult to manually optimize programs to achieve these goals. This paper describes parallel algorithms, hardware optimization, programming languages and compilers to solve these problems and introduces an approach to realize highly efficient image processing computation.
書誌レコードID
収録物識別子タイプ NCID
収録物識別子 AN10438399
書誌情報 研究報告オーディオビジュアル複合情報処理(AVM)

巻 2023-AVM-123, 号 4, p. 1-1, 発行日 2023-12-04
ISSN
収録物識別子タイプ ISSN
収録物識別子 2188-8582
Notice
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc.
出版者
言語 ja
出版者 情報処理学会
戻る
0
views
See details
Views

Versions

Ver.1 2025-01-19 10:44:50.128687
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3