//]]>

OpenACC デバッグ

OpenACC を使うと、NVIDIA のTeslaやFermi GPUといったアクセラレータを活用できるプログラムを、簡単にディレクティブベースで作成することができます。OpenACC は、マルチコアを活用するためのマルチスレッドアプリケーションのための有名な OpenMP ディレクティブと同様に、既存の C/C++、Fortran プログラムに対してGPU加速化部分を追加して高速化する方法を提供します。OpenACC は、NVIDIA、PGI といったローグウェーブのパートナーによってサポートされています。なお、TotalViewのCUDA機能対応についてはこちらをご覧ください。

TotalView はPGIコンパイラおよびCray CCE 8 コンパイラでコンパイルされた OpenACC プログラムに対し、ホストおよびアクセラレータでのデバッグ作業を完全にサポートします。

対応機能:

  • OpenACC で構成されたコードにブレークポイントを設定
  • OpenACC で構成されたコードをWarpレベルでステップ実行
  • OpenACC 変数の表示
  • デバイス、SM、Warp、レーンごとにCUDAデバイスのスレッドをナビゲート可能
Product image: Debugging CUDA application that shows the Warp, Lane and other  specific inf

Warp、レーンなど特定の情報を表示するCUDA アプリケーションのデバッグ  - クリックで拡大表示します