GPU ルーフライン解析

GPU ルーフラインの調査パースペクティブを実行すると、 ハードウェアによって制限されるパフォーマンスの上限に対するベンチマークとハードウェア・メトリックのプロファイルを使用して、GPU カーネルの実際のパフォーマンスを推測して視覚化し、主な制限の要因を特定するのに役立ちます。

[Roofline (ルーフライン)] グラフを使用すると、次のようなことが分かります。

GPU ルーフラインの調査を実行し、GPU での実行が有効になっている SYCL*、OpenMP* を使用した C++/Fortran、インテル® oneAPI レベルゼロ (レベルゼロ)、または OpenCL* アプリケーションのパフォーマンスを測定します。

どのように動作するか

GPU ルーフラインの調査パースペクティブには次の手順が含まれます。

  1. GPU プロファイルとサーベイ解析を使用して、OpenCL* カーネルのタイミングとメモリーデータを収集します。
  2. GPU プロファイルと特性化を使用して、ハードウェアの制限を測定し浮動小数点と整数操作のデータを収集します。

    インテル® Advisor は、次の命令グループの加重合計として計算操作 (FLOP と INTOP) を計算します。BASIC COMPUTE、FMA、BIT、DIV、POW、MATH。

    インテル® Advisor は、dst レジスターを使用して、収集された操作のデータタイプを自動的に判別します。

GPU ルーフラインのサマリー

GPU ルーフラインの調査パースペクティブは、GPU で実行されるカーネルと、CPU で実行されるループ/関数のパフォーマンスを測定し、アプリケーションの最適化の必要性を示します。次のパフォーマンス・データを調査します。

GPU ルーフライン調査のサマリーレポート

アプリケーションのパフォーマンスの概要を知るには、[Summary (サマリー)] セクションを参照し、さらに詳しく調査するには [GPU Roofline Insights Regions (GPU ルーフラインの調査領域)] タブを開いてください。

関連情報