GPU ルーフラインの調査の [Summary (サマリー)] レポートで、アプリケーションのプログラムメトリックと操作、そしてメモリーデータの概要を調べます。
注
インテル® Arc™ Alchemist (DG2) 以降のインテル® X
e グラフィックス製品ファミリーと以降の世代では、従来の用語から GPU アーキテクチャーの用語が変更されています。用語変更の詳細と、従来のコンテンツとの対応については、
インテル® Xe グラフィックスの GPU アーキテクチャー用語を参照してください。
GPU で実行されたコード領域のプログラムメトリックを調査
アプリケーション全体のパフォーマンスを把握し、[Program Metrics (プログラムメトリック)] ペインで次のことを評価します。
- アプリケーションが CPU 依存であるか GPU 依存であるかを理解するため、アプリケーションの合計時間と比較して、CPU と GPU に費やす時間を把握します。
- アプリケーションが CPU と GPU 間のデータ転送に費やす時間を調べます
- アプリケーションが並列実行の操作に浮動小数点ユニット (FPU) をどれくらい活用しているか理解します
- アプリケーションが並列実行の操作に占有する各実行ユニットのスレッド数を理解します
- アプリケーションが FPU パイプラインをどのように活用しているか、およびアプリケーションがサイクルごとに実行する命令数を理解します

注
専用 (ディスクリート) GPU の場合、FPU 利用率と EU IPC レートのメトリックは利用できません。
最も影響のあるデータタイプとホットスポットを特定します。
インテル® Advisor はアプリケーションの実行中にプロファイルを行い、操作に最も影響のあるデータタイプと最適化の対象となる上位のホットスポットを特定します。
- 操作を調査して、[OP/S and Bandwidth (OP/S と帯域幅)] ペインで最も影響のあるデータタイプを特定します。このデータから、コンパイラーが適切でない整数操作 (INTOP) や浮動小数点操作 (FLOP) を生成しているかどうかを確認します。

- [Top Hotspots (上位ホットスポット)] ペインで GPU 上の上位ホットスポットを表示し、[OP/S and Bandwidth (OP/S と帯域幅)] ペインのルーフライン・グラフを参照して、計算パフォーマンスとメモリー帯域幅の関連するパフォーマンスを調べます。これらのホットスポットは、アプリケーションの合計時間に最も影響を及ぼすため、最適化の候補となります。各カーネルのパフォーマンスに関する詳細情報を表示してハードウェアの制限と組み合わせて視覚化するには、ペイン内にあるホットスポットまたはルーフライン・グラフのドットをダブルクリックします。

そのほかの解析とプロパティーは、CPU ルーフラインに関するもので、CPU で実行されたループ/関数のメトリックを示します。CPU ルーフラインのデータの詳細については、CPU / メモリー・ルーフラインの調査をご覧ください。