ウィンドウ: GPU ルーフラインの調査サマリー

GPU ルーフライン・パースペクティブを実行した後、[GPU ルーフラインの調査サマリー] ウィンドウで、GPU および CPU デバイスでコード実行に関する重要な情報を表示します。

各ペインの右上隅にあるドロップダウンを使用して、ウィンドウのレイアウトをカスタマイズできます。

GPU ルーフラインの結果のスナップショットを生成するには、 ボタンをクリックします。詳細は、読み取り専用の結果スナップショットを作成を参照してください。。

インテル® Arc™ Alchemist (DG2) 以降のインテル® Xe グラフィックス製品ファミリーと以降の世代では、従来の用語から GPU アーキテクチャーの用語が変更されています。用語変更の詳細と、従来のコンテンツとの対応については、インテル® Xe グラフィックスの GPU アーキテクチャー用語を参照してください。

[Program Metrics (プログラムのメトリック)] ペイン

GPU および CPU で実行されるアプリケーション領域で最も重要なメトリックを表示します。このペインには、アプリケーションが GPU のリソースをどの程度利用し、改善の余地があるかを示す情報が示されます。このペインは次のサブセクションに分かれています。

メインプログラムのメトリックの下にあるドロップダウン・メニューを開くと、GFLOPS、GINTOPS、および INT と FLOP 計算タイプの演算強度に関する詳細情報が表示されます。

OP/S and Bandwidth (OP/S と帯域幅) ペイン

GPU と CPU のプレビュー・ルーフライン・グラフで、ハードウェアによって制限されるパフォーマンスの上限と比較して、アプリケーションのすべての計算タスクと関数/ループのメトリックを表示します。異なるメモリーレベルで 1 秒あたりに実行できる FLOPS と INTOPS を調査します。GPU ルーフライン・グラフを使用する詳細については、GPU ルーフライン・グラフのボトルネックを調査を参照してください。

プレビューのルーフライン・グラフの右上隅で INTFLOAT を切り替えて、タイプ別に計算をフィルター処理します。

プレビューのルーフライン・グラフの下にあるドロップダウン・メニューを開くと、GFLOPS、GINTOPS、および異なるメモリーレベル (CARM、L3、SLM、GTI) での INT と FLOP 計算タイプの演算強度に関する詳細情報が表示されます。GPU ルーフライン・グラフでは、タイプ (FLOAT、INT、ストア、ロード、ムーブ) ごとにまとめられた命令の合計数を表わす命令ミックス・ダイアグラムを表示します。

ルーフライン・グラフのドット上にマウスを移動すると、そのドットに関連する関数/ループのメトリックが表示されます。ドットをクリックしてソースコードを開いて、GPU ルーフライン・グラフで表示します。

Top Hotspots (上位のホットスポット) ペイン

最適化の有力候補である GPU 上で最も時間を要する上位 5 つの計算タスクと、CPU 上の関数/ループの主要メトリック (経過時間、FLOP、GINTOPS) を表示します。関数名をクリックしてソースコードを開いて、GPU ルーフライン・グラフで表示します。

Performance Characteristics (パフォーマンス特性) ペイン

アプリケーションの CPU および GPU で実行される領域の実行時間の詳細を示します。このペインでは、アプリケーションがそれぞれのメモリーレベルで GPU リソースをどの程度活用しているか確認できます。ヒストグラム上にマウスを移動すると、アクティブ、ストール、およびアイドル状態の EU アレイの割合が表示されます。

Platform Information (プラットフォーム情報) ペイン

ソフトウェアおよびハードウェアの概要を含むシステム情報を表示します。

Collection Information (収集情報) ペイン

サーベイおよび特性化データ収集に関連する情報を表示します。ドロップダウンを使用して、各解析タイプの情報を表示/非表示にします。