GPU ルーフライン・パースペクティブを実行した後、[GPU ルーフラインの調査サマリー] ウィンドウで、GPU および CPU デバイスでコード実行に関する重要な情報を表示します。
各ペインの右上隅にあるドロップダウンを使用して、ウィンドウのレイアウトをカスタマイズできます。
GPU ルーフラインの結果のスナップショットを生成するには、
ボタンをクリックします。詳細は、読み取り専用の結果スナップショットを作成を参照してください。。
GPU および CPU で実行されるアプリケーション領域で最も重要なメトリックを表示します。このペインには、アプリケーションが GPU のリソースをどの程度利用し、改善の余地があるかを示す情報が示されます。このペインは次のサブセクションに分かれています。
メインプログラムのメトリックの下にあるドロップダウン・メニューを開くと、GFLOPS、GINTOPS、および INT と FLOP 計算タイプの演算強度に関する詳細情報が表示されます。
GPU と CPU のプレビュー・ルーフライン・グラフで、ハードウェアによって制限されるパフォーマンスの上限と比較して、アプリケーションのすべての計算タスクと関数/ループのメトリックを表示します。異なるメモリーレベルで 1 秒あたりに実行できる FLOPS と INTOPS を調査します。GPU ルーフライン・グラフを使用する詳細については、GPU ルーフライン・グラフのボトルネックを調査を参照してください。
プレビューのルーフライン・グラフの右上隅で INT と FLOAT を切り替えて、タイプ別に計算をフィルター処理します。
プレビューのルーフライン・グラフの下にあるドロップダウン・メニューを開くと、GFLOPS、GINTOPS、および異なるメモリーレベル (CARM、L3、SLM、GTI) での INT と FLOP 計算タイプの演算強度に関する詳細情報が表示されます。GPU ルーフライン・グラフでは、タイプ (FLOAT、INT、ストア、ロード、ムーブ) ごとにまとめられた命令の合計数を表わす命令ミックス・ダイアグラムを表示します。
ルーフライン・グラフのドット上にマウスを移動すると、そのドットに関連する関数/ループのメトリックが表示されます。ドットをクリックしてソースコードを開いて、GPU ルーフライン・グラフで表示します。
最適化の有力候補である GPU 上で最も時間を要する上位 5 つの計算タスクと、CPU 上の関数/ループの主要メトリック (経過時間、FLOP、GINTOPS) を表示します。関数名をクリックしてソースコードを開いて、GPU ルーフライン・グラフで表示します。
アプリケーションの CPU および GPU で実行される領域の実行時間の詳細を示します。このペインでは、アプリケーションがそれぞれのメモリーレベルで GPU リソースをどの程度活用しているか確認できます。ヒストグラム上にマウスを移動すると、アクティブ、ストール、およびアイドル状態の EU アレイの割合が表示されます。
ソフトウェアおよびハードウェアの概要を含むシステム情報を表示します。
サーベイおよび特性化データ収集に関連する情報を表示します。ドロップダウンを使用して、各解析タイプの情報を表示/非表示にします。