GPU カーネルのみのパースペクティブを収集 (サーベイ、特性化) + GPU カーネルのみのパフォーマンスのモデル化
生成された結果は次のように表示できます。
このトピックでは、インテル® Advisor GUI のオフロードのモデル化レポートに示されるデータについて説明します。結果を HTML 形式で表示することもできますが、データの配置とペインが異なることがあります。
生成される GPU - GPU 間のパフォーマンスのモデル化レポートの構造と制御は、CPU - GPU 間のオフロードのオフロードのモデル化レポートと似ていますが、GPU - GPU 間のモデル化では、インテル® Advisor はアプリケーションの GPU 領域のみをモデル化するため、表示される内容が異なります。
サポートを開くと、最初に [Summary (サマリー)] タブが表示されます。このタブでは、アプリケーションの GPU カーネルのモデル化の結果のサマリーと、推測されるパフォーマンス・メトリックを確認できます。

表示される円グラフで、GPU 実行時間とオフロードのコスト (カーネル起動コストとデータ転送コスト) の比率を確認し、GPU カーネルで最も時間が費やされる場所を特定します。
ペイン内のカーネルごとに、スピードアップ、ベースラインとターゲット GPU の時間、主な制限要因、および推測されるデータ転送量を確認できます。インテル® Advisor はカーネルを 1 対 1 でモデル化し、推測されるスピードアップが 1 未満のカーネルも除外せず表示します。
GPU カーネルのパフォーマンスの詳細を確認するには、[Accelerated Regions (アクセラレートされた領域)] タブに移動します。

また、テーブル内のカーネルを選択し、右のペインの [Details (詳細)] タブでカーネルで測定されたメトリックと推測されたメトリックをハイライトして、注目すべき事項を特定することもできます。
例えば、ボトルネックの可能性を検出します。
次のデータからボトルネックを検出できます。
インテル® Advisor は、このデータを使用して、それぞれのカーネルのデータ転送トラフィックとデータ転送を推測します。