事前定義された GPU ルーフラインの精度

各パースペクティブに対し、インテル® Advisor にはいくつかのレベルの収集精度が用意されています。各精度レベルには、収集されるデータと収集の詳細レベルを制御する一連の解析とプロパティーが設定されています。選択する精度レベルが高いほど、アプリケーションの実行時間に課されるオーバーヘッドは大きくなります。

次の精度レベルが利用できます。

比較 / 精度レベル

Low (低)

Medium (中)

High (高)

オーバーヘッド

5-10x

15-20x

20-50x

目的

GPU で実行されるアプリケーションのカーネルを解析

GPU で実行されるカーネルと CPU で実行されるループ/関数を詳しく解析

GPU で実行されるカーネルと CPU で実行されるループ/関数を詳しく解析

解析

GPU プロファイルとサーベイ + 特性化 (FLOP)

GPU プロファイルとサーベイ + 特性化 (FLOP、ホストとターゲット・デバイス・メモリー間の軽量データ転送シミュレーションとメモリー・オブジェクト解析) + ベースライン GPU のパフォーマンスのモデル化

GPU プロファイルとサーベイ + 特性化 (コールスタック付きトリップカウント & FLOP、ホストとターゲット・デバイス・メモリー間の中間データ転送シミュレーションとメモリー・オブジェクト解析) + ベースライン GPU のパフォーマンスのモデル化

GPU 用のカーネルの結果

パフォーマンス最適化向けの基本的な推奨事項を備えたメモリーレベルの GPU ルーフライン (CARM、L3、SLM、GTI 向け)

パフォーマンス最適化向けの拡張推奨事項を備えたメモリーレベルの GPU ルーフライン (CARM、L3、SLM、GTI 向け)

パフォーマンス最適化向けの拡張推奨事項を備えたメモリーレベルの GPU ルーフライン (CARM、L3、SLM、GTI 向け)

CPU 上のループ/関数の結果

L1 キャッシュ用のキャッシュ対応 CPU ルーフライン

コールスタック付きのメモリーレベルのルーフライン (L1、L2、L3、DRAM 向け)

コールスタック付きのメモリーレベルのルーフライン (L1、L2、L3、DRAM 向け)

カスタム精度を選択し、アプリケーションのカスタム・パースペクティブ・フローを設定できます。詳細については、GPU ルーフラインの調査パースペクティブのカスタマイズを参照してください。

データ収集、結果サイズ、および実行オーバーヘッドを最小化するさまざまな手法があります。解析のオーバーヘッドを最小化をオンにします。