各パースペクティブに対し、インテル® Advisor にはいくつかのレベルの収集精度が用意されています。各精度レベルには、収集されるデータと収集の詳細レベルを制御する一連の解析とプロパティーが設定されています。選択する精度レベルが高いほど、アプリケーションの実行時間に課されるオーバーヘッドは大きくなります。
次の精度レベルが利用できます。
比較 / 精度レベル |
Low (低) |
Medium (中) |
High (高) |
|---|---|---|---|
オーバーヘッド |
5-10x |
15-20x |
20-50x |
目的 |
GPU で実行されるアプリケーションのカーネルを解析 |
GPU で実行されるカーネルと CPU で実行されるループ/関数を詳しく解析 |
GPU で実行されるカーネルと CPU で実行されるループ/関数を詳しく解析 |
解析 |
GPU プロファイルとサーベイ + 特性化 (FLOP) |
GPU プロファイルとサーベイ + 特性化 (FLOP、ホストとターゲット・デバイス・メモリー間の軽量データ転送シミュレーションとメモリー・オブジェクト解析) + ベースライン GPU のパフォーマンスのモデル化 |
GPU プロファイルとサーベイ + 特性化 (コールスタック付きトリップカウント & FLOP、ホストとターゲット・デバイス・メモリー間の中間データ転送シミュレーションとメモリー・オブジェクト解析) + ベースライン GPU のパフォーマンスのモデル化 |
GPU 用のカーネルの結果 |
パフォーマンス最適化向けの基本的な推奨事項を備えたメモリーレベルの GPU ルーフライン (CARM、L3、SLM、GTI 向け) |
パフォーマンス最適化向けの拡張推奨事項を備えたメモリーレベルの GPU ルーフライン (CARM、L3、SLM、GTI 向け) |
パフォーマンス最適化向けの拡張推奨事項を備えたメモリーレベルの GPU ルーフライン (CARM、L3、SLM、GTI 向け) |
CPU 上のループ/関数の結果 |
L1 キャッシュ用のキャッシュ対応 CPU ルーフライン |
コールスタック付きのメモリーレベルのルーフライン (L1、L2、L3、DRAM 向け) |
コールスタック付きのメモリーレベルのルーフライン (L1、L2、L3、DRAM 向け) |
カスタム精度を選択し、アプリケーションのカスタム・パースペクティブ・フローを設定できます。詳細については、GPU ルーフラインの調査パースペクティブのカスタマイズを参照してください。