事前定義された GPU ルーフラインの精度

各パースペクティブに対し、インテル® Advisor にはいくつかのレベルの収集精度が用意されています。各精度レベルには、収集されるデータと収集の詳細レベルを制御する一連の解析とプロパティーが設定されています。選択する精度レベルが高いほど、アプリケーションの実行時間に課されるオーバーヘッドは大きくなります。

次の精度レベルが利用できます。

比較 / 精度レベル	Low (低)	Medium (中)	High (高)
オーバーヘッド	5-10x	15-20x	20-50x
目的	GPU で実行されるアプリケーションのカーネルを解析	GPU で実行されるカーネルと CPU で実行されるループ/関数を詳しく解析	GPU で実行されるカーネルと CPU で実行されるループ/関数を詳しく解析
解析	GPU プロファイルとサーベイ + 特性化 (FLOP)	GPU プロファイルとサーベイ + 特性化 (FLOP、ホストとターゲット・デバイス・メモリー間の軽量データ転送シミュレーションとメモリー・オブジェクト解析) + ベースライン GPU のパフォーマンスのモデル化	GPU プロファイルとサーベイ + 特性化 (コールスタック付きトリップカウント & FLOP、ホストとターゲット・デバイス・メモリー間の中間データ転送シミュレーションとメモリー・オブジェクト解析) + ベースライン GPU のパフォーマンスのモデル化
GPU 用のカーネルの結果	パフォーマンス最適化向けの基本的な推奨事項を備えたメモリーレベルの GPU ルーフライン (CARM、L3、SLM、GTI 向け)	パフォーマンス最適化向けの拡張推奨事項を備えたメモリーレベルの GPU ルーフライン (CARM、L3、SLM、GTI 向け)	パフォーマンス最適化向けの拡張推奨事項を備えたメモリーレベルの GPU ルーフライン (CARM、L3、SLM、GTI 向け)
CPU 上のループ/関数の結果	L1 キャッシュ用のキャッシュ対応 CPU ルーフライン	コールスタック付きのメモリーレベルのルーフライン (L1、L2、L3、DRAM 向け)	コールスタック付きのメモリーレベルのルーフライン (L1、L2、L3、DRAM 向け)

カスタム精度を選択し、アプリケーションのカスタム・パースペクティブ・フローを設定できます。詳細については、GPU ルーフラインの調査パースペクティブのカスタマイズを参照してください。

注

データ収集、結果サイズ、および実行オーバーヘッドを最小化するさまざまな手法があります。解析のオーバーヘッドを最小化をオンにします。