高
サーベイ + 特性化 (キャッシュ・シミュレーションおよびメディアデータ転送シミュレーションによるトリップカウントと FLOP) + 依存関係 + パフォーマンスのモデル化
依存関係解析が行われない場合、ループがプラグマを使用して並列処理であると明示的にマークされていない、またはコンパイラーが依存関係の存在を想定すると、インテル® Advisor は計算時間が長くループのオフロードは適切ではないと見なします。この場合、依存関係に関連するコード領域のパーセンテージが高いことが分かります。依存関係に関する正確な情報を取得するには、依存関係解析を実行します。
オフロードのモデル化パースペクティブを高精度で実行すると、ループに関する依存関係の有無に関する詳しい情報と完全なデータ転送レポートが加えられたオフロードのモデル化レポートが表示されます。
すでに低精度のレポートが生成されている場合、すべてのオフロードに関する推奨事項、メトリック、およびスピードアップが更新され、より正確なデータを取得できます。

[Accelerated Regions (アクセラレートされた領域)] タブには次のメトリックが表示されます。
[詳細] タブではループの依存関係タイプを示すアイコンが表示されます。
- コード領域は並列であるか並列化可能です。
- コード領域には依存関係があります。ホストとデバイス間、およびメモリー・オブジェクト間で転送されるデータに関する詳細情報を含む [データ転送の予測] ペインを確認します。さらに基本データ転送レポートには以下が含まれます。
[Recommendations (推奨事項)] タブで、コードをターゲットデバイスにオフロードし、コードが最大のメリットを得られるように最適化するガイドを取得します。コード領域に最適化の余地が残っている場合、またはターゲットデバイスの能力を十分に活用していない場合は、インテル® Advisor はコードの最適化に役立つヒントとコードの例を示します。
推測された高速化が目的に達し、アプリケーションをオフロードする準備ができていると思われる場合は、収益性の高いコード領域をターゲット・プラットフォームにオフロードするようにコードを書き換え、GPU Roofline Insights (GPU ルーフラインの調査) の観点から GPU カーネルのパフォーマンスを予測します。