モデル化された領域のデータ転送を調査

精度レベル

有効となる解析

サーベイ + 特性化 (キャッシュ・シミュレーションおよびメディアデータ転送シミュレーションによるトリップカウントと FLOP) + 依存関係を想定しないパフォーマンスのモデル化

結果の解釈

Medium (中) 精度でオフロードのモデル化パースペクティブを実行すると、拡張オフロードモデル化レポートが表示され、オフロードされたアプリケーションのメモリーとキャッシュの使用とコストに関する情報が表示されます。基本データに加え、結果には以下が含まれます。

軽量データ転送シミュレーション・モードで GPU アプリケーションをプロファイルすると、CPU コードのみのメモリー・トラフィックの推測が取得されます。

オフロードのモデル化パースペクティブは、依存関係のタイプが不明である場合、ループは並列化されていると見なします。これは、コンパイラーがループに関連する情報を示さないか、ループが並列として明示的にマークされていない (例えば、OpenMP*、SYCL*、インテル® oneAPI スレッディング・ビルディング・ブロックなどのプログラミング・モデルで) ことを意味します。

すでに低精度のレポートが生成されている場合、すべてのオフロードに関する推奨事項、メトリック、およびスピードアップが更新され、より正確なデータを取得できます。

このトピックでは、インテル® Advisor GUI のオフロードのモデル化レポートおよび対話型 HTML レポートに表示されるデータについて説明します。

オフロードのモデル化レポートの [アクセラレートされた領域] タブで、メモリー使用量とデータ転送に関連するメトリックを確認します。

データ転送とコストの予測を含む高速化された領域レポートの例 (オフロードのモデル化パースペクティブ)

メトリックのレポートに関する詳細は、アクセラレーターのメトリックをご覧ください。

次のステップ

アプリケーションのホストとターゲットデバイス間で推測されるデータ転送の詳細を確認するには、次のいずれかのプロパティーを指定してオフロードのモデル化を実行します。

関連情報