オフロードするカーネルの特定

ヘテロジニアス・プラットフォームのデバイスで利用可能な計算サイクルを最大限に活用するには、計算集約型で並列実行可能なタスクを特定することが重要です。CPU のみで実行されるアプリケーションを調査すると、GPU で実行するのに適したタスクが見つかることがあります。これは、インテル® Advisor (英語) のオフロードのモデル化パースペクティブで判別できます。

インテル® Advisor は、アクセラレーターで実行できる可能性があるワークロードのパフォーマンス特性を推測できます。ワークロードのプロファイル情報から、パフォーマンスを見積もり、高速化、ボトルネックの特性を評価して、さらにオフロードデータ転送を推測し、推奨事項を示します。

一般に、計算主体で、大規模なデータセットを持ち、限られたデータ転送を行うカーネルは、デバイスへのオフロードに適しています。

GPU にオフロードにより大きな効果が得られる候補の特定 (英語) し、オフロードのモデル化を使用して手順を確認します。GPU プラットフォームでのアプリケーションのモデル化のパフォーマンスに関するその他のリソースについては、インテル® Advisor ユーザー向けオフロードのモデル化のリソース (英語) を参照してください。