インテル® Advisor 導入ガイド

インテル® Advisor を使用すると、C、C++、Fortran、OpenMP*、SYCL*、Python*、または OpenCL* アプリケーションが最新のプロセッサー上で最大限のパフォーマンスを発揮できるようになります。インテル® Advisor は次の方法でダウンロードできます。

インテル® Advisor をダウンロードしてインストールしたら、始める前にの手順に従ってツールを起動して環境を設定します。インテル® Advisor パースペクティブを引き続き実行して、コードを解析します。

インテル® Advisor では、パースペクティブは複数のプロファイル手順とオプションで有効化される定義済みの分析ワークフローであり、問題を解決するために最適化された特定のデータレイアウトとして表されます。解析の目的に応じて、1 つ以上のパースペクティブに従ってアプリケーションのパフォーマンスを理解し、ボトルネックを特定できます。

このドキュメントでは、アプリケーションのパフォーマンスを最適化する一般的なインテル® Advisor ワークフローの概要を説明します。次のパースペクティブからコードを解析できます。

インテル® Advisor を使用して、次のパースペクティブからコードを解析できます: ベクトル化とコードの調査、CPU/メモリー・ルーフライン、スレッド化。オフロードのモデル化、GPU ルーフラインの調査

ベクトル化とコードの調査

アプリケーション内のベクトル化されていないループと関数、およびベクトル化が不十分なループと関数を見つけ、ベクトル化によってアプリケーションのパフォーマンスを向上させるコード固有の推奨事項を取得します。これには、インテル® アドバンスト・ベクトル・エクステンションやインテル® アドバンスト・ベクトル・エクステンション 512 などの単一命令複数データ (SIMD) 命令を複数のデータ・オブジェクトに適用し、単一の CPU コアで並列処理することが含まれます。C、C++、Fortran、OpenMP*、または混合 Python アプリケーションを解析できます。

サンプル・アプリケーションを使用したクイック・スタート・ワークフローについては、ベクトル化が最も効果的である場所を見つけるを参照してください。

CPU / メモリー・ルーフラインの調査

アプリケーションのパフォーマンスを CPU の上限に対してルーフライン・チャートとして視覚化し、アプリケーションがハードウェア・リソースをどの程度使用しているか、主な制限の要因は何か、最適化の候補は何かを把握します。C、C++、Fortran、OpenMP*、または混合 Python アプリケーションを解析できます。

サンプル・アプリケーションを使用したクイック・スタート・ワークフローについては、CPU ルーフラインを使用してパフォーマンスのボトルネックを特定するを参照してください。

オフロードのモデル化

CPU 上で実行されているアプリケーションの場合、アプリケーションが GPU に移植されることでメリットが得られるかどうかを判断し、最も収益性の高いオフロードの可能性と潜在的なボトルネックを特定します。C、C++、Fortran、SYCL*、OpenCL* アプリケーション、または OpenMP* target ディレクティブを含むアプリケーションを解析できます。

GPU 上で実行されているアプリケーションの場合、次世代 GPU 上で実行することでアプリケーションを高速化できる可能性を判断し、潜在的なボトルネックを特定します。SYCL*、OpenCL* アプリケーション、または OpenMP* target ディレクティブを含むアプリケーションを解析できます。

サンプル・アプリケーションを使用した CPU から GPU へのワークフローのクイックスタートについては、GPU にオフロードする影響の大きい可能性を特定するを参照してください。

GPU ルーフラインの調査

GPU アプリケーションをプロファイルし、GPU の上限に対するカーネル・パフォーマンスをルーフライン・チャートとして視覚化して、主なボトルネックと制限要因を特定し、GPU のパフォーマンスを最適化する推奨事項を取得します。SYCL*、OpenCL* アプリケーション、または OpenMP* target ディレクティブを含むアプリケーションを解析できます。

サンプル・アプリケーションを使用したクイック・スタート・ワークフローについては、GPU ルーフラインを使用した GPU パフォーマンスの測定を参照してください。

スレッド化

開発を中断することなく、コア数が多いシステムでアプリケーションのさまざまなスレッド設計オプションのプロトタイプを作成し、プロジェクトのスケーリングを行い、並列処理を実装する前にパフォーマンスの問題を見つけて修正します。C、C++、または Fortran アプリケーションを解析できます。

サンプル・アプリケーションを使用したクイック・スタート・ワークフローについては、スレッドのプロトタイプを設計を参照してください。