GUI からオフロードのモデル化パースペクティブを実行

要件:

GUI からオフロードのモデル化パースペクティブを設定して実行するには、次の操作を行います。

  1. ドロップダウンからベースライン・デバイスを選択します。インテル® Advisor がパフォーマンス・データを収集するためにアプリケーションが動作するデバイスを選択します。
    • CPU で実行されるアプリケーション (C、C++、Fortran など) を解析する場合、CPU が選択されていることを確認してください。
    • GPU で実行されるアプリケーション (SYCL*、OpenMP* target、OpenCL* など) を解析する場合、GPU ベースラインが選択されていることを確認してください。

      GPU を選択した場合、サーベイ、特性化、パフォーマンスのモデル化解析で [GPU Profiling (GPU プロファイル)] チェックボックスが有効であることを確認してください。
  2. 取得しようとする結果に応じてパースペクティブを構成し、解析プロパティーを設定します。
    • 取得する結果に対して事前定義された解析プロパティーを使用して [collection accuracy level (収集の精度レベル)] を選択します。

      • Low (低): ターゲットデバイス向けのアプリケーションのパフォーマンスをモデル化し、潜在的なスピードアップに関する基本情報を取得します。
      • Medium (中): アプリケーションのパフォーマンスとホストデバイスとターゲットデバイス間のデータ転送をモデル化します。
      • High (高): アプリケーションのパフォーマンス、データ転送、メモリー・オブジェクトの属性をモデル化し、オフロードのモデル化の精度を向上させます。CPU で実行されるアプリケーションでは、ループの依存関係を解析します。
    • 解析とプロパティーを手動で選択して、用途に合わせてパースペクティブのフローを調整します。精度レベルい値は Custom (カスタム) に設定されます。

    選択する精度レベルが高いほど、アプリケーションの実行時間に課されるオーバーヘッドは大きくなります。[Overhead (オーバーヘッド)] のインジケーターは、選択した設定のオーバーヘッドを示します。[Custom (カスタム)] 精度を選択すると、 選択した解析とプロパティーのオーバーヘッドが計算されます。

    依存関係解析 (CPU ベースライン・デバイスの高精度に含まれる) は、最も高いオーバーヘッドが課せられますが、アプリケーションが CPU 上で高度に並列化またはベクトル化されている場合、またはアプリケーションの主なホットスポットにループ伝搬依存がないことが判明している場合は行う必要はありません。CPU アプリケーションにスカラーループ/関数がある場合、またはコード内の依存関係が不明である場合は、CPU アプリケーションに対し実行する必要があります。コード内の潜在的な依存関係については、想定される依存関係がモデル化に与える影響を確認するを参照してください。

    デフォルトで精度は Low (低) に設定されています。詳細については、事前定義されたオフロードのモデル化の精度を参照してください。

  3. [Target Platform Model (ターゲット・プラットフォーム・モデル)] ドロップダウンからターゲット・プラットフォームを選択します。これは、インテル® Advisor がアプリケーションのパフォーマンスをモデル化するプラットフォームです。次のターゲット・プラットフォームを選択できます。

    プラットフォーム

    デバイス

    pvc_xt_448xve (デフォルト )

    インテル® データセンター GPU マックス 448

    pvc_xt_512xve

    インテル® データセンター GPU マックス 512

    XeHPG 512

    インテル® Arc™ グラフィックス (512 ベクトルエンジン)

    XeHPG 256

    インテル® Arc™ グラフィックス (256 ベクトルエンジン)

    Gen11 GT2

    インテル® Iris® Plus グラフィックス

    XeLP Max 96

    インテル® Iris® Xe MAX グラフィックス

    XeLP GT2

    インテル® Iris® Xe グラフィックス

    Gen9 GT2

    インテル® HD グラフィックス 530

    Gen9 GT3e

    インテル® Iris® グラフィックス 550

    Gen9 GT4e

    インテル® Iris® Pro グラフィックス 580

    pvc_xt_448xve および pvc_xt_512xve プラットフォームの複数タイルと複数 GPU 解析は、現在はサポートされていません。
  4. パースペクティブを実行するには、[Run (実行)] をクリックします。

    パースペクティブの実行中に、[Analysis Workflow (解析ワークフロー)] タブで次の操作を行うことができます。

    • パースペクティブの実行をコントロール:
      • データ収集を停止して、収集済みのデータを表示します: ボタンをクリックします。
      • データ収集をポーズ: ボタンをクリックします。
      • データ収集をキャンセルして、収集したデータを廃棄します: ボタンをクリックします。
    • 解析の実行をコントロールするため を拡張します。
      • 解析をポーズ: ボタンをクリックします。
      • 解析を停止して選択した次の解析を開始します: ボタンをクリックします。
      • 選択したすべての解析を中断し、収集済みのデータを確認します: ボタンをクリックします。

    オフロードのモデル化パースペクティブを実行すると、収集されたサーベイデータはほかのすべてのパースペクティブで利用できるようになります。別のパースペクティブに切り替える場合、サーベイをスキップして、パースペクティブ固有の解析だけを実行できます。

コマンドライン・インターフェイスから中精度で CPU - GPU オフロードのモデル化パースペクティブを実行するには、次のコマンドを実行します。

advisor --collect=offload --project-dir=./advi_results -- ./myApplication

コマンドライン・インターフェイスから中精度で GPU - GPU オフロードのモデル化パースペクティブを実行するには、次のコマンドを実行します。

advisor --collect=offload --gpu --project-dir=./advi_results -- ./myApplication

詳細についてはコマンドラインからオフロードのモデル化パースペクティブを実行を参照してください。GPU - GPU 間のオフロードのモデル化の詳細については、コマンドラインから GPU - GPU 間のパフォーマンスをモデル化するを参照してください。

[Command Line (コマンドライン)] ボタンをクリックすると、選択したパースペクティブ設定のコマンドラインを生成できます。

オフロードのモデル化パースペクティブでデータを収集すると、レポートが開き [Summary (サマリー)] タブに推測されるスピードアップ、潜在的なパフォーマンスのボトルネック、上位のオフロードループなど、選択したターゲット・プラットフォームで推測されたパフォーマンス・メトリックが表示されます。選択した精度レベルとパースペクティブのプロパティーに応じて、結果の調査を続行します。オフロードのモデル化の結果を調査を参照してください。