GUI から GPU ルーフラインの調査パースペクティブを実行

要件:

  1. GPU カーネル解析向けにシステムを設定します。
  2. グラフィカル・ユーザー・インターフェイス (GUI): プロジェクトを作成して解析システムおよびターゲットを指定します。

GUI から GPU ルーフラインの調査パースペクティブを設定して実行するには、次の操作を行います。

  1. 取得しようとする結果に応じてパースペクティブを構成し、解析プロパティーを設定します。
    • 取得する結果に対して事前定義された解析プロパティーを使用して [collection accuracy level (収集の精度レベル)] を選択します。
      • Low (低): GPU で実行されるカーネルのパフォーマンスを解析し、すべてのメモリーレベルの GPU ルーフライン・グラフを描画します。CPU で実行されるループ/関数の基本的な CPU ルーフライン・グラフを描画します。
      • Medium (中): GPU で実行されるカーネルのパフォーマンスを解析し、すべてのメモリーレベルの GPU ルーフライン・グラフを描画し、アプリケーションのパフォーマンスをモデル化して最適化に関する推奨事項を取得します。CPU で実行されるループ/関数の基本的な CPU ルーフライン・グラフを描画します。
      • High (高): GPU で実行されるカーネルのパフォーマンスを解析し、すべてのメモリーレベルの GPU ルーフライン・グラフを描画し、アプリケーションのパフォーマンスをモデル化して最適化に関する推奨事項を取得します。CPU で実行されるループ/関数の拡張 CPU ルーフライン・グラフを描画します。
    • 解析とプロパティーを手動で選択して、用途に合わせてパースペクティブのフローを調整します。精度レベルい値は Custom (カスタム) に設定されます。

    デフォルトで精度は Low (低) に設定されています。選択する精度レベルが高いほど、アプリケーションの実行時間に課されるオーバーヘッドは大きくなります。オーバーヘッドのインジケーターは、選択した設定のオーバーヘッドを示します。[Custom (カスタム)] 精度を選択すると、 選択した解析とプロパティーのオーバーヘッドが計算されます。

    詳細については、事前定義された GPU ルーフラインの精度をご覧ください。

    GPU で実行されるコード領域にのみ注目する場合、精度レベル Low (低)または Medium (中) を選択します。これは解析のオーバーヘッドを減らすことができます。

  2. システムに複数の GPU が接続されている場合、[Target GPU (ターゲット GPU)] ドロップダウンからデータを収集するターゲット GPU を選択します。
    • 利用可能なすべての GPU で解析を実行するには、[All devices (すべてのデバイス)] を選択します。

      データ解析に特定の GPU のみを含めるには、「コマンド ラインから GPU ルーフラインの調査パースペクティブを実行する」の説明に従って、target-gpu オプションを使用してコマンドラインから GPU ルーフラインの調査パースペクティブを実行します。
    • マルチタイル GPU の場合、解析設定にタイルは表示されません。ただし、解析のターゲットとしてマルチタイル GPU を選択した場合、インテル® Advisor はすべてのタイルを解析し、各タイルの詳細情報を GPU ルーフライン・レポートに表示します。

      マルチタイル GPU は、インテル® Advisor 2024.0 以降でサポートされます。
    ドロップダウンには、利用可能な GPU アダプターのアドレスと名前が表示されます。アドレスの形式は次のとおりです: <domain>:<bus>:<device-number>.<function-number>。ここですべての値は数値です。
  3. 分析タイプから、Survey > GPU Profiling (サーベイ > GPU プロファイル) または Characterization > FLOP and GPU Profiling (特性化 > FLOP および GPU プロファイル) を選択します。
  4. パースペクティブを実行: ボタンをクリックします。

    パースペクティブの実行中に、[Analysis Workflow (解析ワークフロー)] タブで次の操作を行うことができます。

    • パースペクティブの実行をコントロール:
      • データ収集を停止して、収集済みのデータを表示します: ボタンをクリックします。
      • データ収集をポーズ: ボタンをクリックします。
      • データ収集をキャンセルして、収集したデータを廃棄します: ボタンをクリックします。
    • 解析の実行をコントロールするため を拡張します。
      • 解析をポーズ: ボタンをクリックします。
      • 解析を停止して選択した次の解析を開始します: ボタンをクリックします。
      • 選択したすべての解析を中断し、収集済みのデータを確認します: ボタンをクリックします。

コマンドライン・インターフェイスから低精度で GPU ルーフラインの調査パースペクティブを実行するには、次のコマンドを実行します。

advisor --collect=roofline --profile-gpu --project-dir=./advi_results -- ./myApplication

詳細についてはコマンドラインから GPU ルーフラインの調査パースペクティブを実行を参照してください。

[Command Line (コマンドライン)] ボタンをクリックすると、選択したパースペクティブ設定のコマンドラインを生成できます。

GPU ルーフラインの調査パースペクティブでデータを収集すると、レポートが開いて、アプリケーションの CPU および GPU で実行される領域で測定されたパフォーマンス・メトリックを含む [Summary (サマリー)] と、ループライン・グラフのプレビューが表示されます。結果を調査するには、ルーフライン・グラフの GPU ボトルネックを引き続き調べます。