ウィンドウ: GPU ルーフライン領域

[GPU Roofline Regions (GPU ルーフライン領域)] ウィンドウを使用して、グリッド内の GPU メトリックを表示し、GPU ルーフライン・グラフでカーネルのパフォーマンスを視覚化して最適化の可能性を特定し、カーネルが計算またはメモリー帯域幅をどの程度利用しているか判断する情報を表示します。

インテル® Arc™ Alchemist (DG2) 以降のインテル® Xe グラフィックス製品ファミリーと以降の世代では、従来の用語から GPU アーキテクチャーの用語が変更されています。用語変更の詳細と、従来のコンテンツとの対応については、インテル® Xe グラフィックスの GPU アーキテクチャー用語を参照してください。

インテル® Advisor の GPU ルーフラインの調査パースペクティブのメインレポートで利用できるコントロールを確認します。[GPU Roofline Regions (GPU ルーフライン領域)][Summary (サマリー)] タブでは、ペインをドラッグしてドロップ、閉じる/開く、折りたたむ/展開することで、レイアウトを変更できます。

  • 左上の隅にあるドロップダウン・メニューを使用して視点を切り替えます。
  • [Summary (サマリー)][GPU Roofline Regions (GPU ルーフライン領域)]、および [Source View (ソース表示)] を切り替えます。

アクセラレーターで実行されるアプリケーションのコード領域のメトリックサマリーを確認します。

  • ボタンを使用して、プログラムごとの推奨事項を表示する上部のスライドバーを展開/折りたたむことができます。
    • それぞれの推奨事項を展開または折りたたみます。
    • ボタンをクリックして推奨事項ペインを貼り付けます。

  • ボタンを使用して、収集イベントログの上部にあるスライドバーを展開/折りたたむことができます。上部のスライドバーで次のことができます。
    • [Featured Events (注目するイベント)] ペインの主要なデータ収集イベントと問題。

      ログ内の注目するイベントを展開または折りたたんで詳細を表示。

    • アプリケーション出力。ビューの右上隅にあるトグルを切り替えて、アプリケーションの出力を表示/非表示にできます。
    • [Collection Log (収集ログ)] ペインにあるアプリケーションの完全な実行ログ。

    ボタンをクリックして上部のスライドバーを折りたたむか、ドラッグしてイベントログを最大化します。

    ヒント

    パースペクティブを実行すると、収集イベントログの上部にスライドバーが自動的に表示されます。上部にある緑色のプログレスバーで収集を追跡し、収集イベントをオンラインで表示できます。
  • 現在のプロジェクト結果のスナップショットを作成するには、 ボタンを使用します。詳細は、読み取り専用の結果スナップショットを作成を参照してください。

  • すでに閉じたペインを開くには、+ ボタンをクリックします。このボタンを使用すると、次のペインが追加されます。
    • [CPU Roofline (CPU ルーフライン)] ペインでは、ルーフライン・グラフで視覚化されたハードウェアによって課せられたパフォーマンスの上限と比較して、CPU で実行される関数/ループの実際のパフォーマンスを表示できます。

      結果の解釈については、CPU ルーフライン・グラフのボトルネックを調査を参照してください。

    • [CPU] ペインでは、CPU 上のアプリケーションのパフォーマンス・メトリックを確認し、アクセラレーター上のパフォーマンス・メトリックと比較できます。詳細については、CPU メトリックを参照してください。

[GPU Roofline (GPU ルーフライン)] グラフを使用して、アプリケーションの GPU カーネルの実際のパフォーマンスを、ハードウェアによって制限されるパフォーマンスの上限と比較して確認します。

結果の解釈については、GPU ルーフライン・グラフのボトルネックを調査を参照してください。

ペイン: GPU ルーフライン・グラフの GPU ルーフライン・グラフのコントロールについては、詳細な説明を参照してください。

[GPU Details (GPU 詳細)] タブで、選択したカーネルの実行に関する詳しい情報を表示します。

  • [Summary (サマリー)] ペインで、選択したカーネルのプログラムメトリックを表示します。
  • [Roofline Guidance (ルーフラインのガイド)] ペインで、選択したカーネルが制限されるメモリーレベルを特定します。
  • [OP/S and Bandwidth (OP/S と帯域幅)] ペインで、計算操作数とメモリーレベルの利用率メトリックを調査します。ドロップダウンを使用して、各種メモリーレベルの浮動小数点演算と整数演算の演算数、メモリー・トラフィック、演算強度 (AI) を表示します。
  • [Memory Metrics (メモリーメトリック)] ペインで、選択したカーネルのそれぞれのメモリーレベルの影響を確認し、各メモリーレベルを通過するデータ量を調査します。
  • [Instruction Mix (命令ミックス)] ペインでは、タイプごとにグループ化された計算、メモリー、およびその他の命令数の比率を調べます。
  • [Instruction Mix Details (命令ミックスの詳細)] ペインで、アプリケーションの実行中に使用される命令タイプの詳細概要を取得します。ドロップダウンを使用して各命令カテゴリーを展開し、命令タイプと命令数を表示します。計算カテゴリーでは、インテル® Advisor がデータタイプを決定します。カーネル全体で使用される主なデータタイプは、青でハイライト表示されます。フィルターボタンを使用して、タイプと主なデータタイプで命令をフィルター処理します。
  • [Performance Characteristics (パフォーマンス特性)] ペインで、選択したカーネル内のループが実行ユニット (EU) をどのように利用しているか表示できます。

以下を行うため、[GPU Source (GPU ソース)][GPU Assembly (GPU アセンブリー)] タブを切り替えます。

  • 各ソース行のソースコードとオフロードの詳細を調査します。GPU テーブルのループ、または GPU ルーフラインのドットを選択して、ソースとアセンブリー・コードの対応する領域に注目します。

  • 選択されたカーネルに対応するアセンブリーを確認します。ソースコードの行を選択すると、ソースコードに対応するアセンブリー・コードがハイライト表示されます。

GPU ルーフラインの調査パースペクティブの結果の詳しい解釈については、GPU ルーフライン結果の調査を参照してください。

[Recommendations (推奨事項)] タブを使用して、選択されているカーネルのパフォーマンスの向上に役立つ実用的な情報を取得します。推奨事項を展開すると、詳細情報とサンプルコードが表示されます。

GPU アクセラレーターで実行されるアプリケーションのパフォーマンス・メトリックを確認します。詳細については、アクセラレーターのメトリックをご覧ください。