インテル® VTune™ プロファイラー・ユーザーガイド

GPU レンダリング解析 (プレビュー)

GPU レンダリング解析を使用して、エンジンと GPU ハードウェア・メトリックごとの GPU 使用量に基づいてコードのパフォーマンスを予測します。

これは、プレビュー機能です。プレビュー機能は、正式リリースに含まれるかどうか未定です。皆さんが機能に対する有用性のフィードバックを送ることで、将来の採用決定の判断に役立ちます。プレビュー機能で収集されたデータは、将来のリリースで下位互換が提供される保証はありません。parallel.studio.support@intel.com または intelsystemstudio@intel.com へフィードバックをお送りください。

どのように動作するか

GPU レンダリング解析は、次の使用モデルに注目します。

必要条件

解析を成功させるには、システムの次の設定を確認してください。

ターゲットを選択

GPU レンダリング解析向けのプロジェクト設定は、プロファイルするターゲットによって異なります。

この 2 つの使用モデルは相互排他的です。つまり、Xen* プラットフォーム全体の解析では OpenGL* ES API 呼び出しは検出されず、Xen* 仮想ドメイン統計は [アプリケーションを起動][プロセスにアタッチ] モードでは使用できません。

解析の設定と実行

GPU レンダリング解析を設定して実行します。

  1. (スタンドアロン GUI)/ (Visual Studio* IDE) で、インテル® VTune™ プロファイラーのツールバーにある [解析の設定] ボタンをクリックします。

    [解析の設定] ウィンドウが開きます。

  2. [どのように] ペインで、 実行する解析タイプを選択ボタンをクリックして、[GPU レンダリング] を選択します。

  3. 次の収集オプションを編集することもできます。

    • [GPU サンプリング間隔 (ミリ秒)] オプションを使用して GPU ハードウェア・メトリック収集の GPU サンプルリング間隔を指定できます。デフォルトでは、インテル® VTune™ プロファイラーは、ハードウェア・ベース・サンプリング収集には 1 ミリ秒の間隔を、ユーザーモード・サンプリングとトレース収集には 1000 ミリ秒を適用します。

    • [プロセッサー・グラフィックス・ハードウェア・イベントを解析] オプションにより、レンダーや GPU エンジン利用率 (インテル® グラフィックスのみ) をモニターして、エンジンのどの部分に負荷がかかっているかを特定し、GPU および CPU データと関連付けます。このオプションを使用するには、root 権限が必要です。

      インテル® VTune™ プロファイラーは、プラットフォーム固有の事前定義されたハードウェア・メトリックを用意しています。この解析では、レンダー基本イベントグループが事前に選択されています。すべての事前定義は、次の実行ユニット (EU) アクティビティーに関するデータを収集します: EU アレイ・アクティビティー、EU アレイストール、EU アレイアイドル、計算スレッドのストール、およびコア周波数。

      • 概要イベントグループには、メモリーリード/ライト帯域幅、GPU L3 ミス、サンプラービジー、サンプラー・ボトルネック、および GPU メモリーのテクスチャー・リード/ライト帯域幅などの一般的な GPU メモリーアクセスに関する追加のメトリックが含まれます。これらのメトリックは、グラフィックスと計算主体の両方のアプリケーションに役立ちます。

      • 基本計算 (グローバル/ローカルメモリー・アクセス含む) イベントグループには、型なしリード/ライト帯域幅、型付きリード/ライト・トランザクション、SLM リード/ライト帯域幅、レンダラー/GPGPU コマンド・ストリーマーのロード、および GPU EU アレイの使用など、GPU 上の異なるタイプのデータアクセスを区別する追加のメトリックが含まれます。これらのメトリックは、GPU 上の計算集約型のワークロードに役立ちます。

      • 拡張計算 イベントグループには、インテル® プロセッサー開発コード名 Broadwell 以降の GPU 解析のみをターゲットとする追加のメトリックが含まれます。その他のシステム向けの事前定義はありません。

      • レンダー基本 (プレビュー) イベントグループには、ピクセルシェーダー、バーテックス・シェーダー、および出力マージメトリックが含まれます。

      • 完全な計算イベントグループは、概要と基本計算イベントセットの組み合わせです。

    詳細セクションで事前定義されたオプションを変更するか、収集されるハードウェア・イベントのリストを変更するには、新しいカスタム解析タイプを作成します

  4. 解析を実行するには [開始] ボタンをクリックします。

下部にある コマンドライン・ボタンを使用して、この設定のコマンドラインを生成できます。

インテル® VTune™ プロファイラーは、指定したターゲットのデータを収集して、その結果を GPU レンダリング・ビューポイントで開きます。

データを表示

[サマリー] ビューから解析をはじめて、ワークロードが CPU または GPU のどちらで実行されているか確認します。次に、[プラットフォーム] ビューに移動し、CPU スレッドによって GPU タスクをがどのようにスケジュールされるか視覚化し、グラフィックスを使用する CPU スレッドとプロセスを識別して、GPU 実行中に CPU が何を行っているか調査します。

Xen* プラットフォーム全体を解析するには、[プラットフォーム] ビューを使用して、組込みシステムで GPU を積極的に使用している仮想ドメインを特定します。GPU アクティビティーは、適切な仮想ドメインを示すようタイムラインで色分けされています。

OpenGL* ES API 呼び出しを使用してアプリケーションを解析する場合、[プラットフォーム] ビューには呼び出しがユーザータスクとして表示され、詳細情報がポップアップに示されます。

関連情報