インテル® VTune™ プロファイラー・ユーザーガイド

GPU 計算/メディア・ホットスポット解析 (プレビュー)

最も時間のかかる GPU カーネルを解析し、GPU ハードウェア・メトリックをベースに GPU の使用状況を特徴付け、メモリー・レイテンシーや非効率なカーネル・アルゴリズムによって引き起こされるパフォーマンスの問題を特定して、命令タイプごとの GPU 命令周波数を解析します。

これはプレビュー機能です。プレビュー機能は、正式リリースに含まれるかどうか未定です。皆さんが機能に対する有用性のフィードバックを送ることで、将来の採用決定の判断に役立ちます。プレビュー機能で収集されたデータは、将来のリリースで下位互換が提供される保証はありません。parallel.studio.support@intel.com または intelsystemstudio@intel.com へフィードバックをお送りください。

GPU 計算/メディア・ホットスポット解析は、以下を可能にします。

GPU 計算/メディア・ホットスポット解析は、GPU オフロード解析を実行済みで、以下が特定されている場合に適した手順です。

どのように動作するか: インテル® グラフィックスのレンダーエンジンとハードウェア・メトリック

GPU は、小さなコアのアレイ (実行ユニット (EU)) でグラフィックスや計算処理を行う高度な並列マシンです。各 EU は、複数の軽量なスレッドを同時に実行します。スレッドの 1 つが実行されると、ほかのスレッドがメモリーなどからのデータを待機するためストールしていても、そのストールを隠蔽することができます。

GPU の性能を最大限に利用するため、アプリケーションはできるだけ多くのスレッドをスケジュールして、アイドルサイクルを最小限に抑えようとします。グラフィックスと汎用計算 GPU アプリケーションでは、ストールを最小限にすることも非常に重要です。

インテル® VTune™ プロファイラーは、インテル® グラフィックスのハードウェア・イベントをモニターし、サンプリング期間の統合 GPU リソースの使用状況に関するメトリックを提供します。例えば、EU がアイドル状態、ストール状態、アクティブ状態であったサイクルの比率や、メモリーアクセスとほかの機能ユニットに関する統計情報などが分かります。インテル® VTune™ プロファイラーは GPU カーネル実行をトレースすると、GPU メトリックで各カーネルをアノテート (注釈) します。

以下は、インテル® VTune™ プロファイラーによって収集されるインテル® プロセッサー・グラフィックスに関するさまざまなメトリックです。

GPU メトリックは、GPU ハードウェアがどれくらい効率良く利用されているか、そしてパフォーマンス向上のため改善の余地があるか特定するのに役立ちます。メトリックの多くは、サンプリング中のすべてのサイクルに対して GPU 機能ユニットが特定の状態であったサイクルの比率で表されます。

解析の設定と実行

必要条件:

解析を設定するには以下を行います。

  1. (スタンドアロン GUI)/ (Visual Studio* IDE) [解析の設定] ツールバー・ボタンをクリックします。

    [解析の設定] ウィンドウが開きます。

  2. [どのように] ペインで、 [実行する解析タイプを選択] ボタンをクリックして、[プラットフォーム解析] > [GPU 計算/メディア・ホットスポット] (プレビュー) を選択します。

    GPU 計算/メディア・ホットスポット解析は、GPU 使用データを収集し、GPU タスクのスケジュールを解析して、アプリケーションが CPU 依存であるか GPU 依存であるかを識別するように事前設定されています。

  3. 次の解析モードのいずれかを選択して設定します。

  4. 必要に応じて、GPU オフロード解析でパフォーマンス・クリティカル (ストールまたは時間がかかる) として特定されたカーネルの解析に絞り込み、プロファイル対象の計算タスクとして指定します。必要であれば、それぞれのカーネルのインスタンス・ステップ (サンプリング間隔 (カーネル数)) を変更します。このオプションは、プロファイルのオーバーヘッドを軽減するのに有効です。
  5. 解析を実行するには、[開始] をクリックします。

GPU 計算/メディア・ホットスポット解析を実行するには、次のコマンドラインを入力します。

vtune -collect gpu-hotspots [-knob <knob_name=knob_option>] -- <target> [target_options]

下部にある [コマンドライン...] ボタンを使用して。この設定のコマンドラインを生成できます。

特徴付け解析の設定

この解析タイプは root や管理者権限を必要とし、Windows*、Linux* および Android* ターゲットで使用できます。

[特徴付け] 設定オプションにより、レンダーや GPGPU エンジンの使用 (インテル® グラフィックスのみ) をモニターして、エンジンのどの部分に負荷がかかっているかを特定し、GPU および CPU データと関連付けます。[特徴付け] ラジオボタンを選択すると、設定セクションに追加のオプションが表示されます。

[特徴付け] ドロップダウン・メニューでプラットフォーム固有の GPU メトリックを選択できます。動的命令カウントを除くすべてのプリセットは、実行ユニット (EU) のアクティビティー・データを収集します: EU アレイ・アクティビティー、EU アレイストール、EU アレイアイドル、計算スレッドのストール、およびコア周波数 (それぞれに追加のメトリックがあります)。

特徴付け解析では追加データを収集することもできます。

ソース解析の設定

ソース解析は、パフォーマンス・クリティカルな基本ブロックや GPU カーネルのメモリーアクセスに起因する問題を特定するのに役立ちます。

[ソース解析] ラジオボタンを選択すると、設定セクションにドロップダウン・メニューが表示され、プロファイル・モードを選択して解析する問題の種類を指定できます。

[基本ブロック・レイテンシー] または [メモリー・レイテンシー] プロファイル・モードでは、GPU 計算/メディア・ホットスポット解析は次のようなメトリックを表示します。

データを表示

インテル® VTune™ プロファイラーは解析を実行して、[GPU 計算/メディア・ホットスポット] ビューポイントでデータを開き、次のウィンドウにさまざまなプラットフォーム・データを表示します。

関連情報