VTune™ Amplifier XE 2015 を使用して GPU 上の OpenCL* カーネル解析を解析する

同カテゴリーの次の記事

インテル® VTune™ Amplifier XE のソースビューは OpenCL* ソースファイルと関連付けることができないのか?

この記事は、インテル® デベロッパー・ゾーンに公開されている「Practice of using VTune™ Amplifier XE 2015 on GPU for OpenCL™ kernel analysis」の日本語参考訳です。


インテル® SDK for OpenCL™ Application を使用すると、インテル® HD グラフィックス上で動作するアプリケーションを作成することができます。VTune™ Amplifier XE 2015 は、以下の GPU 上の OpenCL* アプリケーションのパフォーマンスを解析できます:

  1. GPU usage (GPU 利用状況)
  2. GPU hardware metrics (GPU ハードウェア・メトリック)
  3. OpenCL* カーネル実行

Windows* OS 上で OpenCL* アプリケーションをビルドして実行するには、次のような環境が必要です:

  • インテル® SDK for OpenCL* Applications 2014 以降
  • Microsoft* Visual Studio* 2010 以降
  • Microsoft* DirectX* SDK (June 2010) – グラフィックスを使用するサンプルを実行するために必要

注意: インテル® HD グラフィックスのドライバーをインストールする際の特別な要求事項はありません。インテル® HD グラフィックスをサポートするドライバーを OEM から入手してインストールするだけです。

GPU データを取集するには、3 つの方法で VTune™ Amplifier XE 2015 を実行できます:

  • Microsoft* Visual Studio* から起動
  • VTune™ Amplifier XE スタンドアロン・アプリケーション (amplxe-gui) を起動
  • VTune™ Amplifier XE コマンドライン (amplxe-cl) を起動

注意: OpenCL* アプリケーションがインテル® HD グラフィックス上で適切に動作するよう、管理者権限で VTune Amplifier XE を起動する必要があります。

ここで使用した OpenCL* のサンプルコード monte-carlo はここで入手できます。

コマンドライン:
>”C:\Program Files (x86)\Intel\VTune Amplifier XE 2015\bin32\amplxe-cl” -collect advanced-hotspots -knob collection-detail=stack-sampling -knob enable-gpu-usage=true -knob gpu-counters-mode=global-local-accesses  — C:\temp\MonteCarlo\MonteCarlo\Win32\Debug\MonteCarlo.exe

>”C:\Program Files (x86)\Intel\VTune Amplifier XE 2015\bin32\amplxe-cl” -collect advanced-hotspots -knob collection-detail=stack-sampling -knob enable-gpu-usage=true -knob gpu-counters-mode=overview — C:\temp\MonteCarlo
\MonteCarlo\Win32\Debug\MonteCarlo.exe

パフォーマンス・データを収取した後、GPU エンジンなどが使用する GPU 時間を表示できます。

コンパイラーの最適化に関する詳細は、最適化に関する注意事項を参照してください。

関連記事