インテル® VTune™ プロファイラー・ユーザーガイド

ビューポイントの切り替え

ビューポイント (インテル® VTune™ プロファイラーの事前設定されたデータ表示) を使用して、特定のパフォーマンスの問題に注目します。

ビューポイントを選択すると、インテル® VTune™ プロファイラーの結果タブのウィンドウに表示するパフォーマンス・メトリックが選択されます。

VTune ProfilerViewpoint

実行した解析タイプ名。

現在のビューポイント名。ビューポイント名の横にある下矢印をクリックして、利用可能なビューポイントの選択を含むドロップダウン・メニューを開きます。

現在のビューポイントの状況依存ヘルプのアイコン

現在の解析タイプで利用可能なビューポイントのリストを表示するドロップダウン・メニュー。

次の表は、それぞれの解析タイプで使用できるビューポイントを説明します。

ビューポイント

説明

CPU 利用率によるホットスポット

ホットスポット (多くの CPU 時間を消費しているアプリケーションのコード領域) の特定を支援します。CPU 時間は、CPU 利用率状態を示す、アイドル、低い、OK、良いに分類されます。

スレッド化効率

マルチスレッド・アプリケーションが利用可能な CPU コアをどのように活用しているかを示し、非効率な利用率の原因を特定するのに役立ちます。このビューを使用して、同期オブジェクト (ロック) の待機時間が長すぎるスレッドを特定したり、スケジュールのオーバーヘッドを識別します。

マイクロアーキテクチャー全般

アプリケーションが、利用可能なハードウェア・リソースを最大限に活用していない場所を特定するのに役立ちます。このビューポイントでは、ハードウェア・イベントから派生したメトリックが表示されます。 [サマリー] ウィンドウには、実行全体のメトリックのレポートとともに、メトリックの概要説明が示されます。 [ボトムアップ][トップダウン・ツリー] ウィンドウから、アプリケーションのハードウェアの問題を検出できます。パフォーマンスを向上する潜在的な可能性が見つかると、セルがハイライト表示されます。問題の説明を確認するには、グリッドでハイライト表示されたメトリックにカーソルを移動します。

ハードウェア・イベント

監視されたハードウェア・イベントの統計を表示します。統計には、予測されたカウントや収集されたサンプル数、あるいはその両方が含まれます。このビューを使用して、注目するイベントに対し最も高いアクティビティーを持つコード領域 (モジュール、関数、コード行など) を特定します。

メモリー使用

アプリケーションがメモリーをどの程度効率良く使用しているかを理解し、NUMA プラットフォーム上での過大なリモート・メモリー・アクセス、DRAM やインターコネクト帯域幅制限など、メモリーアクセスに関連した潜在的な問題を特定します。アプリケーション・コードとメモリー・オブジェクト配列の両方に対して、各種パフォーマンス・メトリックを提供します。

HPC パフォーマンス特性

アプリケーションが CPU、メモリー、および浮動小数点演算リソースをどの程度効率良く利用しているか評価するのに役立ちます。このビューを使用して、インテルの OpenMP* と MPI ランタイムのスケーラビリティーの問題を改善してメモリーと FPU 効率を向上させる、次のステップを特定します。

入力と出力

ターゲットの実行に関連する入出力データ、CPU とバスの利用率統計を表示します。このビューを使用して、長いレイテンシーの I/O 要求を特定し、I/O 関数のコールスタックを調査して、タイムライン上で低速な I/O 要求を解析し、I/O と計算操作のインバランスを検出します。

GPU 計算/メディア・ホットスポット

高い GPU 利用率の GPU タスクを特定し、効率を予測するのに役立ちます。これは、DPC++ 計算タスク、OpenCL* カーネルの解析およびインテル® メディア SDK タスクの解析に役立ちます。このビューを使用して、最も時間がかかる GPU 計算タスクを特定し、時間経過における GPU タスクの実行を解析して、GPU アーキテクチャー・ブロックごとの GPU ハードウェア・メトリックを調査できます。

FPGA ホットスポット

高い利用率の FPGA と CPU タスクを特定します。このビューを使用して、カーネルの実行に費やされた FPGA 時間、CPU と FPGA 間のメモリー転送の全体時間、および CPU と FPGA 間のワークロードのバランスを評価します。

GPU レンダリング

Xen* 仮想化プラットフォーム固有のサポートを含む、GPU レンダリング解析 (プレビュー) で収集されたプラットフォーム全体の CPU/GPU 利用率と効率統計を示します。

プラットフォーム電力解析

非効率な電力利用につながるアプリケーションのアイドル、またはウェイクアップを行う場所を特定するのに役立ちます。可能であれば、ハードウェアが示す実際の状態と比較したディープスリープ状態における OS 要求時間を示す詳細な C ステート常駐レポートなど、OS とハードウェア両方の視点からのデータを提供します。

関連情報