インテル® VTune™ プロファイラー・ユーザーガイド

ホットスポット・ビュー

最も CPU 時間を要するプログラム単位を特定します (ホットスポット)。このビューポイントはすべての解析結果で利用できます。

ホットスポット・ビューポイントで示されるパフォーマンス・データを解釈するには、次のステップに従います。

  1. パフォーマンスのベースラインを定義します。

  2. 最もホットな関数を特定します。

  3. アルゴリズムの問題を特定します。

  4. ソースを解析します。

  5. その他の解析タイプを調査します。

パフォーマンスのベースラインを測定する

アプリケーションの実行に関する一般的な情報を提供する [サマリー] ウィンドウから調査を始めます。アプリケーションの開始から終了までの時間を含む経過時間は、アプリケーションを実行するすべてのスレッドのアクティブ (待機時間を含まない) プロセッサー時間の合計であるアプリケーション CPU 時間とは異なります。

[サマリー] ウインドウで提供される経過時間値を指標として、最適化前後のバージョンを比較するベースラインを求めます。アプリケーションをチューニングしている間、経過時間は減少する傾向がありますが、CPU 時間はアプリケーションのスレッドを増やすと増加する可能性があります。

ハードウェア・イベントベース・サンプリング・モードでホットスポット解析を実行すると、[サマリー] ウインドウの解析メトリックにはハードウェア・プラットフォーム上でのコード効率の予測に役立つマイクロアーキテクチャー使用率メトリックが表示されます。

このメトリック値に重要であることを示すフラグが付けられている場合、ハードウェア・メトリックをさらに詳しく調査するため、マイクロアーキテクチャー全般解析の実行を検討してください。

最もホットな関数を特定

[サマリー] ウインドウの [上位ホットスポット] セクションから調査を始めて、最も時間がかかる関数リストを取得します。ホットスポット関数をクリックして、[ボトムアップ] ビューで呼び出しフローや関連するメトリックを調査します。

デフォルトでは、[ボトムアップ] ビューのデータは、CPU 時間の降順でソートされ、最も時間のかかる関数が最初に示されます。最も CPU 時間を消費している関数に注目します。これらは最適化の候補となります。

[CPU 時間] カラムを展開して、CPU 時間がどれだけ効率良く利用されたか詳細を表示します。

CPU 利用率ビューポイントによるホットスポット: [ボトムアップ] ペイン

CPU 利用率が最も [低] のプログラム単位にチューニングの労力を集中します。この値は、プログラム単位の実行中にアプリケーションが CPU 時間を十分に活用していないことを意味します。最適化の総合的な目標は、理想的 (緑 ) または OK (オレンジ ) CPU 利用率状態を達成し、低および超過 CPU 利用率を減らすことです。

アルゴリズムの問題を特定

アプリケーション内の呼び出しシーケンスに関する問題を特定し、関数呼び出しを変更することでパフォーマンスを向上できます。潜在的な問題を特定するには、次の方法があります。

ユーザーモード・サンプリングでは、デフォルトでスタックデータを参照できます。このデータをハードウェア・イベントベース・サンプリング・モードで利用するには、ホットスポット解析設定で [コールスタック] オプションを有効にします。

ソースを解析

最もホットな関数をダブルクリックして、関連するソースコードの [ソース/アセンブリー] ウィンドウを表示します。インテル® VTune™ プロファイラーから直接コードエディターを開いてコードを編集できます (例えば、ホットスポット関数の呼び出し回数を最小限に抑えるなど)。

次にすることは?

解析をデフォルトの [追加のパフォーマンス情報を表示] オプションで実行した場合、[サマリー] ビューにはハードウェア利用やベクトル化の効率など、ターゲットの追加メトリックを示す [さらに詳しく調査] セクションが含まれます。この情報は、パフォーマンス解析の次のステップを明らかにし、最適化作業に集中すべき場所を特定するのに役立ちます。

関連情報