インテル® VTune™ プロファイラー・ユーザーガイド

ループを解析

インテル® VTune™ プロファイラーを使用して、アプリケーションの呼び出しツリーのループ階層を表示し、最適化の対象とするコード領域を特定します。

アプリケーションのループを表示して解析するには、次の操作を行います。

  1. ハードウェア・イベントベース収集を基にカスタム解析 (例えば、ループ解析) を作成し、 ループ解析呼び出し数の予測、および トリップカウントの予測オプションを選択します。
  2. フィルターツールバーの [ループモード] ドロップダウン・メニューから、フィルターレベルを選択します。
    • ループのみ: ループを通常のノードとしてツリーに表示します。ループ名には次のものが含まれます。

      • ループの開始アドレス

      • ループが作成されたコード行番号

      • ループが作成された関数名

    • ループと関数: ループと関数を個別のノードとして表示します。

    • 関数のみ (デフォルト): ループ情報を含まない関数データを表示します。

    インテル® VTune™ プロファイラーは、選択したフィルターレベルに応じてグリッドを更新します。

  3. [ボトムアップ] および [トップダウン・ツリー] ウィンドウで、セルフと合計メトリックを解析し、最も時間を消費するループを特定します。
  4. 注目するループをダブルクリックして、ソースコードを表示します。

    インテル® VTune™ プロファイラーは、選択したループと関数のソースファイルを開きます。ループを構成するコード行がハイライト表示されます。

    コード行の情報は、関数のデバッグ情報が利用可能な場合にのみ表示されます。

最も時間を消費するループを特定するには、 [ボトムアップ] ウィンドウで [ループのみ] モードを選択します。デフォルトでは、最も高い CPU 時間値を持つループがグリッドの上位に表示されます。

最も重い上位レベルのループを特定するには、 [トップダウン・ツリー] ウィンドウに切り替えます。グリッド内のデータは、最も時間のかかる最上位のループから合計時間のメトリックでソートされます。

関連情報