インテル® VTune™ プロファイラー・ユーザーガイド

インライン関数のデータを表示

リリースモードでビルドされたアプリケーションでインライン展開された関数ごとのパフォーマンス・データを表示するように、インテル® VTune™ プロファイラーを設定します。

必要条件

このオプションは、以下を使用してコードをコンパイルする際にサポートされます。

インライン関数を表示

インライン展開された関数のデータを表示するには、解析結果ウィンドウで [インラインモード] フィルターバーを [インライン関数を表示] に設定します。インテル® VTune™ プロファイラーは、インライン展開された関数 (仮想フレーム) を通常の関数として表示します。

インライン展開された関数を非表示にするには、[インライン関数を非表示] を選択します。

例 1: ホットスポット解析のインラインモード

この例では、ホットスポット解析の [インライン関数を表示] オプションを有効にします。このモードは、インライン展開された GetModelParams 関数の完全なスタックを表示します。

インライン関数を表示

[グループ化] メニューで、[ソース関数/関数/コールスタック] レベルを選択して、インライン展開された関数のすべてのインスタンスを 1 行に表示できます。

インライン展開された GetModelParams 関数をダブルクリックすると、CPU 時間を最も消費したコードを特定し、対応するアセンブリーを解析できます。

例 2: ホットスポット解析のインラインモードを無効にする

同じサンプルのフィルターバーで [インライン関数を非表示] オプションを選択すると、インテル® VTune™ プロファイラーは [ボトムアップ] ビューに GetModelParams 関数を表示しません。

ただし、main 関数をダブルクリックしてソースコードを表示すると、すべての CPU 時間が GetModelParams インライン関数が呼び出されたコード行に関連付けられていることが分かります。

例 3: GPU 計算/メディア・ホットスポット向けのインラインモード

デフォルトでは、GPU 計算/メディア・ホットスポット解析のインラインモードは無効になっています。この例では、GPU サイクルの 100% が GPU_FFT_Global 関数に関連付けられています。

GPU_FFT_Global 関数をダブルクリックすると、この関数を呼び出すコード行の [ソース] ビューが開き、予測 GPU サイクルが 95.3% であることが分かります。

ただし、[計算タスク/関数/コールスタック] または [計算タスク/ソース関数/コールスタック] グループレベルを選択し、このビューのインラインモードを有効にすると、GPU_FFT_Global 関数は GPU サイクルの 4.7% のみを示し、残りのサイクルは 4 つのインライン関数のものであることが分かります。

ソースとアセンブリー・コードを解析するには、最もホットな GPU_FftIteration 関数をダブルクリックします。

関連情報