インテル® VTune™ プロファイラー・ユーザーガイド

インライン関数のデータを表示

リリースモードでビルドされたアプリケーションでインライン展開された関数ごとのパフォーマンス・データを表示するように、インテル® VTune™ プロファイラーを設定します。

要件

このオプションは、以下を使用してコードをコンパイルする際にサポートされます。

インライン関数を表示

インライン関数のデータを表示するには、解析結果ウィンドウで、フィルターバーの [インラインモード] オプションを [インライン関数を表示] に設定します。インテル® VTune™ プロファイラーは、インライン展開された関数 (仮想フレーム) を通常の関数として表示します。

インライン関数の表示を無効にするには、[インライン関数を非表示] を選択します。

例 1: ホットスポット解析のインラインモード

この例では、ホットスポット解析で [インライン関数を表示] オプションを有効にしています。このモードでは、GetModelParams インライン関数の完全なスタックが表示されます。

インライン関数を表示

[グループ化] メニューで、[ソース関数/関数/コールスタック] レベルを選択して、インライン展開された関数のすべてのインスタンスを 1 行に表示できます。

GetModelParams インライン関数をダブルクリックすると、最も CPU 時間を消費したコード行を特定して対応するアセンブリー・コードを解析できます。

例 2: ホットスポット解析のインラインモードの無効化

同じサンプルでフィルターバーの [インライン関数を非表示] オプションを選択した場合、インテル® VTune™ プロファイラーは [ボトムアップ] ビューに GetModelParams 関数を表示しません。

しかし、main 関数をダブルクリックしてソースコードを表示すると、すべての CPU 時間が GetModelParams インライン関数が呼び出されたコード行に属していることが分かります。

例 3: GPU 計算/メディア・ホットスポットのインラインモード

デフォルトでは、GPU 計算/メディア・ホットスポット解析の [インラインモード] は無効です。この例では、GPU サイクルの 100% が GPU_FFT_Global 関数によるものです。

GPU_FFT_Global ソース関数をダブルクリックしてソースビューを表示します。予測 GPU サイクルの 95.3% を占めるこの関数を呼び出しているコード行が表示されます。

しかし、[計算タスク/関数/コールスタック] または [計算タスク/ソース関数/コールスタック] グループ化レベルを選択して、このビューでインラインモードを有効にすると、GPU_FFT_Global 関数は予測 GPU サイクルの 4.7% のみで、4 つのインライン関数が残りのサイクルを占めていることが分かります。

最もホットな GPU_FftIteration 関数をダブルクリックして、ソースとアセンブリー・コードを解析します。

関連情報