インテル® VTune™ プロファイラー・ユーザーガイド

gprof-cc レポート

インテル® VTune™ プロファイラーのコマンドライン・インターフェイスを使用して、gprof のような形式で解析結果を表示できます。gprof-cc レポートは、各プログラム単位の呼び出し元と呼び出し先で費やされている時間を示します。レポートは、関数と呼び出し先で費やされた時間でソートされます。

この例では、r001hs のホットスポットの結果から、gprof-cc レポートを生成します。

空白行は、レポートを関数ごとに 1 つのエントリーに分割します。エントリーの最初の行は関数の呼び出し元を示し、2 行目は呼び出された関数を、次の行は関数の呼び出し先を示します。レポートの Index by function name (関数名によるインデックス) には、関数名でソートされた関数のインデックスが表示されます。

vtune -report gprof-cc -r r001hs
Index  % CPU Time:Total  CPU Time:Self  CPU Time:Children  Name  Index
-----  ----------------  -------------  -----------------  ---------------------------------------  -----
                         0.0            11.319               func@0x6b2dacf0                        [3]
[1]    100.0             0.0            11.319             BaseThreadInitThunk                      [1]
                         0.030          0.0                  GetSphere                              [36]
                         0.0            0.554                _tmainCRTStartup                       [23]
                         0.0            0.016                func@0x1000c1f0                        [44]
                         0.0            10.709               thread_video                           [10]
                         0.0            0.010                threadstartex                          [49]

                                                             <spontaneous>
[2]    100.0             0.0            11.319             func@0x6b2daccf                          [2]
                         0.0            11.319               func@0x6b2dacf0                        [3]

                         0.0            11.319               func@0x6b2daccf                        [2]
[3]    100.0             0.0            11.319             func@0x6b2dacf0                          [3]
                         0.0            11.319               BaseThreadInitThunk                    [1]

                         0.0            10.709               thread_trace                           [9]
[4]    94.61             0.0            10.709             [TBB parallel_for on class draw_task]    [4]
                         0.0            10.709               draw_task::operator()                  [5]

                         0.0            10.709               [TBB parallel_for on class draw_task]  [4]
[5]    94.61             0.0            10.709             draw_task::operator()                    [5]
                         0.436          0.0                  video::next_frame                      [26]
                         0.020          10.234               render_one_pixel                       [13]
                         0.018          0.0                  drawing_area::~drawing_area            [42]
...

Index by function name

Index  Function
-----  ------------------------------------------------
[96]   ColorAccum
[30]   ColorAddS
[15]   ColorScale
[137]  CreateCompatibleBitmap
[138]  DeleteObject
[211]  EngAcquireSemaphore
[139]  EngCopyBits
[212]  EtwEventRegister
[45]   ExAcquirePushLockExclusiveEx
[35]   ExAcquireResourceExclusiveLite
...