gprof-cc レポート

インテル® VTune™ プロファイラーのコマンドライン・インターフェイスを使用して、gprof のような形式で解析結果を表示できます。gprof-cc レポートは、各プログラム単位の呼び出し元と呼び出し先で費やされている時間を示します。レポートは、関数と呼び出し先で費やされたアクティブなプロセッサー時間を示します。

この例は、r001hs のホットスポットの結果から、gprof-cc レポートを生成します。

空の行で、レポートは関数ごとに 1 つのエントリーに分割されます。エントリーの最初の行には関数の呼び出し元が表示され、2 行目には呼び出された関数が表示され、次の行には関数の呼び出し先が表示されます。レポートの関数名によるインデックス部分には、関数名でソートされた関数の索引が表示されます。

vtune -report gprof-cc -r r001hs

    Index  % CPU Time:Total  CPU Time:Self  CPU Time:Children  Name  Index
    -----  ----------------  -------------  -----------------  ---------------------------------------  -----
                             0.0            11.319               func@0x6b2dacf0                        [3]
    [1]    100.0             0.0            11.319             BaseThreadInitThunk                      [1]
                             0.030          0.0                  GetSphere                              [36]
                             0.0            0.554                _tmainCRTStartup                       [23]
                             0.0            0.016                func@0x1000c1f0                        [44]
                             0.0            10.709               thread_video                           [10]
                             0.0            0.010                threadstartex                          [49]

    
    [2]    100.0             0.0            11.319             func@0x6b2daccf                          [2]
                             0.0            11.319               func@0x6b2dacf0                        [3]

                             0.0            11.319               func@0x6b2daccf                        [2]
    [3]    100.0             0.0            11.319             func@0x6b2dacf0                          [3]
                             0.0            11.319               BaseThreadInitThunk                    [1]

                             0.0            10.709               thread_trace                           [9]
    [4]    94.61             0.0            10.709             [TBB parallel_for on class draw_task]    [4]
                             0.0            10.709               draw_task::operator()                  [5]

                             0.0            10.709               [TBB parallel_for on class draw_task]  [4]
    [5]    94.61             0.0            10.709             draw_task::operator()                    [5]
                             0.436          0.0                  video::next_frame                      [26]
                             0.020          10.234               render_one_pixel                       [13]
                             0.018          0.0                  drawing_area::~drawing_area            [42]
    ...

    Index by function name

    Index  Function
    -----  ------------------------------------------------
    [96]   ColorAccum
    [30]   ColorAddS
    [15]   ColorScale
    [137]  CreateCompatibleBitmap
    [138]  DeleteObject
    [211]  EngAcquireSemaphore
    [139]  EngCopyBits
    [212]  EtwEventRegister
    [45]   ExAcquirePushLockExclusiveEx
    [35]   ExAcquireResourceExclusiveLite
    ...