CPU ルーフライン解析

CPU / メモリー・ルーフラインの調査パースペクティブを実行して、ハードウェアによって制限されるパフォーマンスの上限に対する実際のパフォーマンスを視覚化します。これは、主な制限要因 (メモリー帯域幅や計算能力) を判断するのに役立ち、潜在的な最適化手順のロードマップを示します。

[Roofline (ルーフライン)] グラフを使用すると、次のようなことが分かります。

どのように動作するか

CPU / メモリー・ルーフラインの調査パースペクティブには次の手順が含まれます。

  1. サーベイ解析でループ/関数のタイミングデータを収集します。
  2. 浮動小数点および整数操作データ、メモリー・トラフィック・データを収集し、特性化FLOP 解析によりマシンのハードウェアの制限を測定します。

    ここでインテル® Advisor は以下を収集します。

    • 計算操作 (浮動小数点操作 (FLOP) と整数操作 (INTOP)):
      • FLOP は、次のカテゴリーの命令の合計とその反復回数の積として計算されます: FMA、ADD、SUB、DIV、DP、MUL、ATAN、FPREM、TAN、SIN、COS、SQRT、SUB、RCP、RSQRT、EXP、VSCALE、MAX、MIN、ABS、IMUL、IDIV、FIDIVR、CMP、VREDUCE、VRND
      • INTOP は、デフォルトでは次のカテゴリーの命令の合計とその反復回数の積として計算されます: ADD、ADC、SUB、MUL、IMUL、DIV、IDIV、INC/DEC、shift、rotate。
    • メモリー・トラフィック・データは、メモリー操作と関数/ループによってアクセスされたレジスター内のバイト数の積として計算されます。メモリー・トラフィックの計算では、インテル® Advisor は次のカテゴリーのメモリー命令をカウントします。
      • スカラーとベクトル MOV 命令
      • GATHER/SCATTER 命令
      • VBMI2 圧縮/展開命令

    この収集には、サーベイ解析の 3 倍から 4 倍の時間がかかることがあります。

CPU ルーフライン・レポート

[Roofline (ルーフライン)] グラフは、マシンが達成可能な最大パフォーマンスと、アプリケーションの達成可能なパフォーマンス演算強度を表示します。

CPU ルーフライン・レポートの例を示します。

関連情報