CPU / メモリー・ルーフラインの調査パースペクティブを実行して、ハードウェアによって制限されるパフォーマンスの上限に対する実際のパフォーマンスを視覚化します。これは、主な制限要因 (メモリー帯域幅や計算能力) を判断するのに役立ち、潜在的な最適化手順のロードマップを示します。
[Roofline (ルーフライン)] グラフを使用すると、次のようなことが分かります。
現在のハードウェア・リソースで達成可能な最大パフォーマンスは?
アプリケーションは現在のハードウェア・リソースで最適に動作するか?
そうでない場合、最適化の最良の候補は?
メモリー帯域幅や計算能力が各最適化候補のパフォーマンスを制限しているか?
CPU / メモリー・ルーフラインの調査パースペクティブには次の手順が含まれます。
ここでインテル® Advisor は以下を収集します。
[Roofline (ルーフライン)] グラフは、マシンが達成可能な最大パフォーマンスと、アプリケーションの達成可能なパフォーマンスと演算強度を表示します。
演算強度 (x 軸) - ループ/関数のアルゴリズムを基に、CPU/VPU とメモリー間で転送された 1 バイトあたりの浮動小数点操作数 (FLOPs) または整数操作数 (INTOPs) で測定されます。
パフォーマンス (y 軸) - 1 秒あたりの 10 億浮動小数点演算数 (GFLOPS) または 10 整数演算数 (GINTOPS) で測定されます。
