CPU / メモリーのルーフライン調査パースペクティブは、ハードウェアによって制限されるパフォーマンスの上限に対して、制限の主な要因 (メモリー帯域幅や計算能力) を検証し実際のパフォーマンスを可視化するのを可能にします。

CPU / メモリーのルーフライン調査パースペクティブを実行するには、インテル® Advisor GUI と CLI からの 2 つの方法があります。両方の方法で収集された結果は、インテル® Advisor GUI で開くことができます。
インテル® Advisor GUI から CPU / メモリー・ルーフラインの調査パースペクティブを実行
[Analysis Workflow (解析のワークフロー)] ペインで、ドロップダウン・メニューから [CPU / Memory Roofline Insights (ベクトル化とコードの調査)] パースペクティブを選択し、データ収集の精度レベルを [Low (低)] に設定して、
ボタンをクリックします。この精度レベルでは、インテル® Advisor は次のことを行います。
データ収集精度のプリセットの詳細については、インテル® Advisor ユーザーガイドの CPU ルーフライン精度のプリセットを参照してください。完了すると、インテル® Advisor は [Roofline (ルーフライン)] グラフを表示します。
[Roofline (ルーフライン)] グラフは、マシンの達成可能な最大パフォーマンスに対して、アプリケーションのパフォーマンスと演算強度を表示します。
一般に次のことが言えます。
ドットと最上部の達成可能なルーフラインの間の距離が大きいほど、関数/ループの最適化の可能性が高くなります。

コマンドライン から CPU / メモリー・ルーフラインの調査パースペクティブを実行インターフェイス
Advisor のコマンドライン・インターフェイスを使用して CPU / メモリー・ルーフラインの調査パースペクティブを実行するには、次のコマンドを使用します。
advisor --collect=roofline --project-dir=./advi --search-dir src:p=./advi –- myApplication
このコマンドは、2 つの解析を 1 つずつ実行するバッチモードです。
インタラクティブなルーフライン・グラフで、ハードウェアによって課せられたパフォーマンス上限に対するアプリケーションが達成しているパフォーマンスを表示するには、収集された結果をインテル® Advisor GUI で開くか、次のコマンドでインタラクティブな HTML ルーフライン・レポートを生成します。
advisor --report=roofline --report-output=./advi/advisor-roofline.html --project-dir=./advi
ここで、report-output オプションは、インテル® Advisor が生成したレポートを保存するディレクトリーと HTML ファイルを指定します。
CLI レポートの生成の詳細については、インテル® Advisor ユーザーガイドの該当するセクションを参照するか、ターミナルで次のコマンドを実行してください。
advisor --help report
インテル® Advisor は、次のコマンドで読み取り専用の結果スナップショットを作成できます。
advisor --snapshot --project-dir=./advi --pack --cache-sources --cache-binaries -- /tmp/my_proj_snapshot
次にすることは?
いくつかのループがベクトル化されず、パフォーマンス目標に到達していない場合は、以下を考慮してください。
関連情報