ルーフラインの使用例

このトピックは、自動ルーフライン・グラフを使用して、優先度の高い最適化を決定する方法を紹介するチュートリアルの一部です。

ルーフライン解析は、ハードウェアで達成可能な最大パフォーマンスに対して、アプリケーションの実際のパフォーマンス演算強度を視覚的に示すオプションの解析です。

[Roofline (ルーフライン)] グラフを使用すると、次のようなことが分かります。

ルーフライン解析はキャッシュを考慮しており、DDR メモリーのトラフィックだけでなく、すべてのメモリー・サブシステムのトラフィックを計測します。シングルスレッド・コードとマルチスレッド・コードの両方に対応しています。

ベクトル化アドバイザーと C++ サンプル・アプリケーション (roofline_demo_samples) を使用して、以下の操作を行います。

ステップ

説明

ステップ 1: チュートリアルの準備

次のいずれかを行います。

ステップ 2: ルーフライン解析を実行します

  • ルーフライン解析を実行します。

  • ルーフライン・グラフを表示/非表示にします。

  • ルーフライン・グラフのコントロールを理解します。

  • ルーフライン・グラフのデータを理解します。

ステップ 3: メモリー帯域幅のボトルネックに注目

  • 結果のスナップショットを開く。

  • 各種コントロールを使用して、最も興味のあるルーフライン・グラフのデータに注目します。

  • ルーフライン・グラフのデータを解釈します。

ステップ 4: 計算能力のボトルネックに注目

  • 結果のスナップショットを開く。

  • 各種コントロールを使用して、最も興味のあるルーフライン・グラフのデータに注目します。

  • ルーフライン・グラフのデータを解釈します。

ステップ 5: 実際のボトルネックを特定

  • 結果のスナップショットを開く。

  • 各種コントロールを使用して、最も興味のあるルーフライン・グラフのデータに注目します。

  • ルーフライン・グラフのデータを解釈します。