インテル® VTune™ Amplifier 2018 ヘルプ

HPC パフォーマンス特性解析ビューポイント

HPC パフォーマンス特性解析ビューポイントでは、CPU 使用、メモリー効率、および計算集約型アプリケーションやスループット・アプリケーションの浮動小数点の使用率を推測します。計算主体のアプリケーションやスループット・アプリケーションは、経過時間でハードウェア・リソースを効率良く使用する必要があります。アプリケーションのパフォーマンスやランタイムを最適化する出発点として、HPC パフォーマンス特性解析を使用します。

HPC パフォーマンス特性ビューポイントで示されるパフォーマンス・データを解釈するには、次のステップに従います。

  1. パフォーマンスのベースラインを定義します。

  2. 最適化の可能性を判定します。

  3. ソースを解析します。

  4. その他の解析タイプを試します。

ヒント

ハイブリッド・アプリケーションの基本的なチューニング手順を調査するため、OpenMP* と MPI アプリケーションの解析チュートリアルを使用します。インテル® デベロッパー・ゾーンからチュートリアル (https://software.intel.com/en-us/itac-vtune-mpi-openmp-tutorial-lin (英語)) にアクセスできます。https://software.intel.com/en-us/videos/hpc-applications-need-high-performance-analysis (英語) にあるウェビナーで、HPC パフォーマンス特性解析について詳しく説明しています。

1. パフォーマンスのベースラインを定義

最初に、[Summary (サマリー)] ウィンドウでアプリケーションの実行に関する全般的な情報を確認します。最適化の主要な領域には、経過時間、1 秒の単精度浮動小数点計算数 (SP GFLOPS) が含まれます。倍精度浮動小数点 FLOP は、単精度 FLOPS の解析結果の 2 倍として表されます。赤字のテキストは、最適化の可能性がある場所を示しています。コードをどのように改善するかは、フラグマークにマウスをホバーして説明を表示します。

最適化の前後の結果を比較するため、ベースラインとして経過時間と SP GFLOPS 値を使用します。

2. 最適化の可能性を判定

[Summary] ウィンドウを見直して、アプリケーションの主な最適化の可能性を見つけます。改善可能なパフォーマンス・メトリックは赤くマークされます。表示される問題には、CPU 使用率、メモリー依存、FPU 使用率、またはこれらの組み合わせが含まれます。以降に、パフォーマンスを改善するために行うべき次のステップを示します。

CPU 使用率

メモリー依存

FPU 使用率

FPU と GFLOPS メトリックは、第 3 世代インテル® Core™ プロセッサー、第 5 世代インテル® プロセッサー、および第 6 世代インテル® プロセッサーでサポートされます。インテル® Xeon Phi™ プロセッサー開発コード名 Knights Landing では、一部の機能がサポートされます。このメトリックは、現在第 4 世代インテル® プロセッサーでは利用できません。システム上で利用されているプロセッサー・ファミリーを確認するには、解析設定ペインの [Details (詳細)] セクションを展開します。

3. ソースを解析

最適化する関数をダブルクリックして、[Source (ソース)]/[Assembly (アセンブリー)] ウィンドウでコードを表示します。インテル® VTune™ Amplifier から直接コードエディターを開き、シリアルコードを編集 (ホットスポット関数への呼び出し回数を最小限にするなど) できます。

4. その他の解析タイプを試す

関連情報