インテル® VTune™ プロファイラーは、計算集約型のアプリケーションに基づく HPC パフォーマンス特性解析機能を備えています。
HPC パフォーマンス特性解析は、計算集約型またはスループットに依存するアプリケーションの CPU、メモリー、および FPU 利用率を最適化する可能性を特定するのに役立ちます。HPC パフォーマンス特性解析タイプは、アプリケーションのパフォーマンス状況を理解する出発点です。この解析タイプを使用すると、1 秒あたりの浮動小数点演算数 (GFLOPS) を増やし、アプリケーション全体の実行時間を短縮することで、アプリケーションのパフォーマンスが向上します。解析では、CPU、メモリー、FPU の利用率に関連するデータが収集されます。また、OpenMP* や MPI ランタイム・ライブラリーを使用するアプリケーション向けのスケーラビリティー・メトリックも用意されています。
vtune -collect hpc-performance [-knob <knobName=knobValue>] [--] <target>
Knob:sampling-interval、enable-stack-collection、collect-memory-bandwidth、dram-bandwidth-limits、analyze-openmp、collect-affinity。
HPC パフォーマンス特性解析で利用可能な knob (設定オプション) に関する最新情報は、次のように取得できます。
vtune -help collect hpc-performance
次の例は、メモリー帯域幅解析を有効にして、Linux* 上のアプリケーションで HPC パフォーマンス特性解析を実行します。
vtune -collect hpc-performance -knob collect-memory-bandwidth=true ./home/test/myApplication
データの収集が完了したら、次のいずれかの方法で結果を表示します。
ここでは、-report アクションを使用します。
コマンドラインから -report-output アクションを使用して、レポートを.txt または .csv ファイルに書き込みます。
インテル® VTune™ プロファイラーのグラフィック・インターフェイスで、収集した結果データ (*.vtune) を開きます。