アプリケーション・パフォーマンス・スナップショットとは

この記事は、インテル® デベロッパー・ゾーンに掲載されている「Introducing Application Performance Snapshot」の日本語参考訳です。


利用可能なハードウェア (CPU、FPU、およびメモリー) を MPI アプリケーションがどのように活用しているか、アプリケーション・パフォーマンス・スナップショットを使用して簡単に参照できます。アプリケーション・パフォーマンス・スナップショットは、アプリケーションの CPU と FPU 使用、I/O とメモリー・フットプリント、メモリーアクセスのストール、および MPI と OpenMP* の利用率を解析します。解析後、インテル® プラットフォームを使用するシステム上でのパフォーマンス拡張の可能性が示されます。アプリケーション・パフォーマンス解析の最初のステップとしてこのツールを使用して、主な最適化分野の簡単なスナップショットを取得します。

アプリケーション・パフォーマンス・スナップショットは、インテル® Developer Zone (https://software.intel.com/performance-snapshot (英語)) から、無料でダウンロードできます。このツールは、インテル® Parallel Studio XE またはインテル® VTune™ Amplifier の一部としてインストールされます。


バージョン 2018 ベータ版以降では、Linux* 向けのアプリケーション・パフォーマンス・スナップショットに MPI パフォーマンス・スナップショットのほとんどの機能が含まれるようになり、MPI パフォーマンス・スナップショットは独立したツールとしては利用できなくなりました。

新機能

このユーザーガイドは、アプリケーション・パフォーマンス・スナップショット Linux* 版向けです。

以下は、これまでの製品リリースの変更履歴です。

Application Performance Snapshot 2019 Update 4

  • インテル® MPI ライブラリーが提供するコミュニケーターの内部 ID を収集する機能が追加されました。この機能は、Application Performance Snapshot 2019 Update4 以降およびインテル® MPI ライブラリー 2019 Update4 以降でサポートされます。

Application Performance Snapshot 2019 Update 3

  • メッセージ量ごとの MPI アプリケーションの通信パターンをさらに適切に視覚化するため、HTML ベースのランク-ランク通信の分布図を追加しました。

Application Performance Snapshot 2019 Update 2

  • OpenMP* の機能を完全にサポートしました。
  • ベクトル化効率のメトリックが改善されました。
  • MPI インバランス時間は、収集のオーバーヘッドを最小化するためデフォルトの統計レベル 1 では計算されなくなりました。
  • aps-report: 選択した MPI 関数セットの統計のみを表示するオプションが追加されました。
  • MPI コレクターの一般的な最適化。

Application Performance Snapshot 2019 Update 1

  • MPI インバランス収集が、純粋なアプリケーションのインバランスを測定可能なモードで拡張されました。このモードは、MPICH とバイナリー互換な MPI 実装に適用できます。必要に応じて、インバランス収集をオフにして収集のオーバーヘッドを最小化できます。
  • MPI トレースにおけるオーバーヘッドの改善は、多数のランクがある状況では顕著に影響します。

Application Performance Snapshot 2019

  • インテル® Omni-Path アーキテクチャー・インターコネクト帯域幅とパケットレートのメトリックが追加され、MPI 通信のボトルネックを調査できるようになりました。
  • MPI アプリケーションの通信パターンをさらに適切に視覚化するため、HTML ベースのランク-ランク間通信の分布図が追加されました。

Application Performance Snapshot 2018 Update 3 および 2019 Beta Update

  • aps-report ユーティリティーに –format オプションが追加され、レポートをテキスト (*.txt) やカンマ区切り (*.csv) 形式で生成できます。CSV 形式は、レポート処理の自動化や Microsoft* Excel* などの表計算プログラムへのエクスポートに有用です。
  • 集約通信時間カラムによりランク-ランク間データ転送レポートが強化されました。
  • 圧縮とデフォルトで設定された最小統計レベルで MPI トレースファイルのサイズが小さくなりました。aps-report ユーティリティーで生成されたレポートには、最小の統計レベルでは適用できないものがあります。詳細については、「収集されるデータ量を制御」 (英語) を参照してください。
  • aps-report ユーティリティーでレポート生成時間が大幅に短縮されました。

Application Performance Snapshot 2018 Update 2

Application Performance Snapshot 2018 Update 1

  • MPI_Pcontrol 領域数の制限がなくなりました。

Application Performance Snapshot 2018

  • このツールは、aps.sh ではなく aps として起動されるようになりました。
  • 結果ディレクトリーが stat_* から aps_result_* に変更されました。

Application Performance Snapshot 2018 Beta

  • 最初のリリースです。

コンパイラーの最適化に関する詳細は、最適化に関する注意事項を参照してください。

関連記事

  • MPI アプリケーションのプロファイルMPI アプリケーションのプロファイル この記事は、インテル® デベロッパー・ゾーンに公開されている「インテル® VTune™ Amplifier パフォーマンス解析クックブック」の「Profiling MPI Applications」の日本語参考訳です。 このレシピは、インテル® VTune™ Amplifier を使用して MPI […]
  • システム・アナライザーによるリアルタイム・モニタリングシステム・アナライザーによるリアルタイム・モニタリング この記事は、インテル® デベロッパー・ゾーンに公開されている「インテル® VTune™ Amplifier パフォーマンス解析クックブック」の「Real-Time Monitoring with System […]
  • DPDK アプリケーションの PCIe*トラフィックDPDK アプリケーションの PCIe*トラフィック この記事は、インテル® デベロッパー・ゾーンに公開されている「インテル® VTune™ Amplifier パフォーマンス解析クックブック」の「PCIe Traffic in DPDK Apps」の日本語参考訳です。 インテル® VTune™ Amplifier の PCIe* […]
  • OpenMP* コード解析OpenMP* コード解析 この記事は、インテル® デベロッパー・ゾーンに公開されている「インテル® VTune™ Amplifier パフォーマンス解析クックブック」の「OpenMP* Code Analysis Method」の日本語参考訳です。 このレシピは、OpenMP* または OpenMP* - MPI ハイブリッド・アプリケーションの […]
  • ハードウェアベースのホットスポット解析向けに Hyper-V* 仮想マシンを設定するハードウェアベースのホットスポット解析向けに Hyper-V* 仮想マシンを設定する この記事は、インテル® デベロッパー・ゾーンに公開されている「インテル® VTune™ Amplifier パフォーマンス解析クックブック」の「Configuring a Hyper-V* Virtual Machine for Hardware-Based Hotspots […]