Application Performance Snapshot クイックスタート (プレビュー機能)

同カテゴリーの次の記事

MPI Performance Snapshot クイックスタート

この記事は、インテル® デベロッパー・ゾーンに公開されている、インテル® VTune™ Amplifier のオンラインヘルプの一部「Application Performance Snapshot Quick Start (Preview)」の日本語参考訳です。Windows* 用のヘルプではありますが、その他の OS 環境でも十分ご利用いただけます。また、構成は英語版のヘルプと同じ階層構造にしてあります。


Application Performance Snapshot を使用して、アプリケーションのハードウェア (CPU、FPU、およびメモリー) 使用状況を簡単に見ることができます。

注:

これは、プレビュー機能です。正式リリースに含まれるかどうかは未定です。皆さんが有用性に対するフィードバックを送ることで、将来の採用決定の判断に役立ちます。プレビュー機能で収集されたデータは、将来のリリースで下位互換が提供される保証はありません。Intel-Performance-Snapshot-Feedback@intel.com までご意見をお送りください。

Application Performance Snapshot を使用して、共有メモリー型アプリケーションのハードウェア (CPU、FPU、およびメモリー) 使用状況を簡単に見ることができます。Application Performance Snapshot は、OpenMP* インバランス、メモリーアクセス効率、および FPU 利用率に費やされたアプリケーションの時間を解析します。解析が完了すると、インテル® プラットフォームを使用したシステム向けのパフォーマンス向上の可能性が表示されます。このツールをアプリケーション解析の最初のステップとして使用し、最適化の対象となる簡単なスナップショットを取得し、アプリケーション・パフォーマンスの特定の問題をプロファイルするツールについて学びます。インテル® VTune™ Amplifier XE 2017 Update 3 リリースから、Application Performance Snapshot の Linux* バージョンが、Application Performance Snapshot と MPI Performance Snapshot の初期リリースの機能を備えるようになりました。更新された Application Performance Snapshot は、Linux* システムの MPI アプリケーションの解析に使用できます。

Application Performance Snapshot の使用を始めるには、次のセクションをご覧ください。

インストールと設定

Application Performance Snapshot は、インテル® デベロッパー・ゾーンから無料でダウンロードでき、インテル® Parallel Studio XE、インテル® System Studio、およびインテル® VTune™ Amplifier がすでにインストールされていればすぐに利用できます。

無料の Application Performance Snapshot を入手するには、次の操作を行います。

  1. 最新の製品版は、http://www.intel.com/application-snapshot (英語) からダウンロードできます。
  2. 利用するシステム向けの .tgz (Linux*)/.zip (Windows*) ファイルをダウンロードします。
  3. ローカルシステム上の書き込み可能な場所に展開します。

ツールを実行する前に環境を設定する必要があります。

  1. コマンドプロンプトを開きます。
  2. ツールの実行に必要な環境変数を設定します。
    • インテル® Parallel Studio XE とともにすでにインストールされている場合: <install-dir>\amplxe-vars.bat を実行します。<install-dir> は、インテル® VTune™ Amplifier がインストールされているディレクトリーです。

      例:

      "C:\Program Files (x86)\IntelSWTools\VTune Amplifier 2018\amplxe-vars.bat"
      
    • インテル® デベロッパー・ゾーンからダウンロードした場合: コマンドライン環境にツールを展開したディレクトリーへのパスを追加します: set PATH=%PATH%;<install-dir>

共有メモリー型のアプリケーションを解析

  1. 次のコマンドを実行します。
    aps.bat <my app><app parameters>
    

    <my app> はアプリケーションの格納場所で、<app parameters> はアプリケーションへの引数です。

    Application Performance Snapshot は、アプリケーションを起動してデータ収集を実行します。

    注:

    最初にツールを実行する場合、データ収集を始める前に適切なドライバーをインストールします。

    -u オプションを使用してドライバーをアンインストールします。Application Performance Snapshot とインテル® VTune™ Amplifier の両方を使用している場合、ドライバーをアンインストールするとインテル® VTune™ Amplifier のデータ収集に影響します。

  2. 解析が完了すると、コマンドウィンドウにレポートが表示されます。ブラウザーを使用して、HTML 形式のレポートを開くこともできます。HTML レポートへのパスは、コマンドウィンドウに含まれています。
  3. レポートに表示されるデータを解析します。さらに詳しいメトリックの説明については、以下のセクションまたは HTML レポートでメトリックをホバーして表示される説明をご覧ください。
  4. 解析結果に基づいて適切な次のステップを決定します。一般的な次のステップは、アプリケーションをチューニングするか、インテル® VTune™ Amplifier やインテル® Advisor などのさらに詳しい情報を提供するパフォーマンス解析ツールを使用することです。

クイック・メトリック・リファレンス

Application Performance Snapshot では次のメトリックが収集されます。それぞれのメトリックに関する詳細は、インテル® VTune™ Amplifier オンラインヘルプ (英語) をご覧ください。

Elapsed Time (経過時間): アプリケーションの実行時間 (秒単位)。

SP GFLOPS: 1 秒間に計算された単精度ギガ浮動小数点命令の数。すべての倍精度命令は 2 つの単精度命令としてカウントされます。SP GFLOPS メトリックは、第 3 世代インテル® Core™ プロセッサー、第 5 世代インテル® プロセッサー、および第 6 世代インテル® プロセッサーでのみ利用できます。

Cycles per Instruction Retired (CPI – 命令リタイアのサイクル): それぞれの命令の実行時間がサイクルで測定されます。一般に、CPI = 1 というのは HPC アプリケーションでは許容範囲内ですが、許容範囲はアプリケーション・ドメインにより大きく異なります。CPI 値は、長いレイテンシーのメモリー、浮動小数点または SIMD 命令、分岐ミスによりリタイアしなかった命令、そしてフロントエンドでの命令のスタベーションがあると大きくなる傾向があります。

CPU Utilization (CPU 利用率): アプリケーションによるシステム上のすべての論理 CPU コア利用の予測。このメトリックは、アプリケーションの並列処理の効率を評価するのに役立ちます。この値が 100% である場合、アプリケーションの実行時間全体ですべての論理 CPU がビジーに保たれていることを意味します。このメトリックは、有効なアプリケーションのワークと並列ランタイムで費やされた時間を区別するものではないことに注意してください。

Memory Bound (メモリー依存): アプリケーションがデータをフェッチした際に、失われたプロセッサー・パイプライン・スロットの割合を示します。データをフェッチする際のストールは、通常ロード命令によって引き起こされ、ロード命令が完了するまで実行がストールします。まれなケースですが、ストア命令が完了する前にそのデータが参照されるとストールを引き起こすことがあります。20% 以上の値の場合、詳しい調査が必要です。

FPU Utilization (FPU 利用率): アプリケーション実行中の FPU 使用状況。FPU 利用率の値は、アプリケーションのベクトル化の効率を評価します。値は、FPU によって実行された命令の比率を予測して計算されます。値が 100% であれば、FPU が完全に利用されていることを意味します。50% 以上の値の場合、追加の解析が必要です。FPU メトリックは、第 3 世代インテル® Core™ プロセッサー、第 5 世代インテル® プロセッサー、および第 6 世代インテル® プロセッサーでのみ利用できます。

上位トピック: インテル® Performance Snapshot ユーザーズガイド

コンパイラーの最適化に関する詳細は、最適化に関する注意事項を参照してください。

関連記事

  • Storage Performance Snapshot クイックスタート (プレビュー機能)Storage Performance Snapshot クイックスタート (プレビュー機能) この記事は、インテル® デベロッパー・ゾーンに公開されている、インテル® VTune™ Amplifier のオンラインヘルプの一部「Storage Performance Snapshot Quick Start (Preview)」の日本語参考訳です。Windows* 用のヘルプではありますが、その他の OS […]
  • MPI Performance Snapshot クイックスタートMPI Performance Snapshot クイックスタート この記事は、インテル® デベロッパー・ゾーンに公開されている、インテル® VTune™ Amplifier のオンラインヘルプの一部「MPI Performance Snapshot Quick Start」の日本語参考訳です。Windows* 用のヘルプではありますが、その他の OS […]
  • MPI Performance Snapshot FAQMPI Performance Snapshot FAQ この記事は、インテル® デベロッパー・ゾーンに公開されている、インテル® VTune™ Amplifier のオンラインヘルプの一部「MPI Performance Snapshot FAQ」の日本語参考訳です。Windows* 用のヘルプではありますが、その他の OS […]
  • インテル® Performance Snapshot ユーザーズガイドインテル® Performance Snapshot ユーザーズガイド この記事は、インテル® デベロッパー・ゾーンに公開されている、インテル® VTune™ Amplifier のオンラインヘルプの一部「Intel® Performance Snapshot User's Guide」の日本語参考訳です。Windows* 用のヘルプではありますが、その他の OS […]
  • インテル® VTune™ Amplifier についてインテル® VTune™ Amplifier について この記事は、インテル® デベロッパー・ゾーンに公開されている、インテル® VTune™ Amplifier のオンラインヘルプの一部「Introducing the Intel® VTune™ Amplifier」の日本語参考訳です。Windows* 用のヘルプではありますが、その他の OS […]