パフォーマンス解析の設定

同カテゴリーの次の記事

ソースの表示

この記事は、インテル® デベロッパー・ゾーンに公開されている、インテル® VTune™ Amplifier のオンラインヘルプの一部「Performance Analysis Setup」の日本語参考訳です。Windows* 用のヘルプではありますが、その他の OS 環境でも十分ご利用いただけます。また、構成は英語版のヘルプと同じ階層構造にしてあります。


インテル® VTune™ Amplifier には、次のようなパフォーマンス解析の基本カテゴリーがあります。

各カテゴリーは、それぞれのパフォーマンス解析ツリーの最上位の分類項目です。製品のグラフィカル・インターフェイスやコマンドライン・インターフェイス (amplxe-cl) を使用して、利用可能な解析タイプの実行を選択します。

GUI から解析タイプを選択して設定する:

  1. プロジェクトを作成し、解析ターゲットを設定します。
  2. 次のいずれかの方法で、[Analysis Type (解析タイプ)] ウィンドウを開きます。
    • [New Analysis (新しい解析)] ツールバーボタンをクリックします。
    • [Configure Project (プロジェクトの設定)]ツールバーボタンをクリックするか、製品メニューから [Configure Project… (プロジェクトの設定 …)] を選択し、[Analysis Type (解析タイプ)] タブをクリックします。

インテル® VTune™ Amplifier の解析タイプは、次のデータ収集タイプのいずれかをベースにします。

それぞれの解析タイプは、コードの問題を洗い出して最適化の方法を理解するのに役立つパフォーマンス・メトリックを提供します。

インテル® VTune™ Amplifier は、GUI とコマンドラインを使用してローカルとリモートデータ収集モードをサポートします。また、インテル® VTune™ Amplifier では、リモート Linux* システム上でのデータ収集が可能です。さらに、インテル® VTune™ Amplifier for Systems では、リモート Android*Linux* プラットフォーム上でのデータ収集がサポートされます。

アルゴリズム解析

Algorithm Analysis (アルゴリズム解析) は、ソフトウェア・チューニングに必要な解析タイプを提供します。現在のアルゴリズムの非効率な領域を理解するため、データを収集して解析を行い、アプリケーションのパフォーマンスを改善します。アルゴリズム解析には、次の解析タイプが含まれます。

  • Basic Hotspots (基本ホットスポット) (英語): 特定のターゲットで CPU 時間を最も費やしている関数を特定し、各関数のコールツリーを復元して、スレッドのアクティビティーを表示します。
  • Advanced Hotspots (高度なホットスポット) (英語): イベントベース・サンプリング解析は、オペレーティング・システムを含むシステム上のすべてのソフトウェアの実行を監視します。サンプリング・コレクターは、指定されたサンプリング間隔でプロセッサーに割り込みを掛け、命令アドレスを収集します。
  • Concurrency (並行性): 特定のターゲットで CPU 時間を最も費やしている関数を特定し、利用可能な論理 CPU コアの数に対してアプリケーションがどの程度効率良くスレッド化されているか表示します。インテル® VTune™ Amplifier for Systems では、この解析タイプは Android* システム上でのリモートデータ収集ではサポートされません。
  • Locks and Waits (ロックと待機) (英語): 効率が悪い CPU の使用を招く同期オブジェクトを特定するのに役立ちます。

計算集約型のアプリケーション解析

Compute-Intensive Application Analysis (計算集約型のアプリケーション解析) は、大量の計算を伴うアプリケーション・ベースの解析タイプです。これは、ほかのターゲット解析タイプを実行する前に、アプリケーションのパフォーマンス解析の出発点として使用できます。計算集約型のアプリケーション解析には、次の解析タイプが含まれます。

  • HPC Performance Characterization (HPC パフォーマンス特性) (英語): 浮動小数点演算とメモリー効率に対するアプリケーションの計算負荷とスループットを評価するイベントベース・サンプリングによる解析。アプリケーションのパフォーマンスの概要を理解するための出発点として使用できます。

マイクロアーキテクチャー解析

Microarchitecture Analysis (マイクロアーキテクチャー解析) は、イベントベース・サンプリング・データ収集をベースとする解析タイプです。

  • General Exploration (一般解析) (英語): アプリケーションのパフォーマンスに影響する大部分のハードウェアの問題を特定するのに役立ちます。ハードウェア・レベルの解析を行う際の出発点として使用してください。
  • Memory Access (メモリーアクセス) (英語): メモリーアクセスに関連する問題 (NUMA アーキテクチャー固有の問題など) を特定する一連のメトリックを測定します。
  • SGX Hotspots (SGX ホットスポット) (英語): インテル® ソフトウェア・ガード・エクステンションズ (インテル® SGX) 機能が有効なシステム上で、セキュリティーで保護されたパフォーマンス上重要なプログラムユニットを特定するのに役立ちます。
  • TSX Exploration (TSX の調査) (英語): インテル® トランザクショナル・シンクロナイゼーション・エクステンション (インテル® TSX) をサポートするインテル® プロセッサー向けです。インテル® TSX の使用とトランザクション・アボートの原因を解析するのに役立ちます。
  • TSX Hotspots (TSX ホットスポット) (英語): インテル® TSX をサポートするインテル® プロセッサー向けです。トランザクション内部のホットスポットを解析するのに有効です。

プラットフォーム解析

Platform Analysis (プラットフォーム解析) は、アプリケーション/システムの CPU、GPU、および電力の使用率を監視する解析タイプを提供します。

  • CPU/GPU Concurrency (CPU/GPU 並行性) (英語): プラットフォーム上の各種 CPU と GPU コアのコード実行を調査し、CPU と GPU のアクティビティーを関連付けて、アプリケーションが GPU 依存か CPU 依存かを特定するのを可能にします。
  • GPU Hotspots (GPU ホットスポット) (英語): レンダリング、ビデオ処理、および計算にグラフィックス処理ユニット (GPU) を使用するアプリケーション向けです。CPU/GPU の並行性解析を行い、アプリケーションが GPU 依存であることが特定された場合、GPU ホットスポット解析によりさらに詳しく時間を消費する GPU 計算タスクを特定して、GPU ハードウェアごとのパフォーマンスを解析します。
  • System Overview (システムの概要) (英語): Linux* や Android* システムの一般的な動作を監視し、割り込み要求 (IRQ) 処理の電力とパフォーマンスを関連付ける、ドライバーを使用しないイベントベース・サンプリング解析です。この解析タイプは、インテル® VTune™ Amplifier for Systems でサポートされます。
  • Disk Input and Output (ディスク I/O) (英語): (プレビュー機能) ディスク・サブシステム、CPU、およびプロセッサー・バスの利用率を監視します。

注:

プレビュー機能は、正式リリースに含まれるかどうかは未定です。皆さんが有用性に対するフィードバックを送ることで、将来の採用決定の判断に役立ちます。プレビュー機能で収集されたデータは、将来のリリースで下位互換が提供される保証はありません。インテル® VTune™ Amplifier のフィードバックは、parallel.studio.support@intel.com へ、インテル® VTune™ Amplifier for Systems のフィードバックは、intelsystemstudio@intel.com までお寄せください。

カスタム解析

インテル® VTune™ Amplifier の [Analysis Type] ウィンドウで示されるすべての解析タイプは、インテルの設計者により事前定義されたデフォルトのオプションセットを含んでいます。利用可能な収集タイプや既存の事前設定された解析をベースに、カスタム解析タイプを作成 (英語) することができます。

関連項目

パフォーマンス・メトリックのリファレンス (英語)
基本解析ワークフロー
インテル® VTune™ Amplifier for Systems の電力解析ワークフロー (英語)
解析オプションの設定 (英語)
結果の解釈
コマンドラインから解析を実行 (英語)

コンパイラーの最適化に関する詳細は、最適化に関する注意事項を参照してください。

関連記事

  • 解析ターゲットの設定解析ターゲットの設定 この記事は、インテル® デベロッパー・ゾーンに公開されている、インテル® VTune™ Amplifier のオンラインヘルプの一部「Analysis Target Setup」の日本語参考訳です。Windows* 用のヘルプではありますが、その他の OS […]
  • OpenMP* アプリケーションの解析OpenMP* アプリケーションの解析 この記事は、インテル® デベロッパー・ゾーンに公開されている、インテル® VTune™ Amplifier のオンラインヘルプの一部「Analyzing OpenMP* Applications」の日本語参考訳です。Windows* 用のヘルプではありますが、その他の OS […]
  • パフォーマンス解析の実行パフォーマンス解析の実行 この記事は、インテル® デベロッパー・ゾーンに公開されている、インテル® VTune™ Amplifier のオンラインヘルプの一部「Running Performance Analysis」の日本語参考訳です。Windows* 用のヘルプではありますが、その他の OS […]
  • プロジェクトの設定プロジェクトの設定 この記事は、インテル® デベロッパー・ゾーンに公開されている、インテル® VTune™ Amplifier のオンラインヘルプの一部「Project Setup」の日本語参考訳です。Windows* 用のヘルプではありますが、その他の OS […]
  • Android* システム向けのリモート・パフォーマンス解析のワークフローAndroid* システム向けのリモート・パフォーマンス解析のワークフロー この記事は、インテル® デベロッパー・ゾーンに公開されている、インテル® VTune™ Amplifier のオンラインヘルプの一部「Remote Performance Analysis Workflow for Android* Systems」の日本語参考訳です。Windows* 用のヘルプではありますが、その他の OS […]