インテル® VTune™ プロファイラー・ユーザーガイド

HPC パフォーマンス特性解析

HPC パフォーマンス特性解析を使用して、計算集約型アプリケーションが CPU、メモリー、および浮動小数点演算ハードウェア・リソースをどの程度効率良く使用しているか特定します。

どのように動作するか

HPC パフォーマンス特性解析タイプは、アプリケーションのパフォーマンスを理解する出発点です。また、インテルの OpenMP* やインテル® MPI ランタイム・ライブラリーを使用するアプリケーション向けに、追加のスケーラビリティー・メトリックも用意されています。

HPC パフォーマンス特性の解析中、インテル® VTune™ プロファイラーのデータコレクターは、イベントベース・サンプリング収集を使用してアプリケーションをプロファイルします。インテルの OpenMP* ランタイム・ライブラリーの OpenMP 解析メトリックは、ランタイム・ライブラリーで有効になっているユーザー API インストルメントをベースにしています。

通常、コレクターは指定するアプリケーションのデータを収集しますが、必要に応じて (詳細レベルは制限されますが) システム全体のパフォーマンス・データを収集できます。

ベクトル化と GFLOPS メトリックは、インテル® マイクロアーキテクチャー開発コード名 Ivy Bridge、Broadwell、および Skylake でサポートされています。インテル® Xeon Phi™ プロセッサー開発コード名 Knights Landing では機能が制限されます。メトリックは、第 4 世代のインテル® プロセッサーでは利用できません。システムで利用可能なプロセッサー・ファミリーを表示するには、[解析の設定] ウィンドウの [どのように] ペインの [詳細] セクションを展開します。

解析は、インテル® VTune™ プロファイラーの GUI またはコマンドラインから実行できます。

インテル® VTune™ Amplifier は、インテル® oneAPI ベース・ツールキット向けのバージョンからインテル® VTune™ プロファイラーに名称が変更されました。インテル® VTune™ プロファイラーは、スタンドアロン・バージョンとインテル® Parallel Studio XE およびインテル® System Studio に同梱されたバージョンが提供されます。

解析の設定と実行

次のように HPC パフォーマンス特性解析のオプションを設定します。

必要条件: プロジェクトを作成します。

  1. (スタンドアロン GUI)/ (Visual Studio* IDE) で、インテル® VTune™ プロファイラーのツールバーにある [解析の設定] ボタンをクリックします。

    [解析の設定] ウィンドウが開きます。

  2. [どのように] ペインで、 実行する解析タイプを選択ボタンをクリックして、[HPC パフォーマンス特性] を選択します。

  3. 次のオプションを構成してください。

    [CPU サンプリング間隔 (ミリ秒)] フィールド

    CPU 間のサンプリング間隔を指定します (ミリ秒)。

    設定可能な値は、0.01 - 1000 です。

    デフォルト値は 1 です。

    [スタックを収集] チェックボックス

    コールスタックとスレッドのコンテキスト・スイッチの高度な解析を有効にします。

    このオプションは、デフォルトで無効に設定されています。

    [メモリー帯域幅解析] チェックボックス

    メモリー 帯域幅を計算するのに必要なデータを収集します。

    このオプションは、デフォルトで有効になっています。

    [DRAM の最大帯域幅を評価] チェックボックス

    収集を開始する前に、達成可能な最大 DRAM 帯域幅を評価します。このデータは、タイムライン上で帯域幅メトリックをスケールし、しきい値を計算するために使用されます。

    このオプションは、デフォルトで有効になっています。

    [OpenMP* 領域解析] チェックボックス

    インバランス、ロック競合、またはスケジュール、リダクション、およびアトミック操作のオーバーヘッドなどの非効率性を特定するため、OpenMP* 領域をインストルメントして解析します。

    このオプションは、デフォルトで有効になっています。

    [詳細] ボタン

    この解析タイプのデフォルトの編集不可設定のリストセクションを、展開/折りたたみます。解析の設定を変更または設定の追加を有効にするには、既存の事前定義設定をコピーしてカスタム設定を作成する必要があります。インテル® VTune™ プロファイラーは、解析タイプ設定の編集可能なコピーを作成します。

    下部にある コマンドライン・ボタンを使用して、この設定のコマンドラインを生成できます。

  4. 解析を実行するには [開始] ボタンをクリックします。

データを表示

HPC パフォーマンス特性ビューポイントでは以下を確認します。

ハイブリッド・アプリケーションをチューニングする基本ステップを検討するには、OpenMP* と MPI アプリケーション解析のチュートリアルを利用してください。インテル® デベロッパー・ゾーン (https://software.intel.com/en-us/itac-vtune-mpi-openmp-tutorial-lin (英語)) でチュートリアルを入手できます。

関連情報