インテル® VTune™ Amplifier 2019 の新機能

同カテゴリーの次の記事

使用するものと手法

インテル® VTune™ Amplifier 2019 Update 3

  • インテル® Optane™ DC パーシステント・メモリーと、インテル® マイクロアーキテクチャー開発コード名 Cascade Lake をサポートしました。これには、新しいハードウェア・イベントのサポートと、新しいパーシステント・メモリー・テクノロジー向けの設計と最適化を可能にするメモリー解析の強化が含まれます。使い方については、クックブックの「頻繁な DRAM アクセス」を参照してください。
  • コアとネットワーク・インターフェイス・カード (NIC) 間の相互作用を理解するのに役立つ、入力と出力解析の I/O トラフィック向けの PCIe* デバイスメトリックが拡張されました。
  • MPI 解析の改善:
    • 標準の MPI_PControl API を使用して、MPI アプリケーションのデータ収集を容易に管理できます。わずかな変更で ITT API を使用することなく必要なデータのみを収集します。
    • アプリケーション・パフォーマンス・スナップショットのメッセージ量によるランク間の通信図を使用した、さらに簡単な MPI 通信パターン診断。
  • 品質と利便性の改善:
    • 使いやすくなった「ようこそページ」 (英語) からは、技術コンテンツとプロジェクト制御に素早くアクセスできます。
    • トレースと結果ファイルのインポート処理 (英語) が改善されました。結果ディレクトリー全体をプロジェクトにインポートし、シンボルおよびソース/アセンブリーの解決にプロジェクト検索ディレクトリーを適用できるようになりました。
    • インストールとライセンスが簡素化されました (シリアル番号とライセンスファイルはこの製品には必要ありません)。

インテル® VTune™ Amplifier 2019 Update 2

  • マイクロアーキテクチャー解析の改善:
    • マイクロアーキテクチャー全般解析の設定が、収集されたハードウェア・メトリックとデータ収集のオーバーヘッドを全体的に制御できるよう最適化されました。デフォルトでは、コードがハードウェア・リソースをどのように使用しているかを示す、トップレベルのハードウェア・メトリックとそのサブメトリックが提供されます。新しい設定オプション (英語) を使用して、範囲を絞り込み、選択した上位メトリックのサブメトリックのみ収集することを選べます。
  • プレビュー機能としてインテル® VTune™ Amplifier に追加された、システム・アナライザー (英語) ツールによってターゲットシステムのリアルタイム・メトリックを監視できます。詳細については、インテル® VTune™ Amplifier パフォーマンス解析クックブック (英語) を参照してください。
  • HPC ワークロードのプロファイルを改善:
  • .NET* Core 3.0 プレビュー 1 と .NET Core 2.2 の階層コンパイルで、Linux* と Windows* ターゲットの管理をサポート。
  • 品質と利便性の改善:
    • インテル® VTune™ Amplifier GUI プロジェクトにインポートされたスタンドアロン・コマンドラインで生成された結果へのサポートが向上しました。コマンドライン設定で指定された検索ディレクトリー (英語) は保存され、グラフィカルなビューポイントで適切なモジュール解決に使用されます。


プレビュー機能は、正式リリースに含まれるかどうか未定です。皆さんが機能に対する有用性のフィードバックを送ることで、将来の採用決定の判断に役立ちます。プレビュー機能で収集されたデータは、将来のリリースで下位互換が提供される保証はありません。parallel.studio.support@intel.com または intelsystemstudio@intel.com へフィードバックをお送りください。

インテル® VTune™ Amplifier 2019 Update 1 Patch 1

  • 機能とセキュリティーの更新

インテル® VTune™ Amplifier 2019 Update 1

  • スレッド化解析 (英語) は、低いオーバーヘッドのハードウェア・イベントベース・サンプリング・モードで拡張されました。このモードは、スレッドのプリエンプションとコンテキスト・スイッチの影響を解析するのに役立ちます。Windows* では、この解析設定にはサンプリング・ドライバーが必要です。Linux* では、カーネル 4.4 以降のサンプリング・ドライバーと Linux* Perf* コレクターの両方で利用できます。
  • 品質と利便性の改善:
    • メトリックと上位 5 つのホットスポットのテーブルを含む、ホットスポット解析の豊富なサマリー (英語) のコマンドライン・レポート。GUI のサマリービューからも利用できます。
    • 製品の導入、あらかじめ収集されたホットスポット結果サンプルの確認、そのほかの解析タイプとソース表示オプションの評価に役立つ、matrix サンプル・プロジェクトがプロジェクト・ナビゲーターに追加されました。事前ビルド済みの matrix サンプル・アプリケーションと関連するソースファイルは、インテル® VTune™ Amplifier のインストールに含まれています。
    • Linux* Perf* 収集のサポートが、インテル® VTune™ Amplifier メトリックで拡張され (英語)、Perf* トレースをインテル® VTune™ Amplifier の GUI にインポートして、事前定義されたビューポイントから利点を得られます。このソリューションは、データセンターのパフォーマンス解析に役立ちます。

インテル® VTune™ Amplifier 2019

  • 新しいホットスポット (英語) 解析は、以前の基本ホットスポットと高度なホットスポット解析の構成を組み合わせたもので、アプリケーションのパフォーマンスのホットスポットと解析ステップの詳しい手順を素早く理解できます。デフォルトでは、ホットスポット解析はユーザーモード・サンプリング・モードで動作しますが、インストールされているサンプリング・ドライバーを使用して、さらにオーバーヘッドの低いハードウェア・イベントベース・サンプリング・モードを利用することもできます。
  • 新しいスレッド化 (英語) 解析は、以前の並行性とロック & 待機解析タイプが組み合わされています。
  • インテル® VTune™ Amplifier の新しいプラットフォーム・プロファイラー (英語) ツールは、低いオーバーヘッドで、システム全体の解析と、全体的なシステム構成パフォーマンスと動作に関する詳しい情報を提供します。ツールを使用して次を行うことができます。
    • 過少または過度な利用率のサブシステム、バス (CPU、ストレージ、メモリー、PCIe*、およびネットワーク)、そしてプラットフォーム・レベルのインバランスを監視してボトルネックを特定します。
    • パフォーマンス・データを加えた分布図を使用したシステムトポロジーの理解。
    • データセンター・アプリケーションの平均的な利用ケース、および一時的な動作を監視。
  • マイクロアーキテクチャー解析の改善:
    • マイクロアーキテクチャー全般 (英語) (以前の全般解析) 解析設定は、軽量のサマリー解析やすべてのレベルの PMU メトリックによる詳細解析に分かれています。
    • マイクロアーキテクチャー全般解析ビューは、ハードウェア・メトリック表示 (英語) で拡張され、ハードウェアを使用するボトルネックを簡単に特定し、迅速に詳細情報を得るのに役立ちます。
  • HPC ワークロードのプロファイルを改善。
    • CPU 利用率メトリックは、インテル® Xeon® プロセッサー・ファミリーで実行される HPC アプリケーションにおいて重要となる、論理コアと物理コアの利用率を区別する機能に優れています。
    • インテル® Omni-Path アーキテクチャーのインターコネクト帯域幅とパケットレートのメトリックが、インターコネクトの制限によるパフォーマンスのボトルネックを特定する HPC パフォーマンス特性に追加されました。
    • HPC パフォーマンス特性解析では、マルチスレッドと MPI および OpenMP* のハイブリッド・アプリケーションの CPU 利用率やメモリーアクセスの問題を解析するのに役立つスレッド・アフィニティー・レポートが強化されました。
  • Linux* の GPU 計算/メディア・ホットスポット (英語) 解析 (以前の GPU ホットスポット) が更新され、GPU メトリックの収集にインテル® Metric Discovery API ライブラリーを使用するようになりました。これは、カーネル 4.14 以降でサポートされます。
  • Linux* の入出力 (英語) 解析は、 DPDK と SPDK IO API をプロファイルできるように拡張されました。このデータを使用して、CPU アクティビティーとネットワーク・データ利用率を関連付けて、NIC ごとの PCIe 帯域幅利用率を可視化し、複数ソケットシステムの UPI 帯域幅を予測して、ボトルネックを特定します。
  • コンテナー化のサポートを強化。
  • マネージドランタイム解析を強化しました。
    • アタッチモードでイベントベースのサンプリング解析をサポートする、LLVM* または HHVM* PHP サーバー上で動作するサーバー側アプリケーションの JIT プロファイル拡張しました。
    • OpenJDK* 9 と Oracle* Java SE 開発キット 9 をサポートする Java* コード解析 (英語) を拡張しました。
    • Linux* および Windows* システムで動作する .NET* Core アプリケーションのソースコード解析が改善されました。
  • 組込みプラットフォームとアクセラレーター上での解析:
    • 新しい CPU/FPGA 相互作用解析 (英語) (プレビュー) は、OpenCL* アプリケーションを実行する専用のインテル® Arria® 10 FPGA を搭載したシステム上の CPU と FPGA のバランスを評価します。
    • リモート組込みターゲットにインストールされた Xen* 仮想化プラットフォーム上で実行されるコードの CPU/GPU 利用率を提供する新しい GPU レンダリング解析 (英語) (プレビュー)。
    • イーサーネット接続によるリモート QNX* 組込みシステム (英語) 上でのコマンドライン解析のサンプリングをサポートします。
  • KVM ゲスト OS プロファイル (英語) が拡張され、ホストシステムから KVM カーネルとユーザー空間の両方をプロファイルできるようになりました。これは、ホストシステムとゲストシステムの完全なパフォーマンス解析に役立ちます。
  • アプリケーション・パフォーマンス・スナップショットの改善。
    • DRAM/MCDRAM メモリー解析向けのアンコアベースのメトリックが追加されました。これは、アプリケーションが帯域幅の制限をうけているかどうか特定するのに有用です。
    • MPI_Pcontrol と itt API で収集の停止と再開ができるようになりました。-start-paused オプションを使用して、アプリケーションの起動から再開が実行されるまで収集を除外する機能が追加されました。
    • オーバーヘッドを軽減するため、収集するデータタイプを選択できます。これには、MPI トレース、OpenMP* トレース、ハードウェア・カウンターベースの収集やこれらの組み合わせが含まれます。
    • 適切なハードウェア・イベントをサポートするプロセッサーの物理コアによる、CPU 利用率メトリックを表示します。
    • 大規模なランクで MPI トレースのオーバーヘッドを大幅に軽減します。
    • アプリケーションで使用されるコミュニケーターに関連する情報を表示して、aps-report ユーティリティーによりコミュニケーターによる集合操作をグループ化およびフィルター処理して MPI 統計が強化されました。
    • インテル Trace Analyzer & Collector との統合を改善するため、aps-report オプションを使用してプロファイルの設定ファイルを生成できます。
    • インテル® Omni-Path アーキテクチャー・インターコネクト帯域幅とパケットレートのメトリックが追加され、MPI 通信のボトルネックが調査できるようになりました。
    • MPI アプリケーションの通信パターンをさらに適切に視覚化するため、HTML ベースのランクからランク通信の分布図を追加。
  • 品質と利用性の改善。
    • 最適化されたグラフィック・インターフェイスと解析設定ワークフロー (英語) の簡略化により、同一ビューで事前選択されたターゲットと利用可能な収集オプションを提供します。
    • Windows* 10 Fall Creators Update (RedStone3) の Hyper-V* 環境で実行されるターゲット (英語) をサポートするハードウェア・イベントベース解析。
    • 収集されたサンプル数がしきい値を超えた場合、オーバーヘッドを最小化するため、デフォルトのファイナライズモード (英語) を [高速] に設定します。
    • [ソース] (英語) ビューのホットスポット・ナビゲーションで使用される [注目するデータ] メトリック・タイプは、グリッドで選択されるメトリックに置き換えられ、ホットスポット・ナビゲーションで使用されるコンテキスト・メニュー・コマンドを適用します。
    • イベントベース解析タイプ (サンプリング・ドライバーを使用) 向けの CPU 周波数 (英語) メトリックは、P ステート収集ベースのより信頼性の高いデータを提供します。CPU 周波数メトリックは、ユーザーモード・サンプリングとトレース解析、および Perf* コレクターを使用した解析ではサポートされません。
    • コマンドライン・レポートでサポートされる出力形式 (英語)、XML と HTML オプションが追加されました。
  • 新しいオペレーティング・システムのサポート:
    • SUSE* Linux* Enterprise Server (SLES) 15
    • Red Hat* Enterprise Linux* 7.5
    • Ubuntu* 18.04
    • Fedora* 28
    • Microsoft* Windows* 10 RS4

関連記事