インテル® VTune™ Amplifier 2019 の新機能

同カテゴリーの次の記事

インテル® プロセッサー上でのディープラーニング推論のデプロイメントの最適化手法

インテル® VTune™ Amplifier 2019 Update 6

  • バグフィックスとセキュリティー更新。
  • インテル® VTune™ Amplifier は、機能とセキュリティーの更新を含むサードパーティー・コンポーネントの最新バージョンを提供するように更新されました。利用者は最新バージョンに更新する必要があります。

インテル® VTune™ Amplifier 2019 Update 5

  • インテル® VTune™ Amplifier は、最新のサードパーティー・コンポーネントを含むように更新されました。これには、最新の機能およびセキュリティー・アップデートが含まれます。最新バージョンにアップデートすることを強く推奨します。
  • 管理者/root 権限を持たないユーザーの GPU ハードウェア・メトリック収集の制限を緩和しました。
  • Hyper-V* で実行されているシステム上での HW ベースの解析サポートが追加されました。
  • マイクロアーキテクチャー解析の改善:
    • Linux* の perf_event_paranoid が 2 に設定されている場合の Perf ドライバーを使用しない収集の制限を緩和しました。そのような環境では、ユーザー空間でイベントベース・サンプリングがサポートされます。
    • インテル® マイクロアーキテクチャー開発コード名 Cascade Lake および Skylake 向けに、新しい UPI 利用率メトリックによるメモリーアクセス解析がサポートされました。
  • アプリケーション・パフォーマンス・スナップショットの改善:
    • DRAM、MCDRAM、およびパーシステント・メモリーの使用率を推測するため、Max と Bound メトリックが追加されました。
  • 品質と利便性の改善:
    • [ようこそ] ページからインタラクティブなヘルプツアーを利用でき、サンプルプロジェクトを使用して製品のインターフェイスをガイドできるようになりました。
    • リモート Linux* (SSH) ターゲットへのパスワードなしの自動アクセスをサポートする Windows* から Linux* へのリモート収集の設定が簡素化されました。
  • プラットフォーム・プロファイラーの改善:
    • CPU とメモリーの利用率のサマリー、CPU I/O 待機情報 (Linux*) および主な CPU ストールの原因の CPU 利用率の内訳を含むシステム概要が拡張されました。
    • ユーザーが視覚化するメトリックを指定できるカスタムビューが初めて実装されました。
    • 第 2 世代インテル® Xeon® スケーラブル・プロセッサー (開発コード名 Cascade Lake) を搭載するサーバー・プラットフォーム上で、インテル® Optane™ DC パーシステント・メモリーのメトリックを完全にサポートします。
    • CLI 規則により適合した、データ収集向けの簡素化された一貫性のあるコマンドライン・インターフェイスがサポートされました。以前のコマンドライン・インターフェイスは、下位互換のためサポートされます。詳細は、『インテル® Amplifier・ユーザーガイド』を参照してください。
  • 新しいオペレーティング・システムのサポート:
    • Android* Q
    • Red Hat* Enterprise Linux* 8
    • Fedora* 30

注: 32 ビット OS のサポートは 2019 バージョンで廃止が予定され、今後のリリースではサポートされなくなります。ただし、インテル® VTune™ Amplifier は、64 ビット OS 上での 32 ビット・アプリケーションのプロファイル (クロスモード) は継続してサポートします。


インテル® VTune™ Amplifier 2019 Update 4

  • インテル® VTune™ Amplifier は、最新のサードパーティー・コンポーネントを含むように更新されました。これには、最新の機能およびセキュリティー・アップデートが含まれます。最新バージョンにアップデートすることを強く推奨します。
  • GPU 解析の改善:
    • GPU In-Kernel プロファイル・ビューポイントに [インラインモード] フィルターオプションが追加され、OpenCL* インライン関数を使用して GPU 側のコールスタックを表示し、関数ごとに GPU サイクル統計を正確に集計できるようになりました。デフォルトでは、インラインモードはオフに設定されています。
    • -gline-tables-only -s <cl_source_file_name> オプションを使用して中間 SPIR-V バイナリーが生成されている場合、IL (中間言語) で作成された OpenCL* プログラムでソース/アセンブリー解析を利用できます。
    • (プレビュー) OpenCL* カーネルによって実行された命令タイプごとの GPU 命令を解析するため、新しい命令カウント・プロファイル・モードが GPU In-Kernel プロファイルに追加されました。このモードは、異なるハードウェア上で OpenCL* カーネルのパフォーマンスを比較したり、同一ハードウェアで同じアルゴリズムの異なる実装の命令数を調査するのに役立ちます。

注: プレビュー機能は、正式リリースに含まれるかどうかは未定です。有用性に関する皆さんからのフィードバックが、将来の採用決定の判断に役立ちます。プレビュー機能で収集されたデータは、将来のリリースで下位互換性が保証されません。parallel.studio.support@intel.com または intelsystemstudio@intel.com へフィードバックをお送りください。

  • マイクロアーキテクチャー解析の改善:
    • ホットスポットやスレッドなど、スタック付きハードウェア・イベントベース収集のデフォルトのドライバーを使用しないモード。ドライバーベースの収集は、カスタム解析で [スタックサイズ] オプションに 0 (無制限) を設定するか、[ドライバーを使用しない収集を有効にする] オプションをオフすることで実行できます。
    • プリサイスイベントを明確に区別するため、[ハードウェア・イベントの概要] ビューポイントの [サマリー] に [プリサイス] カラムが追加されました。プリサイスイベントを使用すると、イベントをスキッドすることなく正確なアセンブリー解析ができるようになります。
  • 品質と利便性の改善:
    • Microsoft* Visual Studio* IDE との統合が改善され、スマート統合ウェルカムページを介してインテル® VTune™ Amplifier オプションに素早くアクセスできます。
    • [ボトムアップ] タブの簡単なヒント示すオーバーレイ・ヘルプを使用すると、解析データを効率良く管理するのに重要な手順が強調表示されます。
    • Linux* カーネル 5.0 のサポートが追加されました。

インテル® VTune™ Amplifier 2019 Update 3

  • インテル® Optane™ DC パーシステント・メモリーと、インテル® マイクロアーキテクチャー開発コード名 Cascade Lake をサポートしました。これには、新しいハードウェア・イベントのサポートと、新しいパーシステント・メモリー・テクノロジー向けの設計と最適化を可能にするメモリー解析の強化が含まれます。使い方については、クックブックの「頻繁な DRAM アクセス」を参照してください。
  • コアとネットワーク・インターフェイス・カード (NIC) 間の相互作用を理解するのに役立つ、入力と出力解析の I/O トラフィック向けの PCIe* デバイスメトリックが拡張されました。
  • MPI 解析の改善:
    • 標準の MPI_PControl API を使用して、MPI アプリケーションのデータ収集を容易に管理できます。わずかな変更で ITT API を使用することなく必要なデータのみを収集します。
    • アプリケーション・パフォーマンス・スナップショットのメッセージ量によるランク間の通信図を使用した、さらに簡単な MPI 通信パターン診断。
  • 品質と利便性の改善:
    • 使いやすくなった「ようこそページ」からは、技術コンテンツとプロジェクト制御に素早くアクセスできます。
    • トレースと結果ファイルのインポート処理が改善されました。結果ディレクトリー全体をプロジェクトにインポートし、シンボルおよびソース/アセンブリーの解決にプロジェクト検索ディレクトリーを適用できるようになりました。
    • インストールとライセンスが簡素化されました (シリアル番号とライセンスファイルはこの製品には必要ありません)。

インテル® VTune™ Amplifier 2019 Update 2

  • マイクロアーキテクチャー解析の改善:
    • マイクロアーキテクチャー全般解析の設定が、収集されたハードウェア・メトリックとデータ収集のオーバーヘッドを全体的に制御できるよう最適化されました。デフォルトでは、コードがハードウェア・リソースをどのように使用しているかを示す、トップレベルのハードウェア・メトリックとそのサブメトリックが提供されます。新しい設定オプションを使用して、範囲を絞り込み、選択した上位メトリックのサブメトリックのみ収集することを選べます。
  • プレビュー機能としてインテル® VTune™ Amplifier に追加された、システム・アナライザー (英語) ツールによってターゲットシステムのリアルタイム・メトリックを監視できます。詳細については、インテル® VTune™ Amplifier パフォーマンス解析クックブック (英語) を参照してください。
  • HPC ワークロードのプロファイルを改善:
    • アプリケーション・パフォーマンス・スナップショット (英語) での OpenMPI ターゲットのフルサポート。
    • HPC パフォーマンス特性解析の最新のベクトル化メトリック。
    • HPC パフォーマンス特性解析データに CPU 実行およびリモートアクセス情報を関連付けてプロセス/スレッドのアフィニティーを表す HTML レポート。
  • .NET* Core 3.0 プレビュー 1 と .NET Core 2.2 の階層コンパイルで、Linux* と Windows* ターゲットの管理をサポート。
  • 品質と利便性の改善:
    • インテル® VTune™ Amplifier GUI プロジェクトにインポートされたスタンドアロン・コマンドラインで生成された結果へのサポートが向上しました。コマンドライン設定で指定された検索ディレクトリーは保存され、グラフィカルなビューポイントで適切なモジュール解決に使用されます。


プレビュー機能は、正式リリースに含まれるかどうか未定です。皆さんが機能に対する有用性のフィードバックを送ることで、将来の採用決定の判断に役立ちます。プレビュー機能で収集されたデータは、将来のリリースで下位互換が提供される保証はありません。parallel.studio.support@intel.com または intelsystemstudio@intel.com へフィードバックをお送りください。


インテル® VTune™ Amplifier 2019 Update 1 Patch 1

  • 機能とセキュリティーの更新

インテル® VTune™ Amplifier 2019 Update 1

  • スレッド化解析 (英語) は、低いオーバーヘッドのハードウェア・イベントベース・サンプリング・モードで拡張されました。このモードは、スレッドのプリエンプションとコンテキスト・スイッチの影響を解析するのに役立ちます。Windows* では、この解析設定にはサンプリング・ドライバーが必要です。Linux* では、カーネル 4.4 以降のサンプリング・ドライバーと Linux* Perf* コレクターの両方で利用できます。
  • 品質と利便性の改善:
    • メトリックと上位 5 つのホットスポットのテーブルを含む、ホットスポット解析の豊富なサマリーのコマンドライン・レポート。GUI のサマリービューからも利用できます。
    • 製品の導入、あらかじめ収集されたホットスポット結果サンプルの確認、そのほかの解析タイプとソース表示オプションの評価に役立つ、matrix サンプル・プロジェクトがプロジェクト・ナビゲーターに追加されました。事前ビルド済みの matrix サンプル・アプリケーションと関連するソースファイルは、インテル® VTune™ Amplifier のインストールに含まれています。
    • Linux* Perf* 収集のサポートが、インテル® VTune™ Amplifier メトリックで拡張され、Perf* トレースをインテル® VTune™ Amplifier の GUI にインポートして、事前定義されたビューポイントから利点を得られます。このソリューションは、データセンターのパフォーマンス解析に役立ちます。

インテル® VTune™ Amplifier 2019

  • 新しいホットスポット (英語) 解析は、以前の基本ホットスポットと高度なホットスポット解析の構成を組み合わせたもので、アプリケーションのパフォーマンスのホットスポットと解析ステップの詳しい手順を素早く理解できます。デフォルトでは、ホットスポット解析はユーザーモード・サンプリング・モードで動作しますが、インストールされているサンプリング・ドライバーを使用して、さらにオーバーヘッドの低いハードウェア・イベントベース・サンプリング・モードを利用することもできます。
  • 新しいスレッド化 (英語) 解析は、以前の並行性とロック & 待機解析タイプが組み合わされています。
  • インテル® VTune™ Amplifier の新しいプラットフォーム・プロファイラー・ツールは、低いオーバーヘッドで、システム全体の解析と、全体的なシステム構成パフォーマンスと動作に関する詳しい情報を提供します。ツールを使用して次を行うことができます。
    • 過少または過度な利用率のサブシステム、バス (CPU、ストレージ、メモリー、PCIe*、およびネットワーク)、そしてプラットフォーム・レベルのインバランスを監視してボトルネックを特定します。
    • パフォーマンス・データを加えた分布図を使用したシステムトポロジーの理解。
    • データセンター・アプリケーションの平均的な利用ケース、および一時的な動作を監視。
  • マイクロアーキテクチャー解析の改善:
    • マイクロアーキテクチャー全般 (以前の全般解析) 解析設定は、軽量のサマリー解析やすべてのレベルの PMU メトリックによる詳細解析に分かれています。
    • マイクロアーキテクチャー全般解析ビューは、ハードウェア・メトリック表示で拡張され、ハードウェアを使用するボトルネックを簡単に特定し、迅速に詳細情報を得るのに役立ちます。
  • HPC ワークロードのプロファイルを改善。
    • CPU 利用率メトリックは、インテル® Xeon® プロセッサー・ファミリーで実行される HPC アプリケーションにおいて重要となる、論理コアと物理コアの利用率を区別する機能に優れています。
    • インテル® Omni-Path アーキテクチャーのインターコネクト帯域幅とパケットレートのメトリックが、インターコネクトの制限によるパフォーマンスのボトルネックを特定する HPC パフォーマンス特性に追加されました。
    • HPC パフォーマンス特性解析では、マルチスレッドと MPI および OpenMP* のハイブリッド・アプリケーションの CPU 利用率やメモリーアクセスの問題を解析するのに役立つスレッド・アフィニティー・レポートが強化されました。
  • Linux* の GPU 計算/メディア・ホットスポット解析 (以前の GPU ホットスポット) が更新され、GPU メトリックの収集にインテル® Metric Discovery API ライブラリーを使用するようになりました。これは、カーネル 4.14 以降でサポートされます。
  • Linux* の入出力解析は、 DPDK と SPDK IO API をプロファイルできるように拡張されました。このデータを使用して、CPU アクティビティーとネットワーク・データ利用率を関連付けて、NIC ごとの PCIe 帯域幅利用率を可視化し、複数ソケットシステムの UPI 帯域幅を予測して、ボトルネックを特定します。
  • コンテナー化のサポートを強化。
  • マネージドランタイム解析を強化しました。
    • アタッチモードでイベントベースのサンプリング解析をサポートする、LLVM* または HHVM* PHP サーバー上で動作するサーバー側アプリケーションの JIT プロファイル拡張しました。
    • OpenJDK* 9 と Oracle* Java SE 開発キット 9 をサポートする Java* コード解析 (英語) を拡張しました。
    • Linux* および Windows* システムで動作する .NET* Core アプリケーションのソースコード解析が改善されました。
  • 組込みプラットフォームとアクセラレーター上での解析:
    • 新しい CPU/FPGA 相互作用解析 (プレビュー) は、OpenCL* アプリケーションを実行する専用のインテル® Arria® 10 FPGA を搭載したシステム上の CPU と FPGA のバランスを評価します。
    • リモート組込みターゲットにインストールされた Xen* 仮想化プラットフォーム上で実行されるコードの CPU/GPU 利用率を提供する新しい GPU レンダリング解析 (プレビュー)。
    • イーサーネット接続によるリモート QNX* 組込みシステム上でのコマンドライン解析のサンプリングをサポートします。
  • KVM ゲスト OS プロファイルが拡張され、ホストシステムから KVM カーネルとユーザー空間の両方をプロファイルできるようになりました。これは、ホストシステムとゲストシステムの完全なパフォーマンス解析に役立ちます。
  • アプリケーション・パフォーマンス・スナップショットの改善。
    • DRAM/MCDRAM メモリー解析向けのアンコアベースのメトリックが追加されました。これは、アプリケーションが帯域幅の制限をうけているかどうか特定するのに有用です。
    • MPI_Pcontrol と itt API で収集の停止と再開ができるようになりました。-start-paused オプションを使用して、アプリケーションの起動から再開が実行されるまで収集を除外する機能が追加されました。
    • オーバーヘッドを軽減するため、収集するデータタイプを選択できます。これには、MPI トレース、OpenMP* トレース、ハードウェア・カウンターベースの収集やこれらの組み合わせが含まれます。
    • 適切なハードウェア・イベントをサポートするプロセッサーの物理コアによる、CPU 利用率メトリックを表示します。
    • 大規模なランクで MPI トレースのオーバーヘッドを大幅に軽減します。
    • アプリケーションで使用されるコミュニケーターに関連する情報を表示して、aps-report ユーティリティーによりコミュニケーターによる集合操作をグループ化およびフィルター処理して MPI 統計が強化されました。
    • インテル Trace Analyzer & Collector との統合を改善するため、aps-report オプションを使用してプロファイルの設定ファイルを生成できます。
    • インテル® Omni-Path アーキテクチャー・インターコネクト帯域幅とパケットレートのメトリックが追加され、MPI 通信のボトルネックが調査できるようになりました。
    • MPI アプリケーションの通信パターンをさらに適切に視覚化するため、HTML ベースのランクからランク通信の分布図を追加。
  • 品質と利用性の改善。
    • 最適化されたグラフィック・インターフェイスと解析設定ワークフローの簡略化により、同一ビューで事前選択されたターゲットと利用可能な収集オプションを提供します。
    • Windows* 10 Fall Creators Update (RedStone3) の Hyper-V* 環境で実行されるターゲットをサポートするハードウェア・イベントベース解析。
    • 収集されたサンプル数がしきい値を超えた場合、オーバーヘッドを最小化するため、デフォルトのファイナライズモードを [高速] に設定します。
    • [ソース] ビューのホットスポット・ナビゲーションで使用される [注目するデータ] メトリック・タイプは、グリッドで選択されるメトリックに置き換えられ、ホットスポット・ナビゲーションで使用されるコンテキスト・メニュー・コマンドを適用します。
    • イベントベース解析タイプ (サンプリング・ドライバーを使用) 向けの CPU 周波数 メトリックは、P ステート収集ベースのより信頼性の高いデータを提供します。CPU 周波数メトリックは、ユーザーモード・サンプリングとトレース解析、および Perf* コレクターを使用した解析ではサポートされません。
    • コマンドライン・レポートでサポートされる出力形式、XML と HTML オプションが追加されました。
  • 新しいオペレーティング・システムのサポート:
    • SUSE* Linux* Enterprise Server (SLES) 15
    • Red Hat* Enterprise Linux* 7.5
    • Ubuntu* 18.04
    • Fedora* 28
    • Microsoft* Windows* 10 RS4

関連記事