インテル® VTune™ Amplifier の新機能

同カテゴリーの次の記事

API のサポート

この記事は、インテル® デベロッパー・ゾーンに公開されている、インテル® VTune™ Amplifier のオンラインヘルプの一部「What’s New in Intel® VTune™ Amplifier」の日本語参考訳です。Windows* 用のヘルプではありますが、その他の OS 環境でも十分ご利用いただけます。また、構成は英語版のヘルプと同じ階層構造にしてあります。


インテル® VTune™ Amplifier XE 2017 Update 4

  • 一般解析、メモリー解析、および HPC パフォーマンス特性解析タイプでインテル® Xeon® スケーラブル・プロセッサー・ファミリーのサポートが拡張されました。
  • Microsoft* Windows® 10 Creators Edition (RS2) がサポートされました。

インテル® VTune™ Amplifier XE 2017 Update 3

  • Application Performance Snapshot (プレビュー機能) は、アプリケーションのパフォーマンスを素早く確認し、チューニングにより得られる利点を理解するのに役立ちます。更新されたツールでは、MPI 並列処理 (Linux* のみ)、OpenMP* 並列処理、メモリーアクセス、FPU 使用率、および I/O 効率に関するメトリックと、推奨されるさらに詳細な解析を提示します。

    注:

    プレビュー機能は、正式リリースに含まれるかどうかは未定です。皆さんが有用性に対するフィードバックを送ることで、将来の採用決定の判断に役立ちます。プレビュー機能で収集されたデータは、将来のリリースで下位互換が提供される保証はありません。parallel.studio.support@intel.com へフィードバックをお送りください。

  • インテル® Xeon Phi™ コプロセッサー (開発コード名 Knights Landing) ターゲットをサポート。
  • インテル® スレッディング・ビルディング・ブロック (インテル® TBB) を使用するアプリケーションでオーバーヘッドやスピン時間が長い並列処理の非効率性を詳しく調査できるようになりました。
  • リモート Linux* ターゲットシステムでインテル® VTune™ Amplifier コレクターが自動インストールされるようになりました。この機能は、インテル® VTune™ Amplifier がインストールされていない共有リソース、またはターゲットが頻繁にリセットされるような組込みプラットフォームをプロファイルする際に有用です。
  • Microsoft* Visual Studio* 2017 をサポート。

インテル® VTune™ Amplifier XE 2017 Update 2

  • すべてのライセンスタイプで、OS 間の解析をサポート。利用中の OS の他のインストール・パッケージは、registrationcenter.intel.com からダウンロードできます。
  • インテル® Atom™ プロセッサー (開発コード名 Apollo Lake と開発コード名 Denverton)、およびインテル® プロセッサー (開発コード名 KabyLake) をサポート。
  • コールスタック収集を含むロックと待機解析で、Python* とネイティブコードの混在 (英語) をサポート。
  • HPC Performance Characterization Analysis (HPC パフォーマンス特性解析) (英語) の改善:
    • FPU 利用率の FLOP カウンターに基づいたベクトル効率メトリック向けの詳細と構造化が向上。
    • CPU 利用率において待機中のランクの MPI インバランスと並列効率の改善。
    • 算術演算を伴うホットなループと関数のデータを示す最新のセクション。これにより CPU 時間を消費する FPU 操作が最も多いループや関数を特定できます。
  • メモリーアクセスと HPC パフォーマンス特性解析の Memory Usage viewpoint (メモリー使用量ビューポイント) (英語) でアンコアイベントに基づく DRAM 帯域幅依存のメトリックを使用。
  • GPU Hotspots Summary (GPU ホットスポット・サマリー) ビュー (英語) を、DMA パケット実行の解析でパケットキューの深さパケット長ヒストグラムを提供するように拡張。
  • KVM ゲスト OS (英語) オプションにより、Linux* ホストシステムからカーネルベースの仮想マシン (KVM) 経由でゲスト Linux* オペレーティング・システムのパフォーマンス解析をサポート。
  • Ubuntu* 16.10、Fedora* 25 をサポート。

インテル® VTune™ Amplifier XE 2017 Update 1

  • [Source (ソース)]/[Assembly (アセンブリー)] ビューにある General Exploration (一般解析) の結果向けの位置情報ハードウェア・イベント・メトリックは、注目するメトリックでデータをフィルター処理して、パフォーマンス上重要な行/命令を特定することを可能にします。
  • [Source]/[Assembly] ビューの値の合計タイプによるスタックサンプリング解析データのホットスポット・ナビゲーションとフィルタリングをサポートします。
  • 一般解析の [Summary (サマリー)] ビューを拡張して、ハードウェア・メトリックで明示的に測定するイベントを表示: クロックティックとパイプライン・スロット
  • HPC パフォーマンス特性解析のコマンドラインのサマリーレポート (英語) は、事前定義されているしきい値を超えるメトリックのパフォーマンスの問題の説明を含む、CPU、メモリー、および FPU のパフォーマンスに関連するメトリックを表示するように拡張されました。このサマリーレポートの問題の説明を非表示にするには、新しい report-knob show-issues (英語) オプションを使用します。
  • ドライバーなしの収集 (英語) によるメモリーアクセス解析で Average Latency (平均レイテンシー) (英語) メトリックをサポートします。
  • プレビュー機能: インテル® HD グラフィックスとインテル® Iris™ グラフィックス向けに収集された事前定義 GPU ハードウェア・イベント・グループをリストするため、新たに [Full Compute (計算の完全な情報)] イベントグループが追加されました。このグループは、[Overview (概要)][Compute Basic (計算の基本情報)] イベントグループを組み合わせたもので、同一解析結果内で GPU ストール/アイドルの問題の検出と特定を可能にします。
  • GPU Hotspots (GPU ホットスポット) 解析 (英語) は、GPU の L3 帯域幅に依存するホットな計算タスクの検出するように拡張されました。

インテル® VTune™ Amplifier XE 2017 初期リリース

  • General Exploration (一般解析)、メモリーアクセス (高帯域幅解析を含む)、および HPC パフォーマンス特性を含み、インテル® Xeon Phi™ プロセッサー (開発コード名: Knights Landing) とインテル® Xeon® プロセッサー E5 v4 ファミリー (開発コード名: Broadwell-EP) をサポート。
  • Disk Input and Output (ディスク入出力) 解析 (英語) (プレビュー機能) は、ディスク・サブシステム、CPU、および PCIe* バスの利用率をモニターし、長いレイテンシーの I/O リスエストや I/O と計算のインバランスを特定するのに役立ちます。
  • メモリーアクセス解析 (英語) の改善:
    • システムの最大 DRAM 帯域幅特性を自動検出。このオプションは、利用可能な DRAM 帯域幅を活用しているかどうか理解するのに役立ちます。
    • Memory Allocation (メモリー割り当て) API (英語) を介したカスタムメモリー割り当てのサポートにより、メモリー・オブジェクトを正しく識別できます。
  • HPC ワークロードのプロファイルの改善:
    • HPC パフォーマンス特性解析 (英語) では、アプリケーションのスケーラビリティーに関連する次のパフォーマンス要件を調査します: MPI と OpenMP* 向けの並列性効率と CPU 利用率、メモリーアクセス効率と基本ベクトル化メトリックによる FPU 使用率。
    • 任意の MPI ランチャーと構文を使用して、ノードごとに複数のランクをサポートするイベントベースのサンプリング収集を利用できるように MPI 解析を拡張しました。Arbitrary targets (任意のターゲット) (英語) コマンドライン設定に MPI ランチャーオプションを拡張しました。[Copy Command Line to Clipboard (コマンドラインをクリップボードにコピー)] ダイアログボックスを開いて、GUI 画面から MPI 解析向けにコマンドラインを自動生成 (英語) することができます。
    • 解析設定に [Analyze OpenMP* region (OpenMP 領域の解析)] を有効/無効にするオプションが追加されました。
    • 収集結果のファイナライズを制御する -finalization-mode (英語) オプションが追加されました。これは、ターゲット上で時間のかかるファイナライズを延期またはスキップすることを可能にします。ファイナライズを延期するモードは、ホストよりもシングルスレッドのパフォーマンスが低いターゲット・プラットフォームに有効です。このモードでは、インテル® VTune™ Amplifier はホストマシン上でファイナライズを行うため、バイナリーマッチングのチェックサムを計算します。
  • 言語サポートの追加:
    • Launch Application (アプリケーションの起動) または Attach to Process (プロセスにアタッチ) モードを使用して実行される基本ホットスポット解析で Python* アプリケーション (英語) をプロファイル
    • ハードウェア・イベントベースの解析タイプで Go* アプリケーション (英語) をプロファイル。
  • GPU 解析の改善:
  • ユーザビリティーの改善:
    • Linux* 上の低い優先度の Java* デーモン (英語) 向けのイベントベース・サンプリングと [Attach to Process (プロセスにアタッチ)] ターゲット解析をサポート。
    • フィルター処理オプションでカスタム・ハードウェア・イベントベースのサンプリング解析を拡張する イベント選択 (英語) メカニズムをサポート。
    • 現在のホストから直接接続できないシステム上でパフォーマンス解析を行うためのコマンドラインを生成する任意のターゲット (英語) GUI 設定。
    • グリッド表示とパフォーマンスの問題を特定するため UI を改善。
  • インテル® Performance Snapshot (プレビュー機能) は、インテル® VTune™ Amplifier の一部として次のツールを導入:
    • Application Performance Snapshot は、アプリケーションのパフォーマンスを素早く確認し、チューニングにより得られる利点を理解するのに役立ちます。アプリケーションがハードウェア・プラットフォームをどの程度効率的に使用しているかを特定し、基本的なパフォーマンス拡張の可能性を表示します。
    • Storage Performance Snapshot は、システムのストレージ、CPU、メモリー、およびネットワークの使用率を解析し、インテル製ハードウェアを使用するシステム向けの基本的なパフォーマンス拡張の可能性を表示します。

    注:

    プレビュー機能は、正式リリースに含まれるかどうかは未定です。皆さんが有用性に対するフィードバックを送ることで、将来の採用決定の判断に役立ちます。プレビュー機能で収集されたデータは、将来のリリースで下位互換が提供される保証はありません。parallel.studio.support@intel.com へフィードバックをお送りください。

  • [Bottom-up (ボトムアップ)] / [Top-down Tree (トップダウン・ツリー)]/[Timeline (タイムライン)] ペインでハイライト表示されるプログラムユニットの同期を排除しました。削除された機能が必要な場合は、parallel.studio.support@intel.com までご連絡ください。
  • Windows® 10 RS1 (開発コード名 Redstone) および Windows Server* 2016 をサポート。
  • Microsoft* Visual Studio* 2015 Update 2 をサポート。

上位トピック: インテル® VTune™ Amplifier について

関連項目

インテル® VTune™ Amplifier について
インテル® VTune™ Amplifier 導入ガイド
インテル® VTune™ Amplifier for Systems の新機能 (英語)

コンパイラーの最適化に関する詳細は、最適化に関する注意事項を参照してください。

関連記事

  • インテル® VTune™ Amplifier による GPU 解析インテル® VTune™ Amplifier による GPU 解析 この記事は、インテル® デベロッパー・ゾーンに公開されている、インテル® VTune™ Amplifier のオンラインヘルプの一部「GPU Analysis」の日本語参考訳です。Windows* 用のヘルプではありますが、その他の OS […]
  • インテル® HD グラフィックスとインテル® Iris™ グラフィックスを使用するアプリケーションの解析インテル® HD グラフィックスとインテル® Iris™ グラフィックスを使用するアプリケーションの解析 この記事は、インテル® デベロッパー・ゾーンに公開されている、インテル® VTune™ Amplifier のオンラインヘルプの一部「Analyzing Applications Using Intel® HD Graphics and Intel® Iris™ Graphics」の日本語参考訳です。Windows* […]
  • インテル® プロセッサー・グラフィックスインテル® プロセッサー・グラフィックス この記事は、インテル® デベロッパー・ゾーンに掲載されている「インテル® Processor グラフィックス」の日本語参考訳です。 インテル® プロセッサー・グラフィックス向けの開発者ドキュメント インテル® プロセッサー・グラフィックスは、第 6 世代インテル® Core™ プロセッサーを含むインテル® […]
  • ビデオ・ストリーミング処理 – 環境への配慮ビデオ・ストリーミング処理 – 環境への配慮 この記事は、インテル® デベロッパー・ゾーンに公開されている「Video Streaming Processing - Going Green」(https://software.intel.com/en-us/blogs/2016/03/15/video-streaming-going-green) […]
  • インテル® VTune™ Amplifier についてインテル® VTune™ Amplifier について この記事は、インテル® デベロッパー・ゾーンに公開されている、インテル® VTune™ Amplifier のオンラインヘルプの一部「Introducing the Intel® VTune™ Amplifier」の日本語参考訳です。Windows* 用のヘルプではありますが、その他の OS […]