インテル® VTune™ Amplifier 2018 ヘルプ
HPC ワークロードのプロファイルを改善:
アプリケーション・パフォーマンス・スナップショット (英語) が、収集のオーバーヘッドを軽減して DRAM と MCDRAM の平均帯域幅の測定を可能にするため、インテル® VTune™ Amplifier のサンプリング・ドライバーと Perf によるシステム全体のプロファイルを使用するように拡張されました。
アプリケーション・パフォーマンス・スナップショットの MPI トレースが、MPI_Abort を使用するアプリケーションに対応するように拡張されました。
GPU 解析の改善:
GPU ホットスポット解析が、FPU 依存の OpenCL* アプリケーションを解析するように拡張され、低占有率の問題の原因を特定できるようになりました。
品質とユーザビリティーの改善:
Perf サンプリング間隔の統合を使用することで、ターゲットシステムの Xen* Hypervisor で実行する Perf ベースのドライバーを必要としないサンプリング収集の精度を向上させました。
CPU サンプリング間隔の設定により EBS 収集結果のサイズを効率良く管理できます。サンプリングの間隔を大きくすることで、長時間のプロファイルや大きな結果ファイルを生成するプロファイルに役立ちます。[Duration time estimate (持続時間の推測)] オプションが非推奨となりました。
インテル® System Studio や完全なバージョンのインテル® VTune™ Amplifier のインストールを必要とせずに、Yocto Project* と組込みデバイス上でのパフォーマンス・プロファイルがサポートされるようになりました。
新しいインテル® VTune™ Amplifier 2018 は、オリジナルのインテル® VTune™ Amplifier とインテル® VTune™ Amplifier for Systems で提供される機能を統合し、ホストベースと組込みリモートターゲット解析向けに次の新しいオプションが追加されています。
アプリケーション・パフォーマンス・スナップショット (英語) は、アプリケーションのパフォーマンスを素早く確認し、アプリケーションがチューニングから得られる利点を理解するのに役立ちます。
パフォーマンス・メトリックには、MPI と OpenMP* 並列処理、メモリーアクセス、FPU 使用率、および I/O 効率に関するさらに詳細な解析で推奨を提示します。
新しい MPI メトリックは、平均して時間を消費する上位 5 つの MPI 関数を特定するのに役立ち、MPI ランクと計算ノードごとの常駐および仮想メモリーのフットプリントを表示します。
インテル® Xeon® プロセッサー開発コード名 Skylake を含む複数のプラットフォームをサポートします。
アタッチ・プロファイル・モードと高度なホットスポット解析により、LXC*、Docker* と Mesos* コンテナーで連続して実行されるターゲット (ネイティブと Java* サービスおよびデーモン) 向けのパフォーマンス解析をサポートします。
HPC ワークロードのプロファイルの改善:
HPC パフォーマンス特性解析向けに拡張された MPI メトリックは、ハイブリッド・アプリケーションのスケーラビリティー・ボトルネックを調査します。
[Summary (サマリー)] 表示が、並列領域外でシリアルに実行されるマスタースレッドの上位 5 つの OpenMP* ホットスポット (関数とループ) を表示するように拡張されました。
インテル® スレッディング・ビルディング・ブロック (インテル® TBB) を使用するアプリケーションで、オーバーヘッドやスピン時間が長い並列処理の非効率性を詳しく調査できるようになりました。
FPU 使用率で FLOP カウンターに基づいたベクトル効率メトリック向けの詳細と構造が向上しました。
CPU 使用率で、MPI ビジー待機時間と大部分の待機ランク向けの並列効率をベースとする新しい MPI インバランス・メトリックが追加されました。
算術演算を伴うホットなループと関数のデータを示す新しいセクションが追加されました。これにより CPU 時間を消費する FPU 操作が最も多いループや関数を特定できます。
最適化されたhpc-performance 向けのコマンドライン解析フローとサマリーレポートは、事前定義されているしきい値を超えるメトリックのパフォーマンスの問題の説明を含む、CPU、メモリー、および FPU のパフォーマンスに関連するメトリックを表示するように拡張されました。サマリーレポートで問題説明を非表示にするには、report-knob show-issues オプションを使用します。
マイクロアーキテクチャー解析の改善:
フルスケールのドライバーを必要としないメモリーアクセス解析で、平均レイテンシー特性を提供できるようになりました。
[Source (ソース)]/[Assembly (アセンブリー)] 表示にある General Exploration (全般解析) の結果向けの位置情報ハードウェア・イベント・メトリックは、注目するメトリックでデータをフィルター処理して、パフォーマンス上重要な行/命令を特定することを可能にします。
全般解析の [Summary] 表示が拡張され、ハードウェア・メトリックで明示的に測定するイベントが表示されるようになりました: クロックティックとパイプライン・スロット
帯域幅のボトルネックとメモリー・アクセス・サマリーのコマンドライン・レポートの詳細に、プラットフォーム最大帯域幅、解析中に観察された最大帯域幅、平均帯域幅使用率、および高帯域幅の経過時間の % などの新しいメトリックが含まれるようになりました。
メモリーアクセスと HPC パフォーマンス特性解析の Memory Usage (メモリー使用量) 特性を表示する際に使用されるアンコアイベントに基づくさらに正確な DRAM 帯域幅依存のメトリック。
マネージドランタイム解析の改善:
ネイティブと Python* Linux ターゲット向けの新しいメモリー消費解析は、時系列に RAM 消費をモニターし、解析実行中のメモリー・オブジェクトの割り当てと解放を特定するのに有効です。
コールスタック収集を含むロックと待機解析で、Python* とネイティブコードの混在をサポートします。
GPU 解析の改善:
GPU Hotspots (GPU ホットスポット) 解析は、GPU の L3 帯域幅または DRAM の帯域幅に依存するホットな計算タスクの検出するように拡張されました。
新しい GPU In-kernel プロファイルは、コード行ごとの GPU カーネル実行の解析を支援し、メモリー・レイテンシーや非効率なカーネルのアルゴリズムによるパフォーマンスの問題を特定します。
GPU Hotspots Summary (GPU ホットスポット・サマリー) ビューポイントを、DMA パケット実行の解析でパケットキューの深さとパケット長ヒストグラムを提供するように拡張。
インテル® HD グラフィックスとインテル® Iris® グラフィックス向けに収集された事前定義 GPU ハードウェア・イベント・グループをリストするため、新たに [Full Compute (計算の完全な情報)] イベントグループが追加されました。このグループは、[Overview (概要)] と [Compute Basic (計算の基本情報)] イベントグループを組み合わせたもので、同一解析結果内で GPU ストール/アイドルの問題の検出と特定を可能にします。
KVM ゲスト OS オプションを備えた Linux* ホストシステムから カーネルベースの仮想マシン (KVM) 経由でゲスト Linux* オペレーティング・システムのパフォーマンス解析をサポートします。
コードの最適化を改善するインテル® C++ コンパイラー (Linux* のみ)、GCC および Clang コンパイラー向けのamplxe-pgo-report.sh ユーティリティーで生成されるプロファイル・ガイドによる最適化レポート。
ユーザビリティーの改善:
[Timeline (タイムライン)] ペイン、解析およびターゲット設定ウィンドウの GUI が見やすくなりました。
[Source]/[Assembly] 表示の値の合計タイプによるスタックサンプリング解析データのホットスポット・ナビゲーションとフィルタリングをサポートします。
リモート Linux* ターゲットシステムでインテル® VTune™ Amplifier コレクターが自動インストールされます。この機能は、インテル® VTtune™ Amplifier がインストールされていない共有リソース、またはターゲットが頻繁にリセットされるような組込みプラットフォームをプロファイルする際に有用です。
ドキュメント類の改善:
インテル® VTune™ Amplifier 製品ヘルプ、チュートリアル、およびリリースノート (英語) はオンラインでのみ提供され、インテル® デベロッパー・ゾーン (IDZ) のインテル® ソフトウェア・ドキュメント・ライブラリー (英語) から入手できます。また、製品ヘルプのオフラインバージョンは、IDZ またはインテル® ソフトウェア開発製品レジストレーション・センターからダウンロードできます。
新しい「解析タイプの特定」ガイドを使用して、アプリケーションの解析を始めるべき出発点を知ることができます。このガイドはオンライン (製品ヘルプから) と、オフライン (製品の Welcome ページ) の両方にアクセスできます。
新しパフォーマンス解析クックブックには、インテル® VTune™ Amplifier の解析タイプで最も一般的な問題を特定して解決するレシピが含まれます。
次の新しいインテル® プロセッサーがサポートされます。
インテル® Xeon Phi™ プロセッサー開発コード名 Knights Landing および開発コード名 Knights Mill
インテル® Xeon® プロセッサー・スケーラブル・ファミリー
インテル® Atom™ プロセッサー開発コード名 Apollo Lake および開発コード名 Denverton
インテル® プロセッサー開発コード名 KabyLake
サポートされるプロセッサーの完全なリストは、リリースノート (英語) をご覧ください。
次の新しいオペレーティングシステムと IDE がサポートされています。
Ubuntu* 17.04
Fedora* 26
Debian* 9.0
Microsoft* Windows® 10 Creators Update (RS2)
Microsoft* Visual Studio* 2017
すべてのライセンスタイプで OS 間の解析をサポートします。異なるオペレーティング・システム向けのインストール・パッケージは、registrationcenter.intel.com からダウンロードできます。
サポートされるオペレーティング・システムの完全なリストは、リリースノート (英語) をご覧ください。