ベータ版インテル® VTune™ プロファイラー 2021 リリースノート
この記事は、インテル® デベロッパー・ゾーンに公開されている「Intel® VTune™ Profiler (Beta) Release Notes」の日本語参考訳です。
この記事の PDF 版はこちらからご利用になれます。
免責条項
これは、ベータ版インテル® VTune™ プロファイラー 2021 です。皆様からの早期のフィードバックをお待ちしております。それらは、実際のアプリケーションに影響する問題の優先順位を決定して対処するのに役立ちます。
Change History
ドキュメントの改訂 | 日付 | 説明 |
2021.1 – Beta(05) リリース | 2020 年 3 月 | Beta 05 リリースノート |
2021.1 – Beta(04) リリース | 2020 年 2 月 | Beta 04 リリースノート |
2021.1 – Beta(03) リリース | 2019 年 10 月 | Beta 03 リリースノート |
主な機能
ベータ版インテル® VTune™ プロファイラー 2021 は、インテル® VTune™ Amplifier の後継製品です。既存のすべての主要機能を提供し、CPU およびアクセラレーター全体で DPC++ アプリケーションのプロファイルをサポートします。
新機能 – Beta 05
- GPU アクセラレーターのサポート:
- 動的命令カウントモードでの GPU 計算/メディア・ホットスポット解析が、カーネルおよび命令レベルで SIMD 利用率メトリックを含むように拡張されました。これらのメトリックは、SIMD 機能を十分に活用していない OpenCL* カーネルの命令を特定するのに役立ちます。
- アプリケーション・パフォーマンス・スナップショット (APS) と HPC パフォーマンス特性解析でより深いレベルの GPU 利用率解析が行えるようになりました。GPU 利用率解析に以下の GPU 計算メトリックが追加されました。
- GPU 時間
- GPU IPC
- GPU 利用率
- ストール/アイドル EU のパーセンテージ
- アプリケーション・パフォーマンス・スナップショットの GPU 計算メトリックには、オフロード領域のオーバーヘッドやデータ転送のコストなど、OpenMP* オフロード効率メトリックが含まれます。このメトリックを利用するには、アプリケーションがベータ版インテル® oneAPI HPC ツールキット (英語) に含まれるベータ版インテル® C/C++ コンパイラー 2021.1-Beta05 でコンパイルされている必要があります。
- Linux* システムで GPU ハードウェア統計を収集するインテル® Metrics Discovery API ライブラリーへの依存関係が簡素化されました。インテル® VTune™ プロファイラーは GPU 解析の要件を満たすため、ランタイムで利用可能な最新の libstdc++ を自動選択するようになりました。製品の古いバージョンでは、手動で設定を有効にします。
- プラットフォーム解析の改善:
- CPU/FPGA 相互作用解析は、AOCL プロファイラー (新しいモード) と OpenCL* プロファイル API (従来のモード) の両方で収集されたデータソースを処理できるように拡張されました。[何を] ペインでターゲット・アプリケーションの名前と引数を直接指定します。
- システムの概要解析のハードウェア・トレース・モードが拡張され、カーネルの解析に対応する新しいメトリックが追加されました。
- カーネルモードのスイッチ数とその頻度 (スイッチ/秒) を示すため、CPU 時間メトリックがユーザー時間とカーネル時間メトリックに分離されました。
- OS カーネル・アクティビティーと OS スケジュール・メトリックは、予期しないカーネル・アクティビティーやプリエンプションによる異常動作を特定します。
- ハードウェア・トレース・モードで収集されたデータを表示するため、システム概要ビューポイントに新しく [モジュールのエントリーポイント] グループレベルが追加され、システムコール、割り込み、またはランタイム・ライブラリーの特定の API で費やされる CPU 時間を正確に監視できるようになりました。
新機能 – Beta 04
- GPU アクセラレーターのサポート:
- GPU 解析に必要なシステム設定を簡素化しました。Linux* カーネルを再構築することなく GPU 利用率解析が可能になりました。Ftrace テクノロジーをサポートしないシステムでは、GPU 利用率統計はハードウェア・イベントに基づいて収集され、レンダ―と GPGPU エンジンでのみ利用できます。エンジンごとの詳細な GPU 利用率統計を収集するには、カーネルをリビルドするか、i915 モジュールを設定およびリビルドして i915 Ftrace イベント収集を有効にします。
- プラットフォーム 解析サポート:
- システム概要のハードウェア・トレース・モードが最適化され、ユーザー/カーネルメトリック、スレッド/ハードウェアのグループ化、およびモジュールのエントリーポイントが追加されました。
新機能 – Beta 03
- Linux* および Windows* 上の GPU と FPGA を含む CPU や複数のアクセラレーター・アーキテクチャー全体で DPC++ コードをプロファイルします。
- GPU アクセラレーターのサポート:
- 新しい GPU オフロード解析により、CPU および GPU 全体のコード実行を相関ビューで調査して、GPU 依存のアプリケーションで注目するカーネルを識別できます。そして、CPU 計算/メディア・ホットスポット解析でさらに詳しく調査します。
- GPU In-kernel プロファイル、DPC++ および OpenCL* 計算タスク収集の注目するカーネルをフィルター処理する機能を備えた、GPU 計算/メディア・ホットスポット解析を更新しました。
- Gen 11 をサポート。
- FPGA アクセラレーターのサポート:
- インテル® SoC Watch データコレクターをベースとする電力解析は、プロセッサー・パッケージ全体の経時的な電力消費量を監視し、CPU スロットリングとの関係を特定できるように拡張されました。
- 発熱や電力の制限を超えるなど、システム・スロットリングの原因を特定する新しいスロットリング解析がサポートされました。
- HPC 解析の改善:
- GPU へオフロードされた OpenMP* コードのプロファイル。
- アプリケーション・パフォーマンス・スナップショットの GPU 時間と利用率メトリック。
- DRAM、MCDRAM、インテル® Optane™ DC パーシステント・メモリー、およびインテル® Omni-Path の使用効率を正確に推測するため、アプリケーション・パフォーマンス・スナップショットに最大帯域幅および帯域幅依存メトリックが追加されました。
- 品質と利便性の改善:
- コンテナー化のサポートに Docker* コンテナーにインテル® VTune™ プロファイラーをインストールして実行し、同一コンテナー内/外のターゲットをプロファイルするオプションが追加されました。
- [ようこそ] ページから、サンプルプロジェクトを使用して製品の使い方をガイドするインタラクティブなヘルプツアーが利用できるようになりました。
システム要件
ベータ版インテル® VTune™ プロファイラー 2021 を使用するソフトウェアおよびハードウェア要件については、こちら (英語) をご覧ください。
Docker* コンテナーでインテル® VTune™ プロファイラーを使用する
Docker* コンテナーでインテル® VTune™ プロファイラーを使用する場合、解析を有効にするためコンテナーに追加機能を提供する必要があります。こちらの手順に従ってください。
既知の問題
- Beta 05: [VASP-19445] 現在、C++ の名前のないラムダ関数のシンボル解決はサポートされていません。名前のないラムダ関数は、マングルされたシンボル名で表示されます。
- Beta 05: インテル® oneAPI Beta 05 に含まれるインテル® VTune™ プロファイラーのプラットフォーム・プロファイラーは、不具合により動作しない場合があります。この問題を回避するには、以下のバージョンのインテル® VTune™ プロファイラーに含まれるプラットフォーム・プロファイラーを使用してください。
- Beta 05: インテル® VTune™ プロファイラー Beta 05 の GUI は、GUI で結果を開いたままシステムがスリープ状態になった場合、スリープ状態から復帰した後に新しいインテル® VTune™ プロファイラー結果を開くと、空のウィンドウを表示します。この問題を回避するには、インテル® VTune™ プロファイラーの GUI を再起動します。
- Beta 05 : Google Chrome* 80 以降では、プラットフォーム・プロファイラーの収集結果の参照、または新しい結果ファイルのアップロードを行うことができません。プラットフォーム・プロファイラーのホームページで [View Results] をクリックすると、空のページが表示されます。
- この問題を回避するには、Google Chrome* で次の操作を行います。
- [New Results] ページに移動します。
- F12 キーを押して Chrome* デベロッパー・ツールを開きます。
- 再読み込みツールバーボタンをクリックして長押しします。
- メニューから [キャッシュの消去とハード再読み込み] を選択します。
- 別の方法として、Mozilla Firefox* または Microsoft Edge* を使用します。プラットフォーム・プロファイラーは、Mozilla Firefox* および Microsoft Edge* では問題なく動作します。ただし、トポロジー・ダイアグラムが完全にレンダリングされないなど、ユーザー・エクスペリエンスが低下する場合があります。
- この問題を回避するには、Google Chrome* で次の操作を行います。
- Beta 04: Google Chrome* 80 以降では、プラットフォーム・プロファイラーの収集結果の参照、または新しい結果ファイルのアップロードを行うことができません。プラットフォーム・プロファイラーのホームページで [View Results] をクリックすると、空のページが表示されます。この問題を回避吸うrには、次の操作を行います。
- –enable-blink-features=HTMLImports オプションを指定して Google Chrome* を起動します。Google Chrome* を起動する前に、実行中のすべての Chrome* プロセスを停止してください。
- 別の方法として、Mozilla Firefox* または Microsoft Edge* を使用します。プラットフォーム・プロファイラーは、Mozilla Firefox* および Microsoft Edge* では問題なく動作します。ただし、トポロジー・ダイアグラムが完全にレンダリングされないなど、ユーザー・エクスペリエンスが低下する場合があります。
- Beta 02: インテル® oneAPI ツールキットをインストールした後、最初に Visual Studio* を実行したときに、インテル® VTune™ プロファイラーの Microsoft* Visual Studio* IDE 統合が動作しないことがあります。この問題を回避するには、Visual Studio* を再起動してください。
コンパイラーの最適化に関する詳細は、最適化に関する注意事項を参照してください。