インテル® VTune™ プロファイラー・パフォーマンス解析クックブック最新版の公開

同カテゴリーの次の記事

CatBoost マシンラーニング・ライブラリーが 1.47 倍のスピードアップを達成

インテル® VTune™ プロファイラー・パフォーマンス解析クックブックの最新版が公開されました。

インテル® VTune™ プロファイラー は、開発者がコードを解析し、非効率なアルゴリズムおよびハードウェアの利用状況を特定して、適切なパフォーマンス・チューニングのアドバイスを得られるように支援する、パフォーマンス・プロファイル・ツールです。

このクックブックは、インテル® VTune™ プロファイラーで提供される解析タイプを使用して、パフォーマンスの手法とレシピを紹介します。

今回追加された章

  • 手法
    最初に、チューニング手法、パフォーマンス・メトリック、統計を収集するハードウェア・ソリューションを理解して、パフォーマンス解析を開始します。その後、インテル® VTune™ プロファイラーと従来のインテル® VTune™ Amplifier で利用可能な特定のチューニングや設定レシピにドリルダウンできます。

    • インテル® GPU 向けのソフトウェア最適化
      インテル® VTune™ プロファイラーを使用して、インテル® GPU へオフロードする場合のオーバーヘッドを予測します。GPU にオフロードされた計算タスクのパフォーマンスを解析します。
    • DPDK イベント・デバイス・プロファイル
      DPDK ベースのアプリケーションの DPDK イベント・デバイス・パイプラインの利用効率を解析して、不均衡な負荷分散やワーカーコアが十分に利用されていない問題を特定します。
    • インテル® データ・ダイレクト I/O テクノロジーの効果的な利用
      インテル® VTune™ プロファイラーを使用して、インテル® Xeon® プロセッサーのハードウェア機能であるインテル® データ・ダイレクト I/O テクノロジー (インテル® DDIO) の利用効率を明らかにする方法を示します。
    • 最新の命令セットを使用して最適化されたポータブルなバイナリーをコンパイルする
      移植性を維持しながら最新の命令セットを使用してバイナリーをコンパイルするさまざまな方法を学びます。
  • 設定レシピ
    特定のコード環境でパフォーマンス解析を行うため、システムとインテル® VTune™ プロファイラーと従来のインテル® VTune™ Amplifier を設定する方法を詳しく説明します。

    • パフォーマンス異常を見つけるアプリケーションのプロファイル
      このレシピは、インテル® VTune™ プロファイラーの異常検出解析を使用して、いくつかの要因によるパフォーマンス異常を特定する方法を紹介します。また、これらの異常を修正するための提案も提供します。
    • GPU 上で実行する OpenMP* オフロード・アプリケーションのプロファイル
      このレシピは、インテル® GPU へオフロードされる OpenMP* アプリケーションをコンパイルする方法を示し、インテル® VTune™ プロファイラーで OpenMP* アプリケーションの GPU 解析 (HPC パフォーマンス特性、GPU オフロード、および GPU 計算/メディア・ホットスポット) を実行して、結果を調査する方法を紹介します。
    • コマンドライン・インターフェイスを使用して GPU 上で実行する DPC++ アプリケーションのパフォーマンスを解析
      このレシピは、インテル® VTune™ プロファイラーのコマンドライン・インターフェイス (CLI) を使用して、インテル®GPU にオフロードされたデータ並列 C++ (DPC++) アプリケーションのパフォーマンスを解析する方法を紹介します。また、収集したデータを使用してレポートをカスタマイズする方法も説明します。
    • プロキシーサーバーを介したリモートターゲットのプロファイル
      このレシピは、プロキシーサーバーを介してインテル® VTune™ プロファイラーを実行し、リモートターゲットをプロファイルする方法を説明します。
    • インテル® VTune™ プロファイラー・サーバーと Visual Studio* Code およびインテル® DevCloud for oneAPI の併用
      このレシピでは、インテル® VTune™ プロファイラーをウェブサーバーとして使用し、リモートの開発マシンでパフォーマンスのチューニングを行う方法を紹介します。例として、リモートマシンにインテル® DevCloud for oneAPI のコンピュート・ノードを使用します。
  • チューニング・レシピ
    インテル® VTune™ プロファイラーと従来のインテル® VTune™ Amplifier で検出可能な最も一般的なパフォーマンスの問題を調査し、パフォーマンスを最適化するためのステップを提供します。

    • セグメント化されたキャッシュ環境におけるキャッシュ関連のレイテンシー問題
      このレシピは、キャッシュ・アロケーション・テクノロジー (CAT) を使用して、コア間のキャッシュを分割する際にキャッシュ関連のレイテンシー問題 (キャッシュミス) を制御する方法を示します。
    • ページフォールト
      このレシピは、インテル® VTune™ プロファイラーのマイクロアーキテクチャー全般、システム概要、メモリー消費解析を使用して、ページフォールトがターゲット・アプリケーションのパフォーマンスに与える影響を特定して測定する方法を説明します。

製品とパフォーマンス情報

1実際の性能は利用法、構成、その他の要因によって異なります。詳細は、www.Intel.com/PerformanceIndex (英語) を参照してください。

関連記事