カスタムターゲット GPU デバイスでのアプリケーションのパフォーマンスをモデル化

GPU パラメーターを変更して、将来のまたは特定のグラフィックス処理ユニット (GPU) のパフォーマンスをモデル化し、アプリケーションのパフォーマンスがどのように変化するか確認できます。

インテル® Advisor には、アプリケーションのパフォーマンスをモデル化するのに利用できる事前定義された GPU デバイス構成が用意されています。将来登場する GPU デバイスのパフォーマンスを推測したい、またはハードウェア・パラメーターを変更してアプリケーションのパフォーマンスへの影響を確認したい場合、次のいずれかの方法でオフロードのモデル化パースペクティブのターゲット・ハードウェアのパラメーターを変更できます。

[Modeling Parameters (モデル化パラメーター)] ペインを使用

インテル® Advisor GUI または対話型 HTML レポートでオフロードのモデル化レポートの [Summary (マサリー)] タブを開くと、モデル化されたデバイスとパラメーターが [Modeling Parameters (モデル化パラメーター)] ペインに表示されます。各パラメーターは、値を調整できるスライドバーで示されます。

オフロードのモデル化レポートの [Summary (サマリー)] タブを開くと、変更可能なターゲットデバイスのパラメーターを示す [Modeling Parameters (モデル化パラメーター)] ペインが表示されます。

このペインでは次のことができます。

ペインのコントロールに関するの詳細については、「ウィンドウ : オフロードのモデル化サマリー」をご覧くだい。オフロードのモデル化サマリー

パラメーター・リストは、選択したターゲットデバイスによって異なります。これは、GPU アーキテクチャーや用語固有の違いが原因である可能性があります。例えば、Gen11 GT2 の構成には LLC 帯域幅と LLC サイズ・パラメーターがありますが、XeLP Max 96 はアーキテクチャーが異なるためそれらはありません。

インテル® Arc™ Alchemist (DG2) 以降のインテル® Xe グラフィックス製品ファミリーと以降の世代では、従来の用語から GPU アーキテクチャーの用語が変更されています。用語変更の詳細と、従来のコンテンツとの対応については、インテル® Xe グラフィックスの GPU アーキテクチャー用語を参照してください。

GUI からパフォーマンスを再モデル化

このワークフローは、インテル® Advisor GUI でベースとなる GPU から別のターゲットの GPU デバイスに再モデル化するために利用できます。オフロードのモデル化レポートから、特定のデバイスのアプリケーションのパフォーマンスを再モデル化できます。

要件:

  1. GPU カーネル解析にシステムを設定します。
  2. グラフィカル・ユーザー・インターフェイス (GUI) 、またはコマンドライン・インターフェイスから、オフロードのモデル化を実行します。
  3. インテル® Advisor GUI で結果を開きます

ハードウェア・パラメーターをカスタマイズして、アプリケーションのパフォーマンスを再モデル化するには、次の手順を実行します。

  1. [Analysis Workflow (解析ワークフロー)] ペインの [Baseline Device (ベースライン・デバイス)] ドロップダウンで GPU デバイスが選択されていることを確認します。
  2. オプション: [Summary (サマリー)] の [Modeling Parameters (モデル化パラメーター)] ペインで、変更後のベースラインとして使用するデバイスを [Target Device (ターゲットデバイス)] ドロップダウンから選択します。

    デバイスを変更しない場合、モデル化されている現在のターゲットデバイスがベースラインとして使用されます。

  3. [Hardware Parameters (ハードウェア・パラメーター)] の下にあるスライドバーを移動して値を決定します。黒いラインはベースラインのパラメーター値を示し、青いラインはベースライン値との差を示します。

    例えば、実行ユニットの EU Count (EU 数) を増やすと、さらに多くの計算操作を同時に実行できるようになります。これは、[Offload Bounded By (オフロード境界)] に表示される計算依存型のアプリケーションに有効です。

    [Modeling Parameters (モデル化パラメーター)] ペインの EU Count (EU 数) の値を増やします。

  4. ペインの上部にある ボタンをクリックして、ターゲットデバイス構成のパフォーマンスのモデル化解析を実行します。

    解析が完了すると、特定のデバイス構成の推測結果が開きます。

  5. 新しいターゲット GPU のパフォーマンスの返歌を調べます。

    例えば、EU 数を増やした場合、計算時間と計算依存のパーセンテージが減少し、計算推測メトリックが変化が観測できます。

設定ファイルを使用してパフォーマンスを再モデル化

このワークフローは、パフォーマンスの再モデル化に利用できます。

この場合、オフロードのモデル化レポートを使用してパラメーターを変更し、インテル® Advisor CLI のみでパフォーマンスの再モデル化ができます。

要件:

  1. 環境変数を設定します
  2. グラフィカル・ユーザー・インターフェイス (GUI) 、またはコマンドライン・インターフェイスから、オフロードのモデル化を実行します。
  3. インテル® Advisor GUI の対話型 HTML レポートで結果を開きます

ハードウェア・パラメーターをカスタマイズして、アプリケーションのパフォーマンスを再モデル化するには、次の手順を実行します。

  1. オプション: [Summary (サマリー)] の [Modeling Parameters (モデル化パラメーター)] ペインで、変更後のベースラインとして使用するデバイスを [Target Device (ターゲットデバイス)] ドロップダウンから選択します。

    デバイスを変更しない場合、モデル化されている現在のターゲットデバイスがベースラインとして使用されます。

  2. [Hardware Parameters (ハードウェア・パラメーター)] の下にあるスライドバーを移動して値を決定します。黒いラインはベースラインのパラメーター値を示し、青いラインはベースライン値との差を示します。

    例えば、実行ユニットの EU Count (EU 数) を増やすと、さらに多くの計算操作を同時に実行できるようになります。これは、[Offload Bounded By (オフロード境界)] に表示される計算依存型のアプリケーションに有効です。

    [Modeling Parameters (モデル化パラメーター)] ペインの EU Count (EU 数) の値を増やします。

    スライドバーを移動すると、[Save to Remodel (再モデル化へ保存)] ボタンがアクティブになり、変更した構成を保存できるようになります。

    CPU から GPU へのモデル化を行う場合、帯域幅やサイズなどメモリー関連のパラメーターを変更する場合、最初にトリップカウンターと複数デバイス・キャッシュ・シミュレーションを使用して特性化解析を行います (CLI では --cache-simulation=multi オプションを使用してカスタム構成でパフォーマンスのモデル化を行います)。そうしないと、新しいデバイスのキャッシュ・シミュレーションが更新されないため、結果が不正確になる可能性があります。
  3. [Save to Remodel (再モデル化へ保存)] をクリックして、生成した構成ファイルを保存します。

    [Save Configuration (設定を保存)] ダイアログボックスが表示されます。

  4. 開いたダイアログボックスで、TOML ファイルを保存する場所に移動して、ファイル名を変更 (必要であれば) し [Save (保存)] をクリックします。デフォルトでファイルは config.toml として保存されます。

    カスタム構成ファイルを保存すると、パフォーマンスのモデル化解析コマンドラインが [Modeling Parameters (モデル化パラメーター)] ペインのハードウェア・パラメーターのスライドバーの下に表示されます。

    ハードウェア・パラメーターのスライドバーの下で、生成されたコマンドラインをクリップボードへコピーして、そのコマンドを実行します。

  5. をクリックすると、ハードウェア・パラメーターで生成されたコマンドラインがクリップボードへコピーされます。

    コマンドラインには、保存したカスタム構成ファイルへの完全なパスを指定する --custom-config オプションが含まれることに注意してください。コマンドラインには必要なオプションがすべて含まれているため、コピー&ペーストしてそのまま使用できます。

  6. コピーしたコマンドをターミナルやコマンドプロンプトにペーストして実行します。

    解析が完了すると、プロジェクト・ディレクトリー内の結果が新しいターゲットデバイス構成に合わせて更新されます。

  7. 更新された結果を開いて、新しいターゲット GPU のパフォーマンスでの変化を調べます。

    例えば、EU 数を増やした場合、計算時間と計算依存のパーセンテージが減少し、計算推測メトリックが変化が観測できます。

コマンドライン・オプションを使用してパフォーマンスを再モデル化

コマンドラインからオフロードのモデル化パースペクティブを実行する場合、--set-parameter=<string> オプションを使用してターゲット・パラメーターを変更できます。このオプションは、事前定義されたオフロードのモデル化収集、またはパフォーマンスのモデル化解析とともに利用できます。この変更は、その実行にのみ適用されます。複数のパラメーターをカンマで区切ってリストで指定できます。

例えば、周波数 1.4 GHz、実行ユニット数 224、および gen12_tgl デバイス構成に対応するパラメーターを備えたターゲットデバイスのパフォーマンスをモデル化するには、次のコマンドを使用します。

advisor --collect=offload --config=gen12_tgl --set-parameter="EU_count=224,Frequency=1.4e+9" --project-dir=./advi_results -- ./myApplication

生成された結果を開いて、新しいターゲット GPU のパフォーマンスでの変化を調べます。

変更可能なパラメーターを確認するには、インテル® Advisor GUI または HTML レポートから選択したデバイスの構成ファイルを保存し、リストされるパラメーターから調査できます。

関連情報
GUI からオフロードのモデル化パースペクティブを実行
コマンドラインからオフロードのモデル化パースペクティブを実行
オフロードのモデル化の結果を調査
advisor コマンドオプションのリファレンス