オフロードが推奨される領域を調査

精度レベル

Low (低)

有効となる解析

依存関係を想定しないサーベイ + 特性化 (トリップカウントと FLOP) + パフォーマンスのモデル化

結果の解釈

Low (低) 精度でオフロードのモデル化パースペクティブを実行すると、基本的なオフロードのモデル化レポートが表示されます。このレポートには、ターゲット・プラットフォームにオフロードされたアプリケーションのパフォーマンス予測のほとんどが、計算によって制限されていることを示しています。

Low (低) 精度のオフロードのモデル化では以下を前提とします。

このトピックでは、インテル® Advisor GUI のオフロードのモデル化レポートおよび対話型 HTML レポートに表示されるデータについて説明します。

オフロードのモデル化レポート:

  1. [Summary (サマリー)] タブで、アプリケーション全体のメトリックを確認します。

    • [Program Metrics (プログラムのメトリック)] ペインでは、アプリケーションをターゲットデバイスにオフロードするのが有益であるか、またベースライン・プラットフォームでのパフォーマンスに優位性があるかを確認します。
    • [Offload Bounded by (オフロード依存)] ペインで、ターゲットデバイスで実行したコードのパフォーマンス向上を妨げる原因を確認します。

      [Performance Modeling (パフォーマンスのモデル化)][Assume Dependencies (依存関係を想定)] 解析を有効にすると、依存関係に関連するコード領域のパーセンテージが高くなる可能性があります。正確な結果を得るには、依存関係解析を実行して、パフォーマンスのモデル化を再度行うことを推奨します。
  2. 推測されるスピードアップが十分高く、[Summary (サマリー)] ペインの他のメトリックが、アプリケーションが選択するターゲット・プラットフォームへのオフロードから利益を得られる可能性があることを示す場合、コードのオフロードを行います。
  3. 各領域でレポートされた結果をさらに詳しく調査する場合、[Accelerated Regions (アクセラレートされた領域)] タブに移動します。

    オフロードのモデル化パースペクティブのアクセラレートされた領域の例

    • ターゲットのコード領域が、選択したプラットフォームへのオフロードに推奨されているか確認します。[Basic Estimated Metrics (基本的な推測メトリック)] カラムグループで、[Offload Summary (オフロードのサマリー)] カラムを確認します。推測されるスピードアップが 1 を超える場合、ターゲットデバイスで推測される実行時間がホストでの実行時かにより短ければ、コード領域はオフロードの利点があると見なされます。

      対象のコード領域がオフロードに適していない場合、高い精度でパースペクティブを再度実行するか、そのコード領域のオフロードをモデル化する推奨事項のオフロードされないコード領域を調査を参照して下さい。

    • [code region (コード領域)] ペインの [Estimated Bounded By (推測される制限)] グループの [Bounded By (制限)] カラムを調査して、コード領域のパフォーマンスを制限するボトルネックを特定します (境界セクションを参照)。メトリックは、コード領域内の 1 つ以上のボトルネックを示します。
    • [Estimated Bounded By (推測境界)] グループの [Throughput (スループット)] カラムで、コードの計算および L3 キャッシュの帯域幅で制限された時間を確認します。この値が高い場合、アプリケーションの計算や L3 キャッシュ向けの最適化を検討してください。
    • [Compute Estimates (計算の推測)] カラムグループのメトリックを参照して、それぞれのコード領域で使用される命令とスレッド数の詳細を確認します。
  4. [Recommendations (推奨事項)] タブで、コードをターゲットデバイスにオフロードし、コードが最大のメリットを得られるように最適化するガイドを取得します。コード領域に最適化の余地が残っている場合、またはターゲットデバイスの能力を十分に活用していない場合は、インテル® Advisor はコードの最適化に役立つヒントとコードの例を示します。
  5. [Details (詳細)] ペインで、選択したコード領域のオフロードのサマリーと詳細を表示します。

メトリックのレポートに関する詳細は、アクセラレーターのメトリックをご覧ください。

次のステップ

関連情報