search-n-dim

最適な N 次元オフロードの検索を有効にします。

構文

--search-n-dim

--no-search-n-dim

デフォルト

オン (search-n-dim)

影響するアクション

collect=projection

collect=offload

使用法

search-n-dim を使用すると、最大 3 階層入れ子になった並列ループを N 次元オフロードに組み合わせることができます。これにより、GPU での推定実行時間と計算時間を減らすことができます。no-search-n-dim を使用して、各ループのオフロードを個別に見積もります。

依存関係のないループのみを N 次元オフロードに結合できます。

このオプションを --threads--enable-batching と同時に指定してはなりません。

  1. サーベイ解析を実行します。

  2. 特性化ステージのトリップカウント & FLOP 解析を実行します。

  3. ターゲットデバイスでアプリケーションのパフォーマンスをモデル化する際に、最適な N 次元オフロードの検索を行いません。

advisor --collect=survey --static-instruction-mix --project-dir=./advi_results -- ./myApplication
advisor --collect=tripcounts --flop --enable-data-transfer-analysis --project-dir=./advi_results -- ./myApplication
advisor --collect=projection --no-search-n-dim --project-dir=./advi_results

関連情報