最適な N 次元オフロードの検索を有効にします。
--search-n-dim --no-search-n-dim |
オン (search-n-dim)
search-n-dim を使用すると、最大 3 階層入れ子になった並列ループを N 次元オフロードに組み合わせることができます。これにより、GPU での推定実行時間と計算時間を減らすことができます。no-search-n-dim を使用して、各ループのオフロードを個別に見積もります。
このオプションを --threads や --enable-batching と同時に指定してはなりません。
サーベイ解析を実行します。
特性化ステージのトリップカウント & FLOP 解析を実行します。
ターゲットデバイスでアプリケーションのパフォーマンスをモデル化する際に、最適な N 次元オフロードの検索を行いません。
advisor --collect=survey --static-instruction-mix --project-dir=./advi_results -- ./myApplication
advisor --collect=tripcounts --flop --enable-data-transfer-analysis --project-dir=./advi_results -- ./myApplicationadvisor --collect=projection --no-search-n-dim --project-dir=./advi_results