指定したタイプの解析を実行してデータを収集します。
解析ワークフロー
[File (ファイル)] > [New (新規)] > [Start [Name] Analysis (<解析名> を開始)]
-c=<string> [--action-options] [--global-options] [[--] <target> [<target options>]] --collect=<string> [--action-options] [--global-options] [[--] <target> [<target options>]] |
<string> は実行する次の解析タイプです。
引数 |
説明 |
|---|---|
survey |
ターゲット (アプリケーションの実行形式) を調査し、(より多くの) 並列処理によって利点が得られる可能性があるコードに関するデータを収集します。 |
dependencies |
依存関係データを収集し、データ共有の問題を予測して排除します。 |
map |
メモリー・アクセス・パターン・データを収集します。 |
offload |
単独のコマンドでオフロードのモデル化パースペクティブ解析を実行します。 |
projection |
ターゲットデバイス上でのパフォーマンスを予測します。 |
roofline |
サーベイ解析の直後にトリップカウント & FLOP 解析を実行して、ハードウェアによるパフォーマンスの上限に対する実際のパフォーマンスを視覚化します。 |
suitability |
アノテーションを追加したコードを実行してスータビリティー・データを収集し、スレッド並列処理の可能性とパフォーマンス・ゲインが得られる場所を予測します。 |
tripcounts |
ループ反復、浮動小数点と整数演算、およびメモリー・トラフィック統計などのデータを収集して、サーベイレポートに追加します。 |
デフォルトの引数はありません。
accuracy、app-working-dir、assume-dependencies、assume-hide-taxes、assume-ndim-dependency、assume-single-data-transfer、auto-finalize、batching、benchmarks-sync、cache-config、cache-simulation、cache-sources、cachesim、cachesim-associativity、cachesim-cacheline-size、cachesim-mode、cachesim-sampling-factor、cachesim-sets、check-profitability、config、count-logical-instructions、count-memory-instructions、count-memory-objects-accesses、count-mov-instructions、count-send-latency、cpu-scale-factor,custom-config、data-limit、data-reuse-analysis、data-transfer、data-transfer-histogram、data-transfer-page-size、delete-tripcounts、disable-fp64-math-optimization、dry-run、duration、enable-cache-simulation、enable-data-transfer-analysis、enforce-baseline-decomposition、enforce-fallback、enforce-offloads. estimate-max-speedup、evaluate-min-speedup、exclude-files、executable-of-interest、exp-dir、filter-by-scope、filter-reductions、flop、force-32bit-arithmetics、force-64bit-arithmetics、gpu、gpu-carm、gpu-sampling-interval、hide-data-transfer-tax、ignore、ignore-app-mismatch、ignore-checksums、instance-of-interest、integrated、interval、loop-call-count-limit、loop-filter-threshold、loops、mark-up、mark-up-list、mkl-user-mode、model-baseline-gpu、model-children、model-extended-math、model-system-calls、module-filter、module-filter-mode、mpi-rank、mrte-mode、ndim-depth-limit、option-file、overlap-taxes、profile-gpu、profile-intel-perf-libs、profile-jit、profile-python、profile-stripped-binariesproject-dir、quiet、record-mem-allocations、record-stack-frame、refinalize-survey、resume-after、return-app-exitcode、search-dir、search-n-dim、select、set-dependency、set-parallel、set-parameter、show-report、small-node-filter、spill-analysis、stack-access-granularity、stack-stitching、stack-unwind-limit、stacks、stackwalk-mode、start-paused、static-instruction-mix、strategy、support-multi-isa-binaries、target-device、target-gpu、target-pid、target-process、threads、trace-mode、trace-mpi、track-memory-objects、track-stack-accesses、track-stack-variables、trip-counts、verbose
アプリケーションを調査して、(より多くの) 並列処理の利点を得られる可能性があるコード領域の候補を特定します。
advisor --collect=survey --search-dir src:r=./src --project-dir=./advi_results -- ./bin/myApplication指定するループのメモリー・アクセス・パターン・データを収集します。
advisor --collect=map --mark-up-list=5,10,12 --search-dir src:r=./src --project-dir=./advi_results -- ./bin/myApplicationMPI クラスターの 4 つのノードのサーベイデータを収集して、共有 ./advi プロジェクト・ディレクトリーに保存します。
mpirun -n 4 "advisor --collect=survey --project-dir=./advi_results" -- <PATH>/mpi-sample/1_mpi_sample_serial最も内側にあって合計 CPU 時間 の 2% を上回るすべてのループの依存関係データを収集します。
advisor --collect=dependencies --loops="loop-height=0,total-time>2 --project-dir=./advi_results" -- ./bin/myApplication低い精度でオフロードのモデル化パースペクティブ解析を実行します。
advisor --collect=offload --accuracy=low --config=xehpg_512xve --search-dir src:r=./src --project-dir=./advi_results -- ./bin/myApplication