collect

指定したタイプの解析を実行してデータを収集します。

GUI オプション

解析ワークフロー

[File (ファイル)] > [New (新規)] > [Start [Name] Analysis (<解析名> を開始)]

構文

-c=<string> [--action-options] [--global-options] [[--] <target> [<target options>]]

--collect=<string> [--action-options] [--global-options] [[--] <target> [<target options>]]

引数

<string> は実行する次の解析タイプです。

引数

説明

survey

ターゲット (アプリケーションの実行形式) を調査し、(より多くの) 並列処理によって利点が得られる可能性があるコードに関するデータを収集します。

dependencies

依存関係データを収集し、データ共有の問題を予測して排除します。

map

メモリー・アクセス・パターン・データを収集します。

offload

単独のコマンドでオフロードのモデル化パースペクティブ解析を実行します。

projection

ターゲットデバイス上でのパフォーマンスを予測します。

roofline

サーベイ解析の直後にトリップカウント & FLOP 解析を実行して、ハードウェアによるパフォーマンスの上限に対する実際のパフォーマンスを視覚化します。

suitability

アノテーションを追加したコードを実行してスータビリティー・データを収集し、スレッド並列処理の可能性とパフォーマンス・ゲインが得られる場所を予測します。

tripcounts

ループ反復、浮動小数点と整数演算、およびメモリー・トラフィック統計などのデータを収集して、サーベイレポートに追加します。

デフォルト

デフォルトの引数はありません。

修飾子

accuracyapp-working-dirassume-dependenciesassume-hide-taxesassume-ndim-dependencyassume-single-data-transferauto-finalizebatchingbenchmarks-synccache-configcache-simulationcache-sourcescachesimcachesim-associativitycachesim-cacheline-sizecachesim-modecachesim-sampling-factorcachesim-setscheck-profitabilityconfigcount-logical-instructionscount-memory-instructionscount-memory-objects-accessescount-mov-instructionscount-send-latencycpu-scale-factor,custom-configdata-limitdata-reuse-analysisdata-transferdata-transfer-histogramdata-transfer-page-sizedelete-tripcountsdisable-fp64-math-optimizationdry-rundurationenable-cache-simulationenable-data-transfer-analysisenforce-baseline-decompositionenforce-fallbackenforce-offloads. estimate-max-speedupevaluate-min-speedupexclude-filesexecutable-of-interestexp-dirfilter-by-scopefilter-reductionsflopforce-32bit-arithmeticsforce-64bit-arithmeticsgpugpu-carmgpu-sampling-intervalhide-data-transfer-taxignoreignore-app-mismatchignore-checksumsinstance-of-interestintegratedintervalloop-call-count-limitloop-filter-thresholdloopsmark-upmark-up-listmkl-user-modemodel-baseline-gpumodel-childrenmodel-extended-mathmodel-system-callsmodule-filtermodule-filter-modempi-rankmrte-modendim-depth-limitoption-fileoverlap-taxesprofile-gpuprofile-intel-perf-libsprofile-jitprofile-pythonprofile-stripped-binariesproject-dirquietrecord-mem-allocationsrecord-stack-framerefinalize-surveyresume-afterreturn-app-exitcodesearch-dirsearch-n-dimselectset-dependencyset-parallelset-parametershow-reportsmall-node-filterspill-analysisstack-access-granularitystack-stitchingstack-unwind-limitstacksstackwalk-modestart-pausedstatic-instruction-mixstrategysupport-multi-isa-binariestarget-devicetarget-gputarget-pidtarget-processthreadstrace-modetrace-mpitrack-memory-objectstrack-stack-accessestrack-stack-variablestrip-countsverbose

アプリケーションを調査して、(より多くの) 並列処理の利点を得られる可能性があるコード領域の候補を特定します。

advisor --collect=survey --search-dir src:r=./src --project-dir=./advi_results -- ./bin/myApplication

指定するループのメモリー・アクセス・パターン・データを収集します。

advisor --collect=map --mark-up-list=5,10,12 --search-dir src:r=./src --project-dir=./advi_results -- ./bin/myApplication

MPI クラスターの 4 つのノードのサーベイデータを収集して、共有 ./advi プロジェクト・ディレクトリーに保存します。

mpirun -n 4 "advisor --collect=survey --project-dir=./advi_results" -- <PATH>/mpi-sample/1_mpi_sample_serial

最も内側にあって合計 CPU 時間 の 2% を上回るすべてのループの依存関係データを収集します。

advisor --collect=dependencies --loops="loop-height=0,total-time>2 --project-dir=./advi_results" -- ./bin/myApplication

低い精度でオフロードのモデル化パースペクティブ解析を実行します。

advisor --collect=offload --accuracy=low --config=xehpg_512xve --search-dir src:r=./src --project-dir=./advi_results -- ./bin/myApplication

関連情報