ベクトル化パースペクティブを実行した後、コードに関連する最も重要な情報を示す結果のサマリーを確認してください。解析が終了したら、[Summary (サマリー)] タブをクリックして結果の概要を表示します。
実行時間の統計、ベクトル命令セット (および VNNI などの拡張機能が使用されているかどうか)、使用される CPU スレッド数など、プログラムの主要なパフォーマンス・メトリックを表示します。このセクションは、いくつかのサブセクションに分かれています。
アプリケーションがインテル® oneAPI マス・カーネル・ライブラリー (oneMKL) を使用する場合、Performance characteristics (パフォーマンス特性) セクションに [MKL detail (MKL の詳細)] ボタンが表示され、2 つの追加カラムを切り替えることができます。[User (ユーザー)] カラムはコードと対応する計算メトリックで費やされた時間を示し、[MKL] カラムは MKL コードと対応する計算メトリックで費やされた時間を示します。
ベクトル化の効率データは、ベクトル化されたループでのみ利用できます。
ボタンをクリックし、シングルコアまたはマルチコアのベンチマーク利用率メトリックを選択します。OP/S と帯域幅メトリックは、トリップカウントと FLOP またはルーフライン解析を実行した後に利用できます。
より高いパフォーマンスを達成するため、プログラムに適用可能な推奨を表示します。
元のスカラーループの効率と比較した実行時間統計やベクトル化効率などのパフォーマンス・メトリックから、セルフ時間でソートされる時間を要する上位 5 つのループを表示します。
検出された依存関係とメモリー・アクセス・パターンに関連する詳細情報を表示します。
[Dependencies (依存関係)] カラムは、依存関係ツールで収集された推測されるデータ共有の問題の要約を示します。並列サイトの場所に対応する [Dependencies Report (依存関係レポート)] ウィンドウを表示するには、[Site Location (サイトの位置)] カラムの関数リンクをクリックします。
[Strides Distribution (ストライド分散)] カラムは、ループ内のメモリー・アクセス・ストライド分散の比率を % 形式 (ユニットストライド、定数ストライド、可変ストライド) でレポートします。
Refinement analysis data (リファインメント解析データ) セクションの情報は、メモリー・アクセス・パターンまたは依存関係解析を実行した後でのみ利用できます。
より高いパフォーマンスを達成しようとするコード内で、最初の 5 つのループに対する確実性レベルが高い変更の提案を示します。推奨されるテキストにアクセスするには、推奨リンクをクリックします。
それぞれのコレクターの実行統計、[Collection Log (収集ログ)]、[Application Output (アプリケーション出力)]、[Collection Command Line (収集を行うコマンドライン)] リンクなどのコレクターの実行統計は、対応するレポートログと出力の詳細へリンクしています。
アプリケーション出力は、出力先をアプリケーション出力ウィンドウに設定すると利用できます。これには、[File (ファイル)] > [Options (オプション)] > [General (全般)] > [Application Output Destination (アプリケーションの出力先)] で、[Application Output window (アプリケーション出力ウィンドウ)] を選択します。
ソフトウェアおよびハードウェアの概要を含むシステム情報を表示します。