インテル® VTune™ プロファイラー・ユーザーガイド

インテル® Xeon Phi™ プロセッサー・ターゲット

次の図は、インテル® メニー・インテグレーテッド・コア (インテル® MIC) アーキテクチャーに基づく、インテル® Xeon Phi™ プロセッサー (開発コード名 Knights Landing と Knights Mill) で実行されているアプリケーションの解析、またはインテル® VTune™ プロファイラーを使用したシステム全体の解析に必要な基本的な手順を示します。解析は、インテル® Xeon Phi™ プロセッサーのセルフブート版を搭載した Linux* ターゲットでサポートされます。HPC パフォーマンス特性、メモリーアクセス、マイクロアーキテクチャー全般、ホットスポットの事前定義済み解析タイプを実行するか、カスタム解析タイプを作成するかを選択できます。

ユーザーモード・サンプリング・モードのホットスポットやスレッド化解析などのインストルメント・ベースの収集では、ワーカースレッド数が多いとオーバーヘッドが大きくなる可能性があります。代わりに、ハードウェア・イベントベース・サンプリング・モードのホットスポット解析や HPC パフォーマンス特性解析を使用して、アプリケーションのスケーラビリティーを調査します。

分布図に示されるワークフローは、解析処理を高速に行う推奨される手順です。インテル® Xeon Phi™ プロセッサー上ですべてのインテル® VTune™ プロファイラーの処理を実行することは可能ですが、ファイナライズとビジュアルな表示には時間がかかる場合があります。ターゲットのインテル® Xeon Phi™ プロセッサー上で、通常の解析フローを直接行うことができます。

必要条件

HPC パフォーマンス特性、メモリーアクセス、マイクロアーキテクチャー全般、またはホットスポット (ハードウェア・イベントベース・サンプリング・モード) などのハードウェア・イベントベース・サンプリング収集タイプでは、サンプリング・ドライバーをインストールすることを推奨します。サンプリング・ドライバーがインストールされていないと、インテル® VTune™ プロファイラーは Linux* Perf を使用して動作します。次のシステム構成の設定に注意してください。

1. インテル® Xeon Phi™ プロセッサーを搭載するターゲットシステムで解析を設定して実行

ターゲットシステムで解析を設定して実行するには、次の 2 つの方法があります。

2. ホストシステム上で結果を開く

結果をホストシステムにコピーします (ターゲットシステムで収集された結果がホストと共有されていない場合)。コマンドでファイナライズの遅延が指定されている場合、ファイナライズが行われます。

  1. SSH などを使用して結果をホストシステムにコピーします。

  2. [オプション] モジュールへのパスがターゲットシステムと異なる場合、結果ファイルと検索ディレクトリーを適切なバイナリーに指定して結果をファイナライズします。次に例を示します。
    vtune -finalize -r <my_result_dir> -search-dir <my_binary_dir>

3. 解析結果を開いて解釈

結果を表示する方法は 2 つあります。

関連情報