Linux* Perf ベースの独自のパフォーマンス監視システム (例えば、データセンター基盤の一部) がある場合、インテル® VTune™ プロファイラーでデータを収集できなくても次のようにインテル® VTune™ プロファイラーをデータ解析に使用できます。
注目するインテル® VTune™ プロファイラーの解析タイプを選択します。
インテル® VTune™ プロファイラーを使用して一連の Linux Perf* オプションを取得し、それらをターゲットシステムの Perf コレクションに適用します。
インテル® VTune™ プロファイラーのプロジェクトに Linux Perf* トレースをインポートし、解析を開始します。
インテル® VTune™ プロファイラーは、特定のパフォーマンス問題に注目する豊富な事前定義解析タイプを提供します。それぞれの解析タイプには、選択された低レベルのパフォーマンス・イベントのリストと、それに基づく高レベルのメトリックが含まれます。例えば、マイクロアーキテクチャー全般解析は、TMA 方法論に必要な CPU コアから必要なすべての PMU (パフォーマンス・モニタリング・ユニット) イベントを収集します。メモリーアクセス解析には、メモリー関連のパフォーマンス・メトリック (DRAM 帯域幅など) 向けに一連のコア PMU イベントとアンコア PMU イベントがあります。
必要な低レベル PMU イベントを収集するため、ネイティブ Linux Perf* インターフェイスを使用するのは複雑な場合があるため、(ドライバーを使用しない) Perf* 収集をターゲットとするインテル® VTune™ プロファイラーの設定を再利用することを検討してください。
インテル® VTune™ プロファイラーは、ドライバーを使用しないパフォーマンス・データ収集を行う場合、Linux* Perf コマンドラインを使用し、<result-folder>/data.0/perfcmd ファイルにログを記録します。適切な Perf オプションセットを取得するには、次の手順に従ってください。
パフォーマンス・プロファイルを実行する予定のシステムと同じ構成 (同一の CPU ファミリー) を持つ任意の Linux* システムにインテル® VTune™ プロファイラーをインストールします。
注目するインテル® VTune™ プロファイラーの解析を実行して、Perf* オプションを使用し perfcmd ファイルを生成します。
$ vtune-cl -r <result-folder> -collect <analysis-type> -finalization-mode=none -d 1
例えば、マイクロアーキテクチャー全般解析には次を実行します。
vtune-cl -r bogus_result -collect uarch-exploration -finalization-mode=none -d 1
異なるスレッドから<result-folder>/data.0/perfcmdファイルが生成されます。
ここでは実際のワークロードを実行する必要はありません。この実行での目的は、perfcmd ファイルを生成するだけです。
データを開くことなく収集するだけであれば、インテル® VTune™ プロファイラーのライセンスは必要ありません。
perfcmd ファイルを開いて、その内容をターゲットシステムの Linux* Perf コマンドの呼び出しにコピー&ペーストします。
Perf ツールには、https://github.com/torvalds/linux/commit/f92da71280fb8da3a7c489e08a096f0b8715f939#diff-809984534aa420619413fdf4c260605d (英語) のパッチが適用されている必要があります。Linux* カーネルバージョン 4.19 以降には、このパッチはそのまま適用できますが、それ以前のバージョンでは、手動で適用して Perf ツールを再コンパイルする必要があります。
ターゲットシステムで、Linux* Perf 設定を実行します。
インテル® VTune™ プロファイラーのプロジェクトを作成するか、既存のプロジェクトを開きます。
ツールバーの [結果をインポート] ボタンをクリックします。
[ファイルのインポートと結果の作成] ウィンドウを開きます。
[単一ファイルをインポート] オプションを選択し、Linux Perf* トレースファイルに移動します。
インテル® VTune™ プロファイラーはトレースをインポートし、デフォルトビューに結果を開きます。ビューポイントを切り替えて、最も関連性の高いビューを表示できます。例えば、マイクロアーキテクチャー全般解析には、マイクロアーキテクチャー全般ビューポイントを使用します。