インテル® VTune™ プロファイラー・ユーザーガイド

ウィンドウ: サマリー - 入出力サマリー

インテル® VTune™ プロファイラーによるパフォーマンス解析の開始点として [サマリー] ウィンドウを使用します。このウィンドウにアクセスするには、[入力と出力] ビューポイントを選択して、結果タブで [サマリー] サブタブをクリックします。

解析ターゲットに応じて、[入力と出力] ビューポイントで、[サマリー] ウィンドウは次のシステムレベルの統計を提供します。

解析メトリック

CPU メトリックのリストを調査して、アプリケーション実行全体のハイレベルの統計を把握します。

Linux* ターゲットでは、インテル® VTune™ プロファイラーはアプリケーションが I/O 依存であるか判断するのに役立つ [I/O 待機時間] メトリックを利用できます。

サマリーの I/O 待機時間

I/O 待機時間メトリックは、システムにアイドル状態のコアがある場合に、スレッドが I/O 待機状態である時間を示します。カウントされたスレッド数は、システムのアイドル状態のコア数を上回ることはありません。集約された I/O 待機時間メトリックは、[ボトムアップ] ビューの [タイムライン] ペインで利用可能な I/O 待機メトリック全体の機能です。上記の例のように、I/O 待機時間がアプリケーション経過時間の大部分を占める場合、[プラットフォーム] ウィンドウに切り替えてタイムライン上のすべてのメトリックを詳しく調査して、I/O 待機の原因を理解します。

インテル® VTune™ プロファイラーはメトリックを解析し、インテル® アーキテクチャーが提供するしきい値と比較します。しきい値を上回ると、メトリック値にパフォーマンスの問題としてフラグが追加されます。フラグ付きの値にマウスポインターを移動すると、問題の説明とチューニングの推奨が表示されます。

帯域幅利用率分布図

この分布図は、システム帯域幅が特定の値 (帯域幅ドメイン) で使用された時間を表し、しきい値により帯域幅利用率を、高、中、低、に分類します。しきい値を変更するには、下部にあるスライドバーを使用します。

この分布図は、[メモリー帯域幅を解析] オプションを有効にして収集された結果で示されます。

SPDK 情報

全体の I/O パフォーマンス統計については、[SPDK 情報] セクションを参照してください。各デバイスの操作やメトリックごとのパフォーマンスを確認するには、対応するブロックを展開して SSD 間の潜在的な I/O パフォーマンスのインバランスを特定します。

SPDK スループット

[SPDK スループット分布図] と表を調査して、選択した SPDK デバイスのスループットが低い ([低い] 利用率レベルの) 時間を特定します。

上位ホットスポット

インテル® VTune™ プロファイラーは、最もパフォーマンス・クリティカルな関数と CPU 時間を [上位ホットスポット] として表示します。これらの関数を最適化することで、一般的にアプリケーション全体のパフォーマンスが向上します。リストの関数をクリックすると、その関数の [ボトムアップ] ウィンドウが表示されます。

グレー表示された [その他] のモジュールがある場合、この表に含まれないアプリケーションのほかのすべての関数の合計値が示されます。

ビューポイント設定ファイルを介してこのリストのオブジェクト数と表示メトリックを制御できます。

ディスク入出力分布図

[ディスク入出力分布図] は、カーネル・サブシステムによるストレージ要求の速度を示し、レイテンシー分布図の予測と低速の I/O 要求の識別に役立ちます。

X 軸はストレージ要求を満たすために要した時間を示し、Y 軸はこのカテゴリー内の入出力要求の数を示しています。[操作タイプ] ドロップダウン・メニューを使用して、注目する I/O 操作のタイプを選択します。例えば、[書き込み] タイプでは、合計 0.03 秒を超えて実行された 30 個のストレージ要求は、低速として分類されます。

ディスク入出力分布図

このタイプの I/O 要求の詳細を確認するには、[ボトムアップ] ウィンドウで [タイムライン] ペインに切り替えます。

収集とプラットフォーム情報

ここでは次のデータを提供します。

アプリケーションのコマンド行

ターゲット・アプリケーションへのパス。

オペレーティング・システム

収集に使用されたオペレーティング・システム。

コンピューター名

収集に使用されたコンピューター名。

結果サイズ

インテル® VTune™ プロファイラーで収集された結果のサイズ。

収集開始時間

外部収集の開始時間 (UTC 形式)。[タイムライン] ペインで、カスタムコレクターによって提供されたパフォーマンス統計を調査できます。

収集停止時間

外部収集の停止時間 (UTC 形式)。[タイムライン] ペインで、カスタムコレクターによって提供されたパフォーマンス統計を調査できます。

コレクタータイプ

解析に使用されたデータコレクターのタイプ。次のタイプが利用できます。

CPU 情報

名前

収集に使用されたプロセッサー名。

周波数

収集に使用されたプロセッサーの周波数。

論理 CPU 数

収集に使用されたマシンの論理 CPU 数。

物理コア数

システム上の物理コア数。

ユーザー名

データ収集を開始したユーザー。このフィールドは、製品のインストール時にユーザーごとのイベントベース・サンプリング収集モードを有効にすると利用できます。

GPU 情報

名前

システムに搭載されているグラフィックス名。

ベンダー

GPU ベンダー。

ドライバー

システムにインストールされているグラフィックス・ドライバーのバージョン。

ステッピング

マイクロプロセッサーのバージョン。

EU カウント

レンダーと GPGPU エンジンの最大実行ユニット (EU) 数。このデータは、インテル® HD グラフィックスおよびインテル® Iris® グラフィックス (以降、「インテル® グラフィックス」) 固有です。

最大 EU スレッドカウント

実行ユニットごとの最大スレッド数。このデータはインテル® グラフィックス固有です。

最大コア周波数

グラフィックス・プロセッサーの最大周波数。このデータはインテル® グラフィックス固有です。

グラフィックス・パフォーマンス解析

GPU メトリック収集は、ハードウェア・レベルで有効になります。このデータはインテル® グラフィックス固有です。

一部のシステムでは、L3 ミス、メモリーアクセス、サンプラービジー、SLM アクセスなどの拡張メトリックの収集は BIOS で無効にされています。システムによっては、BIOS オプションを設定してこの収集を有効にできます。オプションの有無およびオプション名は BIOS ベンダーによって異なります。BIOS でインテル® グラフィックス・パフォーマンス・アナライザー・オプション (または等価なオプション) を有効に設定します。

関連情報