インテル® VTune™ プロファイラー・ユーザーガイド

CPU 利用率

メトリックの説明

このメトリックは、アプリケーションの並列処理効率を評価します。これは、並列ランタイムシステムによるオーバーヘッドを除く、アプリケーションで使用されるシステム内のすべての論理 CPU コアの比率を予測します。100% の利用率は、アプリケーションが実行中にすべての論理 CPU コアをビジーに保つことを意味します。

解析タイプに応じて、[ボトムアップ] グリッド (HPC パフォーマンス特性)、[タイムライン] ペイン、および [サマリー] ウィンドウの [効率良い CPU 利用率の分布図] に CPU 利用率データが表示されます。

分布図では、インテル® VTune™ プロファイラーはプロセッサー利用率スケールを識別し、ターゲット CPU 利用率を計算して、プロセッサーのコア数に応じてデフォルトの利用率範囲を定義します。必要に応じて、スライドバーを調整することで利用率範囲のしきい値を変更できます。

利用率タイプ

デフォルトの色

説明

アイドル

アイドル利用率。デフォルトでは、すべてのスレッドで CPU 時間が 1 コアの CPU 時間の 100% の 0.5 未満である場合、CPU 利用率はアイドルとして分類されます。式: i=1,ThreadsCount(CPUTime(T,i)/T) < 0.5。ここで CPUTime(T,i) はスレッド i の間隔 T での合計 CPU 時間です。

低い

低い利用率。デフォルトでは、低い利用率は、同時に実行される CPU 数がターゲットの CPU 利用率の 50% 未満の状態です。

OK

許容 (OK) できる利用率。デフォルトでは、OK となる利用率は、同時に実行される CPU 数がターゲットの CPU 利用率の 51% ~ 85% の状態です。

理想的

理想的な利用率。デフォルトでは、理想的な利用率は、同時に実行される CPU 数がターゲットの CPU 利用率の 86% ~ 100% の状態です。

インテル® VTune™ プロファイラーは、スピンオーバーヘッドをアイドル CPU 利用率として扱います。コールスタック情報の利用状況によっては、異なる解析タイプでスピンとオーバーヘッド時間を異なって認識することがあります。そのため、解析タイプごとに CPU 利用率のグラフ表示が異なることがあります。

HPC パフォーマンス特性解析では、インテル® VTune™ プロファイラーは、インテル® Xeon Phi™ プロセッサー開発コード名 Knights Mill と Knights Landing を除くすべてのシステムで、効率的な物理コア利用率効率的な論理コア利用率を区別します。

インテル® Xeon Phi™ プロセッサー開発コード名 Knights Mill と Knights Landing やインテル® ハイパースレッディング・テクノロジー (インテル® HT テクノロジー) が無効なシステムでは、通常の効率的な CPU 利用率メトリックのみが示されます。

CPU 利用率とスレッド効率

論理的に待機している (スレッドがスピンしている) 間に CPU でスレッドコードを実行すると、CPU 利用率はスレッド効率 (スレッド化解析で利用可能) よりも高くなります。

次の場合に CPU 利用率はスレッド効率よりも低くなります。

  1. 並列性レベルが利用可能なコア数よりも高いと (オーバーサブスクリプション)、このレベルの CPU 利用率に達するのは困難です。一般に、オーバーサブスクリプションが頻繁に発生すると、過度なコンテキスト・スイッチが生じるため、アプリケーションのパフォーマンスに悪影響を与えます。

  2. プロファイルされたプロセスがスワップアウトされた期間がありました。そのため、論理的には待機状態ではありませんでしたが、いずれの CPU にもスケジュールされていません。

考えられる問題

このメトリックの値が低いと、ロード・インバランス、スレッドランタイムのオーバーヘッド、同期競合、または低いスレッド/プロセスの利用により、論理 CPU コアの利用率が低い可能性を示します。MPI と OpenMP* 並列処理の効率を予測するには CPU 利用率のサブメトリックを調査するか、スレッド化解析を実行してその他の並列ランタイムの並列処理のボトルネックを特定します。

関連情報