[Statistics (統計)] タブには、アルゴリズムで導入されている並列構造の効率情報も含まれます。このデータは、[Statistics (統計)] グループの [Parallel Efficiency (並列効率)] タブに表示されます。

カーネルの各インスタンスのデータ並列構造の効率。このカラムは、実行を理解するのに役立ち、パフォーマンスを向上する推論を行います。
- カーネル名を正しくデマングルできる場合、並列アルゴリズムはカーネル名の下に入れ子にされます。
- [効率] カラムは、アルゴリズム名に関連付けられているアルゴリズムの効率を示します。ワーカースレッドの場合、[効率] カラムは実行に参加するスレッドの効率を示します。このデータは通常、並列構造で費やされた合計時間と、スレッドがほかの並列構造に参加するために消費した時間から求められます。
- [タスク数] カラムは、参加するスレッドによって実行されたタスクの数を示します。
- 持続期間は、参加するスレッドが並列構造のタスクを実行するのに費やす時間を示します。
- CPU 時間は、並列構造の実時間のパーセンテージとして表される [Duration (持続期間)] カラムのデータです。
- スレッドが並列構造のタスク実行に 100% 参加している場合、[Other Time (その他の時間)] は 0 になります。ただし、oneTBB などのランタイムでは、参加するスレッドがデバイスに送信された他の並列構造のタスクをスチールして、動的なロードバランスとスループットを向上させることがあります。その場合、[Other Time (その他の時間)] カラムには、参加するスレッドが他の並列構造のタスク実行に費やした合計実時間のパーセンテージが表示されます。
- [Fork Imbalance (フォーク・インバランス)] は、並列構造のタスクの実行に参加するため、スレッドをウェイクアップするペナルティーを示します。詳細については、「スタートアップのペナルティー」を参照して下さい。
- [Join Imbalance (ジョイン・インバランス)] は、ワーカースレッドによる並列構造のタスクのインバランスな実行の割合を示します。詳細については、データ並列効率を参照して下さい。