自動チャンク化

自動チャンク化#

並列ループ構造には、スケジュールされるワークのチャンクごとにオーバーヘッド・コストが含まれます。oneAPI スレッディング・ビルディング・ブロック (oneTBB) は、負荷分散の要求に応じてチャンクサイズを自動的に選択します。このヒューリスティックは、負荷分散の十分な可能性を残しながら、オーバーヘッドを制限しようとします。

警告

通常、ループで parallel_for を有効に使用するには、ループは少なくとも 100 万クロックサイクル消費する必要があります。例えば、2 GHz プロセッサーで少なくとも 500 マイクロ秒かかるループは、parallel_for のメリットが得られる可能性があります。

ほとんどの用途では、デフォルトの自動チャンク化が推奨されます。ただし、ほとんどのヒューリスティックと同様に、チャンクサイズをより正確に制御するとパフォーマンスが向上する場合があります。