< 目次

GPU に最適な HPCG 構成の選択

Intel® Optimized HPCG のパフォーマンスは、ホストノードのハードウェア構成、ノードに接続された 1 つ以上のデバイス、および使用される MPI 実装など、多くのシステム・パラメーターに依存します (ただし、これらに限定されません)。特定のシステム構成で最適なパフォーマンスを得るには、以下のパラメーターの組み合わせを選択します。

インテル® データセンター GPU マックスシリーズ GPU では、ローカル問題のサイズが大きいタイルごとに 1 つの MPI プロセスを使用することを推奨します。最新の GPU では、タイルあたりのラスト・レベル・キャッシュ (LLC) のサイズが非常に大きくなるか小さくなる可能性があり、デバイスメモリーがかなり制限される可能性があります。したがって、現在の HPCG ベンチマーク要件に準拠するには、ローカル問題のサイズ (nx x ny x nz) は、ベンチマークからのベクトルのサイズ (各ベクトルは nx*ny*nz*sizeof(double) バイト) がデバイスの LLC に完全に収まらない程度に大きくする必要がありますが、完全なベンチマーク・システムはデバイスメモリーに収まらなければなりません。

製品および性能に関する情報

性能は、使用状況、構成、およびその他の要因によって異なります。詳細については、www.Intel.com/PerformanceIndex (英語) をご覧ください。

改訂 #20201201