Intel® Optimized High Performance Conjugate Gradient Benchmark (Intel® Optimized HPCG) は、HPCG ベンチマーク (http://hpcg-benchmark.org) の CPU および GPU に最適化された実装を提供します。CPU バージョンは、インテル® アドバンスト・ベクトル・エクステンション 2 (インテル® AVX2) およびインテル® アドバンスト・ベクトル・エクステンション 512 (インテル® AVX-512) をサポートするインテル® Xeon® プロセッサー用に最適化されています。GPU バージョンは、インテル® データセンター GPU マックスシリーズ向けに最適化されています。
HPCG ベンチマークは、重要なクラスター・アプリケーションの広範なセットに適したメトリックを提供することにより、TOP500 (http://www.top500.org) システムのランク付けに使用される HPL (High Performance Linpack) ベンチマークを補完することを目的としています。
HPCG ベンチマークの実装は、楕円型偏微分方程式の 3 次元 (3D) の規則的な 27 ポイント離散化に基づいています。実装は、3D ドメインを呼び出してすべての利用可能な MPI ランクの 3D 仮想プロセスグリッドをフィルします。HPCG ベンチマークは、前処理付き共役勾配法 (CG) を使用して中間の連立方程式を解き、三角前進解法と後退解法に必要なローカルおよび対称ガウス・ザイデル前処理ステップを取り入れています。ベンチマークが実際のアプリケーションにより適するように、合成マルチグリッド V サイクルが各前処理ステップで使用されます。HPCG ベンチマークは、行列乗算をローカルに実装します。実装には、近隣プロセス間の初期ハロ交換も含まれます。ベンチマークは、多くの科学的なワークロードを左右する不規則なメモリーアクセスおよび細粒度の再帰計算を示します。
Intel® Optimized HPCG には、以下を追加するのに必要な変更を加えた HPCG v3.1 リファレンス実装のソースコードが含まれています。
インテル® アーキテクチャー向けの最適化
インテル® oneAPI マス・カーネル・ライブラリー (インテル® oneMKL) にリンクする、事前ビルドされたベンチマーク実行ファイル
スパース三角ソルバー (SpTRSV)
対称ガウス・ザイデル・スムーザー (SYMGS)
インテル® oneAPI マス・カーネル・ライブラリー (インテル® oneMKL) のインスペクター実行スパース BLAS カーネル SpMV、TRSV、および SYMGS は、インスペクター実行モデルを使用して実装されています。検査ステップは、入力行列に最適なアルゴリズムを選択して、実行ステップで高いパフォーマンスが得られるように行列を特別な内部表現に変換します。
Intel® GPU Optimized HPCG には、以下を追加するのに必要な変更を加えた HPCG v3.1 リファレンス実装のソースコードが含まれています。
SYCL* および C++ 言語を使用してカーネルのホストとデバイスの効率的なスケジューリングを行う
インテル® GPU アーキテクチャー最適化
対称ガウス・ザイデルスムーザーなどの主要な計算カーネルの一部で、より多くのタスク並列処理を可能にするスパース行列の対称順列。
スパース行列を Ellpack Block Sparse (ESB) 行列形式に変換して、GPU ハードウェアでベクトル化可能な負荷をより効率的に実行します。
SYCL* で記述され、低レベルのインテル® GPU プログラミング用の「明示的 SIMD」(ESIMD) SYCL* 拡張機能を使用するコア計算カーネル:
疎行列-ベクトル乗算 (SpMV)
スパース三角ソルバー (SpTRSV)
対称ガウス・ザイデル・スムーザー (SYMGS)
このパッケージを使用して、インテル® データセンター GPU マックス・シリーズ・ファミリーをベースとする分散メモリーシステムのパフォーマンスを評価します。
製品および性能に関する情報 |
---|
性能は、使用状況、構成、およびその他の要因によって異なります。詳細については、www.Intel.com/PerformanceIndex (英語) をご覧ください。 改訂 #20201201 |