< 目次

Intel® Optimized HPCG の概要

Intel® Optimized High Performance Conjugate Gradient Benchmark (Intel® Optimized HPCG) は、HPCG ベンチマーク (http://hpcg-benchmark.org) の CPU および GPU に最適化された実装を提供します。CPU バージョンは、インテル® アドバンスト・ベクトル・エクステンション 2 (インテル® AVX2) およびインテル® アドバンスト・ベクトル・エクステンション 512 (インテル® AVX-512) をサポートするインテル® Xeon® プロセッサー用に最適化されています。GPU バージョンは、インテル® データセンター GPU マックスシリーズ向けに最適化されています。

HPCG ベンチマークは、重要なクラスター・アプリケーションの広範なセットに適したメトリックを提供することにより、TOP500 (http://www.top500.org) システムのランク付けに使用される HPL (High Performance Linpack) ベンチマークを補完することを目的としています。

HPCG ベンチマークの実装は、楕円型偏微分方程式の 3 次元 (3D) の規則的な 27 ポイント離散化に基づいています。実装は、3D ドメインを呼び出してすべての利用可能な MPI ランクの 3D 仮想プロセスグリッドをフィルします。HPCG ベンチマークは、前処理付き共役勾配法 (CG) を使用して中間の連立方程式を解き、三角前進解法と後退解法に必要なローカルおよび対称ガウス・ザイデル前処理ステップを取り入れています。ベンチマークが実際のアプリケーションにより適するように、合成マルチグリッド V サイクルが各前処理ステップで使用されます。HPCG ベンチマークは、行列乗算をローカルに実装します。実装には、近隣プロセス間の初期ハロ交換も含まれます。ベンチマークは、多くの科学的なワークロードを左右する不規則なメモリーアクセスおよび細粒度の再帰計算を示します。

Intel® Optimized HPCG Benchmark

Intel® Optimized HPCG には、以下を追加するのに必要な変更を加えた HPCG v3.1 リファレンス実装のソースコードが含まれています。

これらは、インテル® AVX2 とインテル® AVX-512 命令セット向けに最適化されています。このパッケージを使用して、インテル® Xeon® プロセッサー E3、インテル® Xeon® プロセッサー E5、インテル® Xeon® プロセッサー E7、およびインテル® Xeon® スケーラブル・プロセッサー・ファミリーの任意の世代をベースとする分散メモリーシステムのパフォーマンスを評価できます。

インテル® oneAPI マス・カーネル・ライブラリー (インテル® oneMKL) のインスペクター実行スパース BLAS カーネル SpMV、TRSV、および SYMGS は、インスペクター実行モデルを使用して実装されています。検査ステップは、入力行列に最適なアルゴリズムを選択して、実行ステップで高いパフォーマンスが得られるように行列を特別な内部表現に変換します。

Intel® GPU Optimized HPCG Benchmark

Intel® GPU Optimized HPCG には、以下を追加するのに必要な変更を加えた HPCG v3.1 リファレンス実装のソースコードが含まれています。

このパッケージを使用して、インテル® データセンター GPU マックス・シリーズ・ファミリーをベースとする分散メモリーシステムのパフォーマンスを評価します。

製品および性能に関する情報

性能は、使用状況、構成、およびその他の要因によって異なります。詳細については、www.Intel.com/PerformanceIndex (英語) をご覧ください。

改訂 #20201201