素早く、賢く予測する: インテル® Xeon® プロセッサーによるリアルタイム気象シミュレーション

HPC

この記事は、インテルのウェブサイトで公開されている「Predict Faster. Predict Smarter. Real-Time Weather Simulation Powered by Intel® Xeon® Processors」を iSUS で翻訳した日本語参考訳です。原文は更新される可能性があります。原文と翻訳文の内容が異なる場合は原文を優先してください。


著者: Jimmy Leon、インテル社エンジニアリング・マネージャー

貢献者:
Andrey Ovsyannikov、インテル社ソフトウェア・イネーブリングおよび最適化エンジニア
Joseph Robichaux、インテル社システムおよびソフトウェア最適化エンジニア
David Trusov、テクニカル・マーケティング・エンジニア、チームのメンバー

より正確で詳細な天気予報の需要が急増しています。緊急対応要員がハリケーンの進路を予測するのを支援する、または農家が灌漑を最適化するのを支援する場合でも、シミュレーションの精度は、純粋な計算能力に依存しています。現代の数値気象予報 (NWP) は、一度の実行で数千個のコアを活用しており、インテル® Xeon® プロセッサーはこの進化の中心的な役割を果たしています。

インテル® Xeon® プロセッサーは、数値気象予報 (NWP) のワークロードで明確かつ測定可能なメリットをもたらします。シミュレーションのスループットとデータ処理の両方を高速化し、正確な予報をタイムリーに作成する重要な要素を実現します。実世界の数値天気予報 (NWP) ベンチマークにおいて、インテル® Xeon® 6980P は、AMD EPYC 9755 プロセッサーと比較して、気象研究予測モデル (WRF) モデルでは最大 1.15 倍、スケール間予測モデル (MPAS) では最大 1.33 倍のパフォーマンスを発揮し、最新の気象モデリングにおける高効率なコンピューティング・プラットフォームとしての強みを際立たせています。

 

気象モデル化にインテル® Xeon® プロセッサーが必要な理由

気象シミュレーションは、「メモリー帯域幅の制約」を受けやすいことで知られており、これはプロセッサーとメモリー間のデータ転送速度がシステムのパフォーマンスを制限することが多いことを意味します。気象のモデル化アプリケーションは、バイト対浮動小数点 (BF) 比が高く、これは、プロセッサーの速度や 1 秒あたりの浮動小数点演算回数 (FLOPS) だけでなく、メモリー帯域幅に大きく依存しています。インテル® Xeon® プロセッサー・ファミリーの最近の進化は、これらの課題に対処します:

  • メモリー帯域幅: 最新のインテル® Xeon® 6 プロセッサーは、マルチプレックス・ランク・デュアル・インライン・メモリ・モジュール (MRDIMM) テクノロジーを搭載しており、WRF や MPAS といった気象モデルのパフォーマンスを大幅に向上させます。インテル® Xeon® 6900P プロセッサーを搭載するプラットフォームは、デュアル・ソケット・プラットフォームで最大 1.6 テラバイト/秒 (Tb/秒) の理論上のメモリー帯域幅を実現します。(1)
  • 大規模並列処理: WRF システムのようなモデルは、数千個のコアにスケールできるように設計されています。気象シミュレーションにおいて、インテル® Xeon® 6900P プロセッサーは、メモリー帯域幅とパフォーマンス・コア (P コア) のバランスの取れた組み合わせを提供します。
  • インテル® oneAPI HPC ツールキットとインテル® MPI ライブラリー: インテル® oneAPI HPC ツールキットは、最適化コンパイラー、ライブラリー、およびツールを備え、マルチノードの大規模シミュレーションにおける高速通信を実現します。これにより、気象学者は膨大なデータセットをより効率良く処理できるようになり、結果として異常気象の予測精度が向上します。

 

数値気象シミュレーションの競争力

WRF を使用するテストケース: WRF モデルは、大気研究と実用的な予報の両方を目的として設計された、オープンソースの中規模数値気象予報システムです。これは、世界中の政府機関、学術機関、民間団体において、運用予測、研究、およびリアルタイムの大気質予測、ハリケーン予測、気候シミュレーションなどの専門的な用途に利用されています。

CONUS 2.5-kilometer (km) ベンチマークは、米国本土全域における WRF モデルの性能評価に使用される高解像度気象モデリングのテストケースです。このベンチマークは、米国全土で 2.5km の解像度で 6 時間予報(多くの場合、後半の 3 時間に焦点を当てる)をシミュレートします。インテル® Xeon® 6980P 128 コア・プロセッサーは、128 コアの AMD EPYC 9755 と比較して最大 1.15 倍のパフォーマンス向上を実現しました。192 コアの AMD EPYC 9965 は、128 コアの AMD EPYC 9755 とほぼ同等の性能を達成しています。

図 1: インテル® Xeon® 6980P は、WRF パフォーマンスにおいて AMD EPYC 9755 および AMD EPYC 9965 を最大 1.15 倍上回ります。

 

MPAS を使用するテストケース: MPAS は、大気、海洋、その他の地球システム・シミュレーション・コンポーネントを開発する共同プロジェクトとして、気候、地域気候、気象の研究に利用されています。

MPAS-A システムは大気の状態を重視しており、非構造化ボロノイメッシュを用いて可変解像度シミュレーションを実現することで、地球規模の環境において詳細な地域規模の予測を可能にします。MPAS-A は、熱帯気象学、極端気象現象、および長期気候シミュレーションに関する研究でよく利用されています。インテル® Xeon® 6980P 128 コア・プロセッサーは、128 コアの AMD EPYC 9755 と比較して、最大 1.33 倍の MPAS パフォーマンスを実現しました。

図 2: インテル® Xeon® 6980P は、AMD EPYC 9755 を最大 1.33 倍上回る性能を発揮します。

 

以下の動画では、MPAS-A テストケースを実行した際のインテル® Xeon® 6980P プロセッサーと AMD EPYC 9755 プロセッサーの性能を比較しています。

 

インテル® Xeon® プロセッサー: 最新の気象モデリング向け高効率プロセッサー

インテル® Xeon® 6980P プロセッサーは、シミュレーション速度の向上とメモリー帯域幅の拡大を実現することで、数値気象予報 (NWP) のパフォーマンスを大幅に向上させます。これらは、タイムリーかつ正確な予報を行う上で不可欠な要素です。

最高のパフォーマンスを実現するため、チューニング・ガイド (英語) を参照して、インテルのツールを使用してインテル® Xeon® プロセッサーを搭載するハイパフォーマンス・コンピューティング (HPC) プラットフォームをチューニングする方法を学んでください。このガイドには、すべての HPC アプリケーションに関する一般的な BIOS および Linux の構成ガイドラインに加え、WRF や MPAS-A を含む、厳選された HPC アプリケーションおよびベンチマークのビルドと実行手順が含まれています。

 

製品とパフォーマンス情報

WRF

インテル® Xeon® 6980P については 2024 年 12 月時点、AMD EPYC 9755 については 2025 年 1 月時点、AMD EPYC 9965 については 2025 年 10 月時点のインテルによるテスト結果です。結果は異なる場合があります。インテルのテクノロジーを使用するには、対応したハードウェア、ソフトウェア、またはサービスの有効化が必要となる場合があります。

ハードウェア構成

インテル® Xeon® 6980P: 1 ノードあたり、2 つのインテル® Xeon® 6980P プロセッサー、128 コア、500W TDP、HT 有効、ターボブースト有効、合計メモリー 1536GB (24x64GB DDR5 8800 MT/秒 [8800 MT/秒])、BIOS BHSDCRB1.IPC.3544.P15.2410232346、マイクロコード 0x1000341、2 つのイーサネット・コントローラー X710 (10GBASE-T)、1 つの 3.5T SAMSUNG MZWLJ3T8HBLS-00007、Ubuntu 22.04.5 LTS、6.5.0-21-generic。物理コアのみを使用します。2024 年 12 月にインテルによってテストされました。

AMD EPYC 9755: 1 ノードあたり、2 つの AMD EPYC 9755 プロセッサー、128 コア、500W TDP、SMT 有効、ターボブースト有効、合計メモリー 1536GB (24x64GB DDR5 6400 MT/秒 [6000 MT/秒])、BIOS 1.1、マイクロコード 0xb002116、2 つのイーサネット・コントローラー X710 (10GBASE-T)、1 つの 3.5T Micron_7450_MTFDKCB3T8TFR、Ubuntu 24.04.1 LTS、6.8.0-48-generic。物理コアのみを使用します。2025 年 1 月にインテルによってテストされました。

AMD EPYC 9965: 1 ノードあたり、2 つの AMD EPYC 9965 プロセッサー、192 コア、500W TDP、SMT 有効、ターボブースト有効、合計メモリー 1536GB (24x64GB DDR5 6400 MT/秒 [6000 MT/秒])、BIOS 1.1、マイクロコード 0xb002116、2 つのイーサネット・コントローラー X710 (10GBASE-T)、1 つの 3.5T Micron_7450_MTFDKCB3T8TFR、Ubuntu 24.04.1 LTS、6.8.0-48-generic。物理コアのみを使用します。2025 年 10 月にインテルによってテストされました。

ソフトウェア構成

WRF (CONUS-2.5km): インテル: アプリケーションのバージョン: v4.5.2 (英語)、conus2.5km
AMD: アプリケーションのバージョン: v4.5.2 (英語)、conus2.5km
インテル® Fortran コンパイラー、バージョン 2025.0
インテル® MPI ライブラリー、バージョン 2021.14

MPAS

2025 年 3 月にインテルによってテストされました。結果は異なる場合があります。インテルのテクノロジーを使用するには、対応したハードウェア、ソフトウェア、またはサービスの有効化が必要となる場合があります。

ハードウェア構成

インテル® Xeon® 6980P: 1 ノードあたり、2 つのインテル® Xeon® 6980P プロセッサー、128 コア、500W TDP、HT 有効、ターボブースト有効、合計メモリー 3072GB (24x128GB DDR5 8800 MT/秒 [8800 MT/秒])、BIOS BHSDCRB1.IPC.3544.P15.2410232346、マイクロコード 0x1000341、1 つのイーサネット・コントローラー I210 (1000BASE-T)、1 つの 3.6T INTEL SSDPE2KX040T8、Ubuntu 24.04.2 LTS、6.8.0-47-generic。物理コアのみを使用します。2025 年 3 月にインテルによってテストされました。

AMD EPYC 9755: 1 ノードあたり、2 つの AMD EPYC 9755 プロセッサー、128 コア、500W TDP、SMT 有効、ターボブースト有効、合計メモリー 1536GB (24x64GB DDR5 6400 MT/秒 [6000 MT/秒])、BIOS 1.1、マイクロコード 0xb002116、2 つのイーサネット・コントローラー X710 (10GBASE-T)、1 つの 3.5T Micron_7450_MTFDKCB3T8TFR、Ubuntu 24.04.1 LTS、6.8.0-47-generic。物理コアのみを使用します。2025 年 3 月にインテルによってテストされました。

ソフトウェア構成

インテル® MPI ライブラリー 2021 Update 15、インテル® oneAPI HPC ツールキット、MPAS バージョン 7.3 (英語) (720 タイムステップ、3 日間の予測)。

(1) 8800 MT/秒のデータレートは、64 ビットのバス幅を使用した場合、8 バイトになります。帯域幅 (BW) = データレート (MT/秒) * バス幅 (ビット) /(1 バイトあたりのビット数 (8) * 1000) = 8800 MT * 64 ビット/(8 ビット/バイト * 1000) = 70.4 GB/秒 (DIMM あたり)。24 チャネルの場合 = 1689.6 TB/秒

 

法務上の注意書き

性能は、使用状況、構成、その他の要因によって異なります。詳細については、パフォーマンス・インデックス・サイト (英語) を参照してください。
性能の測定結果はシステム構成の日付時点のテストに基づいています。また、現在公開中のすべてのセキュリティー・アップデートが適用されているとは限りません。詳細については参考資料を参照してください。絶対的なセキュリティーを提供できるコンピューター・システムはありません。
コスト対効果は異なる場合があります。
インテルのテクノロジーを使用するには、対応したハードウェア、ソフトウェア、またはサービスの有効化が必要となる場合があります。
© Intel Corporation. Intel、インテル、Intel ロゴ、その他のインテルの名称やロゴは、Intel Corporation またはその子会社の商標です。* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。

タイトルとURLをコピーしました