インテル Parallel Universe 37 号日本語版の公開

インテル Parallel Universe マガジンの最新号が公開されました。

注目記事: 第 2 世代インテル® Xeon® スケーラブル・プロセッサーで最先端のパフォーマンスを実現

掲載記事

最新のパフォーマンス解析ツールを使用してインテル® Optane™ DC パーシステント・メモリーに対応
NUMA マイグレーションのパフォーマンスへの影響を測定
Python* の並列化: numexpr によるベクトル化の指示
インテル® Xeon® プロセッサーでインテル® AVX-512 を利用してオープン・シェーディング言語を加速
パフォーマンスの最適化と生産性 (PoP) プロジェクト
インテル® ソフトウェアへの投資が HPC ソフトウェア開発者にもたらす 7 つのメリット

編集者からのメッセージ

ブラックホールとハイパフォーマンス・コンピューティング

もう随分前のことのように思われますが、イベント・ホライゾン・テレスコープがブラックホールの画像を公開したのはわずか 3 ヶ月程前のことです。

これは明らかに素晴らしい科学的偉業でした。しかし、1 つの画像だけでは、この偉業を成し遂げた膨大な量の専門知識、データ、計算を伝えることはできません。ECHO を含む、この偉業の達成に使用されたいくつかのコードの詳細は、イベントホライゾン一般相対論的電磁流体コードの比較プロジェクト (英語) で提供されています。「ECHO-3DHPC による天体物理シミュレーションのパフォーマンスを向上」 (2018 年に公開された The Parallel Universe 34 号の記事) では、ライプニッツ研究センター (LRZ) の研究者とインテルによるこのコードの最適化を紹介しています。

この号の注目記事「第 2 世代インテル® Xeon® スケーラブル・プロセッサーで最先端のパフォーマンスを実現」では、最新のインテル® Xeon® プロセッサー・ファミリーについて説明します。この新しいプロセッサーには、インテル® ディープラーニング・ブースト (英語) とインテル® Optane™ DC パーシステント・メモリーのサポートが追加されており、CPU ソケットごとに最大 56 コア、ソケットごとに 12 の DDR4 メモリーチャネルを搭載しています。この記事を読めば、この新しいプロセッサーがパフォーマンスの新記録を達成した理由が分かります。「最新のパフォーマンス解析ツールを使用してインテル® Optane™ DC パーシステント・メモリーに対応」では、この新しいメモリー・テクノロジーによってアプリケーションが利点を得られるかどうか判断する方法、およびこのテクノロジーを使用するアプリケーションの解析方法を紹介します。

NUMA (Non-Uniform Memory Access) アーキテクチャーは、長年にわたって利用されています。メモリーアクセスを高速化するため、スレッドをデータの近くに配置すべきことはほとんどの人が知っていますが、スレッドが実際に実行されている場所やオペレーティング・システムがスレッドを移動しているかどうかに注意を払う人はほとんどいません。「NUMA マイグレーションのパフォーマンスへの影響を測定」は、NUMA システムにおけるスレッドの振る舞いを理解するのに役立ちます。

この号でも引き続き Python* コードの最適化と並列化に関する記事を取り上げています。「Python* の並列化: numexpr によるベクトル化の指示」は、簡単なコード変更により、複雑な数式のパフォーマンスを劇的に向上する方法を示します。

「インテル® Xeon® プロセッサーでインテル® AVX-512 を利用してオープン・シェーディング言語を加速」では、オスカー受賞実績のあるオープン・シェーディング言語をベクトル化するインテルの取り組みを紹介します。オープン・シェーディング言語は、100 本を超える映画で採用されているデジタルコンテンツ制作の事実上のオープンソース標準です。

最後に、Numerical Algorithms Group (英語) の Mike Croucher 氏と、本誌の名誉編集長である James Reinders によるゲスト論説で締めくくります。Mike Croucher 氏は、ソフトウェア・パフォーマンス向上のため、欧州連合が資金援助する「パフォーマンスの最適化と生産性 (PoP) プロジェクト」について述べます。James Reinders は、「インテル® ソフトウェアへの投資が HPC ソフトウェア開発者にもたらす 7 つのメリット」で、インテル® ソフトウェアを利用して最小限の労力でパフォーマンスを最大限に引き出す方法を示します。これらの論説は、パフォーマンスへの道は何が利用可能かを知っているかどうかであることを示しています。

また、コードの現代化、ビジュアル・コンピューティング、データセンターとクラウド・コンピューティング、データサイエンス、システムと IoT 開発向けのインテルのソリューションの詳細は、Tech.Decoded (英語) を参照してください。

入手はこちらから