インテル Parallel Universe 37 号日本語版の公開

同カテゴリーの次の記事

メモリーアクセスのパフォーマンス・ボトルネックを特定

parallel_v37

インテル Parallel Universe マガジンの最新号が公開されました。

注目記事: 第 2 世代インテル® Xeon® スケーラブル・プロセッサーで最先端のパフォーマンスを実現

掲載記事

  • 最新のパフォーマンス解析ツールを使用してインテル® Optane™ DC パーシステント・メモリーに対応
  • NUMA マイグレーションのパフォーマンスへの影響を測定
  • Python* の並列化: numexpr によるベクトル化の指示
  • インテル® Xeon® プロセッサーでインテル® AVX-512 を利用してオープン・シェーディング言語を加速
  • パフォーマンスの最適化と生産性 (PoP) プロジェクト
  • インテル® ソフトウェアへの投資が HPC ソフトウェア開発者にもたらす 7 つのメリット

編集者からのメッセージ

ブラックホールとハイパフォーマンス・コンピューティング

もう随分前のことのように思われますが、イベント・ホライゾン・テレスコープ がブラックホールの画像を公開したのはわずか 3 ヶ月程前のことです。

これは明らかに素晴らしい科学的偉業でした。しかし、1 つの画像だけでは、この偉業を成し遂げた膨大な量の専門知識、データ、計算を伝えることはできません。ECHO を含む、この偉業の達成に使用されたいくつかのコードの詳細は、イベントホライゾン一般相対論的電磁流体コードの比較プロジェクト (英語) で提供されています。「ECHO-3DHPC による天体物理シミュレーションのパフォーマンスを向上」 (2018 年に公開された The Parallel Universe 34 号の記事) では、ライプニッツ研究センター (LRZ) の研究者とインテルによるこのコードの最適化を紹介しています。

この号の注目記事「第 2 世代インテル® Xeon® スケーラブル・プロセッサーで最先端のパフォーマンスを実現」では、最新のインテル® Xeon® プロセッサー・ファミリーについて説明します。この新しいプロセッサーには、インテル® ディープラーニング・ブースト (英語) とインテル® Optane™ DC パーシステント・メモリーのサポートが追加されており、CPU ソケットごとに最大 56 コア、ソケットごとに 12 の DDR4 メモリーチャネルを搭載しています。この記事を読めば、この新しいプロセッサーがパフォーマンスの新記録を達成した理由が分かります。「最新のパフォーマンス解析ツールを使用してインテル® Optane™ DC パーシステント・メモリーに対応」では、この新しいメモリー・テクノロジーによってアプリケーションが利点を得られるかどうか判断する方法、およびこのテクノロジーを使用するアプリケーションの解析方法を紹介します。

NUMA (Non-Uniform Memory Access) アーキテクチャーは、長年にわたって利用されています。メモリーアクセスを高速化するため、スレッドをデータの近くに配置すべきことはほとんどの人が知っていますが、スレッドが実際に実行されている場所やオペレーティング・システムがスレッドを移動しているかどうかに注意を払う人はほとんどいません。「NUMA マイグレーションのパフォーマンスへの影響を測定」は、NUMA システムにおけるスレッドの振る舞いを理解するのに役立ちます。

この号でも引き続き Python* コードの最適化と並列化に関する記事を取り上げています。「Python* の並列化: numexpr によるベクトル化の指示」は、簡単なコード変更により、複雑な数式のパフォーマンスを劇的に向上する方法を示します。

「インテル® Xeon® プロセッサーでインテル® AVX-512 を利用してオープン・シェーディング言語を加速」では、オスカー受賞実績のあるオープン・シェーディング言語をベクトル化するインテルの取り組みを紹介します。オープン・シェーディング言語は、100 本を超える映画で採用されているデジタルコンテンツ制作の事実上のオープンソース標準です。

最後に、Numerical Algorithms Group (英語) の Mike Croucher 氏と、本誌の名誉編集長である James Reinders によるゲスト論説で締めくくります。Mike Croucher 氏は、ソフトウェア・パフォーマンス向上のため、欧州連合が資金援助する「パフォーマンスの最適化と生産性 (PoP) プロジェクト」について述べます。James Reinders は、「インテル® ソフトウェアへの投資が HPC ソフトウェア開発者にもたらす 7 つのメリット」で、インテル® ソフトウェアを利用して最小限の労力でパフォーマンスを最大限に引き出す方法を示します。これらの論説は、パフォーマンスへの道は何が利用可能かを知っているかどうかであることを示しています。

また、コードの現代化、ビジュアル・コンピューティング、データセンターとクラウド・コンピューティング、データサイエンス、システムと IoT 開発向けのインテルのソリューションの詳細は、Tech.Decoded (英語) を参照してください。

関連記事

  • インテル Parallel Universe 34 号日本語版の公開インテル Parallel Universe 34 号日本語版の公開 インテル Parallel Universe マガジンの最新号が公開されました。 注目記事: OpenVINO™ ツールキットと FPGA 掲載記事 インテル® ソフトウェア・ツールにおける浮動小数点結果の再現性 C++ メモリー割り当てライブラリーの比較 LIBXSMM: […]
  • インテル Parallel Universe 26 号日本語版の公開インテル Parallel Universe 26 号日本語版の公開 インテル Parallel Universe マガジンの最新号が公開されました。この号では、インテル® Xeon Phi™ プロセッサー向けのコードの現代化について説明します。また、インテル® Parallel Studio XE 2017 […]
  • インテル Parallel Universe 33 号日本語版の公開インテル Parallel Universe 33 号日本語版の公開 インテル Parallel Universe マガジンの最新号が公開されました。 注目記事: BigDL により Apache Spark* 上で人工知能を向上 掲載記事 WebAssembly が Web 上のコンピューティングの未来を握る理由 コードの現代化を実践: […]
  • インテル Parallel Universe 23 号日本語版の公開インテル Parallel Universe 23 号日本語版の公開 インテル Parallel Universe マガジンの最新号が公開されました。この号では、パフォーマンスを向上する最適なツールの選択に関する以下トピックを取り扱っています。 最適なツールの選択 - アプリケーションのパフォーマンスを向上するためのロードマップ 将来の HPC […]
  • インテル® VTune™ Amplifier XE を利用した Python* コードの高速化インテル® VTune™ Amplifier XE を利用した Python* コードの高速化 この記事は、インテルの The Parallel Universe Magazine 25 号に収録されている、インテル® VTune™ Amplifier XE を利用して非常に低いオーバーヘッドで Python* コードのプロファイリング情報を得る方法に関する章を抜粋翻訳したものです。 インテル® […]