インテル Parallel Universe 36 号日本語版の公開

同カテゴリーの次の記事

ベクトル化の効率を把握する

parallel_v36

インテル Parallel Universe マガジンの最新号が公開されました。

注目記事: CPU 上でのマシンラーニング/ ディープラーニング・プロジェクトの効率的な訓練と実行

掲載記事

  • Numba を使用した Python* での並列処理
  • グラフ解析ワークロードのパフォーマンスの向上
  • ベクトル化の効率を把握する
  • PIC コードのベクトル化によるパフォーマンスの向上
  • インテル® MPI ライブラリーのマルチ EP によりハイブリッド・アプリケーションのパフォーマンスを向上
  • システムと IoT アプリケーションの革新

編集者からのメッセージ

エクサスケール・コンピューティングの時代

皆さんはすでにご存知かもしれませんが、私は HPC を好きで選んだのではなく、やむを得ず選んだ人間です。ハイパフォーマンス・コンピューティング (HPC) には、一般に 2 つの意味があります。1 つには、単にアプリケーション・パフォーマンスの向上を意味します。例えば、コンパイラー・チームの一部のメンバーは 5% のスピードアップを HPC と呼んでいます。彼らの世界ではこれで正解です。ただし、私の世界では、HPC とは数十万、数百万のコアを利用して桁違いのスピードアップを得る大規模コンピューティングを意味します。(TOP500 (英語) をイメージしてみてください。)

そのため私は、先月発表された、インテルがアルゴンヌ国立研究所に Aurora スーパーコンピューターを納入するというニュースを聞いて大いに興奮しています(詳細は、「米国エネルギー省とインテルが米国初のエクサスケール・スーパーコンピューターを実現」 (英語) を参照)。Aurora はエクサ FLOPS パフォーマンス (1 秒間に 100 京回(1018 回) の浮動小数点演算が可能) を達成すると期待されています。エクサスケール・システムは、前号の The Parallel Universe で述べたように、集中型のワークフローには不可欠です。

この号の 3 つの記事では、エクサスケール・システムの登場を待ち望んでいる最適化を取り上げます。プリンストン・プラズマ物理研究所は、エクサスケール・システムを活用する科学の研究を行っています。「PIC コードのベクトル化によるパフォーマンスの向上」では、クリティカルなアルゴリズムの 1 つを微調整する方法を説明します。「ベクトル化の効率を把握する」では、インテル® Advisor により提供される情報の活用方法を示します。「インテル® MPI ライブラリーのマルチ EP によりハイブリッド・アプリケーションのパフォーマンスを向上」では、メッセージパッシングとマルチスレッドを組み合わせたアプリケーションのスケーラビリティーを高める方法を紹介します。

HPC 関連以外にも、さまざまな分野の記事が用意されています。注目記事「CPU 上でのマシンラーニング/ディープラーニング・プロジェクトの効率的な訓練と実行」では、ディープ・ニューラル・ネットワーク向けインテル® マス・カーネル・ライブラリー (インテル® MKL-DNN) (英語) を使用して AI フレームワークを高速化する方法を説明します。データ・サイエンティスト向けに、2 つの記事「Numba を使用した Python* での並列処理」および「グラフ解析ワークロードのパフォーマンスの向上」も用意しました。前者は、Numba コンパイラーを使用して Python* 数値カーネルのパフォーマンスを大幅に向上するための実践的なアドバイスを提供します。また後者は、グラフ解析の一般的なベンチマークである GAP ベンチマーク・スイート (英語) の解析を説明します。

この号の最後の記事「システムと IoT アプリケーションの革新」では、インテル® System Studio のさまざまな解析ツールを説明します。

以前からお伝えしているように、コードの現代化、ビジュアル・コンピューティング、データセンターとクラウド・コンピューティング、データサイエンス、システムと IoT 開発向けのソリューションの詳細については、インテルの開発者向けのナレッジハブ、Tech.Decoded (英語) を参照してください。

関連記事

  • インテル Parallel Universe 34 号日本語版の公開インテル Parallel Universe 34 号日本語版の公開 インテル Parallel Universe マガジンの最新号が公開されました。 注目記事: OpenVINO™ ツールキットと FPGA 掲載記事 インテル® ソフトウェア・ツールにおける浮動小数点結果の再現性 C++ メモリー割り当てライブラリーの比較 LIBXSMM: […]
  • インテル Parallel Universe 31 号日本語版の公開インテル Parallel Universe 31 号日本語版の公開 インテル Parallel Universe マガジンの最新号が公開されました。 この号の注目記事、「OpenCL* による FPGA プログラミング」では、前号に引き続き FPGA プログラミングを取り上げます。The Parallel Universe の創刊者兼編集者であった James Reinders […]
  • インテル Parallel Universe 26 号日本語版の公開インテル Parallel Universe 26 号日本語版の公開 インテル Parallel Universe マガジンの最新号が公開されました。この号では、インテル® Xeon Phi™ プロセッサー向けのコードの現代化について説明します。また、インテル® Parallel Studio XE 2017 […]
  • ディープラーニングの訓練向けインテル® プロセッサーディープラーニングの訓練向けインテル® プロセッサー この記事は、インテル® デベロッパー・ゾーンに公開されている「Intel® Processors for Deep Learning Training」の日本語参考訳です。 この記事の PDF 版はこちらからご利用になれます。 はじめに 2017 年 11 月 7 […]
  • 将来に対応したコードの最適化によるソフトウェアの現代化将来に対応したコードの最適化によるソフトウェアの現代化 この記事は、インテル® デベロッパー・ゾーンに公開されている「Modernizing Software with Future-Proof Code Optimizations」の日本語参考訳です。 この記事の PDF 版はこちらからご利用になれます。 新しいインテル® Parallel Studio XE […]