Xeon Phi 書籍をご購入の方へ | インテル Xeon Phi 開発者フォーラム | フォーラム

iSUS に投稿されている記事の内容や、IA プラットフォーム上でのソフトウェア開発に関するトピックを開発者同士でディスカッションできる場としてフォーラムを公開しています。

運営ルールはフォーラムの利用案内をご覧ください。
フォーラムの使い方はこちら

 
フォーラムに投稿するにはログインが必要ですログイン

Xeon Phi 書籍をご購入の方へ

メンバー投稿

4:43 PM
2014年2月6日


iSUS編集部 – 菅原

投稿数 206

1

投稿は 5:48 PM – 2014年2月15日 に iSUS編集部 – 菅原 さんにより更新されました


インテル Xeon Phi ハイパフォーマンス・プログラミングの書籍をご購入の方へお知らせがあります。

書籍で紹介しているサンプルコード helloflops1.c が期待通りの性能値とならないことがあります。この現状は、バージョン14以降の C/C++ コンパイラーで発生します。
ご利用のシステムにバージョン13.1がインストールされている場合、そちらでお試しください。

もしバージョン14以降しかなければ、helloflops1.c の70行目にある for ループの前に #pragma simd を追加してください。

      #pragma simd
70 for(k=0; k<LOOP_COUNT; k++)
71 {
72 fa[k] = a * fa[k] + fb[k];
73 }

原因はこのループがアンロールされないためです。#pragma unroll を挿入しても同等の効果が得られます。同じような構造がある。helloflops2 と helloflops3 では、この問題は起こりません。

12:45 PM
2014年2月16日


iSUS編集部 – 菅原

投稿数 206

2

この問題は、2月にリリースされた V14 の update2 で解決されています。

タグはありません