Intel Xeon Phi のベンチマーク・データが公開されました | Core チャンネル | フォーラム

iSUS に投稿されている記事の内容や、IA プラットフォーム上でのソフトウェア開発に関するトピックを開発者同士でディスカッションできる場としてフォーラムを公開しています。

運営ルールはフォーラムの利用案内をご覧ください。
フォーラムの使い方はこちら

 
フォーラムに投稿するにはログインが必要ですログイン

Intel Xeon Phi のベンチマーク・データが公開されました

メンバー投稿

8:00 AM
2012年11月16日


iSUS編集部 – 菅原

投稿数 206

1

米国インテルのサイトにインテル・マスカーネル・ライブラリーを使用したベンチマーク・データが公開されました。

http://software.intel.com/en-u…..12768-1295

3:43 PM
2012年12月10日


yoshihingis

投稿数 54

2

菅原様、12/7のインテルソフトウェア・カンファレンスでは、Intel Xeon Phiに関してのご講演お疲れ様でした。いつも、ISUSの掲示板でいろいろアドバイスを頂いておりますので、ご挨拶をと思っていたのですが、お風邪で体調を崩されているようでしたし、ちょっと所用がありまして、帰りを急いでいたもので、ご挨拶できなったのが残念です。

 Intel Xeon Phiに関しては、私も注目しておりますが、今回のカンファレンスに参加していろいろご質問したい点も出てきました。

1.開発言語に関して
 従来のC/C++のコードと変わらぬ言語と環境で、ソフト開発が出来るというのはGPUに対して大きなアドバンテージだと思いますが、GPU側もOpen ACCでプラグマ追加だけでGPUのコード開発を可能とし、ソフト開発をするという提案をしています。
 Open ACCは将来、Open MPに取り込まれる形になるという噂も聞きますが、そうなると
Xeon PhiもOpen ACCには対応することとなり、GPUとXeon Phiのコード開発は共通化され、GPUに対する大きなアドバンテージが無くなるのではないか?

2.Windows対応に関して
Main PC:Host(LINUX)-Xeon Phi:Client(LINUX)ですので、LINUX用のC++ Studio XEだけで、コード生成や、ホットスポット検出が可能でしたが、Host側だけはWindows対応の予定もあるというような話が、カンファレンスの最初の講演中にありましたが、こうなった場合、Host側のためにWindwos用 C++ studio XE,Clinet Xeon phiの為にLINUX用C++ Studio XEが必要になるようになるのではないか?
 というのがまず考えられます。

 次にホスト側のWindowsからLINUX上で動作しているXeon PhiのプロファイルをVtuneなどで同時解析出来るのか?という疑問が沸きます。

 私の考え違いかもしれませんが、まだホストのWindows対応などなされてませんが、なにか情報ありましたら教えて頂ければ幸いです。

5:24 PM
2012年12月10日


上田@Juse

投稿数 8

3

菅原様
Xeon Phi関連の話なので、こちらに投稿させていただきました。
先日のカンファレンスは午後一の講演のみしか聴講できず、ご挨拶もできませんでした。またの機会にお話しできればと思います。

Xeon Phiに関して、並列化の興味深いデータやお話が当日いただいた資料にあったのですが、メモリ、キャッシュまわりの話しがあまりなかったように見えました。これまでは、大きな共有キャッシュがあったのですが、Xeon Phiにはないように見えた( http://www.intel.co.jp/content…..agram.html )のですが、この辺りはどの程度パフォーマンス、プログラミングに影響しそうでしょうか?

9:53 PM
2012年12月10日


iSUS編集部 – 菅原

投稿数 206

4

yoshihingis様、上田様

当日はご来場ありがとうございます。私は2日間、食事がのどを通らず最悪でした。お話しできなく残念に思っています。

開発言語に関してですが。
すべてのアルゴリズムが1つの並列化モデルでうまく対応できるわけではなく、そのためIAの世界でも、OpenMP、Cilk Plus、TBB、OpenCLなど多くの並列化モデルをインテルコンパイラーやライブラリーとして実装してきました。OpenACCもその一つの選択肢として考えられます。OpenMPやOpenACCはデータ並列向きで、対応が難しいアルゴリズムもあります。クイックソートなどそのいい例でしょう。これまでCUDAのみを使われていた開発者が、抽象度の高いOpenACCでほかのハードウェアを使用できる可能性が広がることのほうが利点は大きいと思います。ひょっとしたら、Xeon Phi向けの画期的な並列化モデルが現れるかのしれません。

Windows対応に関してですが、
現状のXoen Phi側のプログラムはLinuxの世界です。Windows環境で、Linux環境の開発を強いるのは、Windows開発者には負担になるだけです。Windows環境で、Xeon Phiを使うメリットがあるとすれば、高度な抽象化モデルによってのみ実現できるのではないでしょうか?もう少しすれば、現実的なお話ができるようになる、と思います。
実はIA上のWindows環境で、Linux環境でサンプリングした結果を、ある程度解析できること、ご存知でしたか?Linuxでのサンプリング結果と、Linuxのシンボル付実行ファイルがあると、アプリ自体は解析できるのです。当然、OS内部やランタイムはわかりません。

Xeon Phiのキャッシュに関して、
Xeon Phiは、Xeonより多くのタスクがより小さなデータを同時に処理することで性能を高めると考えることができます。XeonのLLCは20メガとかありますが、8つの物理コアでシェアすれば、コアあたり2.5Mです。Xeon Phi は、60個の物理コアが512バイトのL2を持つので30Mにもなります。2.5Mのデータがキャッシュにあっても1つのコアがシーケンシャルに最初のデータから最後のデータを処理するまでは、かなり時間がかかります。なので、Xeon Phiのようなメニーコアのプロセッサーでは、Xeonの考え方をそのまま適用するのは無理があるかな、という気がします。

と、これは取り急ぎ、私編集長菅原の見解です。ご意見あればどうぞ。
正式見解はしばしお待ちください。追ってお知らせします。

8:37 AM
2012年12月11日


yoshihingis

投稿数 54

5

 菅原様
 Xeon Phiに関する早速のご回答ありがとうございました。
 確かに並列化にもいろいろあり、OpenMPやOpenACCのデータ並列化だけでなくXeon Phiはご指摘のような多様な並列化モデルに対応可能ですね。

 Winodows対応に関してもご回答ありがとうございます。
 どうしても自分を含めた周囲の開発環境がWindows一色なので、Windowsに固執してしまうところがあります。
 
 菅原様のご見解ということも理解しました。
 また追加情報や正式見解などが発表された場合は、ISUSでお知らせ頂ければ幸いです。

 どうもありがとうございました。

10:33 AM
2012年12月12日


上田@Juse

投稿数 8

6

菅原様
回答いただきありがとうございました。
これまでのIA向けコードもそのまま動作すると思います(そうなると期待)が、高速化を目指すならユーザ側で考え方を変えて対応しなければならないのかもしれませんね。
正式見解等でましたら、よろしくお願いします。