Intel Open CL のintel HD2500のパフォーマンス | 最適化フォーラム | フォーラム

iSUS に投稿されている記事の内容や、IA プラットフォーム上でのソフトウェア開発に関するトピックを開発者同士でディスカッションできる場としてフォーラムを公開しています。

運営ルールはフォーラムの利用案内をご覧ください。
フォーラムの使い方はこちら

 
フォーラムに投稿するにはログインが必要ですログイン

Intel Open CL のintel HD2500のパフォーマンス

メンバー投稿

9:34 AM
2013年7月5日


yoshihingis

投稿数 54

1

 Intel SDK for OpenCL Application Samples Getting StartedにMedian FilterのSampleコードがあったので、CPUとGPUでパフォーマンス比較をしてみました。
 Sample Codeは、GPUはIntel HD5000/HD2500しか使用できないようなので、手持ちのPCでCore i3-3220でCPUとGPUで比較してみましたが、

 CPU Core-i3 3220 3.3GHz 5.830691msec 4Computer Units

GPU Intel HD Graphic 2500 12.547587msec 6Computer Units

と内蔵GPUよりCPUの方が2倍以上処理速度が速いという結果となりました。
 元からHD2500はあまりハイパフォーマンスな内蔵GPUではありませんが、この結果は少々、期待はずれでした。
 やはりグラフックのパフォーマンスが強化されたHaswell CoreのHD5000でないとパフォーマンスが出ないのかと推測していますが、HD5000を内蔵したCPUはUltara Book用用途のようですね。
 Core i7-4770のHD5200あたりでもサンプルプログラムが動作させられると、会社にPCを新規で購入させやすいのですが・・・。

とりあえず、初めてOpenCLを動作させてみた感想と結果報告でした。

 
 

2:37 AM
2013年7月6日


iSUS編集部 – 菅原

投稿数 206

2

yoshihingis 様

こんにちは、Intel SDK for OpenCL Applications は、第三世代以降、つまり IvyBridge であれは HD Graphics が利用できます。Median Filter のサンプルも、手元の Core i7 4770 (HD Graphics 4600) で実行できました。結果は… この環境でも CPU の方が早いですね。

デスクトップ向けの Haswell は、4770Rが用意されて…これは Iris Pro Graphics 5200 が搭載されますが、ソケットがLGA1150ではなく、BGAでボード直付けなので、まだ製品としては少ないようですね。4770Rはデスクトップ向けといっても、L3キャッシュも6Mと、モバイルCPUと同じ構成なので導入するメリットがあまりないですね。

少し調べてみますので、何かわかったらまたお知らせします。

2:24 PM
2013年7月8日


yoshihingis

投稿数 54

3

菅原様、いろいろご助言ありがとうございます。

 CPUに内蔵のGPU使用の並列演算でパフォーマンスが向上するなら、外付けグラフィックカードよりメリットがあるかなと考えて実験してみました。
 外付けグラフィックカードの場合、PCI-Eを経由して、CPU-GPU間でデータをやりとりするので、ここがボトルネックになりやすいですが、CPUに内蔵されたGPUならPCI-Eを通さないし、CPUの外付けメモリを共用するので、PCI-Eを通さずに済むので、CPU-GPU間のデータ転送効率が上がるかな?と期待しました。

 まぁ、CPUの共用メモリだとDDR3、外付けGPUだとメモリはDDR5が使用されている場合が多いので、メモリの速度が異なるので、PCI-Eと通さないメリットがどれだけあるかは、微妙なところですが。

 ただ、現状Intel HD Graphicsを使用するとCPUよりパフォーマンスが落ちるようでは、CPUに内蔵されたGPUを利用しての演算パフォーマンス向上は難しそうですね。

 また何か分かりましたら、是非、教えてください。

5:53 AM
2013年7月9日


iSUS編集部 – 菅原

投稿数 206

4

お手持ちのコードを HD Graphics で実行される場合、clCreateBuffer()などでCL_MEM_COPY_HOST_PTR を使われているところを CL_MEM_USE_HOST_PTR に変更されることをお勧めします。CPU内臓GPUでは、メモリーコピーが必要ないので、ポインターで高速にデータにアクセスできます。