目次

DPCT1040

目次

DPCT1040

メッセージ

コードがデバイス上で使用される場合は、printf の代わりに sycl::stream を使用します。

説明

オリジナルコードでホストとデバイスで使用される printf 文は、変更されません。DPC++ で出力を作成するには、デバイスでは sycl::stream を、ホストでは printf を使用する必要があります。

修正方法の提案#

printf 文がホストでのみ使用されている場合は、コードを変更する必要はありません。
printf 文がデバイスでのみ使用されている場合は、printf の代わりに sycl::stream を使用します。

例えば、以下のオリジナル CUDA* コードについて考えてみます。

 __host__ __device__ void hd() { 
 printf("Hello!\n"); 
 } 
 
 __global__ void k() { 
 hd(); 
 } 
 
 void foo() { 
 hd(); 
 k<<<1, 1>>>(); 
 }

このコードは、以下の SYCL* コードに移行されます。

 void hd() { 
 /* 
 DPCT1040:0: Use sycl::stream instead of printf if your code is used on the 
 device.
 */ 
 printf("Hello!\n"); 
 } 
 
 void k() { 
 hd(); 
 } 
 
 void foo() { 
 hd(); 
 dpct::get_default_queue().parallel_for( 
     sycl::nd_range<3>(sycl::range<3>(1, 1, 1), sycl::range<3>(1, 1, 1)), 
         [=](sycl::nd_item<3> item_ct1) { 
             k(); 
         }); 
 }

このコードは次のように書き換えられます。

 void hd_host() { 
 printf("Hello!\n"); 
 } 
 
 void hd_device(const sycl::stream &stream) { 
 stream << "Hello!\n"; 
 } 
 
 void k(const sycl::stream &stream) { 
 hd_device(stream); 
 } 
 
 void foo() { 
 hd_host(); 
 dpct::get_default_queue().submit([&](sycl::handler &cgh) { 
    sycl::stream stream(64 * 1024 /*totalBufferSize*/, 80 /*workItemBufferSize*/, cgh); 
 
 cgh.parallel_for( 
 sycl::nd_range<3>(sycl::range<3>(1, 1, 1), sycl::range<3>(1, 1, 1)), 
      [=](sycl::nd_item<3> item_ct1) { 
          k(stream); 
      }); 
    }); 
 }