DPCT1049

メッセージ

SYCL* カーネルに渡される work-group サイズが制限を超えている可能性があります。デバイスの上限値は、info::device::max_work_group_size で照会できます。必要に応じて、work-group サイズを調整します。

詳細な説明

SYCL* デバイスの SYCL* カーネルに渡される work-group サイズには制限があります (SYCL* 1.2.1 仕様の「4.6.4.2 デバイス情報記述子」を参照)。

この警告は、ローカルレンジの次元をすべて評価できなかった場合や、ローカルレンジの次元の積が 256 以上の場合に表示されます。

修正方法の提案

info::device::max_work_group_size を照会して、使用するデバイスの work-group サイズの上限を定義します。コードで使用されている work-group サイズが制限値を下回っている場合は、この警告を無視できます。そうでない場合は、 work-group サイズを小さくする必要があります。

例えば、以下のオリジナル CUDA* コードについて考えてみます。

 __global__ void k() {} 
 
 void foo() { 
     k<<<1, 2048>>>(); 
 }

このコードは、以下の SYCL* コードに移行されます。

 void k() {} 
 
 void foo() { 
   /* 
   DPCT1049:0: The work-group size passed to the SYCL kernel may exceed the 
   limit. To get the device limit, query info::device::max_work_group_size. 
   Adjust the work-group size if needed. 
   */ 
   dpct::get_default_queue().parallel_for( 
       sycl::nd_range<3>(sycl::range<3>(1, 1, 2048), sycl::range<3>(1, 1, 2048)), 
       [=](sycl::nd_item<3> item_ct1) { 
         k(); 
       }); 
 }

このコードは次のように書き換えられます。

 void k() {} 
 
 void foo() { 
   size_t max_work_group_size = 
      dpct::get_default_queue() 
           .get_device() 
           .get_info<sycl::info::device::max_work_group_size>(); 
   size_t work_group_size = 2048; 
   if (work_group_size > max_work_group_size) { 
     work_group_size = max_work_group_size; 
   } 
   size_t work_group_num = std::ceil((float)2048 / (float)work_group_size); 
   dpct::get_default_queue().parallel_for( 
      sycl::nd_range<3>(sycl::range<3>(1, 1, work_group_num * work_group_size), 
                sycl::range<3>(1, 1, work_group_size)), 
      [=](sycl::nd_item<3> item_ct1) { k(); }); 
   }

インテル® DPC++
互換性ツール・
デベロッパー・ガイド
およびリファレンス

DPCT1049

目次

DPCT1049

メッセージ

詳細な説明

修正方法の提案

インテル® DPC++互換性ツール・デベロッパー・ガイドおよびリファレンス

DPCT1049

目次

DPCT1049

メッセージ

詳細な説明

修正方法の提案

インテル® DPC++
互換性ツール・
デベロッパー・ガイド
およびリファレンス