DPCT1018

メッセージ

<API 名> は移行されましたが、生成されたコードのパフォーマンスは、以下の理由により最適ではない可能性があります。

  • <パラメーター名> が評価できませんでした。また、<ほかのパラメーター名> よりも小さい可能性があります。

  • <パラメーター名> は <ほかのパラメーター名> と等しいですが、1 よりも大きいです。

説明

この警告は、以下の 2 つのケースで表示されます。

  • cublasSetMatrix: インテル® DPC++ 互換性ツールは、cublasSetMatrix をホストからデバイスへのメモリーコピーに置き換えました。cublasSetMatrix の rows パラメーターが lda パラメーターよりも小さい場合、生成されたコードは行列で利用可能な実際のデータ (rows*cols) よりも多くのデータ (lda*cols) をコピーします。

    パフォーマンスを向上するには、ldaldb の値を変更することを検討してください。rows パラメーターが lda 以上の場合、このコードには何もする必要はありません。

  • cublasSetVector: インテル® DPC++ 互換性ツールは、cublasSetVector をホストからデバイスへのメモリーコピーに置き換えました。cublasSetVectorincx パラメーターが incy パラメーターと等しく、1 よりも大きい場合、生成されたコードはベクトルで利用可能な実際のデータ (n) よりも多くのデータ (incx*n) をコピーします。パフォーマンスを向上するには、incxincy の値を変更することを検討してください。

修正方法の提案

cublasSetMatrix の rows パラメーターが lda パラメーターよりも小さく、パフォーマンスの問題が見つかった場合、ldaldb の値を変更することを検討してください。

cublasSetVectorincx パラメーターが incy パラメーターと等しく、1 よりも大きく、パフォーマンスの問題が見つかった場合、incxincy の値を変更することを検討してください。