DPCT1018¶
メッセージ¶
<API 名> は移行されましたが、生成されたコードのパフォーマンスは、以下の理由により最適ではない可能性があります。
<パラメーター名> が評価できませんでした。また、<ほかのパラメーター名> よりも小さい可能性があります。
<パラメーター名> は <ほかのパラメーター名> と等しいですが、1 よりも大きいです。
説明¶
この警告は、以下の 2 つのケースで表示されます。
cublasSetMatrix
: インテル® DPC++ 互換性ツールは、cublasSetMatrix
をホストからデバイスへのメモリーコピーに置き換えました。cublasSetMatrix
の rows パラメーターがlda
パラメーターよりも小さい場合、生成されたコードは行列で利用可能な実際のデータ (rows*cols
) よりも多くのデータ (lda*cols
) をコピーします。パフォーマンスを向上するには、
lda
とldb
の値を変更することを検討してください。rows パラメーターがlda
以上の場合、このコードには何もする必要はありません。cublasSetVector
: インテル® DPC++ 互換性ツールは、cublasSetVector
をホストからデバイスへのメモリーコピーに置き換えました。cublasSetVector
のincx
パラメーターがincy
パラメーターと等しく、1 よりも大きい場合、生成されたコードはベクトルで利用可能な実際のデータ (n
) よりも多くのデータ (incx*n
) をコピーします。パフォーマンスを向上するには、incx
とincy
の値を変更することを検討してください。
修正方法の提案¶
cublasSetMatrix
の rows パラメーターが lda
パラメーターよりも小さく、パフォーマンスの問題が見つかった場合、lda
と ldb
の値を変更することを検討してください。
cublasSetVector
の incx
パラメーターが incy
パラメーターと等しく、1 よりも大きく、パフォーマンスの問題が見つかった場合、incx
と incy
の値を変更することを検討してください。