gemm_bias#
バイアス付きの一般整数行列を使用して行列-行列積を計算します。
説明#
gemm_bias ルーチンは、バイアス/オフセットを持つ一般整数行列を使用して、スカラー - 行列 - 行列積を計算し、その結果をスカラー行列積に加算します。操作はのように定義されています。
説明:
op(
X) は、op(X) =X、op(X) =XT、または op(X) =XH のいずれかですalphaとbetaはスカラーですA_offsetは、すべての要素が値aoに等しいmxk行列ですB_offsetは、すべての要素が値boに等しいkxn行列ですC_offsetは、coバッファーによって定義されるmxn行列です。詳細はデータタイプを参照してください。A、B、およびCは行列ですop(
A) はmxk、op(B) はkxn、そしてCはmxnです。
gemm_bias は次の精度をサポートします。
Ta |
Tb |
|---|---|
|
|
|
|
|
|
|
|
gemm_bias (バッファーバージョン)#
構文#
namespace oneapi::mkl::blas::column_major {
void gemm_bias(sycl::queue &queue,
oneapi::mkl::transpose transa,
oneapi::mkl::transpose transb,
oneapi::mkl::offset offsetc,
std::int64_t m,
std::int64_t n,
std::int64_t k,
float alpha,
sycl::buffer<Ta,1> &a,
std::int64_t lda,
Ta ao,
sycl::buffer<Tb,1> &b,
std::int64_t ldb,
Tb bo,
float beta,
sycl::buffer<std::int32_t,1> &c,
std::int64_t ldc,
sycl::buffer<std::int32_t,1> &co,
compute_mode mode = compute_mode::unset)
}namespace oneapi::mkl::blas::row_major {
void gemm_bias(sycl::queue &queue,
oneapi::mkl::transpose transa,
oneapi::mkl::transpose transb,
oneapi::mkl::offset offsetc,
std::int64_t m,
std::int64_t n,
std::int64_t k,
float alpha,
sycl::buffer<Ta,1> &a,
std::int64_t lda,
Ta ao,
sycl::buffer<Tb,1> &b,
std::int64_t ldb,
Tb bo,
float beta,
sycl::buffer<std::int32_t,1> &c,
std::int64_t ldc,
sycl::buffer<std::int32_t,1> &co,
compute_mode mode = compute_mode::unset)
}入力パラメーター#
- queue
ルーチンを実行するキュー。
- transa
行列
Aに適用される転置演算 op(A) を指定します。詳細はデータタイプを参照してください。- transb
行列
Bに適用される転置演算 op(B) を指定します。詳細はデータタイプを参照してください。- offsetc
行列乗算で使用される
C_offsetの形式を指定します。詳細はデータタイプを参照してください。- m
行列 op(
A) と行列Cの行数。最小値は 0 です。- n
行列 op(
B) と行列Cの列数。最小値は 0 です。- k
行列 op(
A) の列数と行列 op(B) の行数。最小値は 0 です。- alpha
行列 - 行列積のスケーリング係数。
- a
入力行列
Aを保持するバッファー。行列ストレージを参照してください。transa=transpose::nontranstransa=transpose::transまたはtrans=transpose::conjtrans列優先
Aはmxkの行列です。配列aのサイズはlda*k以上でなければなりませんAはkxmの行列です。配列aのサイズはlda*m以上でなければなりません行優先
Aはmxkの行列です。配列aのサイズはlda*m以上でなければなりませんAはkxmの行列です。配列aのサイズはlda*k以上でなければなりません- lda
行列
Aの先頭次元。正である必要があります。transa=transpose::nontranstransa=transpose::transまたはtrans=transpose::conjtrans列優先
m以上である必要がありますk以上である必要があります行優先
k以上である必要がありますm以上である必要があります- ao
行列
Aのスカラーオフセット値を指定します。- b
入力行列
Bを保持するバッファー。行列ストレージを参照してください。transb=transpose::nontranstransb=transpose::transまたはtrans=transpose::conjtrans列優先
Bはkxnの行列です。配列bのサイズはldb*n以上でなければなりませんBはnxkの行列です。配列bのサイズはldb*k以上でなければなりません行優先
Bはkxnの行列です。配列bのサイズはldb*k以上でなければなりませんBはnxkの行列です。配列bのサイズはldb*n以上でなければなりません- ldb
行列
Bの先頭次元。正である必要があります。transb=transpose::nontranstransb=transpose::transまたはtrans=transpose::conjtrans列優先
k以上である必要がありますn以上である必要があります行優先
n以上である必要がありますk以上である必要があります- bo
行列
Bのスカラーオフセット値を指定します。- beta
行列
Cのスケーリング係数。- c
入力/出力行列
Cを保持するバッファー。行列ストレージを参照してください。列優先
Cはmxnの行列です。配列cのサイズはldc*n以上でなければなりません行優先
Cはmxnの行列です。配列cのサイズはldc*m以上でなければなりません- ldc
行列
Cの先頭次元。正である必要があります。列優先
m以上である必要があります行優先
n以上である必要があります- co
行列
Cのオフセット値を保持するバッファー。offset_type = offset::fixの場合、co配列のサイズは 1 以上である必要があります。offset_type = offset::colの場合、co配列のサイズはmax(1,m)以上である必要があります。offset_type = offset::rowの場合、co配列のサイズはmax(1,n)以上である必要があります。詳細はデータタイプを参照してください。
- mode
オプション。計算モードの設定。詳細は、計算モードを参照してください。
出力パラメーター#
- c
出力バッファーは、
alpha* (op(A) -A_offset) * (op(B) -B_offset) +beta*C+C_offsetで上書きされます。
注
beta = 0 の場合、gemm_bias を呼び出す前に行列 C を初期化する必要はありません。
gemm_bias (USM バージョン)#
構文#
namespace oneapi::mkl::blas::column_major {
sycl::event gemm_bias(sycl::queue &queue,
oneapi::mkl::transpose transa,
oneapi::mkl::transpose transb, oneapi::mkl::offset offsetc,
std::int64_t m,
std::int64_t n,
std::int64_t k,
oneapi::mkl::value_or_pointer<float> alpha,
const Ta *a,
std::int64_t lda,
Ta ao,
const Tb *b,
std::int64_t ldb,
Tb bo,
oneapi::mkl::value_or_pointer<float> beta,
std::int32_t *c,
std::int64_t ldc,
const std::int32_t *co,
compute_mode mode = compute_mode::unset,
const std::vector<sycl::event> &dependencies = {})
}namespace oneapi::mkl::blas::row_major {
sycl::event gemm_bias(sycl::queue &queue,
oneapi::mkl::transpose transa,
oneapi::mkl::transpose transb,
oneapi::mkl::offset offsetc,
std::int64_t m,
std::int64_t n,
std::int64_t k,
oneapi::mkl::value_or_pointer<float> alpha,
const Ta *a,
std::int64_t lda,
Ta ao,
const Tb *b,
std::int64_t ldb,
Tb bo,
oneapi::mkl::value_or_pointer<float> beta,
std::int32_t *c,
std::int64_t ldc,
const std::int32_t *co,
compute_mode mode = compute_mode::unset,
const std::vector<sycl::event> &dependencies = {})
}入力パラメーター#
- queue
ルーチンを実行するキュー。
- transa
行列
Aに適用される転置演算 op(A) を指定します。詳細はデータタイプを参照してください。- transb
行列
Bに適用される転置演算 op(B) を指定します。詳細はデータタイプを参照してください。- offsetc
行列乗算で使用される
C_offsetの形式を指定します。詳細はデータタイプを参照してください。- m
行列 op(
A) と行列Cの行数。最小値は 0 です。- n
行列 op(
B) と行列Cの列数。最小値は 0 です。- k
行列 op(
A) の列数と行列 op(B) の行数。最小値は 0 です。- alpha
行列 - 行列積のスケーリング係数。
value_or_pointerデータタイプの詳細については、スカラー引数を参照してください。- a
入力行列
Aへのポインター。行列ストレージを参照してください。transa=transpose::nontranstransa=transpose::transまたはtrans=transpose::conjtrans列優先
Aはmxkの行列です。配列aのサイズはlda*k以上でなければなりませんAはkxmの行列です。配列aのサイズはlda*m以上でなければなりません行優先
Aはmxkの行列です。配列aのサイズはlda*m以上でなければなりませんAはkxmの行列です。配列aのサイズはlda*k以上でなければなりません- lda
行列
Aの先頭次元。正である必要があります。transa=transpose::nontranstransa=transpose::transまたはtrans=transpose::conjtrans列優先
m以上である必要がありますk以上である必要があります行優先
k以上である必要がありますm以上である必要があります- ao
行列
Aのスカラーオフセット値を指定します。- b
入力行列
Bへのポインター。行列ストレージを参照してください。transb=transpose::nontranstransb=transpose::transまたはtrans=transpose::conjtrans列優先
Bはkxnの行列です。配列bのサイズはldb*n以上でなければなりませんBはnxkの行列です。配列bのサイズはldb*k以上でなければなりません行優先
Bはkxnの行列です。配列bのサイズはldb*k以上でなければなりませんBはnxkの行列です。配列bのサイズはldb*n以上でなければなりません- ldb
行列
Bの先頭次元。正である必要があります。transb=transpose::nontranstransb=transpose::transまたはtrans=transpose::conjtrans列優先
k以上である必要がありますn以上である必要があります行優先
n以上である必要がありますk以上である必要があります- bo
行列
Bのスカラーオフセット値を指定します。- beta
行列
Cのスケーリング係数。value_or_pointerデータタイプの詳細については、スカラー引数を参照してください。- c
入力/出力行列
Cへのポインター。行列ストレージを参照してください。列優先
Cはmxnの行列です。配列cのサイズはldc*n以上でなければなりません行優先
Cはmxnの行列です。配列cのサイズはldc*m以上でなければなりません- ldc
行列
Cの先頭次元。正である必要があります。列優先
m以上である必要があります行優先
n以上である必要があります- co
行列
Cのオフセット値を保持する配列へのポインター。offset_type = offset::fixの場合、co配列のサイズは 1 以上である必要があります。offset_type = offset::colの場合、co配列のサイズはmax(1,m)以上である必要があります。offset_type = offset::rowの場合、co配列のサイズはmax(1,n)以上である必要があります。詳細はデータタイプを参照してください。
- mode
オプション。計算モードの設定。詳細は、計算モードを参照してください。
- dependencies
オプション。計算を開始する前に待機するイベントのリスト (存在する場合)。省略した場合、依存関係はデフォルトでなくなります。
modeとdependenciesはそれぞれ省略できます。dependencies を提供するのにmodeを指定する必要はありません。
出力パラメーター#
- c
alpha* (op(A) -A_offset) * (op(B) -B_offset) +beta*C+C_offsetで上書きされた出力行列Cへのポインター。
注
beta = 0 の場合、gemm_bias を呼び出す前に行列 C を初期化する必要はありません。
戻り値#
計算が完了したことを確認するために待機する出力イベント。