gemm#

一般行列の行列-行列積を計算します。

説明

gemm ルーチンは、スカラー - 行列 - 行列積を計算し、その結果を一般行列のスカラー行列積に加算します。操作はのように定義されています。

\[C \leftarrow alpha*op(A)*op(B) + beta*C\]

説明:

  • op(X) は、op(X) = X、op(X) = XT、または op(X) = XH のいずれかです

  • alphabeta はスカラーです

  • AB、および C は行列です

  • op(A) は m x k 行列です

  • op(B) は k x n 行列です

  • Cm x n の行列です

gemm は次の精度をサポートします。

Ta
(A 行列)
Tb
(B 行列)
Tc
(C 行列)
Ts
(alpha/beta)

sycl::half

sycl::half

sycl::half

sycl::half

sycl::half

sycl::half

float

float

oneapi::mkl::bfloat16

oneapi::mkl::bfloat16

oneapi::mkl::bfloat16

float

oneapi::mkl::bfloat16

oneapi::mkl::bfloat16

float

float

std::int8_t

std::int8_t

std::int32_t

float

std::int8_t

std::int8_t

float

float

float

float

float

float

double

double

double

double

std::complex<float>

std::complex<float>

std::complex<float>

std::complex<float>

std::complex<double>

std::complex<double>

std::complex<double>

std::complex<double>

gemm (バッファーバージョン)#

構文#

namespace oneapi::mkl::blas::column_major { 
    void gemm(sycl::queue &queue, 
              oneapi::mkl::transpose transa, 
              oneapi::mkl::transpose transb, 
              std::int64_t m, 
              std::int64_t n, 
              std::int64_t k, 
              Ts alpha, 
              sycl::buffer<Ta,1> &a, 
              std::int64_t lda, 
              sycl::buffer<Tb,1> &b, 
              std::int64_t ldb, 
              Ts beta, 
              sycl::buffer<Tc,1> &c, 
              std::int64_t ldc, 
              compute_mode mode = compute_mode::unset) 
}
namespace oneapi::mkl::blas::row_major { 
    void gemm(sycl::queue &queue, 
              oneapi::mkl::transpose transa, 
              oneapi::mkl::transpose transb, 
              std::int64_t m, 
              std::int64_t n, 
              std::int64_t k, 
              Ts alpha, 
              sycl::buffer<Ta,1> &a, 
              std::int64_t lda, 
              sycl::buffer<Tb,1> &b, 
              std::int64_t ldb, 
              Ts beta, 
              sycl::buffer<Tc,1> &c, 
              std::int64_t ldc, 
              compute_mode mode = compute_mode::unset) 
}

入力パラメーター#

queue

ルーチンを実行するキュー。

transa

行列 A に適用される転置演算 op(A) を指定します。詳細はデータタイプを参照してください。

transb

行列 B に適用される転置演算 op(B) を指定します。詳細はデータタイプを参照してください。

m

行列 op(A) と行列 C の行数。最小値は 0 です。

n

行列 op(B) と行列 C の列数。最小値は 0 です。

k

行列 op(A) の列数と行列 op(B) の行数。最小値は 0 です。

alpha

行列 - 行列積のスケーリング係数。

a

入力行列 A を保持するバッファー。行列ストレージを参照してください。

transa = transpose::nontrans

transa = transpose::trans または trans = transpose::conjtrans

列優先

Am x k の行列です。配列 a のサイズは lda * k 以上でなければなりません

Ak x m の行列です。配列 a のサイズは lda * m 以上でなければなりません

行優先

Am x k の行列です。配列 a のサイズは lda * m 以上でなければなりません

Ak x m の行列です。配列 a のサイズは lda * k 以上でなければなりません

lda

行列 A の先頭次元。正である必要があります。

transa = transpose::nontrans

transa = transpose::trans または trans = transpose::conjtrans

列優先

m 以上である必要があります

k 以上である必要があります

行優先

k 以上である必要があります

m 以上である必要があります

b

入力行列 B を保持するバッファー。行列ストレージを参照してください。

transb = transpose::nontrans

transb = transpose::trans または trans = transpose::conjtrans

列優先

Bk x n の行列です。配列 b のサイズは ldb * n 以上でなければなりません

Bn x k の行列です。配列 b のサイズは ldb * k 以上でなければなりません

行優先

Bk x n の行列です。配列 b のサイズは ldb * k 以上でなければなりません

Bn x k の行列です。配列 b のサイズは ldb * n 以上でなければなりません

ldb

行列 B の先頭次元。正である必要があります。

transb = transpose::nontrans

transb = transpose::trans または trans = transpose::conjtrans

列優先

k 以上である必要があります

n 以上である必要があります

行優先

n 以上である必要があります

k 以上である必要があります

beta

行列 C のスケーリング係数。

c

入力/出力行列 C を保持するバッファー。行列ストレージを参照してください。

列優先

Cm x n の行列です。配列 c のサイズは ldc * n 以上でなければなりません

行優先

Cm x n の行列です。配列 c のサイズは ldc * m 以上でなければなりません

ldc

行列 C の先頭次元。正である必要があります。

列優先

m 以上である必要があります

行優先

n 以上である必要があります

mode

オプション。計算モードの設定。詳細は、計算モードを参照してください。

出力パラメーター#

c

出力バッファーは alpha * op(A) * op(B) + beta * C) で上書きされます。

beta = 0 の場合、gemm を呼び出す前に行列 C を初期化する必要はありません。

#

バッファーバージョンの gemm の使用方法の例は、oneMKL インストール・ディレクトリーの次の場所にあります。

share/doc/mkl/examples/sycl/blas/source/gemm.cpp

gemm (USM バージョン)#

構文#

namespace oneapi::mkl::blas::column_major { 
    sycl::event gemm(sycl::queue &queue, 
                     oneapi::mkl::transpose transa, 
                     oneapi::mkl::transpose transb, 
                     std::int64_t m, 
                     std::int64_t n, std::int64_t k, 
                     oneapi::mkl::value_or_pointer<Ts> alpha, 
                     const Ta *a, 
                     std::int64_t lda, 
                     const Tb *b, 
                     std::int64_t ldb, 
                     oneapi::mkl::value_or_pointer<Ts> beta, 
                     Tc *c, 
                     std::int64_t ldc, 
                     compute_mode mode = compute_mode::unset, 
                     const std::vector<sycl::event> &dependencies = {}) 
}
namespace oneapi::mkl::blas::row_major { 
    sycl::event gemm(sycl::queue &queue, 
                     oneapi::mkl::transpose transa, 
                     oneapi::mkl::transpose transb, 
                     std::int64_t m, 
                     std::int64_t n, 
                     std::int64_t k, 
                     oneapi::mkl::value_or_pointer<Ts> alpha, 
                     const Ta *a, 
                     std::int64_t lda, 
                     const Tb *b, 
                     std::int64_t ldb, 
                     oneapi::mkl::value_or_pointer<Ts> beta, 
                     Tc *c, 
                     std::int64_t ldc, 
                     compute_mode mode = compute_mode::unset, 
                     const std::vector<sycl::event> &dependencies = {}) 
}

入力パラメーター#

queue

ルーチンを実行するキュー。

transa

行列 A に適用される転置演算 op(A) を指定します。詳細はデータタイプを参照してください。

transb

行列 B に適用される転置演算 op(B) を指定します。詳細はデータタイプを参照してください。

m

行列 op(A) と行列 C の行数。最小値は 0 です。

n

行列 op(B) と行列 C の列数。最小値は 0 です。

k

行列 op(A) の列数と行列 op(B) の行数。最小値は 0 です。

alpha

行列 - 行列積のスケーリング係数。value_or_pointer データタイプの詳細については、スカラー引数を参照してください。

a

入力行列 A へのポインター。行列ストレージを参照してください。

A は転置されていない

A は転置されている

列優先

Am x k の行列です。配列 a のサイズは lda * k 以上でなければなりません

Ak x m の行列です。配列 a のサイズは lda * m 以上でなければなりません

行優先

Am x k の行列です。配列 a のサイズは lda * m 以上でなければなりません

Ak x m の行列です。配列 a のサイズは lda * k 以上でなければなりません

lda

行列 A の先頭次元。正である必要があります。

A は転置されていない

A は転置されている

列優先

m 以上である必要があります

k 以上である必要があります

行優先

k 以上である必要があります

m 以上である必要があります

b

入力行列 B へのポインター。行列ストレージを参照してください。

B は転置されていない

B は転置されている

列優先

Bk x n の行列です。配列 b のサイズは ldb * n 以上でなければなりません

Bn x k の行列です。配列 b のサイズは ldb * k 以上でなければなりません

行優先

Bk x n の行列です。配列 b のサイズは ldb * k 以上でなければなりません

Bn x k の行列です。配列 b のサイズは ldb * n 以上でなければなりません

ldb

行列 B の先頭次元。正である必要があります。

B は転置されていない

B は転置されている

列優先

k 以上である必要があります

n 以上である必要があります

行優先

n 以上である必要があります

k 以上である必要があります

beta

行列 C のスケーリング係数。value_or_pointer データタイプの詳細については、スカラー引数を参照してください。

c

入力/出力行列 C へのポインター。行列ストレージを参照してください。

列優先

Cm x n の行列です。配列 c のサイズは ldc * n 以上でなければなりません

行優先

Cm x n の行列です。配列 c のサイズは ldc * m 以上でなければなりません

ldc

行列 C の先頭次元。正である必要があります。

列優先

m 以上である必要があります

行優先

n 以上である必要があります

mode

オプション。計算モードの設定。詳細は、計算モードを参照してください。

dependencies

オプション。計算を開始する前に待機するイベントのリスト (存在する場合)。省略した場合、依存関係はデフォルトでなくなります。

modedependencies はそれぞれ省略できます。dependencies を提供するのに mode を指定する必要はありません。

出力パラメーター#

c

alpha * op(A)*op(B) + beta * C で上書きされた出力行列へのポインター。

beta = 0 の場合、gemm を呼び出す前に行列 C を初期化する必要はありません。

戻り値#

計算が完了したことを確認するために待機する出力イベント。

#

USM バージョンの gemm の使用方法の例は、oneMKL インストール・ディレクトリーの次の場所にあります。

share/doc/mkl/examples/sycl/blas/source/gemm_usm.cpp