gels_batch (USM ストライドバージョン)#
過剰決定線形システムのバッチの最小二乗解を求めます。このルーチンは、oneapi::mkl::lapack 名前空間に属します。
説明#
QR 分解を使用して、フルランク行列を持つ一連の線形システムのバッチを解きます。各線形システムは次のように解かれます。
m ≥ n かつ trans = transpose::nontrans の場合、過剰決定システムの最小二乗解が計算されます: min ||A*X - B||
m ≥ n かつ trans = (transpose::trans または tranpose::conjtrans) の場合、劣決定システムの最小ノルム解が計算されます: min ||X|| s.t. AH *X = B
終了時に、B の内容は解ベクトル X で上書きされます。
現在、m ≥ n および trans = transpose::nontrans の場合にのみサポートされます。
API#
構文#
namespace oneapi::mkl::lapack {
sycl::event gels_batch(sycl::queue &queue,
mkl::transpose trans,
int64_t m,
int64_t n,
int64_t nrhs,
T *a,
int64_t lda,
int64_t stride_a,
T *b,
int64_t ldb,
int64_t stride_b,
int64_t batch_size,
T *scratchpad,
int64_t scratchpad_size,
const std::vector<sycl::event> &events = {})
}この関数は次の精度とデバイスをサポートしています。
T |
デバイスサポート |
|---|---|
|
GPU |
|
GPU |
|
GPU |
|
GPU |
入力パラメーター#
- queue
計算が実行されるデバイスキュー。
- trans
行列
Ai に適用される演算。実数精度:mkl::tranpose::nontransまたはmkl::transpose::trans複素数精度:mkl::tranpose::nontransまたはmkl::transpose::conjtrans- m
行列
Ai の行数 (m ≥ n ≥ 0)。- n
行列
Ai の列数 (m ≥ n ≥ 0)。- nrhs
右辺の数:
Bi の列の数 (nrhs ≥ 0)。- a
バッチサイズの m 行 n 列の行列
Ai を含みます- lda
Ai の先頭次元 i(lda≥max(1,m))。- stride_a
バッチ配列
a内の行列Ai の先頭間のストライド (stride_a≥max(1, lda * n))。- b
右辺のベクトルの行列
Bi が含まれます。各行列Bi には、解ベクトルXi を格納するのに十分なスペース、つまりmax(m,n)行nrhs列の領域が割り当てられる必要があります。trans = transpose::nontransの場合、Bi はm行nrhs列、それ以外の場合、Bi はn行nrhs列になります。- ldb
Bi の先頭次元 i(ldb≥max(1,max(m,n)))。- stride_b
バッチ配列
b内の行列Bi の先頭間のストライド (stride_b≥max(1, ldb * nrhs))。- batch_size
バッチ内の問題数 (
batch_size≥ 0)。- scratchpad
ルーチンが中間結果を保存するスクラッチパッド・メモリー。
- scratchpad_size
T タイプの浮動小数点要素数のスクラッチパッド・メモリーのサイズ。サイズは、gels_batch_scratchpad_size (ストライドバージョン) が返す値よりも小さくてはなりません。
- events
計算を開始する前に待機するイベントのリスト。デフォルトでは空のリストになります。
出力パラメーター#
- a
因数分解データによって次のように上書きされます: 最小二乗計算で使用される
Ai に基づいて取得された三角行列 R が含まれます。tauベクトルは記録されません。- b
一連の問題の最小二乗解によって上書きされます。
例外#
例外 |
説明 |
|---|---|
|
この例外は、計算中に問題が発生した場合にスローされます。例外オブジェクトの info() メソッドを使用して、問題の情報コードを取得できます。
|
戻り値#
計算が完了したことを確認するために待機する出力イベント。