gels_batch (バッファー・ストライド・バージョン)

gels_batch (バッファー・ストライド・バージョン)#

過剰決定線形システムのバッチの最小二乗解を求めます。このルーチンは、oneapi::mkl::lapack 名前空間に属します。

説明#

QR 分解を使用して、フルランク行列を持つ一連の線形システムのバッチを解きます。各線形システムは次のように解かれます。

m n かつ trans = transpose::nontrans の場合、過剰決定システムの最小二乗解が計算されます: min ||A*X - B||

m n かつ trans = (transpose::trans または tranpose::conjtrans) の場合、劣決定システムの最小ノルム解が計算されます: min ||X|| s.t. AH *X = B

終了時に、B の内容は解ベクトル X で上書きされます。

現在、m n かつ trans = transpose::nontrans の場合にのみサポートされます。

API#

構文#

namespace oneapi::mkl::lapack { 
  void gels_batch(sycl::queue &queue, 
  mkl::transpose trans, 
  int64_t m, 
  int64_t n, 
  int64_t nrhs, 
  sycl::buffer<T> &a, 
  int64_t lda, 
  int64_t stride_a, 
  sycl::buffer<T> &b, 
  int64_t ldb, 
  int64_t stride_b, 
  int64_t batch_size, 
  sycl::buffer<T> &scratchpad, 
  int64_t scratchpad_size) 
}

この関数は次の精度とデバイスをサポートしています。

T

デバイスサポート

float

GPU

double

GPU

std::complex<float>

GPU

std::complex<double>

GPU

入力パラメーター#

queue

計算が実行されるデバイスキュー。

trans

行列 Ai に適用される演算。実数精度: mkl::tranpose::nontrans または mkl::transpose::trans 複素数精度: mkl::tranpose::nontrans または mkl::transpose::conjtrans

m

行列 Ai の行数 (m n 0)。

n

行列 Ai の列数 (m n 0)。

nrhs

右辺の数: Bi の列の数 (nrhs 0)。

a

バッチサイズの m 行 n 列の行列 Ai を含みます

lda

Ai の先頭次元 i(ldamax(1,m))。

stride_a

バッチ配列 a 内の行列 Ai の先頭間のストライド (stride_amax(1, lda * n))。

b

右辺のベクトルの行列 Bi が含まれます。各行列 Bi には、解ベクトル Xi を格納するのに十分なスペース、つまり max(m,n)nrhs 列の領域が割り当てられる必要があります。

trans = transpose::nontrans の場合、Bimnrhs 列、それ以外の場合、Binnrhs 列になります。

ldb

Bi の先頭次元 i(ldbmax(1,max(m,n)))。

stride_b

バッチ配列 b 内の行列 Bi の先頭間のストライド (stride_bmax(1, ldb * nrhs))。

batch_size

バッチ内の問題数 (batch_size ≥ 0)。

scratchpad

ルーチンが中間結果を保存するスクラッチパッド・メモリー。

scratchpad_size

T タイプの浮動小数点要素数のスクラッチパッド・メモリーのサイズ。サイズは、gels_batch_scratchpad_size (ストライドバージョン) が返す値よりも小さくてはなりません。

出力パラメーター#

a

因数分解データによって次のように上書きされます: 最小二乗計算で使用される Ai に基づいて取得された三角行列 R が含まれます。tau ベクトルは記録されません。

b

一連の問題の最小二乗解によって上書きされます。

例外#

例外

説明

mkl::lapack::batch_exception

この例外は、計算中に問題が発生した場合にスローされます。例外オブジェクトの info() メソッドを使用して、問題の情報コードを取得できます。

info = -i の場合、i 番目のパラメーターの値が不正です。

info がスクラッチパッドのサイズとして渡された値と等しく、detail() がゼロ以外を返す場合、渡されたスクラッチパッドのサイズが十分ではなく、必要なサイズは例外オブジェクトの detail() メソッドによって返される値以上である必要があります。

info がゼロの場合、Ai はフルランクを持たないため、解決を完了できません。バッチ内のこのような行列のインデックスは、例外オブジェクトの ids() メソッドを使用して取得できます。例外オブジェクトの infos() メソッドを使用して、これらの行列の最初のゼロ対角要素のインデックスを取得できます。