gels (USM バージョン)#

過剰決定連立一次方程式の最小二乗解または不足決定連立一次方程式の最小ノルム解を求めます。このルーチンは、oneapi::mkl::lapack 名前空間に属します。

説明#

QR 分解を使用して、フルランク行列の連立一次方程式を解きます。各線形システムは次のように解かれます。

m n かつ trans = transpose::nontrans の場合、過剰決定システムの最小二乗解が計算されます: min ||A*X - B||

m n かつ trans = (transpose::trans または tranpose::conjtrans) の場合、劣決定システムの最小ノルム解が計算されます: min ||X|| s.t. AH* X = B

m < n は、サポートされません。

終了時に、B の内容は解ベクトル X で上書きされます。

API#

構文#

namespace oneapi::mkl::lapack { 
  sycl::event gels(sycl::queue &queue, 
  mkl::transpose trans, 
  int64_t m, 
  int64_t n, 
  int64_t nrhs, 
  T *a, 
  int64_t lda, 
  T *b, 
  int64_t ldb, 
  T *scratchpad, 
  int64_t scratchpad_size, 
  const std::vector<sycl::event> &events = {}) 
}

gels (USM バージョン) は、次の精度とデバイスをサポートします。

T

デバイスサポート

float

CPU および GPU

double

CPU および GPU

std::complex<float>

CPU および GPU

std::complex<double>

CPU および GPU

入力パラメーター#

queue

計算が実行されるデバイスキュー。

trans

行列 A に適用された演算。実数精度: mkl::tranpose::nontrans または mkl::transpose::trans 複素数精度: mkl::tranpose::nontrans または mkl::transpose::conjtrans

m

行列 A の行数 (m n 0)。

n

行列 A の列数 (m n 0)。

nrhs

右辺の数: B の列数 (nrhs 0)。

a

入力行列 A を保持するメモリーへのポインタ。

lda

a の先頭次元 (lda max(1,m))。

b

右辺ベクトルの入力行列 B を保持するメモリーへのポインター。各行列 B には、解ベクトル X を格納するのに十分なスペース、つまり max(m,n)nrhs 列の領域が割り当てられる必要があります。

trans = transpose::nontrans の場合、Bmnrhs 列、それ以外の場合、Bnnrhs 列になります。

ldb

b の先頭次元 (ldb max(1, max(m,n)))。

scratchpad

ルーチンが中間結果を保存するスクラッチパッド・メモリーへのポインター。

scratchpad_size

T タイプの浮動小数点要素の数であるスクラッチパッド・メモリーのサイズ。サイズは、gels_scratchpad_size 関数が返す値以下であってはなりません。

events

計算を開始する前に待機するイベントのリスト。デフォルトでは空のリストになります。

出力パラメーター#

a

次のように因数分解データによって上書きされます。最小二乗計算で使用される A に基づいて取得された三角行列 R が含まれます。

b

問題の最小二乗解によって上書きされます。

例外#

例外

説明

mkl::lapack::exception

この例外は、計算中に問題が発生した場合にスローされます。例外オブジェクトの info() メソッドを使用して、問題の情報コードを取得できます。

info = -i の場合、i 番目のパラメーターの値が不正です。

info がスクラッチパッドのサイズとして渡された値と等しく、detail() がゼロ以外を返す場合、渡されたスクラッチパッドのサイズが十分ではなく、必要なサイズは例外オブジェクトの detail() メソッドによって返される値以上である必要があります。

戻り値#

計算が完了したことを確認するために待機する出力イベント。