potrs_batch (USM ストライドバージョン)

potrs_batch (USM ストライドバージョン)#

コレスキー分解された対称 (エルミート) 正定値係数行列を持つ線形方程式系を解きます。このルーチンは、oneapi::mkl::lapack 名前空間に属します。

説明#

このルーチンは、対称正定値行列、または複素数データの場合はエルミート正定値行列 Ai を持つ線形方程式 Ai*Xi = Bi の連立方程式を、Ai のコレスキー分解 i ϵ{1...batch_size} が与えられた場合に Xi について解きます。

  • 実データの場合は Ai = UiT*Ui、複素データの場合は Ai = UiH*Ui。 uplo=mkl::uplo::upper の場合、

  • 実データの場合は Ai = Li*LiT、複素データの場合は Ai = Li*LiH。 uplo=mkl::uplo::lower の場合、

ここで、Li は下三角行列、Ui は上三角行列です。このシステムは、行列 Bi の列に複数の右辺が格納された状態で解かれます。

このルーチンを呼び出す前に、行列 Aipotrf_batch (USM ストライドバージョン) の呼び出しによって因数分解する必要があります。

API#

構文#

namespace oneapi::mkl::lapack { 
  sycl::event potrs_batch(sycl::queue &queue, 
  mkl::uplo uplo, 
  int64_t n, 
  int64_t nrhs, 
  const T *a, 
  int64_t lda, 
  int64_t stride_a, 
  T *b, 
  int64_t ldb, int64_t stride_b, 
  int64_t batch_size, 
  T *scratchpad, 
  int64_t scratchpad_size, 
  const std::vector<sycl::event> &events = {}) 
}

この関数は次の精度とデバイスをサポートしています。

T

デバイスサポート

float

CPU および GPU

double

CPU および GPU

std::complex<float>

CPU および GPU

std::complex<double>

CPU および GPU

入力パラメーター#

queue

計算が実行されるデバイスキュー。

uplo

入力行列がどのように因数分解されたかを示します。

uplo=mkl::uplo::upper の場合、Ai の上三角 Ui が格納されます。ここで、実数データの場合は Ai = UiT*Ui、複素数データの場合は Ai = UiH*Ui です。

uplo=mkl::uplo::lower の場合、Ai の下三角 Li が格納されます。ここで、実数データの場合は Ai = Li*LiT、複素数データの場合は Ai = Li*LiH です。

n

行列 Ai の順序 (n 0)。

nrhs

右辺の数 (nrhs 0)

a

potrf_batch (USM ストライドバージョン) によって返される、行列 Ai の因数分解のバッチを含む配列。

lda

Ai の先頭次元 i(ldamax(1, n))。

stride_a

バッチ配列 a 内の先頭間のストライド (stride_amax(1, lda * n))。

b

連立方程式の右辺の列を持つ行列 Bi のバッチを含む配列。

ldb

Bi の先頭次元 i(ldbmax(1, n))。

stride_b

バッチ配列 b 内の行列 Bi の先頭間のストライド (stride_bmax(1, ldb * nrhs))。

batch_size

バッチ内の問題数 (batch_size ≥ 0)。

scratchpad

ルーチンが中間結果を保存するスクラッチパッド・メモリー。

scratchpad_size

T タイプの浮動小数点要素数のスクラッチパッド・メモリーのサイズ。サイズは、potrs_batch_scratchpad_size (ストライドバージョン) が返す値よりも小さくてはなりません。

events

計算を開始する前に待機するイベントのリスト。デフォルトでは空のリストになります。

出力パラメーター#

b

ポインターバッチ配列 b が指すメモリーは、解行列 Xi によって上書きされます。

例外#

例外

説明

mkl::lapack::batch_exception

この例外は、計算中に問題が発生した場合にスローされます。例外オブジェクトの info() メソッドを使用して、問題の情報コードを取得できます。

info = -n の場合、n 番目のパラメーターの値が不正です。

info がスクラッチパッドのサイズとして渡された値と等しく、detail() がゼロ以外を返す場合、渡されたスクラッチパッドのサイズが十分ではなく、必要なサイズは例外オブジェクトの detail() メソッドによって返される値以上である必要があります。

info がゼロの場合、Ui の一部の対角要素がゼロになり、解決を完了できません。バッチ内のこのような行列のインデックスは、例外オブジェクトの ids() メソッドを使用して取得できます。例外オブジェクトの infos() メソッドを使用して、これらの Ui 行列の最初のゼロ対角要素のインデックスを取得できます。

戻り値#

計算が完了したことを確認するために待機する出力イベント。