getrs_batch (グループバージョン)

getrs_batch (グループバージョン)#

複数の右辺を持つ LU 分解された正方係数行列のバッチを使用して、一連の線形方程式を解きます。このルーチンは、oneapi::mkl::lapack 名前空間に属します。

説明#

このルーチンは、Xi (iϵ{1...batch_size}) について次の線形方程式を解きます。

  • trans = mkl::transpose::notrans の場合、Ai * Xi = Bi

  • trans = mkl::transpose::trans の場合、AiT * Xi = Bi

  • trans = mkl::transpose::conjtrans の場合、AiH * Xi = Bi

このルーチンを呼び出す前に、getrf_batch (グループバージョン) を呼び出して Ai の LU 分解を計算します。

解決する問題の合計数 batch_size は、``group_sizes`` 配列によって提供されるすべてのパラメーター・グループのサイズの合計です。

API#

構文#

namespace oneapi::mkl::lapack { 
  sycl::event getrs_batch(sycl::queue &queue, 
  mkl::transpose *trans, 
  int64_t *n, 
  int64_t *nrhs, 
  const T * const *a, 
  int64_t *lda, 
  const int64_t *
   const *ipiv, 
  T **b, 
  int64_t *ldb, 
  int64_t group_count, 
  int64_t *group_sizes, 
  T *scratchpad, 
  int64_t scratchpad_size, 
  const std::vector<sycl::event> &events = {}) 
}

この関数は次の精度とデバイスをサポートしています。

T

デバイスサポート

float

CPU および GPU

double

CPU および GPU

std::complex<float>

CPU および GPU

std::complex<double>

CPU および GPU

入力パラメーター#

queue

計算が実行されるデバイスキュー。

trans

グループ g の方程式の形式を示す group_count パラメーター transg の配列:

trans = mkl::transpose::nontrans の場合、Xi について Ai*Xi = Bi が解かれます。

trans = mkl::transpose::trans の場合、Xi について AiT*Xi = Bi が解かれます。

trans = mkl::transpose::conjtrans の場合、Xi について AiH*Xi = Bi が解かれます。

n

行列 Ai の順序とグループ g に属する行列 Bi の行数を指定する group_count パラメーター ng の配列 (ng ≥ 0)。

nrhs

グループ g の右辺を指定する group_count パラメーター nrhsg の配列 (nrhsg ≥ 0)。

a

getrf_batch (グループバージョン) によって返される、行列 Ai の因数分解への batch_size ポインターの配列。ポインターはデバイスからアクセス可能である必要があります。

lda

グループ g から Ai の先頭次元を指定する group_count パラメーター ldag の配列 (ldagmax(1, ng))。

ipiv

getrf_batch (グループバージョン) によって返される ipiv 配列。ポインターはデバイスからアクセス可能である必要があります。

b

連立方程式の右辺の列を持つ行列 Bi への batch_size ポインターを含む配列。ポインターはデバイスからアクセス可能である必要があります。

ldb

グループ g 属する Bi の先頭次元を指定する group_count パラメーター ldbg の配列 (ldbgmax(1, ng))。

group_count

パラメーターのグループの数を指定します。少なくとも 0 である必要があります。

group_sizes

group_count 整数の配列。インデックス g の配列要素は、パラメーター g のグループごとに解決する問題の数を指定します。したがって、解決する問題の合計数 batch_size は、すべてのパラメーター・グループ・サイズの合計になります。

scratchpad

ルーチンが中間結果を保存するスクラッチパッド・メモリー。

scratchpad_size

T タイプの浮動小数点要素数のスクラッチパッド・メモリーのサイズ。サイズは、getrs_batch_scratchpad_size (グループバージョン) が返す値よりも小さくてはなりません。

events

計算を開始する前に待機するイベントのリスト。デフォルトでは空のリストになります。

出力パラメーター#

b

解行列 Xi によって上書きされます。

例外#

例外

説明

mkl::lapack::batch_exception

この例外は、計算中に問題が発生した場合にスローされます。例外オブジェクトの info() メソッドを使用して、問題の情報コードを取得できます。

info = -n の場合、n 番目のパラメーターの値が不正です。

info がスクラッチパッドのサイズとして渡された値と等しく、detail() がゼロ以外を返す場合、渡されたスクラッチパッドのサイズが十分ではなく、必要なサイズは例外オブジェクトの detail() メソッドによって返される値以上である必要があります。

info がゼロの場合、Ui の一部の対角要素がゼロになり、解決を完了できません。バッチ内のこのような行列のインデックスは、例外オブジェクトの ids() メソッドを使用して取得できます。例外オブジェクトの infos() メソッドを使用して、これらの Ui 行列の最初のゼロ対角要素のインデックスを取得できます。

戻り値#

計算が完了したことを確認するために待機する出力イベント。