potrs_batch (グループバージョン)

potrs_batch (グループバージョン)#

コレスキー分解された対称 (エルミート) 正定値係数行列を持つ線形方程式系を解きます。このルーチンは、oneapi::mkl::lapack 名前空間に属します。

説明#

このルーチンは、対称正定値行列、または複素数データの場合はエルミート正定値行列 Ai を持つ線形方程式 Ai*Xi = Bi の連立方程式を、Ai のコレスキー分解 i ϵ{1...batch_size} が与えられた場合に Xi について解きます。

  • 実データの場合は Ai = UiT*Ui、複素データの場合は Ai = UiH*Ui。 uplog=mkl::uplo::upper の場合、

  • 実データの場合は Ai = Li*LiT、複素データの場合は Ai = Li*LiH。 uplog=mkl::uplo::lower の場合、

ここで、Li は下三角行列、Ui は上三角行列、gAi に対応するパラメーター・グループのインデックス、解決する問題の総数 batch_size は、group_sizes 配列によって提供されるすべてのパラメーター・グループのサイズの合計です。

このシステムは、行列 Bi の列に複数の右辺が格納された状態で解かれます。

このルーチンを呼び出す前に、行列 Aipotrf_batch (グループ ージョン) の呼び出しによって因数分解する必要があります。

API#

構文#

namespace oneapi::mkl::lapack { 
  sycl::event potrs_batch(sycl::queue &queue, 
  mkl::uplo *uplo, int64_t *n, 
  int64_t *nrhs, 
  const T * const *a, 
  int64_t *lda, 
  T **b, 
  int64_t *ldb, 
  int64_t group_count, 
  int64_t *group_sizes, 
  T *scratchpad, 
  int64_t scratchpad_size, 
  const std::vector<sycl::event> &events = {}) 
}

この関数は次の精度とデバイスをサポートしています。

T

デバイスサポート

float

CPU および GPU

double

CPU および GPU

std::complex<float>

CPU および GPU

std::complex<double>

CPU および GPU

入力パラメーター#

queue

計算が実行されるデバイスキュー。

uplo

group_count uplog パラメーターの配列。

各 uplog は、入力行列の上三角部分または下三角部分が与えられているかどうかを示します。

uplog=mkl::uplo::upper の場合、グループ g に属する配列 a の入力行列は上三角部分を格納します。

uplog=mkl::uplo::lower の場合、グループ g に属する配列 a の入力行列は下三角部分を格納します。

n

group_count パラメーターの配列 ng

ng は、グループ g (ng ≥ 0) に属する配列 a の入力行列の順序を指定します。

nrhs

group_count パラメーター nrhsg の配列。

各 nrhsg は、配列 b の対応する部分でグループ g に提供される右辺の数を指定します (nrhsg ≥ 0)。

a

potrf_batch (グループバージョン) によって返される、コレスキー分解行列 Ai への batch_size ポインターの配列。

lda

group_count パラメーター ldag の配列。

各 ldag は、グループ g に属する a 行列の先頭次元を指定します (ldagmax(1, ng))。

b

右辺の行列 Bi への batch_size ポインターの配列。それぞれのサイズは ldbg*nrhsg です。ここで、gBi に対応するグループのインデックスです。

ldb

group_count パラメーター ldbg の配列。

各 ldag は、グループ g に属する b 行列の先頭次元を指定します (ldbgmax(1, ng))。

group_count

パラメーターのグループの数を指定します。少なくとも 0 である必要があります。

group_sizes

group_count 整数の配列。インデックス g の配列要素は、パラメーター g のグループごとに解決する問題の数を指定します。したがって、解決する問題の合計数 batch_size は、すべてのパラメーター・グループ・サイズの合計になります。

scratchpad

ルーチンが中間結果を保存するスクラッチパッド・メモリー。

scratchpad_size

T タイプの浮動小数点要素数のスクラッチパッド・メモリーのサイズ。サイズは、potrs_batch_scratchpad_size (グループバージョン) が返す値よりも小さくてはなりません。

events

計算を開始する前に待機するイベントのリスト。デフォルトでは空のリストになります。

出力パラメーター#

b

配列 b が指す行列は、解行列 X によって上書きされます。

例外#

例外

説明

mkl::lapack::batch_exception

この例外は、計算中に問題が発生した場合にスローされます。例外オブジェクトの info() メソッドを使用して、問題の情報コードを取得できます。

info = -n の場合、n 番目のパラメーターの値が不正です。

info がスクラッチパッドのサイズとして渡された値と等しく、detail() がゼロ以外を返す場合、渡されたスクラッチパッドのサイズが十分ではなく、必要なサイズは例外オブジェクトの detail() メソッドによって返される値以上である必要があります。

info がゼロの場合、Ui の一部の対角要素がゼロになり、解決を完了できません。バッチ内のこのような行列のインデックスは、例外オブジェクトの ids() メソッドを使用して取得できます。例外オブジェクトの infos() メソッドを使用して、これらの Ui 行列の最初のゼロ対角要素のインデックスを取得できます。

戻り値#

計算が完了したことを確認するために待機する出力イベント。