getrf_batch (グループバージョン)

getrf_batch (グループバージョン)#

m 行 n 列の一般行列バッチの LU 分解バッチを計算します。このルーチンは、oneapi::mkl::lapack 名前空間に属します。

説明#

このルーチンは、mn 列の一般行列 Ai の LU 分解を次のように計算します (iϵ{1...batch_size})。

\[A_i = P_i \times L_i \times U_i\]

ここで、Pi は順列行列、Li は単位対角要素を持つ下三角行列 (m > n の場合は下台形行列) であり、Ui は上三角行列 m < n の場合は上台形行列) です。このルーチンは、行の交換を伴う部分ピボットを使用します。

解決する問題の合計数 batch_size は、group_sizes 配列によって提供されるすべてのパラメーター・グループのサイズの合計です。

API#

構文#

namespace oneapi::mkl::lapack { 
  sycl::event getrf_batch(sycl::queue &queue, 
  int64_t *m, 
  int64_t *n, 
  T **a, 
  int64_t *lda, 
  int64_t **ipiv, 
  int64_t group_count, 
  int64_t *group_sizes, 
  T *scratchpad, 
  int64_t scratchpad_size, 
  const std::vector<sycl::event> &events = {}) 
}

この関数は次の精度とデバイスをサポートしています。

T

デバイスサポート

float

CPU および GPU

double

CPU および GPU

std::complex<float>

CPU および GPU

std::complex<double>

CPU および GPU

入力パラメーター#

queue

計算が実行されるデバイスキュー。

m

グループ g に属する行列 Ai の行数を指定する group_count パラメーター mg の配列 (mg ≥ 0)。

n

グループ g に属する行列 Ai の列数を指定する group_count パラメーター ng の配列 (ng ≥ 0)。

a

入力行列 Aibatch_size ポインターの配列。ポインターはデバイスからアクセス可能である必要があります。

lda

グループ g 属する Ai の先頭次元を指定する group_count パラメーター ldag の配列 (ldagmax(1, mg))。

group_count

パラメーターのグループの数を指定します。少なくとも 0 である必要があります。

group_sizes

group_count 整数の配列。インデックス g の配列要素は、パラメーター g のグループごとに解決する問題の数を指定します。したがって、解決する問題の合計数 batch_size は、すべてのパラメーター・グループ・サイズの合計になります。

scratchpad

ルーチンが中間結果を保存するスクラッチパッド・メモリー。

scratchpad_size

T タイプの浮動小数点要素数のスクラッチパッド・メモリーのサイズ。サイズは、getrf_batch_scratchpad_size (グループバージョン) が返す値よりも小さくてはなりません。

events

計算を開始する前に待機するイベントのリスト。デフォルトでは空のリストになります。

出力パラメーター#

a

配列 a が指す行列は、LiUi によって上書きされます。Li の単位対角要素は保存されません。

ipiv

ピボット・インデックス ipivi を含む配列への batch_size ポインター配列。それぞれのサイズは max(1,min(mg, ng)) 以上です。1 ≤ kmin(mg, ng) の場合、Ai の 行 k (k) は行 ipivi と交換されます。ポインターはデバイスからアクセス可能である必要があります。

例外#

例外

説明

mkl::lapack::batch_exception

この例外は、計算中に問題が発生した場合にスローされます。例外オブジェクトの info() メソッドを使用して、問題の情報コードを取得できます。

info = -n の場合、n 番目のパラメーターの値が不正です。

info がスクラッチパッドのサイズとして渡された値と等しく、detail() がゼロ以外を返す場合、渡されたスクラッチパッドのサイズが十分ではなく、必要なサイズは例外オブジェクトの detail() メソッドによって返される値以上である必要があります。

info がゼロの場合、Ui の一部の対角要素がゼロになり、解決を完了できません。バッチ内のこのような行列のインデックスは、例外オブジェクトの ids() メソッドを使用して取得できます。例外オブジェクトの infos() メソッドを使用して、これらの Ui 行列の最初のゼロ対角要素のインデックスを取得できます。

戻り値#

計算が完了したことを確認するために待機する出力イベント。