ormqr (USM バージョン)#

geqrf (USM のバージョン) 関数によって形成された QR 分解の直交行列 Q を実行列に乗算します。このルーチンは、oneapi::mkl::lapack 名前空間に属します。

説明#

このルーチンは、実数 CQ または QT で乗算します。ここで、Q はルーチン geqrf (USM バージョン) によって形成された QR 分解の直交行列 Q です。

パラメーター sidetrans に応じて、ルーチンは行列積 Q*CQT*CC*Q、または C*QT (結果を C に上書き) のいずれかを形成できます。

API#

構文#

namespace oneapi::mkl::lapack { 
  sycl::event ormqr(sycl::queue &queue, 
  mkl::side side, 
  mkl::transpose trans, 
  int64_t m, 
  int64_t n, 
  int64_t k, 
  const T *a, 
  int64_t lda, 
  const T *tau, 
  T *c, 
  int64_t ldc, 
  T *scratchpad, 
  int64_t scratchpad_size, 
  const std::vector<sycl::event> &events = {}) 
}

ormqr (USM バージョン) は、次の精度とデバイスをサポートします。

T

デバイスサポート

float

CPU、GPU*

double

CPU、GPU*

* ハイブリッドのサポート。計算の一部は CPU 上で実行されます。

入力パラメーター#

queue

計算が実行されるデバイスキュー。

side

side = mkl::side::left の場合、Q または QT が左から C に適用されます。side = mkl::side::right の場合、Q または QT が右から C に適用されます。

trans

trans=mkl::transpose::trans の場合、ルーチンは CQ を乗算します。

trans=mkl::transpose::nontrans の場合、ルーチンは CQT を乗算しますT。

m

行列 A の行数 (0 m)。

n

行列 A の列数 (0 n m)。

k

積が行列 Q を定義する基本反射体の数 (0 k n)。

a

geqrf (USM バージョン) 関数によって返される結果へのポインター。a の 2 番目の次元は max(1,k) 以上でなければなりません。

lda

a の先頭次元。

tau

geqrf (USM バージョン) 関数によって返される tau へのポインター。

c

行列 C へのポインター。c の 2 番目の次元は max(1,n) 以上でなければなりません。

ldc

c の先頭次元。

scratchpad

ルーチンが中間結果を保存するスクラッチパッド・メモリーへのポインター。

scratchpad_size

T タイプの浮動小数点要素の数であるスクラッチパッド・メモリーのサイズ。サイズは、ormqr_scratchpad_size 関数が返す値以下であってはなりません。

events

計算を開始する前に待機するイベントのリスト。デフォルトでは空のリストになります。

出力パラメーター#

c

Q*CQT*CC*Q、または C*QT (side および trans で指定) によって上書きされます。

例外#

例外

説明

mkl::lapack::exception

この例外は、計算中に問題が発生した場合にスローされます。例外オブジェクトの info() メソッドを使用して、問題の情報コードを取得できます。

info = -i の場合、i 番目のパラメーターの値が不正です。

info がスクラッチパッドのサイズとして渡された値と等しく、detail() がゼロ以外を返す場合、渡されたスクラッチパッドのサイズが十分ではなく、必要なサイズは例外オブジェクトの detail() メソッドによって返される値以上である必要があります。

戻り値#

計算が完了したことを確認するために待機する出力イベント。