インテル® oneAPI マス・カーネル・ライブラリー (インテル® oneMKL) の verbose モードでは、verbose 対応関数を呼び出すと説明ラインが出力されます。このラインは、MKL_VERBOSE という文字列で始まり、スペースが区切り文字となります。このラインの形式は、将来のリリースで変更される可能性があります。
次の表は、CPU アプリケーションの Verbose 呼び出しの説明ラインに含まれる情報を示し、詳細情報へのリンクを示します。
情報 |
説明 |
関連リンク |
|---|---|---|
関数名 |
出力される名前は、アプリケーションのソースコードで使用されている名前と異なる場合がありますが (例えば、CBLAS 関数のプリフィクス cblas_ は出力されません)、その名前から簡単に関数を認識することができます。 |
|
引数の値 |
|
|
関数の実行時間 |
|
マルチコア・パフォーマンスの管理 (アフィニティー・マスクを設定するためのオプション) |
MKL_CBWR 環境変数の値。 |
出力される値には、プリフィクス CNR: が付いています。 |
|
MKL_DYNAMIC 環境変数の値。 |
出力される値には、プリフィクス Dyn: が付いています。 |
|
インテル® oneAPI マス・カーネル・ライブラリー (インテル® oneMKL) メモリー・マネージャーのステータス。 |
出力される値には、プリフィクス FastMM: が付いています。 |
インテル® oneAPI マス・カーネル・ライブラリー (インテル® oneMKL) メモリー・マネージャーの説明については、oneMKL におけるメモリーリークの回避を参照してください。 |
呼び出しスレッドの OpenMP* スレッド番号 |
出力される値には、プリフィクス TID: が付いています。 |
|
全般的なスレッド数とドメイン固有のスレッド数を定義するカンマで区切ったインテル® oneAPI マス・カーネル・ライブラリー (インテル® oneMKL) 環境変数の値。 |
出力される最初の値には、プリフィクス NThr: が付いています。 |
以下は、呼び出しの説明ラインの出力例です (OpenMP* によるスレッド化)。
MKL_VERBOSE DGEMM(n,n,1000,1000,240,0x7ffff708bb30,0x7ff2aea4c000,1000,0x7ff28e92b000,240,0x7ffff708bb38,0x7ff28e08d000,1000) 1.66ms CNR:OFF Dyn:1 FastMM:1 TID:0 NThr:16
以下は、呼び出しの説明ラインの出力例です (TBB によるスレッド化)。
MKL_VERBOSE DGEMM(n,n,1000,1000,240,0x7ffff708bb30,0x7ff2aea4c000,1000,0x7ff28e92b000,240,0x7ffff708bb38,0x7ff28e08d000,1000) 1.66ms CNR:OFF Dyn:1 FastMM:1
インテル® oneAPI マス・カーネル・ライブラリー (インテル® oneMKL) の verbose モードの制限により、以下の情報は出力されません。
関数により変更された参照渡しパラメーターの入力値。
例えば、ワークスペース・クエリーによって LAPACK 関数が呼び出された場合、つまり lwork パラメーターの入力値が -1 の場合、呼び出しの説明行には -1 ではなくクエリーの結果が出力されます。
関数の戻り値。
例えば、関数 ilaenv の戻り値は出力されません。
参照渡しの浮動小数点スカラー。
インテル® oneAPI マス・カーネル・ライブラリー (インテル® oneMKL) の verbose モードでは、verbose 対応関数を呼び出すと説明ラインが出力されます。このラインは、MKL_VERBOSE という文字列で始まり、スペースが区切り文字となります。このラインの形式は、将来のリリースで変更される可能性があります。
次の表は、GPU を使用した verbose アプリケーションの呼び出し説明ラインに含まれる情報を示しています。
| 情報 | 説明 |
|---|---|
| 関数名 | 出力される名前は、アプリケーションのソースコードで使用されている名前と異なる場合がありますが、その名前から簡単に関数を認識することができます。 |
| 引数の値 |
|
| 関数の時間 |
|
| デバイス・インデックス | カーネルが実行されている GPU デバイスのインデックスは、文字列 "GPU" の後に表示されます (例: GPU0、GPU1、GPU2 など)。特定のデバイスの詳細については、インデックスを使用して GPU 情報ラインを参照してください。 カーネルがホスト CPU で実行される場合、このフィールドは空になります。 |
以下は、呼び出しの説明ラインの出力例です。
MKL_VERBOSE FFT(dcfi64) 224.30us GPU0
GPU アプリケーションの場合、次の 2 つのケースで、呼び出しの説明ラインが順序どおりに表示されないことがあります (verbose 出力に表示される呼び出しの説明ラインの順序は、関数でカーネルが送信される順序と一致しないことがあります)。