クラスター・アプリケーションのパフォーマンスを向上するには、インテル® oneAPI マス・カーネル・ライブラリー (インテル® oneMKL) で最適なスレッド数と正しいスレッド・アフィニティーを使用することが不可欠です。通常、最適な数は、ノードあたりの使用可能なコア数をノードあたりの MPI プロセス数で割った数になります。スレッド数を設定する方法にあるいずれかの手法でスレッド数を設定できます。
スレッド数が設定されていない場合、インテル® oneAPI マス・カーネル・ライブラリー (インテル® oneMKL) は、インテル® MPI ライブラリーによって提供される MPI プロセスで実行されるかどうか確認します。MPI プロセスで実行される場合、次の環境変数によりインテル® oneAPI マス・カーネル・ライブラリー (インテル® oneMKL) スレッドの動作が定義されます。
スレッドの動作は、I_MPI_THREAD_LEVEL の値に依存します:
0 または未定義。
インテル® oneAPI マス・カーネル・ライブラリー (インテル® oneMKL) は、インテル® MPI ライブラリーのスレッド・サポート・レベルが MPI_THREAD_SINGLE であると見なし、シーケンシャル実行をデフォルトに設定します。
1、2、または 3。
この値は、インテル® oneAPI マス・カーネル・ライブラリー (インテル® oneMKL) のスレッド・サポート・レベルを決定します。
いずれの場合も、インテル® oneAPI マス・カーネル・ライブラリー (インテル® oneMKL) は、前述のほかの環境変数を使用してノードあたりの MPI プロセス数を決定し、ノードあたりの利用可能なスレッド数をノードあたりの MPI プロセス数で割った値をスレッド数のデフォルトに設定します。
ここで説明した暗黙的な設定に頼らず、インテル® oneAPI マス・カーネル・ライブラリー (インテル® oneMKL) のスレッド数を明示的に設定します。
製品および性能に関する情報 |
---|
性能は、使用状況、構成、およびその他の要因によって異なります。詳細については、www.Intel.com/PerformanceIndex (英語) をご覧ください。 改訂 #20201201 |