インテル® MKL を使用した小行列乗算の高速化

同カテゴリーの次の記事

一般的な Linux* パッケージ・マネージャーを使用してインテル® パフォーマンス・ライブラリーとインテル® Distribution for Python* をインストールする

このセッションは、インテル® デベロッパー・ゾーンに公開されている「Speed Up Small-Matrix Multiplication using New Intel® Math Kernel Library Capabilities」の日本語版です。


この数年間、インテルは特に小行列をターゲットにした機能をインテル® マス・カーネル・ライブラリー (インテル® MKL) に追加してきました。 このセッションでは、それらの機能とサンプルコード、および基本的な使用モデルを紹介します。

    目次:
  • インテル® MKL の概要
  • インテル® MKL の新機能
  • 行列-行列乗算
  • 小行列のパフォーマンスの課題
  • 小行列のパフォーマンスを向上するインテル® MKL のソリューション
    • MKL_DIRECT_CALL
    • バッチ API
    • コンパクト API
    • パックド API
  • パフォーマンスのヒントと測定
  • サマリーおよびインテル® MKL 関連情報

パート 1 では、インテル® MKL の概要、新機能を説明しております。 そして、行列行列乗算について説明し、高速化のための最適化機能を紹介します。

パート 2 では、パフォーマンスの課題を克服するための 4つのソリューションを紹介し、最後にパフォーマンスのヒント、サブルーチンのパフォーマンスを測定するためのサンプルコードをご紹介します。

オンライン・トレーニング

※システム要件の詳細については、こちらのページをご覧ください。

関連記事