インテル® プラットフォーム上でディープ・イメージ・マッティング・アルゴリズムの推論を高速化する

イメージインテル® oneMKLインテル® VTune™ プロファイラーマシンラーニング

この記事は、インテル® デベロッパー・ゾーンに公開されている「Accelerate Deep Image Matting Algorithm Inference on Intel Platforms」(https://software.intel.com/en-us/blogs/2018/09/26/accelerate-deep-image-matting-algorithm-inference-on-intel-platforms) の日本語参考訳です。


はじめに

イメージ・マッティングは視覚処理における問題であり、背景色と前景色が類似すると複雑になります。イリノイ大学アーバナ・シャンペーン校ベックマン先端科学技術研究所の研究者と Adobe* Research のエンジニアは共同で、CVPR’17 (英語) においてディープ・イメージ・マッティング・アルゴリズムを発表しました。

このアルゴリズム (図 1) は、ディープラーニングを使用して前景と背景をインテリジェントに分離しますが、非常に多くの CPU 時間を要するため、大規模な処理をローカルで実行するのには向いていません。

インフォグラフィック
図 1. タイルごとの推論アルゴリズム (英語)

ディープラーニングの推論をクライアントで行うと、レイテンシーの短縮、コスト軽減、ネットワーク帯域幅に関する懸念の解消 (オフラインで処理可能)、消費者の信頼性とプライバシーの確保につながるため、将来のユースケースはこの傾向にあります。

320×320 イメージのディープ・イメージ・マッティングの実行では、1 つの推論に約 2.35 秒かかります。これはクライアント上の推論では許容できる値ではありません。図 2 は、インテル® HD グラフィックス内蔵第 7 世代インテル® Core™ i7 プロセッサー上でインテル® VTune™ Amplifier を使用して測定したディープ・イメージ・マッティング・アルゴリズムの合計実行時間を示しています。図 3 は、Windows* パフォーマンス・アナライザーで測定したディープ・イメージ・マッティング・アルゴリズムのメモリー使用量を示しています。

CPU 時間
図 2. インテル® マス・カーネル・ライブラリー (インテル® MKL) の BLAS を使用するディープ・イメージ・マッティングの CPU 時間 – 2.35 秒

メモリー使用量のグラフ
図 3. ディープ・イメージ・マッティングのメモリー使用量

OpenVINO™ ツールキットとディープ・ニューラル・ネットワーク向けインテル® MKL (インテル® MKL-DNN) を使用してインテルがイメージ・マッティング・アルゴリズムを最適化した結果、CPU 時間は 5.3 倍向上し、メモリー使用量は 1/3 に減りました。図 4 は、インテル® VTune™ Amplifier で測定した、最適化されたディープ・イメージ・マッティング・アルゴリズムの 1 反復の合計実行時間を示しています。

CPU 時間
図 4. OpenVINO™ ツールキットを使用して最適化されたディープ・イメージ・マッティング

図 5 は、Windows* パフォーマンス・アナライザーで測定した、最適化されたディープ・イメージ・マッティング・アルゴリズムのメモリー使用量を示しています。.

メモリー使用量のグラフ
図 5. 最適化されたディープ・イメージ・マッティングのメモリー使用量

OpenVINO™ ツールキットは、最高のパフォーマンスを実現するため、アルゴリズムがインテル® ハードウェア上で最適化されたパイプラインを使用するのを支援します。

まとめ

クライアントでインテリジェントな処理を行うことで、開発者はコストを軽減できるだけなく、レイテンシーとセキュリティーの要件を満たすことができます。OpenVINO™ ツールキットとインテル® MKL-DNN を使用することで、最適化されたディープラーニング・ライブラリーによりディープ・イメージ・マッティング・アルゴリズムの計算時間が 1/5 になりました。また、OpenVINO™ ツールキットは、ディープラーニングの推論を最適化して、メモリー使用量を 1/3 に減らしました。

関連情報

システム構成

  • インテル® HD グラフィックス内蔵第 7 世代インテル® Core™ i7 プロセッサー (4 コア、8 スレッド)
  • TDP: 15W
  • メモリー: 8GB RAM
  • オペレーティング・システム: Windows® 10

コンパイラーの最適化に関する詳細は、最適化に関する注意事項を参照してください。

タイトルとURLをコピーしました