インテル® oneAPI 最新情報

同カテゴリーの次の記事

インテル® oneAPI ポーティング・ガイド (ifx) 日本語版 最新版公開

この記事は、インテル® デベロッパー・ゾーンに公開されている「Intel oneAPI News Updates」の日本語参考訳です。


2022年

Tencent が oneAPI ツールにより最大 85% のパフォーマンス向上を達成

2022年9月12日 | インテル® oneAPI DPC++/C++ コンパイラーIntel® VTune™ プロファイラー

MySQL を最適化した Tencent の結果は、インテル® oneAPI DPC++/C++ コンパイラーなどの最新の [インテル® oneAPI] 開発ツールとインテル® VTune™ プロファイラーによる最新の最適化手法の両方の重要性を実証しています。パフォーマンスの大幅な向上により、ビジネス・クリティカルなアプリケーションでは、結果を得るまでの時間の短縮、あるいはより多くの結果を得ることが可能です。

インテル コーポレーション
ソフトウェア製品 & エコシステム担当 VP & GM
Joe Curley

Tencentは、データベース・ホスティング・サービスである TencentDB for MySQL (英語) のパフォーマンスを大幅に向上させました。オープンソースのリレーショナル・データベース管理システム MySQL をベースに、インテル® Xeon® プロセッサーで構築し、高度なインテル® oneAPI DPC++/C++ コンパイラーとインテル® VTune™ プロファイラー (インテル® oneAPI ベース・ツールキットに含まれる) を使用することでパフォーマンスの向上を実現しました。

これが重要な理由

分散データストレージは、インターネット、金融、電子商取引などの業界やユースケースにおいて重要な役割を果たします。TencentDB for MySQL のようなソリューションは、開発者に分散データストレージのサービスを提供し、クラウドでリレーショナル・データベースを簡単にセットアップ、運用、拡張できるようにサポートします。

記事を読む (英語)>


レンダリングから HPC まで、インテル® oneAPI ツールがオープンソース・ソリューションを最適化

2022年9月8日 | インテル® oneAPI ベース・ツールキットインテル® oneAPI HPC ツールキットインテル® oneAPI レンダリング・ツールキット

2 つの人気があるパワフルなアプリケーション、Blender 3.3 と Radioss (オープンソース版 OpenRadioss を利用可能) が、非常に異なる (そして非常に重要な) oneAPI ツールと機能によって最適化されました。

Blender Cycles がインテル® ディスクリート GPU を完全にサポート

Blender 3.3 (英語) から、Cycles レンダリング・エンジンに、インテル® Arc™ A シリーズ・ディスクリート・グラフィックスインテル® Data Center GPU フレックス・シリーズをサポートするレンダリング・デバイス API として oneAPI が含まれました。この新しいサポートは、マルチベンダーの CPU と GPU コード開発を提供する、オープンで標準ベースの言語である The Khronos Group の SYCL* を実装しています。これは、Blender のクリエイターとユーザーを、特定の独自アーキテクチャーとプログラミングから解放することを目的とした、進化的な開発アプローチの第一歩となります。

Cycles は Blender のレイトレーシング・レンダラーで、複雑なパストレーシング・シーン、ジオメトリー・ノート、間接照明、最終フレーム用の高密度ジオメトリーを備えています。長年にわたり、インテルは、開発コンサルティング、高度なレイトレーシング機能の統合、トレーニングなど、Blender に貢献してきました。アカデミー賞を受賞した (英語) 3D レイトレーシング・カーネル・ライブラリーであるインテル® Embree は、数年前に Blender に統合され、高忠実度のフォトリアリズムを実現し、多くの映画やプロジェクトをサポートしています。2019年にはインテル® Open Image Denoise が追加され、アーティストやスタジオがより短時間で最終フレームの画質を実現できるようになりました。

Altair が OpenRadioss を発表

「Altair が OpenRadioss をオープンソース・コミュニティーに提供したことで、衝突シミュレーションなどの構造解析における重要な問題の解決を目指す開発者が、オープンソース開発のメリットを享受できるようになりました。オープンソース開発に対するインテルのコミットメントは、ハイパフォーマンス・ハードウェアの価値を生産的に最大化するのに役立つ、オープンソースの oneAPI コンパイラー、ライブラリー、開発ツールを用いた Altair との協業にも反映されています。」

インテル コーポレーション
ソフトウェア製品 & エコシステム担当 VP & GM
Joe Curley

Altair は、複雑な設計の耐衝撃性、安全性、および製造可能性を高める最先端の解析ソリューション Radioss (英語) を、OpenRadioss としてオープンソース化しました。Altair のエンジニアは、インテル® oneAPI ベース & HPC ツールキットに含まれる複数のツールを使用して、ソフトウェアの最適化を行いました。

動画を見る (英語) >


インテリジェント・ビジュアル・クラウド向けの新しいインテル® Data Center GPU フレックス・シリーズがオープン・ソフトウェア・スタックを採用

2022年8月24日 | インテル® oneVPL (英語) | インテル® VTune™ プロファイラー

本日発表されたインテル® Data Center GPU フレックス・シリーズは、汎用性の高いシームレスなハードウェアとオープンなソフトウェア・ソリューション・スタックを備え、インテリジェントなビジュアル・クラウド・ワークロードに必要な柔軟性とパフォーマンスを提供します。

主な機能:

  • 競合ソリューションの半分の消費電力で、5 倍のメディア・トランスコード・スループットと 2 倍のデコード・スループットを実現1
  • 帯域幅を 30% 以上向上し、総所有コスト (TCO) を大幅に軽減
  • 一般的なメディアツール、API、フレームワーク、および最新のコーデックを幅広くサポート

インテル® フレックス・シリーズ GPU は、メディア配信、クラウドゲーミング、AI、メタバースなど、幅広いワークロードに柔軟に対応し、パフォーマンスや品質を損なうことなく、TCO を軽減/最適化するように設計されています。この GPU は、ユーザーをサイロ化された独自環境の制約から解放し、データセンターが個別の専用ソリューションを使用する必要性を低減します。

開発者は、オープンソースのコンポーネントとツールを組み合わせた包括的なソフトウェア・スタックを利用して、ビジュアル・クラウド・ワークロード向けのインテル® フレックス・シリーズ GPU の機能を効果的に実現できます。インテル® oneAPI ツールは、インテル® oneVPL (英語)、インテル® VTune™ プロファイラーなど、高速化されたアプリケーションとサービスを提供する開発者向けのツールです。

簡単にダウンロードできるソフトウェア・パッケージの詳細については、近日公開予定です。

詳細: インテル ニュースルーム | インテル® フレックス・シリーズ GPU


インテルのハードウェアと高度なレイトレーシングにより 3D アーティストの映像に生命を吹き込む

2022年8月16日 | インテル® Open VKL (英語)、インテル® oneAPI レンダリング・ツールキット

インテル® Advanced Ray Tracing とインテル® Core™ モバイル・プロセッサー HX シリーズは、プロフェッショナルなワークフローと素晴らしいコンテンツ制作のためのハイパフォーマンスを提供します。

インテルは最近、RenderMan* 向けのインテル® Open VKL プラグイン (英語) をリリースしました。このプラグインは、VFX およびアニメーション向けの世界で最も汎用性の高いレンダラーである Pixar Animation の RenderMan* と連携し、インテル® オープン・ボリューム・カーネル・ライブラリーを利用して、最終フレームのボリューム・レンダリングのパフォーマンスを大幅に向上させることが可能です。

Renderman*、インテル® Open VKL、第 12 世代インテル® Core™ HX プロセッサーの強力な組み合わせにより、Fabio Sciedlarczyk (英語) などのアーティストは、火、水、空気、雲、煙など、計算量の多いボリュメトリック・コンテンツをより迅速にレンダリングできるようになり、視覚的に魅力的なストーリーの制作により多くの時間を割くことが可能になりました。このビデオでは、Sciedlarczyk 氏がこれらのツールを使って、素晴らしいフォトリアリスティックなビジュアルを構築し、パフォーマンスを犠牲にすることなく、モバイル・ワークステーションでコンパイル時間を劇的に短縮しながら、外出先でもそれらを作成する様子をご覧いただけます。

「最近では、利用可能なツールを使用することで、コンピューター・グラフィックスがほとんど制約のないメディアになりつつあります。」そしてインテルは、可能性の限界を押し広げ続けているのです。

ルック・デベロップメント・アーティスト
Fabio Sciedlarczyk 氏

 

このオープンソース・プラグインは、GitHub* (英語) で無料公開されており、ソフトウェア・エコシステム全体でコンテンツ・クリエイターや開発者によるイノベーションと幅広い採用を促進するという、インテルのオープン・ソフトウェア戦略に沿ったものとなっています。インテル® Open VKLは、インテル® oneAPI レンダリングツール・キットに含まれます。

関連情報


インテルと Aible が AI を実現するため提携

2022年8月9日 | Aible (英語)、インテル® AI アナリティクス・ツールキット (英語)

インテル® Xeon® スケーラブル・プロセッサーは、ソフトウェアの最適化とともに、30 日以内にビジネス成果を実現します。

インテルは、クラウドベースの AI/ML プラットフォーム・ソリューション・プロバイダーである Aible との協業により、データセンター・ベースの AI アプリケーションおよびイニシアチブを、複雑性を増すことなく、より迅速に、より優れた TCO で提供できます。

AI を加速するインテル® Xeon® スケーラブル・プロセッサーと AI に最適化されたツール (インテル® oneAPI ディープ・ニューラル・ネットワーク・ライブラリー (インテル® oneDNN) + インテル® AI アナリティクス・ツールキットのほかのツール) と組み合わせることで、Aible のテクノロジーは、ほかのサーバー指向ソリューションよりも速くマシンラーニング・モジュールをトレーニングするサーバーレス・ファーストアプローチを提供できます。

詳細とベンチマーク (英語) >
ケーススタディー (英語) >


インテル® Advanced Ray Tracing による驚異的な Hi-Fi グラフィックスの展開

2022年8月8日 | [NEW!] インテル® Arc™ Pro A シリーズ・グラフィックスインテル® Open VKL プラグインplugin for RenderMan* (英語)、インテル® Open Path Guiding Library (英語)、SIGGRAPH 2022 (英語)

新たに発表されたインテル ® Arc™ Pro GPU、インテル® Open VKL Plugin for Renderman*、およびインテル® Open Path Guiding Library

SIGGRAPH 2022 に合わせて、インテルは高忠実度グラフィックスを高速化する新しい GPU ハードウェアおよびソフトウェア・テクノロジーを発表しました。これらのイノベーションは、コンシューマー向けからハイエンドノート PC、ワークステーション、データセンター/レンダーファーム、クラウド、そして世界最大のスーパーコンピューターまで、パフォーマンスをスケーリングするオープンなエンドツーエンドのプラットフォーム規模のソリューションを提供するというインテルのミッションの次のステップを示しています。

概要

プロフェッショナル向けのインテル® Arc™ Pro A シリーズ GPU は、内蔵のレイトレーシング・ハードウェア、業界初の AV1 ハードウェア・エンコーディング・アクセラレーション、およびマシンラーニング機能を搭載しています。
詳細 (英語) >

新しいインテル® Advanced Ray Tracing テクノロジーは、洗練されたレイトレーシング、ビジュアル・コンピューティング、高忠実度、ビジュアライゼーションを可能にします。

標準ベースのソリューションにおけるグローバルリーダーとの異業種コラボレーションにより、グラフィックス・イノベーションを継続的に進めています。

  • DreamWorks Animation (英語) は、MCRT レンダラー「MoonRay*」をオープンソース・ソフトウェアとして今年後半にリリースする計画を発表しました。このレンダラーの写実的なレイトレーシングは、インテル® oneAPI レンダリング・ツールキット (レンダリング・キット) の 2 つのオープンソース・ツールによってサポートされています。インテル® Embree レイトレーシング・カーネル・ライブラリーは高度なレンダリング機能を、インテル® Implicit SPMD Program Compiler (インテル® ISPC) はベクトル命令の並列化を提供します。
  • Blender* 3.3 (英語) のベータ版が公開され、oneAPI プログラミングにより、インテル® Arc™ GPU および今後発売予定のインテル® データセンター GPU において、Linux* および Windows* で 1 つのコードベースをサポートすることが可能になりました。
  • インテルは、Unity* アセット・パブリッシャーである Procedural Worlds 社と共同で、インテル® Game Dev AI Toolkit with Gaia ML (for Unity*) (英語) を開発しました。これにより、開発者はマシンラーニング機能をゲーム体験に導入できます。
  • Foundry の Modo* 16.0 (英語) リリースは、次期インテル® Arc™ GPUのリアルタイム・ビューポートに新たなサポートを追加します。

SIGGRAPH 2022 に参加される皆さん

インテルのブース (#427) (英語) では、発表されたばかりのインテル® Arc™ Pro グラフィックス上で動作する Topaz や SketchUp、インテルの GPU と CPU 上で Render Kit によって最適化された SideFX、Blender、RenderMan など、革新的な使用方法を紹介するデモをご覧いただけます。

関連情報


インテルが開発を簡素化するオープンソースの AI リファレンス・キットをリリース

2022年7月12日 | インテル® AI 開発ツール (英語)

インテルは、オンプレミス、クラウド、エッジ環境において AI をより利用しやすくするため特別に設計された、オープンソースの AI リファレンス・キットを新たにリリースしました。

インテル® Vision (英語) で発表されたこれらのキットには、AI モデルコード、トレーニング・データ、エンドツーエンドのマシンラーニング・パイプライン命令、ライブラリー、クロスアーキテクチャー・パフォーマンス向けのインテル® oneAPI コンポーネントが含まれています。

現時点では、以下のキットを利用できます。

  • Utility Asset Health (英語) – ユーティリティーがより高いサービス信頼性を提供できるようにトレーニングされた予測分析モデルです。
  • Visual Quality Control (英語) – 製薬などのライフサイエンス分野の VQ 管理検査を自動化し、錠剤の品質向上と運用コスト低減に貢献します。
  • Customer Chatbot for the Enterprise (英語) – Airline Travel Information Systems データセットからの 4,000 以上の発話を使用してトレーニングされ、94% の予測精度を提供する会話型 AI チャットボット・モデルです。
  • Intelligent Document Indexing (英語) – 高速なルーティングと手作業によるコスト削減により、数百万件のドキュメントの処理と分類を自動化します。

詳細 (英語) >

イノベーションはオープンで大衆化された環境で成長し、インテルの AI ツールとフレームワークの最適化は、オープンで標準ベースの統一された oneAPI プログラミング・モデルの基盤の上に構築されています。Project Apollo リファレンス・キットは、インテルのエンドツーエンドの AI ソフトウェア・ポートフォリオのコンポーネントで構築されており、何百万人もの開発者やデータ・サイエンティストが、アプリケーションに AI を迅速かつ容易に導入したり、既存の AI/ML 実装を強化できるようにします。これにより、さまざまなユースケースや産業にわたる幅広いインテリジェント・ソリューションの実現が可能になります。

インテル コーポレーション
バイスプレジデント兼 AI アナリティクス事業本部長
Wei Li 氏

無料のソフトウェアをダウンロードする (英語)


インテルと Google Cloud* が HPC ワークロード向けのすぐに使える最適化ソリューションを提供

2022年7月6日 | インテル® oneAPI ベース・ツールキットインテル® oneAPI HPC ツールキット

インテルと Google は協力して、Google Cloud* 上でハイパフォーマンス・コンピューティングを推進する Cloud HPC Toolkit (英語) をリリースしました。この新しいリソースは、インテル® MPI ライブラリーとインテル® oneAPI マス・カーネル・ライブラリーを含むインテル® oneAPI ベース & HPC ツールキットの各種ツールへのアクセスを提供し、インテル® Select ソリューション for シミュレーション & モデリングによりパフォーマンスを最適化します。これらの新しいツールは、コンパイル時間と結果の速度を向上させ、SYCL* でマルチベンダーのアクセラレーションを提供します。

これが重要な理由

新しいツールキットは、不慣れな開発コンセプトやツールを理解し、克服するための課題を取り除くことで、堅牢でハイパフォーマンスなクラウド・コンピューティングを容易に導入できるようにします (これらの課題は、要求の厳しいワークロードの展開に時間がかかったり、ソフトウェアの非互換性を生じさせたり、パフォーマンスを低下させることがあります)。

「Cloud HPC Toolkit とインテル® Select ソリューション for シミュレーション & モデリングを使用することで、厳密なテストを経て実際のパフォーマンスに最適化されたハードウェア・ソフトウェア構成を自動的にスピンアップできるため、当て推量を排除できる利点があります。」

Google
HPC ソリューション主席
Ilias Katsardis 氏

記事を読む (英語) >

関連情報


インテル® VTune™ プロファイラー 2022.3 リリース

2022年6月7日 | インテル® VTune™ プロファイラー

インテル® VTune™ プロファイラー 2022.3 CPU、GPU、FPGA システムのパフォーマンス・ボトルネックを素早く発見して最適化できます。

新機能

  • ホスト側の非効率的な API 呼び出しとその原因を特定する DirectML API をサポートしました。
  • CPU 側のスタックを分析して、OpenCL* API の USM 拡張を使用する GPU 計算タスクのメモリー転送関連のボトルネックを特定できます。

ダウンロード (英語) >

詳細については、software.intel.com/vtune (英語) を参照してください。


インテルが Codeplay Software を買収

2022年6月1日 | oneAPI 仕様 (英語)

インテルが Codeplay Software を買収

インテルは、クロスアーキテクチャーでオープンな標準ベースの開発者向けテクノロジーのグローバルリーダーである Codeplay Software の買収に合意し、oneAPI エコシステムのサポートをさらに推進しています。

Codeplay は、oneAPI で採用された Khronos Group のオープンスタンダードなプログラミング・モデルである SYCL* に関する専門知識とリーダーシップ、および SYCL* や OpenCL* などのオープンエコシステムの活動から、RISC-V*、自動車のソフトウェア安全、医療画像に至る、幅広い業界への大きな貢献で世界的に認められている企業です。

Codeplay は、oneAPI を大衆に届けるという使命を担い、多様なハードウェア・プラットフォームをサポートする製品をグローバルに幅広く提供しています。

Codeplay は、インテルの強みを生かし、オープンスタンダードとその上に構築されたオープンソースのエコシステムに基づき、SYCL* ソリューションをクロスアーキテクチャーおよびマルチベンダーの製品に展開できるでしょう。

インテル コーポレーション
ソフトウェア製品 & エコシステム担当 VP & GM
Joe Curley

詳細 (英語) >


ISC 2022 においてインテルは持続可能でオープンな HPC-AI に注力

2022年5月31日 | Intel @ ISC 2022 (英語)

International SuperComputing 2022 において、インテル コーポレーションのスーパーコンピューティング・グループの VP である Jeff McVeigh は、より持続可能でオープンな HPC-AI 向けのイノベーションを加速するインテルの HPC リーダーシップ技術を、次のように紹介しました。

  • インテル® ソフトウェアと oneAPI は、ソフトウェア・スタック全体をカバーしており、開発者がコード・リファクタリングの負担なしに、最新のシリコン・イノベーションを活用してスケーラブルでハイパフォーマンスな効率良いコードを作成できるように支援する、ツール、プラットフォーム、ソフトウェア IP を提供します。
  • 新たに 2 つのインテル® oneAPI 研究拠点がエコシステムに加わり、oneAPI の能力と採用を拡大するため世界中で活動している大学や研究所は合計 22 となりました。

Jeff の論説を読む (英語) >

新しいインテル® oneAPI 研究拠点の紹介

  • ブリストル大学 (英語) では、oneAPI とクロスプラットフォーム・プログラミング向けの Khronos Group の SYCL* 抽象化レイヤーを使用して、エクサスケールのパフォーマンス移植性を達成するベスト・プラクティスを開発しています。目標は、科学計算コードが大規模なヘテロジニアス・スーパーコンピューティング・システムでハイパフォーマンスを達成できるようにすることです。
  • Centre for Development of Advanced Computing (CDAC) (英語) は、インドの HPC および AI コミュニティーに oneAPI トレーニングを提供する、熟練インストラクターの基盤を構築しています。CDAC は、そのインフラを通じて国内でトレーニングを幅広く展開し、トップレベルの大学で oneAPI を教える予定です。

関連情報


ハイデルベルク大学が oneMKL オープンソース・インターフェイスでヘテロジニアス・コンピューティングを推進

2022年5月25日 | インテル® oneMKLoneAPI 仕様 (英語)

ハイデルベルク大学 (英語) は最近、インテル® oneAPI マス・カーネル・ライブラリー (インテル® oneMKL) インターフェイスで乱数生成と BLAS に対する ROCm サポートを実現しました。これは、oneMKL インターフェイス・プロジェクトに対するコミュニティーによる新しい重要な貢献です。このプロジェクトは、CPU およびコンピュート・アクセラレーター・アーキテクチャーに焦点を当てた数学アルゴリズム向けに、SYCL* ベースの API を提供する oneAPI 業界イニシアティブの一部です。

rocRAND と rocBLAS のサポートをプロジェクトに追加するこの取り組みにより、hipSYCL コンパイラーを使用して乱数生成と線形代数計算が可能になり、hipSYCL で記述されたクロスプラットフォーム・アプリケーションでネイティブに近いパフォーマンスを達成できるようになりました。また、oneMKL オープンソース・インターフェイスは、DPC++ 以外のほかの SYCL* 実装をアップストリーム・サポートする最初の oneAPI コンポーネントとなります。

詳細 (英語) >

関連情報


TensorFlow* 2 で oneDNN の AI 最適化のチューニングがデフォルトで有効に

2022年5月25日 | インテル® oneDNN (英語)

最新リリースの TensorFlow* 2.9 (英語) では、Google* が x86 パッケージのデフォルトのバックエンド CPU 最適化として、インテル® oneAPI ディープ・ニューラル・ネットワーク・ライブラリー (インテル® oneDNN) を有効にしたことで、パフォーマンスが向上しています。これは、すべての Linux* x86 パッケージと、第 2 世代インテル® Xeon® スケーラブル・プロセッサー以降の CPU でサポートされるインテル® AVX512_VNNI、インテル® AVX512_BF16、インテル® AMX ベクトルおよび行列拡張などのニューラル・ネットワーク向けのハードウェア機能を搭載した CPU に対して適用されます。

これらの最適化により、畳み込み、行列乗算、バッチ正規化などの主要な計算負荷の高い演算が高速化され、oneDNN を使用しないバージョンと比較して、パフォーマンスが最大 3 倍 (英語) 向上します。

これが重要な理由

今日、マシンラーニングやディープラーニングでは GPU などの AI アクセラレーターが重視されていますが、AI ワークフローのすべての段階において、CPU は依然として重要な役割を果たしており、ほとんどのパーソナルデバイス、ワークステーション、データセンターで利用されています。このデフォルトの最適化により、すでに TensorFlow* を使用している何百万人もの開発者が、生産性の向上、トレーニング時間の短縮、計算の効率的な利用を達成できるようになります。

パフォーマンスの向上は、自然言語処理、画像および物体認識、自律走行車、不正検知、医療診断および治療など、さまざまなアプリケーションに恩恵をもたらします。

詳細 (英語) >

ソフトウェアを入手

関連情報


インテルがヘテロジニアス・コードの開発を支援する SYCLomatic 移行ツールをオープンソース化

2022年5月15日 | DPC++/SYCL* (英語)

インテルは最近、SYCLomatic (英語) と呼ばれるプロジェクトを通じて、コードを SYCL* に移行するオープンソースのツールをリリースしました。このツールは、開発者がより簡単に CUDA* コードを SYCL* および C++ に移行し、ヘテロジニアス・アーキテクチャー向けのクロスアーキテクチャー・プログラミングを加速することを支援します。このオープンソース・プロジェクトは、SYCL* 標準の採用を推進するコミュニティーの協力を可能にし、開発者を単一ベンダーの独占的エコシステムから解放する重要なステップとなります。

SYCLomatic ツールの仕組み

SYCLomatic は、CUDA* コードから SYCL* への移行を支援し、通常、CUDA* コードの 90~95% を自動的に SYCL* コードに移行します。このプロセスを完了するため、開発者は残りのコードを手動で完成させ、その後、希望するパフォーマンスのレベルまでカスタム・チューニングします。

インテル® oneAPI のエバンジェリストである James Reinders は次のように述べています。

「SYCL* を使用して C++ に移行することで、ISO C++ との整合性が強化され、マルチベンダーのサポートによりベンダーロックインを解消し、マルチアーキテクチャーのサポートにより新しいハードウェア・イノベーションのパワーを最大限に活用する柔軟性が得られます。SYCLomatic は、作業の多くを自動化する貴重なツールであり、開発者は移行よりもカスタム・チューニングに集中することができます。」

SYCLomatic は GitHub プロジェクトです。ツールの進化のため、このツールを使用し、フィードバックや貢献にご協力ください。

詳細 (英語) >


インテル® oneAPI ツールキット 2022.2 リリース

2022年5月18日 | インテル® oneAPIインテル® oneAPI ツールキット

最新のインテル® oneAPI ツールがリリースされました。パッケージはダウンロードすることも、インテル® DevCloud (英語) で利用することもできます。今回のリリースにはすべてのツールキット (30 以上の個別のツール) のアップデートが含まれており、それぞれがデータセントリックなワークロード向けにパフォーマンスの向上と機能の拡張をもたらすように最適化されています。

2022.2 の新機能:

メディア、ゲーム、AI ワークロード向けのインテル® Arc™ ディスクリート・グラフィックス

コンパイラー

  • インテル® oneAPI DPC++/C++ コンパイラーは、GPU や FPGA などのさまざまなハードウェア・アクセラレーターをプログラミングする開発者の生産性を高める SYCL* 2020 機能を追加し、OpenMP* 5.1 への対応を強化し、計算オフロードにおける OpenMP* リダクションのパフォーマンスを向上します。
  • インテル® Fortran コンパイラーは、最新の LLVM テクノロジーをベースに、パラメーター化された派生型、F2018 の IEEE 比較操作、VAX 構造体のサポートを追加し、スカラー用の宣言マッパーのサポートにより OpenMP* 5.0 のサポートを拡大しています。

ハイパフォーマンス・ライブラリー

  • インテル® oneMKL は、BLAS ドメインに MKL_VERBOSE GPU サポートと転置ドメインに CPU サポートを追加し、デバッグ時の視認性が向上しています。
  • インテル® oneCCL (英語) は、インテル® インストルメンテーションおよびトレーシング・テクノロジー (インテル® ITT) のプロファイルをサポートし、インテル® VTune™ プロファイラーなどのツールで新たな情報が得られます。
  • インテル® oneTBB は、parallel_sort について最新の C++ 標準のサポートと使用を改善し、task_area 拡張、collaborative_all_once、アダプティブ・ミューテックス、concurrent_hash_map のヘテロジニアス・オーバーロード、および task_scheduler_handle に対する完全に動作する機能が追加されました。
  • インテル® oneVPL は、複数のハードウェア・アダプターと拡張開発環境をサポートし、さらに CPU 実装での MPEG2 デコードにより、専用ハードウェアを持たないシステムでコーデックのカバレッジを向上します。
  • インテル® MPI ライブラリーは、GPU ピンニングにより、アプリケーション・レベルで優れたリソース計画と制御を可能にし、マルチレールのサポートによりアプリケーションのノード間通信帯域幅を向上します。

解析ツール

  • インテル® Advisor は、CPU から GPU へのオフロードのデータ転送再利用コストの最適化、GPU ルーフライン・カーネルとオフロードのモデル化の詳細、GPU ルーフライン・パースペクティブでのオフロード領域のソースコードの確認 (パフォーマンス・メトリックを含む) など、ユーザー向けの推奨と共有が追加されました。
  • インテル® VTune™ プロファイラーは、最新世代のサーバー・プラットフォームのインテル® VT-d に関連するパフォーマンスの非効率性を特定できるようになり、インテル® Arc™ GPU をサポートし、さらに Docker* コンテナとしても提供されています。

AI ワークロードの高速化

レンダリングとレイトレーシングによるサイエンティフィック・ビジュアライゼーション

FPGA

詳細 (英語) >

インテル® Arc™ A シリーズ AV1


GROMACS と oneAPI がオープンソースの創薬を支援

2022年5月5日 | oneAPI 仕様 (英語)、インテル® oneAPI ツール

SYCL*、oneAPI、マルチアーキテクチャー・ツールで高速化された GROMACS は、インテル® Xe アーキテクチャー・ベースの GPU で強力なパフォーマンスを発揮

最近リリースされた GROMACS 2022 (英語) では、インテル® Xe アーキテクチャー・ベースの現在および将来の GPU を含む、マルチベンダー・アーキテクチャーに拡張されました。

ストックホルム大学およびスウェーデン王立工科大学の Erik Lindahl 氏が率いるチームは、NVIDIA* ハードウェアでのみ動作する GROMACS の CUDA* コードを、インテル® DPC++ 互換性ツールを使用して SYCL* に移行しました。通常、このツールはコードの 90%~95%を自動で移行します1,2、その結果、単一の移植性に優れたクロスアーキテクチャー対応のコードベースにより、開発を大幅に合理化し、マルチアーキテクチャー環境での展開に柔軟に対応できるようになりました。

ソフトウェアの高速計算は、インテル® oneAPI の DPC++/C++ コンパイラー、ライブラリー、HPC 解析ツール、クラスターツールなどのクロスアーキテクチャー・ツールを使用することで実現されました。

GROMACS 2022 は SYCL* と oneAPI をフルサポートしており、新しいクラスのハードウェア上で動作するように拡張されています。すでに、現行のインテル® Xe アーキテクチャー・ベースの GPU と、インテル® DevCloud を使用して次期インテル® Xe アーキテクチャー・ベースの GPU 開発プラットフォーム (開発コード名 Ponte Vecchio) 上で、本番シミュレーションを実行しています。現段階では優れたパフォーマンス結果を達成し、インテルのハードウェアとソフトウェアの連携によるパワーを証明しています。全体として、これらの最適化はハードウェアの多様性に対応し、ハイエンドのパフォーマンスを提供し、競争とイノベーションを促進することで、科学をより速く、より低コストで実現します。

— Erik Lindahl 氏

記事を読む (英語) >
動画を見る (英語) >

GROMACS について
GROMACS は、タンパク質、脂質、核酸のシミュレーションを行う分子動力学パッケージです。乳がん、COVID-19、2 型糖尿病といった疾患に対する重要な医薬品の特定や、国際的な分散コンピューティング・イニシアチブ Folding@home (英語) に貢献しています。

1GROMACS の NVIDIA* CUDA* コードを、oneAPI の SYCL* 実装であるデータ並列 C++ (DPC++) に移行し、新たにクロスアーキテクチャーに対応したコードを作成しました。

2出典: 2021年9月現在のインテルによる推定。Rodinia、SHOC、PENNANT など、70 種類の HPC ベンチマークとサンプルの測定結果に基づいています。結果は異なることがあります。


クロスアーキテクチャーの開発ツールにより、新しい GPU を搭載したシステムで驚異的なエンドユーザー体験を実現

2022年3月31日 | インテル® ソフトウェア・ツールインテル® グラフィカル・パフォーマンス・アナライザー (英語)、インテル® oneAPI ビデオ・プロセシング・ライブラリー

コンテンツ制作者やゲーム開発者は、インテル® Arc™ GPU (開発コード名 Alchemist) を搭載した新しいインテル® Evo™ プラットフォーム (英語) により、テクノロジー、ソフトウェア、AI アクセラレーション処理などのイノベーションを活用して、没入型のエンドユーザー体験を創出できます。

インテル®ソフトウェア・ツールは、開発者がインテル® Arc™ GPU の能力を解放し、インテル® CPUと組み合わせて最大のビジュアル・パフォーマンスを発揮できるようにアプリケーションを最適化する大きな役割を担っています。

インテル®ソフトウェア・ツールは、次のような利点をもたらします。

詳細 (英語) >

1. HandBrake の内部リリースを使用したビデオエンコードの FPS は、インテル® Xe グラフィックスとインテル® Arc™ グラフィックスを組み合わせほうが、インテル® Arc™ グラフィックスのみの場合よりも最大で 40% 向上。製品化前のインテル® GPU 開発コード名 Alchemist で HandBrake を実行。2021年10月現在。


Soda がさまざまなアーキテクチャーで scikit-learn* のパフォーマンスをサポートするインテル® oneAPI 研究拠点を発表

2022年3月31日| インテル® Extension for scikit-learn* (英語)

フランスのデジタル科学技術のための国立研究機関である Inria (National Institute for Research in Digital Science and Technology) (英語) の ソーシャルデータ研究チーム (Soda) (英語) は、最も広く使用されているマシンラーニング・ライブラリーの 1 つである scikit-learn* のハードウェア最適化パフォーマンス・ブースターの開発に注力するため、インテル® oneAPI 研究拠点 (CoE) を開設することを発表しました。

この scikit-learn* 拡張は、oneAPI の numba_dppy や DPC++ コンポーネントを使用して、より効率的なマシンラーニングを実現します。この実装は、scikit-learn* のコア開発者、インテルのエンジニア、および関心のあるコミュニティー・メンバーによって保守される、独立して管理されるプロジェクトにパッケージ化されます。

「ヘテロジニアス・コンピューティングは必然です。ホストが CPU や GPU などの異なるプロセッサーやアクセラレーターに計算タスクをスケジューリングすることで発生します。このパートナーシップにより、scikit-learn* はマルチアーキテクチャー・システムにおいて、より高いパフォーマンスとエネルギー効率を実現することができます。」

Inria
scikit-learn* 保守管理者
Olivier Grisel 氏

VS Marketplace でインテル® コンパイラーを提供開始

2022年3月10日 | インテル® oneAPI DPC++/C++ コンパイラー (英語)

マルチ並列処理をサポートするコンパイラーのダウンロード方法が増えました。LLVM ベースの Windows* 向け DPC++/C++/C コンパイラーが Visual Studio* Marketplace からダウンロードできるようになりました。

主な機能

  • 高速でマルチコア対応のベクトル化されたクラスターベースのアプリケーションの生産的な開発をサポートする拡張を含む
  • 最新の C/C++ 言語と OpenMP* 標準をサポート
  • 複数の並列モデルとインテル® oneTBB、インテル® oneMKL、インテル® oneVPL、およびインテル® IPP を含むハイパフォーマンス・ライブラリーをサポート
  • C++、Visual Basic*、C# など、言語が混在するアプリケーションをビルド可能

詳細と無料のダウンロード (英語)


インテルがソフトウェアによる成長機会に投資

2022年2月22日 | インテル® oneAPI ツール

インテルの 2022年投資家会議では、データセンター、AI、その他のセグメントのワークロードを高速化する次世代のインテル® Xeon® およびクライアント向け CPU、Ponte Vecchio/Arctic Sound-M GPU などの製品の最新情報と、これらを実現するためのソフトウェアが発表されました。

役員によるセッション (英語) では、インテルのソフトウェア・ファースト戦略に言及しました。

  • インテル コーポレーションのシニア・バイスプレジデント兼 CTO 兼ソフトウェア & アドバンスト・テクノロジー・グループ本部長である Greg Lavender は、oneAPI (英語) とインテル® oneAPI ツールキットによるオープンで標準ベースのクロスアーキテクチャー・プログラミングが、高度なアーキテクチャーにおいて、いかにパフォーマンスと開発生産性を実現するかについて、論説 (英語) とプレゼンテーション (英語) で説明しました。
  • インテル コーポレーションのシニア・バイスプレジデント兼アクセラレーテッド・コンピューティング・システム & グラフィックス・グループ本部長である Raja Koduri は、インテルのメディアおよび HPC-AI スーパーコンピューティング戦略を支えるハードウェアとソフトウェアの強化について紹介しました。以下に概要を示します。
    • インテル® Xeon® プロセッサーと、インテル® oneAPI ビデオ・プロセシング・ライブラリー (インテル® oneVPL) (英語)、インテル® oneAPI AI アナリティクス・ツールキット (英語)、インテル® ディストリビューションの OpenVINO™ ツールキットなどのオープンなエコシステムにより、高密度、リアルタイムのブロードキャスト、プレミアムコンテンツを実現し、インターネット・トラフィックの 80% が動画であるグローバルな需要に応えます1
    • 今後発売予定の Artic Sound-M GPU は、デスクトップおよびクラウドゲーミングの品質、レイテンシー、密度の要件に対応した最先端のトランスコード・パフォーマンスと、AI アナリティクス・エンジンを備えたシームレスなメディア・スーパーコンピューターを実現します。Artic Sound-M GPU は、ストリーミング、ゲーム、アナリティクス向けの業界唯一のオープンソース・メディア・ソリューション・スタックであり、同じ品質で 30% 以上の帯域幅の改善を実現する AV1 エンコードを搭載した業界初の GPU です2
    • 何十億行ものコードが、スーパーコンピューターの 85% に搭載されているインテル® Xeon® プロセッサー向けに最適化されています3。インテル® Xeon® CPU (Sapphire Rapids) + Ponte Vecchio GPU は強力でシームレスなエコシステムの基盤となり、oneAPI は開発者が単一のコードベースで多種多様な CPU やアクセラレーターを利用できるようにします。

関連情報

1出展: Cisco Global 2021 Forecast Highlights
2出展: Mhojhos Research
3過去 10 年間の TOP500 リストに基づく
開発コード名


ダルムシュタット工科大学がインテル® oneAPI 研究拠点を開設

2022年2月14日 | インテル® oneAPI ツール

ダルムシュタット工科大学の組込みシステム・アプリケーション・グループは、oneAPI (英語) のオープンなクロスアーキテクチャー・プログラミングにより、医学および薬学研究で使用されるデータ並列計算とシミュレーション・ソフトウェアを高速化することを目的として、インテル® oneAPI 研究拠点 (CoE) を開設することを発表しました。

インテルと共同で、Autodock アプリケーション (英語) の高速化されたバージョンを移行して、複数のハードウェア・アーキテクチャー向けに効率良く最適化およびチューニングできる単一のコードベースを作成する予定です。

さらに、ダルムシュタット工科大学では、CPU、GPU、FPGA で並列実行することで創薬シミュレーションをスピードアップするため、Autodock-GPU (英語) の次世代並列実装に取り組んでいます。

インテル コーポレーションのバイスプレジデント兼ソフトウェア製品 & エコシステム事業本部長の Joe Curley は次のように述べています。

「新しい oneAPI 研究拠点は、マルチアーキテクチャーの SYCL* 言語と oneAPI にとって素晴らしい前進と言えるでしょう。ダルムシュタット工科大学のチームとのコラボレーションにより、医学および薬学の研究者が AutoDOCK-GPU を任意のハードウェア上で生産的に使用するための道が開かれました。」

詳細: 英語 | ドイツ語

2021年

インテル® oneAPI ツールキット 2022.1 リリース

2021年12月23日 | インテル® oneAPI ツール (英語)

ハードウェアの選択肢を増やし、プロプライエタリーの壁を越えて、コードの最高パフォーマンスを解放

インテル® oneAPI ツールキット 2022.1 リリースでは、ハイパフォーマンスなクロスアーキテクチャーのアプリケーションとソリューションを実現する新機能、性能、改善点 (2021.1年12月の 2021 リリースから 900 以上) を提供しています。

主な変更点:

クロスアーキテクチャー・プログラミング

高度な開発生産性

  • インテル® VTune™ プロファイラー (英語) のフレームグラフにより、パフォーマンス・ホットスポットを可視化する機能が向上しました。
  • インテル® Advisor (英語) のアクセラレーター・パフォーマンスのモデル化により、コードを変更する前に GPU へオフロードする利点を予測できます。
  • コーン・テレメトリー、補助特徴ノイズ除去、FP16 サポートを含むインテル® oneAPI レンダリング・ツールキット (英語) の新機能は、より堅牢な形状を提供し、レンダリング時間を短縮します。今後リリースされるインテル® Xe GPU のサポートに加えて、リアルタイムのノイズ除去により、最終フレームのプロダクション品質のレンダリングをさらに向上します。
  • 拡張された開発環境のサポートには、Microsoft* VS Code とのより緊密な統合、VS 2022 サポート、および Windows* 上での Linux* 開発用の WSL2 が含まれます。

AI トレーニングと推論パフォーマンスの最適化

  • インテル® Optimization for Tensorflow* (英語) は、第 3 世代インテル® Xeon® スケーラブル・プロセッサー上で純正バージョンと比較して 10 倍のスピードアップを実現します。2
  • 新しいインテル® Extension for scikit-learn* (英語) は、インテル® CPU 上でマシンラーニング・アルゴリズムを 100 倍以上高速化します。3
  • 複数のディープラーニング・フレームワークにおいて、トレーニング後の最適化手法により推論パフォーマンスを高速化するインテル® Neural Compressor (英語) が追加されました。

ハードウェア・サポート

  • すべてのツールキットは、インテル® AVX-VNNI 対応の第 12 世代インテル® Core™ プロセッサー (開発コード名 Alder Lake)、インテル® AMX 対応の第 4 世代インテル® Xeon® スケーラブル・プロセッサー (開発コード名 Sapphire Rapids)、およびこの語リリースされる Xe クライアントやデータセンター GPU を含む最新のハードウェアの高度な機能を利用するように最適化されています。

oneAPI を利用することで、ハードウェアの価値を最大限に引き出し、ハイパフォーマンスなクロスアーキテクチャー・コードを自信を持って開発し、アプリケーションの将来性を確保できます。

ブログを読む (英語)
プレスリリース (英語)
ツールキットを見る (英語)


インテルのレイトレーシング・ライブラリーをベースに構築された「Curved Ray Traversal」

2021年11月22日 | インテル® oneAPI レンダリング・ツールキット (英語)、インテル® Advanced Ray Tracing (英語)

システムを保護、強化、および実現する技術のリーダーである SURVICE Engineering Company (英語) は、インテル® Embree のレイトレーシング・カーネル・ライブラリーとインテル® OSPRay のレイトレーシング API (いずれもインテル® oneAPI レンダリング・ツールキットに含まれる) をベースにした新しい研究開発プロジェクト「Curved Ray Traversal (CRT)」を発表しました。

注目すべき理由
CRTは、実験フローの 3 次元構造を取得、処理、可視化するシステムである PowerFlow3D (英語) の中核を成しています。SURVICE 社は現在、インテルの先進的なレイトレーシング技術と oneAPI (英語) のクロスアーキテクチャー・プログラミングを利用して CRT の実装と最適化を行い、インテルの CPUと将来の Xe アーキテクチャーの GPU をサポートし、PowerFlow3D ベースのソリューションを前進させるべく取り組んでいます。

この共同研究は、ビジュアライゼーションと科学計算の両方において、ハイパフォーマンスなレイトレーシングを使用して革新的なアプリケーションを探求する SURVICE 社とインテルの取り組みを継続するものです。現在、次のようなレイトレーシングを中心とした取り組みが行われています。

  • 電波伝搬のインタラクティブなシミュレーションと可視化
  • 工業用画像処理および非接触計測における逆問題
  • 国防総省向けに開発されている SURVICE 社の Tactical Resupply Vehicle をはじめとする、ドローン・プラットフォームの自律航行を可能にするディープ・ニューラル・ネットワークのトレーニング用合成データの生成

専門家の声

「今回の研究では、最新のプラットフォーム・ハードウェアとインテルが提供するオープンソースの oneAPI レイトレーシング・ソフトウェアを活用し、並列化とコード最適化の最先端の技術を駆使して、複数のアプリケーションに飛躍的な機能を提供しています。」

SURVICE
応用技術担当副社長
Mark Butkiewicz 氏

「インテルは、HPC ハードウェアとレイトレーシング・ソフトウェアの業界リーダーとして、オープンスタンダードとオープンソース・ソフトウェアを通じて業界の発展に努めています。SURVICE 社と協力することで、PowerFlow3D のようなドメイン固有の計算アプリケーション向けのレイトレース・ハードウェア・アクセラレーションなど、新しい画期的なユースケースを可能にしています。」

インテル コーポレーション
アドバンスド・レンダリング & ビジュアライゼーション・アーキテクチャー・シニア・ディレクター
Jim Jeffers

SuperComputing 2021: HPC を高速化する oneAPI

2021年11月15日 | インテル® oneAPI ツールキット (英語)

SC21 (英語) でインテル コーポレーション データセンター XPU 製品 & ソリューション担当副社長 Jeff McVeigh が発表した通り、バージョン 2021 から 900 を超える新機能が追加されたインテル® oneAPI ツールキット 2022.1 (英語) が 12月初旬にリリースされます。

以下は、新機能の一例です。

  • 統一された C++/SYCL*/Fortran コンパイラーとデータ並列 Python* による、CPU と GPU 向けの新しいクロスアーキテクチャー開発機能。
  • アクセラレーターをモデル化したり、パフォーマンス・ホットスポットを視覚化する高度な解析機能。

また、HPC と AI 分野で oneAPI エコシステムの拡大を加速させる 2 つの oneAPI 研究拠点 (CoE) の追加を発表しました。これらの研究拠点は、戦略的なコードの移行、ハードウェア・サポートの追加、新しい技術やサービス、開発者向けトレーニングを提供します。

  • オールド・ドミニオン大学 (英語) は、NASA の支援を受けて、非構造格子 CFD カーネルを最適化し、インテルの CPU や Xe アーキテクチャーの GPU 上での効率的な実装を開発し、複雑な空力問題の解決を支援します。
  • 中国科学院計算技術研究所は、oneAPI のハードウェア・サポートを追加のアーキテクチャーに拡大する予定です。

関連情報
Jeff McVeigh の講演動画: スーパーコンピューティングがより身近に (英語)
インテル® oneAPI 研究拠点ファクトシート (英語)
インテルの HPC & AI パビリオン (英語)
Intel® Academic Program for oneAPI (英語)


Khronos がスケーラブルな 3D データ・ビジュアライゼーション向けの ANARI* 1.0 Provisional API をリリース

2021年11月2日 | インテル® OSPRay (英語)、Khronos Group

本日、Khronos Group は、スケーラブルな 3D データ・ビジュアライゼーション向けの暫定的なオープン・スタンダード API である ANARI* 1.0 (Analytic Rendering Interface: アナリティクス・レンダリング・インターフェイス) をリリースしました。ANARI* は、レンダリング処理の詳細を指定するのではなく、シーンの記述を構築して画像を生成することができるため、ビジュアライゼーション・アプリケーションの開発を容易にし、最先端のレイトレーシングを含む多様なレンダリング・エンジンを提供するクロスベンダーの移植性を実現します。

Khronos は、ANARI 仕様 (英語) に加えて、サンプル実装、初心者向けアプリケーション、開発ツール、適合性テストをオープンソースで公開しており、2022年の仕様確定に向けて、コミュニティーからのフィードバックを受け付けています。

ANARI の初期実装は、インテルによるインテル® OSPRay (英語) へのアクセスを含め、現在開発中です。

インテルは、インテル® oneAPI レンダリング・ツールキットに含まれるインテル® OSPRay をベースにしたオープンソース実装で ANARI* API をサポートし、サイエンティフィック・ビジュアライゼーション、高忠実度レンダリング、MPI スケーラビリティーを向上させる専門知識と技術を ANARI* ユーザーに提供しています。

インテル コーポレーション
シニア主席エンジニア兼アドバンスド・レンダリング & ビジュアライゼーション・アーキテクチャー・シニア・ディレクター
Jim Jeffers

詳細は、こちら (英語) を参照してください。


統合されたインテル® デベロッパー・ゾーン、インテル® oneAPI 2022、および新しい研究拠点

2021年10月27日 | インテル® デベロッパー・ゾーン (英語)、インテル® oneAPIインテル® oneAPI ツール (英語)

インテルは、開発者と業界関係者向けのテクニカル・カンファレンスである Intel InnovatiON (英語) において、統合されたインテル® デベロッパー・ゾーンインテル® oneAPI 2022 ツール、およびインテル® oneAPI 研究拠点を発表しました。これらは、オープンなアプローチ、選択肢、信頼性を基本とする、インテルの開発者重視のソフトウェア・ファースト戦略の一環です。

統合された開発者体験

統合されたインテル® デベロッパー・ゾーンは、AI、クラウド、5G/エッジ、クライアント、ゲームなどの技術リソース、サンプルコード、リファレンス・デザイン、ツールなどへのアクセスを合理化し、簡素化します。また、ソフトウェアに関するトピックとテクノロジー (英語) の統合開発者カタログ、開発ツール (英語)、インテル® アーキテクチャー (CPU、GPU、FPGA、VPU など) 上でインテル® oneAPI ツールを使用してコードを開発およびテストする改善されたインテル® DevCloud (英語) にアアクスすることもできます。ブックマーク (英語) して活用してください。

インテル® oneAPI 2022 ツールのリリース

2021年内に、多数の新機能を提供するインテル® oneAPI 2022.1 ツールキットのリリースが予定されています (バージョン 2021 がリリースされた 2020年12月以降、累計で 900 以上の新機能が追加されています)。

2022.1 リリースの注目機能:

  • 初の C++/SYCL*/Fortran コンパイラーとデータ並列 Python* により、CPU および GPU 向けの新しいクロスアーキテクチャー開発機能を追加。
  • インテル® Advisor のアクセラレーター・パフォーマンスのモデル化を拡張。
  • インテル® VTune™ プロファイラーにパフォーマンスのホットスポットを視覚化するフレームグラフを搭載。
  • Microsoft* Visual Studio* との連携強化と Microsoft* WSL 2 (Windows* Subsystem for Linux*) のサポートによる生産性の向上。

ツールキットを見る (英語)

新しいインテル® oneAPI 開発拠点

インテルは、HPC、AI、ビジュアライゼーションに特化した 11 の新しいインテル® oneAPI 開発拠点 (CoE) を通じて、研究、技術、教育への投資を行っています。これらの研究拠点は、戦略的なコードの移行、ハードウェア・サポートの追加、新しい技術やサービス、カリキュラムを提供し、oneAPI エコシステムの導入を促進します。

以下の研究所および大学で構成されています。

  • HPC – オークリッジ国立研究所とダラム大学
  • HPC& ビジュアライゼーション – テネシー大学ノックスビル校
  • AI – カリフォルニア大学バークレー校
  • ビジュアライゼーション – カレル大学、ノーザンイリノイ大学、カリフォルニア大学デービス校、シュトゥットガルト大学、ユタ大学/Scientific Computing and Imaging (SCI)、ケンブリッジ大学/Stephen Hawking Centre for Theoretical Cosmology、テキサス大学オースティン校/Texas Advanced Computing Center (TACC)

詳細: インテル® oneAPI 研究拠点ファクトシート (英語) | Intel® Academic Program for oneAPI (英語) 


Arnold 7.0 がインテル® Open Image Denoise を搭載

2021年10月19日 | インテル® Open Image Denoise (英語)、インテル® oneAPI レンダリング・ツールキット

Autodesk の Arnold 7.0 には、視覚的なノイズを選択的に除去するマシンラーニング・アルゴリズムにより画像品質を向上させる高度なノイズ除去機能である、インテル® Open Image Denoise が搭載されています。この統合により、開発者は忠実度を高め、効率良くレンダリングできます。

インテル® Open Image Denoise は、インテル® oneAPI レンダリング・ツールキットに含まれています。

インテル® oneAPI レンダリング・ツールキットをダウンロードする (英語)

ビデオを見る (英語) [1:56]

インテル® Open Image Denoise のコミュニティー & メーリングリスト (英語) にぜひご登録ください。


インテル® oneAPI ツールキット 2021.4 リリース

2021年10月1日 | インテル® oneAPIインテル® oneAPI ツールキット (英語)

インテル® oneAPI ツールキット (英語) とスタンドアロン・ツールの最新のアップデートがリリースされました。パッケージをダウンロードすることも、インテル® DevCloud (英語) で利用することもできます。今回のリリースには 30 以上のツールが含まれており、それぞれがデータセントリックなワークロード向けにパフォーマンスの向上と機能の拡張をもたらすように最適化されています。

インテル® oneAPI ツールキットは、クロスアーキテクチャーおよびヘテロジニアス・コンピューティングの実現、最適化、および高速化を目的としています。C++、SYCL*、Fortran、MPI、OpenMP*、Python*などの業界標準を実装するコンパイラー、言語、ライブラリー、解析およびデバッグツール、最適化されたフレームワークを提供します。

2021.4 の新機能:

コンパイラー

解析ツール

  • インテル® VTune™ プロファイラーのホットスポット解析では、フレームグラフを使用して、ホットなコードパスと各関数およびその呼び出し先でかかった時間を視覚化できるようになりました。
  • インテル® Advisor では、既存の GPU コードを将来の GPU に移行した場合のパフォーマンス・ゲインを予測する、GPU 間のモデル化機能が追加されました。また、GPU ルーフライン機能では、ユーザーコードの解析で GPU を最大限に活用するための実用的な提案が得られるようになりました。
  • インテル® Inspector では、C++ スタックフレームの表示が改善され、libc と OpenCL* ライブラリーのレポートの精度が向上しています。

AI とアナリティクス

  • インテル® AI アナリティクス・ツールキット (英語) にスパース機能とプルーニング機能が追加され、自然言語アルゴリズムのパフォーマンスをチューニングできるようになりました。
  • Python* ベースの scikit-learn* アルゴリズムを GPUに簡単にオフロードして、ハードウェアの最先端の機能を利用できるようになりました。

ハイパフォーマンス・コンピューティング

  • インテル® oneAPI マス・カーネル・ライブラリー (インテル® oneMKL) (英語) では、乱数ジェネレーター (RNG) の多項分布、ポアソン V 分布、超幾何分布、負の 2 項分布、2 項分布において、DPC++ と OpenMP* オフロード API による GPU サポートが追加されました。
  • インテル® MPI ライブラリーでは、Mellanox ConnectX*-6 のハイダイナミック・レンジ (HDR) に対応した OFI/psm3 のパフォーマンスが向上しました。

レンダリングとレイトレーシング

  • インテル® オープン・ボリューム・カーネル・ライブラリー (英語) が ARM* CPU でのネイティブな使用に対応しました。また、インターバルとヒット・イテレーター・コンテキスト、任意のボリューム属性の反復処理、設定可能な背景値、3 次フィルタリングなどが追加されています。
  • インテル® OSPRay (英語) では、トランスフォーム・モーション・ブラーがサポートされ、Studio Scene Graph での Python* バインディング、トランスフォームとカメラ・モーション・ブラー効果を制御するパラメーター、UDIM テクスチャー・ワークフローのサポートなど、いくつかの新機能が追加されています。

FPGA

詳細は、ブログ (英語) を参照してください。


インテルがデータセンター、HPC-AI、クライアント・コンピューティング向けにアーキテクチャーを強化

2021年8月19日 | インテル® oneAPI レンダリング・ツールキットインテル® oneAPI AI アナリティクス・ツールキット (英語)

2021年の Intel Architecture Day において、インテル コーポレーションのアーキテクチャー、グラフィックス & ソフトウェア・グループのチーフ・アーキテクト兼シニア・バイスプレジデントである Raja Koduri次世代のインテル® アーキテクチャー (CPU、GPU、IPU) を発表 (英語) し、次のように述べました。

「本日インテルは、インテル®アーキテクチャーにおける一世代で最大の変革を発表しました。」

これらの新しいアーキテクチャーは、今後発売されるハイパフォーマンス製品に搭載され、計算能力とパフォーマンスへの要求の高まりに応える次時代のインテルのイノベーションの基盤となります。

高度な機能を実現するインテル® oneAPI ツールキット
インテル® oneAPI ツールで最適化された、Xe/GPU 開発プラットフォーム上で動作する以下の 2 つのデモをご覧ください。

インテル® oneAPI レンダリング・ツールキットのデモ (英語) [07:05] – CPU と Xe アーキテクチャーのレイトレーシング高速化 GPU 上でクロスアーキテクチャーで動作する、本ツールキットの 2 つのライブラリー (インテル® Embree とインテル® Open Image Denois) のプリプロダクション実装を使用したエンドツーエンドの映画品質クリエーターのワークフローを紹介します。

  • 市販の SideFx Houdini アプリケーションで Pixar のオープンソース USD API からインテル® Embree とインテル® Open Image Denoise API を呼び出す CPU ベースのクリエイターのワークフロー
  • Xe GPU を利用してリアルタイムの美しいレンダリングを実現する、CPU 上でのインテル® Embree とインテル® Open Image Denoise API 呼び出し
  • インテルの歴史にインスピレーションを得た架空の「4004 Moore Lane」でのパストレース・シーンのリアルタイム・ウォークスルー
  • CPU のみの場合よりも何倍も高速にレンダリングする、1,350 フレームで構成される 45 秒の映画の 4K 映画品質の最終版

インテル® oneAPI AI アナリティクス・ツールキットのデモ (英語) [1:27] – 開発コード名 Ponte Vecchio 上でインテル® oneAPI AI アナリティクス・ツールキットを使用して ResNet50 ベンチマークを実行します。開発コード名 Ponte Vecchio と Sapphire Rapids 上での ResNet50 の推論およびトレーニング・スループットの初期結果は、すでに新たなパフォーマンス・レベルに達しており、インテルが AI および HPC 分野においてこれまでのパフォーマンスを上回るという目標の実現に向けて順調に進んでいることを示しています。

世界は、人々の生活を豊かにするため、最も困難な計算問題を解決することをアーキテクト、エンジニア、開発者に期待しています。インテルはこれらの要求に応えるため、ハードウェアおよびソフトウェア戦略とその実行を急ピッチで進めています。

関連情報


インテル® Arc™ – ハイパフォーマンスなディスクリート・グラフィックスの新ブランド

2021年8月16日 | インテル® oneAPI レンダリング・ツールキットインテル® グラフィックス・パフォーマンス・アナライザー (英語)

インテルは、待望の新しいコンシューマー向けハイパフォーマンス・グラフィックス製品のブランドであるインテル® Arc™ を発表しました。

インテル® Arc™ ブランドは、ハードウェア、ソフトウェア、サーバーを網羅し、複数のハードウェア世代にまたがるものとなります。第 1 世代のインテル® Arc™ 製品は Xe HPG マイクロアーキテクチャー (開発コード名 Alchemist) をベースとしており、ハードウェアベースのレイトレーシングと AI によるスーパーサンプリング機能を備え、DirectX* 12 Ultimate をフルサポートします。

関連情報

業界の声…
「インテルは、パワフルでありながらアクセス可能なソフトウェア・ツールに支えられた幅広いハードウェアの選択肢を提供することで、この業界を牽引するゲーマーをサポートしたいと考えています。」 – CG Magazine (https://www.cgmagonline.com/2021/08/16/intel-arc-high-end-graphics-2022/)

「これは、グラフィックス市場の巨人 NVIDIA と AMD に対抗するためのインテルのもう 1 つの戦略です。」 – Geeknetic (スペイン語)

「ついに、青い巨人 (インテル) のファンはインテル® Core™ プロセッサーとインテル® Arc™ グラフィックスの両方を搭載したマシンを構築できるようになりました。」 – Thanh Nien (ベトナム語)

Intel、次期 CPU「Alder Lake」に搭載される新コアの詳細を発表

NVIDIA A100 の倍以上の性能となる Intel のモンスター GPU「Ponte Vecchio」。FP32 で 45TFLOPS を実現

Intel 次期 CPU「Alder Lake」は Windows 11 に最適化されたスレッド割り当て機能を搭載

Intel、ゲーマー向け次世代 GPU「Arc」をチラ見せ。ハイエンドまで対応可能な伸縮アーキテクチャ

Intel、次世代 DC 向けプロセッサ「Sapphire Rapids」の概要を発表 4 タイルを 1 パッケージに実装、DL 演算向け新命令 AMX に対応

Intel が IPU の具体的な製品計画を発表 Arm CPU を搭載した Mount Evans など 3 製品を投入~FPGA 搭載の Oak Springs Canyon、Arrow Creek も製品化へ~


レイトレーシングの今後: オープンでヘテロジニアスな高忠実度を重視したアプローチによるビジュアライゼーション


インテルは、Adobe、Autodesk、Blender、Chapeau Studios、Dassault Systèmes、Foundry などの業界リーダーとともに、8月9日~ 13日に開催されたバーチャル SIGGRAPH において、プロジェクション・マッピング、3D モデリングとアニメーション、リアルタイム・グラフィックス、ワークフローの効率化、メモリー・ソリューション、映画制作など、クールなレンダリング機能に焦点を当てた 10 のテクニカルセッションを実施しました (セッションのビデオと PDF はこちら (英語) を参照)。インテル コーポレーションのインテル・アドバンスト・レンダリング & ビジュアライゼーション・アーキテクチャー担当シニア主席エンジニア兼シニア・ディレクターの Jim Jeffers による基調講演 (英語) では、インテルの包括的なエンドツーエンドのプラットフォームにより、最も複雑なワークロードに取り組み、最高の忠実度を実現する方法を紹介しています。このプラットフォームは、強力なインテル® プロセッサー、インテル® Optane™ パーシステント・メモリー、ネットワーク、そしてインテル® oneAPI レンダリング・ツールキットを利用したオープンでヘテロジニアスな開発による高度なレイトレーシングで構成されています。特別基調講演のビデオでは、Autodesk のシニア・ソフトウェア開発マネージャーである Frederic Servant 氏が、インテル® Open Image Denoise (インテル® oneAPI レンダリング・ツールキットの一部) を Arnold レンダラーに統合することで、ノイズ除去のスピードと品質の向上に加えて、ディープラーニングを高速化する方法を紹介しています (ビデオ [2:50] (英語))。Linux Foundation のデジタルメディア & ゲーム担当 GM である Royal O’Brien 氏によるビデオでは、新しいオープンソース・プロジェクトである Open 3D Engine (O3DE) による、業界全体に利益をもたらすコラボレーションとイノベーションの可能性を説明します (ビデオ [3:30] (英語))。O3DE もインテル® oneAPI レンダリング・ツールキットのコンポーネントを使用しています。

今後の展望として Jeffers は、レイトレーシングの持続可能な開発には、新しい革新的なアーキテクチャーが利用可能になったときに選択肢を提供し、プロプライエタリーなプログラミングのウォールドガーデンがもたらす課題を克服するため、オープンで柔軟性があり、生産性の高いヘテロジニアスなアプローチが必要であると述べています。また、データセットやモデルのサイズ、複雑さが増しているため、「グラウンド・トゥルース」に近いフォトリアリスティックなビジュアライゼーションを実現するには、高い忠実度が重要な差別化要因となります。この点を説明するため、Jeffers はブログ (英語) で、インテル® Open Image Denoise と NVIDIA OptiX* を使用して一般に公開されているモデルの忠実度を比較しています。コンテンツ制作者、開発者、研究者の皆さん、oneAPI とインテルのテクノロジーを活用することで、仕事をより鮮やかに、生産的にできることをぜひ確認してください。


インテル® oneAPI ツールキット 2021.3 リリース

2021年7月2日 | インテル® oneAPIインテル® oneAPI ツールインテル® DevCloud (英語)

AI、HPC、メディア、レイトレーシングなどを含むデータセントリックなワークロードに対してパフォーマンスの向上と機能の拡張を提供する、インテル® oneAPI ツールキットの最新のアップデートがリリースされました。パッケージをダウンロードすることも、インテル® DevCloud で利用することもできます。

インテル® oneAPI ツールキットは、業界標準の C++、SYCL*、Fortran、MPI、OpenMP*、Python* などを実装し、インテル® AVX-512、インテル® VNNI/インテル® DL ブースト、暗号化命令などの独自の CPU 機能と GPU や FPGA を利用して、複雑なデータ駆動型アプリケーションを強化する、コンパイラー、ライブラリー、解析ツール、最適化されたフレームワークを提供します。

2021.3 の新機能:

  • 第 3 世代インテル® Xeon® スケーラブル・プロセッサー (開発コード名:Ice Lake Server) 上でのパフォーマンスが向上しました (コンパイラー、ライブラリー、フレームワークの最適化を含む) (注: インテル® DevCloud for oneAPI で第 3 世代インテル® Xeon® スケーラブル・プロセッサーを利用できるようになりました)。
  • 間もなくリリースされるインテル® oneAPI AI アナリティクス・ツールキットのアップデートにインテル® Extension for Scikit-learn* が追加されます。これにより、シングルノードおよびマルチノードのインテルの CPU および GPU 上で、マシンラーニング・アルゴリズムをワンラインの動的パッチで高速化して、100 倍以上のパフォーマンス向上を実現できます。
  • ディープラーニングの推論ワークロードにおいて、明示的な入出力設定なしにグラフの最適化が改善され、洗練された自動混合精度 API により Int8 のサポートが向上しました。これは、インテル® oneAPI AI アナリティクス・ツールキットのアップデートに含まれます。
  • インテル® DPC++ 互換性ツールで CUDA* 11.2 および 11.3 のヘッダーフィールドがサポートされ、CUDA* ドライバーおよびメモリーフェンス API の移行範囲が改善され、移行時間が最大 50% 削減されました。
  • インテル® VTune™ プロファイラーで CPU と GPU 間のデータ転送解析が改善され、GPU オフロードスキーマの解析が向上しました。この機能は、達成可能なピーク GPU 占有率を制限する原因を自動的に検出することで、最もホットな計算カーネルのパフォーマンスを向上させます。
  • インテル® Advisor の GPU ルーフライン解析が改善されました。これにより、メモリー・サブシステムのボトルネックを解消するためメモリー依存コードを調査したり、異なるワークロードのパフォーマンス特性を比較するため各カーネルのインスタンスの詳細を得られます。
  • インテル® oneAPI レンダリング・ツールキットのボリューム・レイトレーシング・ライブラリーに、構造化 FP16、VDB FP16、VDB モーションブラー、VDB キュービック・フィルタリングの新しいサポートや、同じシーンで複数のボリュームを処理する機能が追加されました。
  • インテル® コンパイラーと一部のライブラリー (インテル® oneMKL、インテル® oneDAL、インテル® oneDNN、インテル® oneVPL、インテル® IPP、インテル® MPI ライブラリー) は、HPC 向けパッケージ・マネージャーである Spack から入手可能です。
  • より広範なユースケースで、新しい C API、プレビュー C++ および Python* API、インテル® oneVPL サンプルによるパフォーマンス上の利点が得られるようになりました。
  • ベータ版インテル® Fortran コンパイラーで、GPU への計算オフロードを含む OpenMP* 5.1 のサブセットと Fortran 2008 標準がサポートされました。
  • 新しい Yocto Project* レイヤーの meta-intel-oneapi により、DPC++ ランタイム、データコレクター、ライブラリーなどを Yocto Project* の Linux* カーネルに簡単に統合できるようになりました。
  • すべてのツールにおいて、このほかにも新機能が追加され、パフォーマンス、安定性、セキュリティーが改善されています。

アップデートの詳細 (英語)


米国政府が AMD GPU ベースのエクサスケール・スーパーコンピューターをサポートするため oneAPI DPC++ コンパイラーに資金提供

2021年6月17日 | インテル® oneAPI DPC++ コンパイラー (英語)、インテル® oneAPI ツール

アルゴンヌ国立研究所 (英語) はオークリッジ国立研究所 (英語) と共同で、AMD GPU ベースの高性能計算スーパーコンピューター「Frontier」をサポートするため、SYCL* オープン・スタンダード・ソフトウェアの実装である oneAPI DPC++ コンパイラーの実装契約を Codeplay (英語) に授与しました。

Codeplay 社は、多様なハードウェア・アーキテクチャー用のコンパイラーやツールを開発している英国のソフトウェア企業で、SYCL* コンパイラーの主要な実装者でもあります。Frontier が SYCL* オープン・スタンダードに対応することで、米国エネルギー省の国立研究所のヘテロジニアス計算環境向けに科学アプリケーションを開発するための共通のプログラミング・モデルを実現します。

詳細 (英語)


インテル® oneAPI ツールをサポートする Lenovo LiCO をリリース

2021年6月11日 | インテル® oneAPI ツール (英語)、インテル® MPI ライブラリー (英語)

ヘテロジニアス・コンピューティングのための oneAPI へのコミットメントとして、Lenovo は LiCO の最新リリースに、インテル・プロセッサー向けに最適化された 3 つのインテル® oneAPI ベースのテンプレート (インテル® MPI ライブラリー、インテル® MPITune、インテルの OpenMP) を追加しました。

LiCO とは?
LiCo は Lenovo Intelligent Computing Orchestration の略で、AI モデルの開発とトレーニングのクラスター・コンピューティング・リソースの使用を簡素化するソフトウェア・ソリューションです。統一されたプラットフォームにより、基盤となる計算リソースとのやり取りが簡素化され、AI に使用する際の労力や複雑さを軽減しつつ、ポピュラーなオープンソースのクラスターツールを活用できます。

詳細 (英語)


ハイパフォーマンス・クラスターAppsbroker がインテルと Google Cloud を利用して STAC-A2 ベンチマークで HPC 速度に関する 2 つの世界記録を更新

2021年6月7日| インテル® oneAPI ベース・ツールキット (英語)、インテル® oneMKL (英語)、第 2 世代インテル® Xeon® スケーラブル・プロセッサー

Google Premier Provider である Appsbroker (英語) が、第 2 世代インテル® Xeon® スケーラブル・プロセッサー・ベースの Google Cloud Platform (GCP) インスタンスのクラスターとインテル® oneAPI ツールによる最適化を組み合わせたテスト用ソリューションを提供しました。STAC-A2 ベンチマークがパブリッククラウドでテストされたのは今回が初めてで、その結果は記録的なものでした。

「STAC-A2 の C++ コードは、インテル® oneAPI ベース・ツールキットとインテル® oneAPI マス・カーネル・ライブラリー (インテル® oneMKL) を使用して、インテル・アーキテクチャー向けに開発および最適化されました。このハイパフォーマンスなコードは OnPrem で動作し、Appsbroker は GCP にシームレスに移行しました」

インテル コーポレーション
ファイナンシャル・サービス担当 GM
Mike Blalock

記事を読む (英語) | STAC レポートを見る (英語)


SberCloud が 4 つのインテル® oneAPI ツールキットで AI 向け開発プラットフォームを拡張

2021年5月21日 | SberCloud、インテル® oneAPI ツールキット (英語)、oneAPI 仕様 (英語)

SmartDev (https://smartdev21.ru/) において、Sber 社は AI サービスのフルサイクルの開発と実装を行うクラウド・プラットフォーム「SberCloud ML Space」の機能拡張を発表しました。マシンラーニング・モデルを作成、トレーニング、展開するツールやリソースを提供し、データソースへの迅速な接続から SberCloud (https://www.sberbank.com/eco/sbercloud) へのモデルの自動展開までを行います。

ML Space は、AI アクセラレーションを内蔵したインテル® Xeon® スケーラブル・プロセッサーを使用して、分散学習を組織的に行うためのクラウドサービスです。そのアーキテクチャーは、SberCloud のスーパーコンピューター「Christofari」をベースにしています。Christofari は、ロシア最大のスーパーコンピューターであり、oneAPI プログラミング・モデルを採用して、ベンチマークでは 6.7 ペタフロップスのパフォーマンスを実現しています。

XPU 時代、特に AI 開発をサポートするため、ML Space は 4 つのインテル® oneAPI ツールキット (ベース・ツールキット、HPC ツールキット、AI アナリティクス・ツールキット、OpenVINO™ ツールキット) を追加します。

詳細: 英語 | ロシア語


PING 社がインテル® Xeon® プロセッサーとインテル® oneAPI ツールを使用してゴルフ用品のイノベーションを推進

2021年5月19日 | インテル® Xeon® スケーラブル・プロセッサーインテル® oneMKL (英語)、インテル® MPI ライブラリー

世界的に有名なゴルフ用品メーカーである PING 社が、ハイパフォーマンス・コンピューティング (HPC) を採用した設計戦略により、製品ラインのイノベーションを促進するため、インテル、Altair、Dell Technologies と提携しました。この提携により、PING 社は、設計サイクルの時間短縮、製品性能のばらつきの低減、市場投入までの時間を遅らせることなく品質の向上を実現して、シミュレーション速度を 4.5 倍向上しました。

PING 社がインテル® oneAPI マス・カーネル・ライブラリー (インテル® oneMKL) とインテル® MPI ライブラリーを活用して、インテル® Xeon® スケーラブル・プロセッサー上のアプリケーションの効率と品質を向上させた成功事例 (英語) をご覧ください。

また、PING 社とインテルが HPC と AI を連携させて完璧なゴルフクラブを見つけた様子を紹介したビデオ [2:43] (英語) もご覧ください。


oneAPI 1.1 暫定仕様を公開

2021年5月13日 | oneAPI 業界仕様 (英語)

インテル コーポレーションのデベロッパー・ソフトウェア担当バイスプレジデント兼ゼネラル・マネージャーの Sanjiv Shah が oneAPI 1.1 暫定仕様リビジョン 1 (英語) の公開を発表しました。

AI、レンダリング、メディアでの新たなユースケースを可能にする、以下のような新機能が追加されています。

  • 高度なレイトレーシング。ソフトウェア開発者は、複数のベンダーのシステムやアクセラレーターを使用して、高忠実度のレイトレース計算を行うことができます。
  • oneAPI ディープ・ニューラル・ネットワーク・ライブラリー (oneDNN)。ディープラーニングの計算グラフをコンパイルして実行するグラフ API が oneDNN に追加されました。
  • oneAPI ビデオ・プロセシング・ライブラリー (oneVPL)。利用可能なメディア・コンポーネント間でワークロードを効率良く分割するハイパーエンコード・モードが oneVPL に追加されました。
  • 言語の進化。最新の SYCL* 仕様に含まれる新機能の大部分は、データ並列 C++ (DPC++) 言語の拡張機能が占めています。

アップデートの詳細 (英語)


インテル® oneAPI ツールキット 2021.2 リリース

2021年4月2日 | インテル® oneAPIインテル® oneAPI ツールキット (英語)

2020年末に製品版がリリースされたインテル® oneAPI ツールキットの Update 1 がリリースされました。計算、AI、メディア、レイトレーシング、HPC などに、さらなるパフォーマンスと新しい機能を提供します。インテル® oneAPI ツールキットは、現在入手可能な oneAPI イニシアチブ準拠のツール (コンパイラー、ライブラリー、最適化フレームワーク、アナライザー、デバッガ) の中で、最も完全で多様なセットです。

主な新機能:

AI および HPC

  • AI 向けには、XGBoost と scikit-learn のパフォーマンスが大幅に強化され、さらに Tensorflow* とPyTorch* 向けのインテルの最適化もアップグレードされています。
  • インテル® MPI ライブラリーのコンテナーサポートが拡張され、Mellanox* OFED サポートが更新されました。
  • インテル® Advisor のオフロードのモデル化と GPU ルーフライン機能のソースビュー解析が拡張されました。
  • インテル® VTune™ プロファイラーにプラットフォーム・ダイアグラムが追加されました。入力および出力解析の新しい開始点として使用して、システム・トポロジーや、PCIe* デバイス、インテル® ウルトラ・パス・インターコネクト (インテル® UPI)、メモリーを含むハードウェア・リソースの高レベルの利用率メトリックを提供します。

メディア、レイトレーシング、レンダリング

  • VDB マルチアトリビュート・ボリューム・サポート、高速な構造および VDB ボリュームサンプル、構造、VDB、非構造ボリュームの高速インターバル・イテレーション。
  • 拡張されたノイズ除去ライブラリーで指向性ライトマップと Apple Silicon がサポートされました。
  • ライブラリー GUI では、Lights エディターの改善によりシーンのライティングが容易になり、gITF ローダーがトライアングル・メッシュ、ライト、マテリアル、テクスチャーのアニメーションとスキニングに対応し、シーンファイルのロードとセーブが向上しています。
  • 高速なトランスコードやストリーミングなどのメディアサポート。

アップデートの詳細 (英語) | ブログを読む (英語)


hipSYCL が SYCL* 2020 & oneAPI DPC++ 機能をサポート

2021年2月23日 | DPC++ (英語)、インテル® oneAPI

oneAPI 研究拠点のハイデルベルク大学 (英語) が hipSYCL 0.9.0 に関するブログ記事を投稿しました。hipSYCL 0.9.0 では、SYCL* 2020 仕様の次の機能がサポートされます。

  • 統合共有メモリー
  • 並列リダクション
  • サブグループ
  • ワークグループおよびサブグループ・プリミティブ
  • その他

これらの機能は、より細かなハードウェア制御、より柔軟な使用パターン、そしてプログラマーにとっては冗長性の軽減をもたらします。これにより、開発者は DPC++ で SYCL* 2020 の機能を使用してコードを記述できるだけでなく、例えば AMD の GPU をターゲットにする必要がある場合、hipSYCL にシームレスに移行できます。詳細は、こちら (英語) を参照してください。


oneAPI 仕様で提案されている高度なレイトレーシング API

2021年2月17日 | oneAPI 仕様 (英語)

「oneAPI 仕様への追加が検討されている現在公開中の一連の高度なレイトレーシング API (英語) について、皆様のご意見をお寄せください。」

インテル コーポレーション
シニア主席エンジニア兼インテル・アドバンスト・レンダリング & ビジュアライゼーション・アーキテクチャー シニア・ディレクター
Jim Jeffers

Jim の最新のブログ (英語) では、レイトレーシング計算の分野でロバストで効率的な開発を促進するため、開発者がフィードバックを送ることができるこの機会について詳しく述べています。oneAPI 仕様にレイトレーシング機能を追加することで、業界全体のソフトウェア開発者が、複数のベンダーのシステムやアクセラレーターにまたがる高忠実度のレイトレーシング計算を「一度記述する」だけで済むようになります。

開発者の皆さんからのフィードバックとコラボレーションを GitHub* リポジトリー (英語) までお寄せください。| 詳細 (英語)


Demetics がインテル® oneAPI 製品を使用して AI アルゴリズムを保護

2021年2月15日| インテル® oneMKL (英語)、インテル® SGX

Demetics Medical Technology Co. Ltd. は、インテル® ソフトウェア・ガード・エクステンション (インテル® SGX) とインテル® oneAPI マス・カーネル・ライブラリー (インテル® oneMKL) (英語) を使用して、エッジの医療用人工知能 (AI) アルゴリズムと医療機器の知的財産 (IP) を保護しています。中国における AI ベースの超音波検査のパイオニアである Demetics 社は、独自に開発したディープラーニング・フレームワーク「DE-Light」の採用を加速させ、オープンソース・フレームワークでの甲状腺結節の検出精度を 30~40% 向上させ、優れた性能を実現しました。1

記事を読む (英語)
インテル® oneMKL を含むインテル® oneAPI ベース・ツールキット (英語) のダウンロード

1 テスト結果は Demetics 社による社内評価を引用したものです。詳細は、Demetics 社までお問い合わせください。


SYCL* 2020 最終仕様書で oneAPI データ並列 C++ 機能を採用

2021年2月9日 | oneAPI 仕様 (英語)、SYCL* 仕様 (英語)、DPC++ (英語)

高度な相互運用性規格を作成する、業界をリードする企業によるオープン・コンソーシアムである The Khronos Group (英語) は、シングルソースの C++ 並列プログラミングのオープン標準である SYCL* 2020 最終仕様書 (英語) の公開を発表しました。SYCL* 2020 は、長年の仕様開発を包含する重要なマイルストーンであり、SYCL* 1.2.1 の機能をベースに構築され、プログラマビリティーの向上、コードサイズの縮小、およびパフォーマンスの向上を実現しています。SYCL* 2020 は C++17 をベースにしており、標準 C++ アプリケーションの高速化を容易にし、ISO C++ ロードマップとの緊密な連携を可能にします。SYCL* 2020 最終仕様書 (英語) には、oneAPI データ並列 C++ (DPC++) 機能が追加されています。

2019年の発表以来、DPC++ は大幅に進歩し、oneAPI 開発拠点からクロスアーキテクチャーとクロスベンダーのサポートを得て、現在は業界標準へ機能をアップストリームしています。オープンなコミュニティー・ベースの DPC++ の開発において、インテルは SYCL* のプログラミング抽象化の改善に大きく貢献をしています。新しい機能は、CPU、GPU、FPGA、AI などの広範な XPU アーキテクチャーでの HPC、マシンラーニング、組込みコンピューティング、および計算集約型アプリケーションのヘテロジニアス並列プログラミングを加速します。

記事を読む (英語)
Khronos のプレスリリースを読む (英語)


インテル® Embree がアカデミー賞を受賞

2021年2月2日 | インテル® oneAPI レンダリング・ツールキット (英語)、インテル® Embree レイトレーシング・ライブラリー (英語)

映画芸術科学アカデミー (AMPAS) は、インテル® Embree レイトレーシング・ライブラリー (インテル® oneAPI レンダリング・ツールキット (英語) のコンポーネント) に科学技術賞 (英語) を授与しました。毎年アカデミー賞を主催している映画芸術科学アカデミー (AMPAS) は、インテル® Embree の業界をリードするジオメトリー・レンダリングのレイトレーシングを、映画製作プロセスにおける革新的な貢献として表彰しました

詳細はこちら (英語) をご覧ください。インテル® Embree はインテル® oneAPI レンダリング・ツールキット (英語) の一部として無料でダウンロードできます。

インテル® Embree が採用されている映画の例:
  • ヒックとドラゴン 聖地への冒険
  • レゴバットマン ザ・ムービー
  • ネクスト ロボ
  • ペット 2
  • アベンジャーズ/インフィニティ・ウォー
  • グリンチ
  • ほか多数

受賞者: Sven Woop、Carsten Benthin、Attila Afra、Manfred Ernst、Ingo Wald、およびインテル コーポレーション アドバンスト・レンダリング & ビジュアライゼーション シニア・ディレクター Jim Jeffers。

2020年

インテルが XPU ソフトウェア開発向けインテル® oneAPI ツールキットをリリース

2020年12月8日 | インテル® oneAPI ツールキット (英語)、インテル® DevCloud (英語)

「インテル® ソフトウェア開発ツールが CPU から GPU や FPGA に拡張されたことは、XPU への道のりにとって重要なマイルストーンと言えます。oneAPI 業界イニシアチブは、独自のプログラミング・モデルに代わる、オープンな統一されたクロスアーキテクチャー・プログラミングをエコシステムにもたらします。インテル® oneAPI ツールキットとインテル® DevCloud は、分散型インテリジェンス時代への進歩を加速させるために必要なツールを提供します。」
インテル コーポレーション
アーキテクチャー、グラフィックス & ソフトウェア・グループ
チーフ・アーキテクト兼シニア・バイスプレジデント
Raja Koduri

インテルは、インテルの CPU、GPU、FPGA でハイパフォーマンスなアプリケーション開発を簡素化するインテル® oneAPI ツールキット 2021.1 (英語) をリリースしました。開発ツールにおけるインテルの長年の実績と豊富な経験を標準化されたオープンなクロスアーキテクチャー・プログラミング・モデルと組み合わせることで、開発者が経済的および技術的な負担を伴う独自のプログラミング・モデルに縛られることなく、特定のワークロードに最適なハードウェアを自由に選択できるようにします。インテル® oneAPI ベース・ツールキットには、コンパイラー、パフォーマンス・ライブラリー、解析およびデバッグツール、CUDA* コードからデータ並列 C++ (DPC++) への移行を支援する互換性ツールが含まれます。HPC、AI、IoT、レンダリング向けのアドオン・ツールキットは、特殊なワークロードの高速化を支援するツールとコンポーネントを提供します。インテル® oneAPI ツールキットは、無料でダウンロード (英語) してローカルで使用することも、インテル® DevCloud (英語) で使用することもできます。インテル® DevCloud では、さまざまなインテルの CPU、GPU、FPGA でコードとワークロードを開発してテストできます。パッケージは、ウェブ・ダウンロード、リポジトリー、コンテナーから入手できます。

そのほかにも、以下の発表がありました。

  • 商用版では、インテルのテクニカル・コンサルティング・エンジニアによるサポートを世界中から受けることができます。既存のインテル® Parallel Studio XE とインテル® System Studio は、インテル® oneAPI 製品に移行します。インテル® oneAPI 製品は上位互換であり、現在のすべての機能に加えて、新しい機能とツールを備えています。
  • oneAPI エコシステムの進展: ニジニ・ノヴゴロドのロバチェフスキー大学 (UNN) が、oneAPI クロスアーキテクチャー・プログラミングにより、CPU、GPU、その他のアクセラレーターを利用して現代物理学の研究を促進する新たな oneAPI 研究拠点 (CoE) の開設を発表 (英語) しました。
  • oneAPI エコシステム・サポート: 60 以上の主要な研究機関、企業、大学が oneAPI イニシアチブをサポートしており、インテル® oneAPI ツールキットを使用して成功を収めているものもあります。詳細は、賛同者の声 (英語) を参照してください。最新の oneAPI アプリケーション・カタログ (英語) には、oneAPI を利用した 240 以上のアプリケーションの詳細が記載されています。

詳細>


ニジニ・ノヴゴロドのロバチェフスキー大学が oneAPI を使用して量子プロセスの研究を高速化

2020年12月8日 | oneAPI イニシアチブ (英語)

ニジニ・ノヴゴロドのロバチェフスキー大学 (UNN) が、oneAPI クロスアーキテクチャー・プログラミングにより、CPU、GPU、その他のアクセラレーターを利用して現代物理学の研究を促進する新たな oneAPI 研究拠点 (CoE) の開設を発表しました。新しいセンターは、ヘテロジニアス・アーキテクチャー上でハイパフォーマンス・コンピューティング (HPC) を必要とする研究課題に取り組むとともに、次世代の科学者を育成するためのソフトウェア・カリキュラムを拡充することを目的としています。

詳細は、こちら (英語) を参照してください。


2020年12月にインテル® oneAPI ツールキットを出荷開始

インテル® oneAPI ツールキットは開発者がアーキテクチャーを超えて自由にコードを記述し、XPU 時代のコンピューティングを高速化できるように支援

2020年11月11日 | インテル® oneAPIoneAPI イニシアチブ (英語)

インテルの XPU に関する最新情報

インテルは、標準化されたソフトウェア抽象化により、さまざまなアーキテクチャーの組み合わせに多様なワークロードを素早く展開できるようにする取り組みにおいて、以下を含む重要なマイルストーンを発表しました。

  • 12月にインテル® oneAPI ツールキット (英語) を出荷開始
  • インテルのハードウェアとソフトウェアを組み合わせた設計アプローチの一環として、ソフトウェア・スタックに新たな追加された機能
  • 高密度、低レイテンシーの Android* クラウドゲームやメディア・ストリーミング向けに設計された、Xe-LP マイクロアーキテクチャー・ベースのインテル初のデータセンター向けディスクリート GPU 「インテル® サーバー GPU」のデビュー

これらのマイルストーンは、AI から HPC、グラフィックスに至るまで、専門的なワークロードの増加に対応するハードウェアとソフトウェア・ソリューションを提供する上で重要です。詳細は、こちら (英語) を参照してください。

インテル® oneAPI ツールキット: 新機能

インテルの CPU、GPU、FPGA をサポートするインテル® oneAPI ツールキットは 12月に出荷され、ローカルおよびインテル® DevCloud で無料で利用できます。このツールキットは、開発者がターゲット・ハードウェアの潜在的なパフォーマンスを発揮し、ソフトウェアの開発と保守コストを軽減するのに役立つだけでなく、独自のベンダー固有のソリューションと比較して、高速化されたコンピューティングのデプロイに伴うリスクを軽減します。インテル® oneAPI ツールキットは、インテルの CPU 開発ツールの豊富な経験を基に構築され、XPU に拡張されています。そのほかにも、以下の発表がありました。

  • インテルのテクニカル・コンサルティング・エンジニアによるワールドワイドなサポートを含むインテル® oneAPI ツールキットの商用版。既存のインテル® Parallel Studio XE とインテル® System Studio は、インテル® oneAPI 製品に移行します。
  • oneAPI エコシステムの進展イリノイ大学ベックマン先端科学技術研究所が新たな oneAPI 研究拠点を開設 (英語)、Microsoft* Azure*、TensorFlow* などがoneAPI を支持 (英語)
  • インテル® DevCloud に新しいインテル® Xe GPU ハードウェアが追加され、パブリック・アクセス向けのインテル® Iris® Xe MAX グラフィックスと、一部の開発者向けのインテル® Xe-HP が利用可能に

詳細は、「インテル® oneAPI 製品: 12月にリリース」 (英語) ブログ | 「インテル® oneAPI ファクトシート」 (英語) を参照してください。


イリノイ大学が NAMD に oneAPI クロスアーキテクチャー・プログラミング・モデルを導入

2020年11月11日 | oneAPI イニシアチブ (英語)

イリノイ大学ベックマン先端科学技術研究所は、ライフサイエンス・アプリケーション NAMD に oneAPI プログラミング・モデルを導入し、新たなヘテロジニアス・コンピューティング環境を追加するため、新しい oneAPI 研究拠点の設立を発表 (英語) しました。大規模な生体分子システムをシミュレーションする NAMD は、COVID-19 のような現実世界の課題に取り組むのに役立っています。


SC 2020 でお会いしましょう

2020年11月6日 | oneAPI @ SuperComputing 2020 (英語)、oneAPI イニシアチブ (英語)、DPC++ (英語)

間もなく SC 2020 が開催されます。統一された標準ベースのモデルを介してヘテロジニアス・プログラミングを簡素化する oneAPI イニシアチブに関する取り組みの進捗状況を、コミュニティーの皆さんと共有できることを楽しみにしています。

oneAPI、DPC++、SYCL*、OpenMP*、MPI に加えて、パフォーマンス・チューニングやビジュアライゼーション・ツールなど、幅広いトピックをカバーします。技術的な話から詳細なワークショップ、デモやライブチャットまで、この 2 週間さまざまな方法で皆さんと交流できることを楽しみにしています。詳細は、こちら (英語) を参照してください。


インテル® oneAPI beta10 リリース

2020年10月27日 | インテル® oneAPIインテル® VTune™ プロファイラーインテル® DPC++/C++ コンパイラー (英語)、インテル® OSPRay Studio (英語)

間もなく発表予定の Gold 製品のリリースに向けて、beta10 では次の機能が追加/強化されています。

  • インテル® VTune™ プロファイラーを使用して、DPC++ と OpenMP* の両方でオフロードコストをプロファイルして、パフォーマンスを低下させるメモリー転送を検出できます。
  • インテル® VTune™ プロファイラーで CPU の電力解析を行い、スロットリングの問題をデバッグしたり、ワットあたりの FLOPS をチューニングできます。GPU 電力解析も近日中に実装される予定です。
  • インテル® ディストリビューションの Modin と完全な機能互換性を保持しつつ、pandas API の 95% を並列化します。OmniSci バックエンドは、ノードあたり 6TB のインテル® Optane™ メモリーを追加して、大規模なデータを効率良くスケーリングし、手動でクラスターを生成することなくローカルのノートブックからクラウドへシームレスに拡張します。
  • SYCL* とインテル® GPU サポートにより高速化されたネイティブ・ライブラリーと NumPy* 形式の API である Data Parallel NumPy* (dpnp) の初期リリースは、Python* の数学コードを高速化します。
  • サポートベクトル分類 (SVC)、ランダムフォレスト、K 近傍法分類器を含む scikit-learn アルゴリズムの追加の最適化により、インテル® CPU 上でのモデル適合と予測を高速化します。
  • XGBoost と LightGBM からトレーニング済みのモデルを変換し、daal4py ライブラリーを使用してインテル® CPU 上でモデルの予測を高速化します。
  • インテル® oneAPI DPC+/C++ コンパイラーを使用して、インライン CPU アセンブリーと GPU 仮想命令セットコードを混在させることができます。
  • 直感的なインターフェイスを備えたシーングラフ・アプリケーションである新しいインテル® OSPRay Studio を使用して、高忠実度の、レイトレースされた、インタラクティブな、リアルタイム・レンダリングを実行できます。

インテル® oneAPI をぜひお試しください (英語)。beta10 は、インテル® DevCloud for oneAPI (英語) で利用することも、インテル® oneAPI ページからダウンロードすることも、コンテナーやリポジトリー経由で入手することもできます。


追加のインテル® oneAPI マス・カーネル・ライブラリー (インテル® oneMKL) オープンソース・インターフェイス

2020年10月9日 | oneMKL インターフェイス (英語)、インテル® oneMKL (英語)

インテル® oneAPI マス・カーネル・ライブラリー (インテル® oneMKL) のオープンソース・インターフェイスは拡大を続けており、開発者は複数のベンダーのアーキテクチャーで実行される移植性の高い演算集約型アプリケーションを効率良くコーディングできます。今年初めにリリースされたインテル® oneMKL の密線形代数 BLAS ドメインのインターフェイスに加えて、インテル® oneMKL の乱数ジェネレーター (RNG) ドメインのインターフェイスが追加されました。この新しいインターフェースは、モンテカルロ・シミュレーション、財務予測、リスク管理、暗号、その他のアプリケーションでよく使用される、連続分布と離散分布の疑似乱数や非決定論的エンジンを実装するルーチンを提供し、一般的な数学関数を幅広くカバーします。

追加のクロスアーキテクチャー、クロスベンダー・ハードウェアをサポートするため、oneAPI パートナーは、ダウンロード可能なこれらのインターフェイスを使用することを推奨します。詳細は、こちら (英語) を参照してください。


ハイデルバーグ大学コンピューティング・センター (URZ) が oneAPI 研究拠点を開設

2020年9月29日 | oneAPI イニシアチブ (英語)、インテル® DPC++ (英語)

ハイデルバーグ大学コンピューティング・センターは、AMD* GPU、NVIDIA* GPU、および CPU ベースのシステムをサポートする hipSYCL に高度なデータ並列 C++ (DPC++) 機能を追加することを目的とした oneAPI 研究拠点 (英語) の開設を発表しました。

oneAPI のクロスアーキテクチャー言語である DPC++ は、生産性が高く、可読性に優れており、学習しやすく、開発者がベンダー固有の言語やツールに強制されることなくアクセラレーターのパフォーマンスを引き出すのに役立ちます。新しい DPC++ 拡張機能は SYCL* 2020 暫定仕様の一部であり、hipSYCL や対応プラットフォームに統合共有メモリーなどの機能をもたらします。この研究拠点は、ソフトウェア・コミュニティーがこの機能を実現するための大きな一歩を提供し、生産性とパフォーマンスの両方を備えたクロスアーキテクチャー、クロスベンダーのプログラミング・ソリューションを作成する oneAPI 業界イニシアチブを促進します。

詳細は、こちら (英語) を参照してください。


oneAPI v1.0 仕様リリース

2020年9月28日 | oneAPI イニシアチブ (英語)

oneAPI v1.0 仕様 (英語) がリリースされました。これにより、容易にアクセラレーター・プログラミングを取り入れて、データ集約型ワークロードに対応できるようになりました。今回のリリースは、産官学の第一線で活躍するテクノロジストによる 1 年間の取り組みの集大成であり、クロスアーキテクチャー開発のオープンな道を切り開くものです。

本仕様は、言語に加えて、数学ライブラリー、ディープラーニングおよびマシンラーニングのインターフェイス、ビデオ解析 API、低レベルのハードウェア抽象化インターフェイスやランタイム API など、アクセラレーターにより利点が得られる多くのドメインをカバーしています。誰でも利用でき、任意のプログラムに移植可能なオープンソース・スタックが公開されています。詳細は、デベロッパー・ソフトウェア・エンジニアリング・マネージャーの Sanjiv Shah の投稿 (英語) を参照してください。

次世代のアクセラレーター・ソフトウェアに影響を与えたり、多種多様なアクセラレーター向けの新しい言語を開発したり、oneAPI 準拠のツールを開発したり、ハードウェアに接続してこのソフトウェア・スタックを活用したいと考えている方は、仕様書や GitHub* (英語) 上のオープンソース実装にぜひ貢献してください。


インテル® oneAPI beta09 リリース

2020年9月14日 | インテル® oneAPIDPC++ (英語)、インテル® oneMKL (英語)、インテル® oneVPL (英語)、インテル® Advisorインテル® VTune™ プロファイラー

今回のリリースでは、今年後半に予定されている Gold リリース に向けて、多数のツール (コンパイラー、ライブラリー、および解析ツール) に加えて、DL フレームワークをサポートするインテル® Low Precision Optimization、インテル® Advisor の GPU ルーフライン解析、インテル® oneAPI ビデオ・プロセシング・ライブラリーでの H.264 & MJPEG ソフトウェア・デコード/エンコードのサポートが追加されています。

詳細:

  • 今年後半に予定されている Gold リリースに向けて、すべてのコンパイラー、ライブラリー、ツールのパフォーマンスと安定性が向上しました。
  • インテル® AI アナリティクス・ツールキットに、複数のディープラーニング・フレームワークをサポートする統一された低精度推論インターフェイスである、インテル® Low Precision Optimization Tool が追加されました。FP32 モデルを int8 や Bfloat16 に簡単に変換したり、精度を重視したチューニング戦略を活用したり、パフォーマンス、モデルサイズ、およびメモリー使用を最適化できます。
  • インテル® Optimization for PyTorch* とインテル® oneAPI コレクティブ・コミュニケーション・ライブラリー (インテル® oneCCL) の連携により、CPU 上で効率良い分散トレーニングが可能になりました。モデルデータ型の自動混合精度もサポートされました。
  • インテル® Advisor の新しいテクニカルプレビュー機能では、GPU ルーフライン解析とオフロード・アドバイザーが統合されたユーザー・インターフェイス・ワークフローとツールバー (英語) や、オフロード・アドバイザーでデータ転送の最適化に関する推奨事項を利用できるようになりました。
  • インテル® VTune™ プロファイラーでは、遅い MMIO 書き込みが行われた場所を特定するように改善された I/O 分析を使用して、パフォーマンスを低下させる I/O 書き込みが発生するモジュールを見つけることができます。
  • インテル® VTune™ プロファイラーで FPGA の各計算ユニットのストールとデータ転送に関する情報を収集し、より少ない推測で FPGA ソフトウェア・パフォーマンスを最適化できます。
  • インテル® MPI ライブラリーでは、GPU プログラミングがサポートされ、Mellanox * ファブリック上の独立した MPI ジョブの連結が可能になりました。
  • インテル® oneAPI マス・カーネル・ライブラリー (インテル® oneMKL) に、RNG 移動オペレーター、LAPACK バッファー、ポインターベース (統合共有メモリー) インターフェイスを含む、CPU および GPU 向けの DPC++ 関数が追加されました。
  • インテル® oneAPI ビデオ・プロセシング・ライブラリー (インテル® oneVPL) に、H.264 & MJPEG ソフトウェア・デコード/エンコード、ビデオの前処理 (サイズ変更、色変換、クロップ関数を含む)、および内部割り当てバッファーのサポートが追加されました。
  • Python* 向けインテル® ディストリビューションでは、Numba 関数内のデータ並列カーネルの GPU 自動オフロードと、scikit-image 変換関数とフィルターの最適化のマルチスレッド化が Windows* でサポートされました。

インテル® oneAPI をぜひお試しください (英語)。beta09 は、インテル® DevCloud for oneAPI (英語) で利用することも、インテル® oneAPI ページからダウンロードすることも、コンテナーやリポジトリー経由で入手することもできます。


未来のレイトレーシング・ソリューションを開発

2020年8月24日 | インテル® oneAPIRenderKit (英語)、インテル® DevCloud (英語)

インテルは、コンピューター・グラフィックスの世界的なイベントである SIGGRAPH 2020 において、インテル® oneAPI レンダリング・ツールキット (英語) の新機能を発表し、ハードウェア、メモリー、ネットワーク、およびソフトウェア・テクノロジーを含む、インテルの強力なレイトレーシング・プラットフォームを活用した顧客の成功事例を発表しました (プレスリリース全文はこちら (英語))

以下は、インテル® oneAPI レンダリング・ツールキットのレイトレーシングとレンダリング向け新機能の一部です。

  • インテル® OSPRay Studio – 高忠実度のレイトレーシングされた、インタラクティブなリアルタイム・レンダリングを実現するシーン・グラフ・アプリケーションです。3Dモデルや時系列の複数のフォーマットを可視化する機能を提供します。インテル® OSPRay とほかのインテル® レンダリング・ライブラリー (インテル® Embree、インテル® Open Image Denoise など) を組み合わせて作成されており、信頼性の高いサイエンティフィック・ビジュアライゼーションと写実的なレンダリングに使用されます。2020年後半にリリース予定です。
  • インテル® OPSRay for Hydra – アニメ映画や 3D CAD/CAM モデリング向けのビューポートにフォーカスしたインターフェイスを備えた、高忠実度のスケーラブルなレイトレーシング・パフォーマンスとリアルタイム・レンダリングを提供する、Universal Scene Description (USD) Hydra API に準拠したレンダラーです。
  • インテル® DevCloud for oneAPI デスクトップ可視化機能 – リモート・デスクトップを介して、レンダリングを可視化して反復処理を行い、リアルタイムでインタラクティブなアプリケーションを作成する、新しいビジュアル開発機能。インテル® oneAPI レンダリング・ツールキットを使用して、最新のインテル® ハードウェア (CPU、GPU、FPGA) で可視化パフォーマンスを最適化し、ワークロードを評価できます。インストール、セットアップ、設定が不要な無料のアクセスを利用できます。興味のある方は、こちら (英語) からサインアップできます。

SIGGRAPH 2020 のウェブサイト (英語) で、インテルや Tangent Studios (英語)、Chaos Group (英語)、Bentley Motors (英語) などの業界リーダーによる SIGGRAPH デモ、技術セッション、講演 (英語) をご覧ください。


LAIKA Studios とインテルが共同でストップモーション映画制作の可能性を拡大

2020年8月11日 | インテル® oneAPIインテル® AI アナリティクス・ツールキット (英語)、インテル® oneAPI レンダリング・ツールキット (英語)、インテル® DevCloud (英語)

Laika Studios とインテルの Applied Machine Learning チームは、ストップモーション・アニメーションの無限の可能性を実現するために協力しています。制作技術ディレクターの Jeff Stringer 氏と視覚効果監修者の Steve Emerson 氏が、インテル® oneAPI ツールを使用して AI の力を映画に取り入れる方法について述べます。



インテル® oneAPI beta08 リリース

2020年7月31日 | インテル® oneAPIインテル® oneVPL (英語)、インテル® oneTBB (英語)、インテル® oneAPI レンダリング・ツールキット (英語)、インテル® VTune™ プロファイラーインテル® Advisor

本リリースでの変更点は、分散 (および高速) データ・アナリティクス前処理向けインテル® Distribution of Modin and OmniSci の導入、インテル® oneAPI レンダリング・ツールキットでの最大 4 倍のレンダリング・スピードアップと粒子体積のサポート、迅速な初期解析を提供するインテル® VTune™ プロファイラーのパフォーマンス・スナップショット・プロファイル、インテル® Advisor のメモリーレベルのルーフライン解析、インテル® oneAPI ビデオ・プロセシング・ライブラリーの H.265 および AV1 CPU ソフトウェア・コーデック、および、インテル® oneAPI スレッディング・ビルディング・ブロックの NUMA の最適化機能などです。

詳細:

  • インテル® oneAPI ビデオ・プロセシング・ライブラリー (インテル® oneVPL) のメジャー・アップデート。H.265 および AV1 CPU ソフトウェア・コーデック、インテル® メディア SDK との上位互換性などが含まれます。
  • インテル® oneAPI スレッディング・ビルディング・ブロック (インテル® oneTBB) のメジャー・アップデート。詳細な NUMA アフィニティー管理機能や最新の C++ との整合性などが含まれます。
  • インテル® oneAPI DPC++ コンパイラーの CPU アーキテクチャー向けのコード・パフォーマンスが向上しました。
  • インテル® VTune™ プロファイラーでは、OpenMP* オフロードプラグマに対応したメトリックの追加により、GPU アクセラレーターの解析が改良されました。また、最初のプロファイル・ステップとして、パフォーマンス・スナップショットが追加され、最も大きな最適化の機会を特定するため詳細な解析 (メモリー、スレッドなど) を提案します。
  • インテル® Advisor にメモリー階層 (L1、L2、L3、または DRAM) のボトルネックをピンポイントで特定するメモリーレベルのルーフライン解析が追加されました。
  • インテル® C++ コンパイラーに OpenMP* 5.0 の GPU オフロードの初期サポートが追加されました。
  • Anaconda* チャネル (英語) でリリースされているインテル® Distribution of Modin の導入により、インテル® AI アナリティクス・ツールキットのデータ・アナリティクス・ワークフローが大幅に拡張されました。pandas と同一の API を持つこのインテリジェントな分散型データフレーム/ライブラリーを使用して、複数のノード間でデータの前処理をシームレスにスケーリングします。バックエンドでは、既存および最新のインテル® ハードウェアの計算処理能力を活用するように最適化された、エンドツーエンド分析のためのパフォーマンス・フレームワークである OmniSci がサポートしています。
  • インテル® AI アナリティクス・ツールキットも PyTorch* 1.5 にアップグレードされ、Bfloat16 データ型と最新の第 3 世代インテル® Xeon® スケーラブル・プロセッサー (開発コード名 Cooper Lake) をサポートしています。
  • Python* 向けインテル® ディストリビューションでは、Linux* 上の Python*/Numba コードの GPU サポートが追加され、Python* Data Parallel Processing Library (PyDPPL) が導入されました。PyDPPL は、DPC++ と SYCL* 向けの軽量な Python* ラッパーで、インテル® CPU やインテル® GPU のデバイス管理機能を効率的に活用するデータ並列インターフェイスと抽象化を提供します。
  • インテル® OSPRay とインテル® オープン・ボリューム・カーネル・ライブラリーに粒子体積のサポートが追加されました。さらに、インテル® OSPRay では、パノラマカメラ用のステレオ 3D モードと光源のスケーラビリティーをサポートされました。
  • インテル® オープン・ボリューム・カーネル・ライブラリーとインテル® Open Image Denoise のパフォーマンスが向上し、レンダリング速度が最大 4 倍高速になり、画質が向上しました。
  • インテル® Embree で光子マップがサポートされました。
  • インテル® オープン・ボリューム・カーネル・ライブラリーでは、設定可能なフィルター/再構築メソッド、ストリームワイドのサンプリングと勾配 API、イテレーター割り当て API、およびストライドデータ配列もサポートされました。
  • インテル® Open Image Denoise では、追加の Feature Buffers により画質が向上されました。また、新しい XTraining Code 機能とその他の改善が含まれています。
  • インテル® oneAPI レンダリング・ツールキットとインテル® C++ および Fortran コンパイラー、インテル® oneAPI ベース・ツールキットのほとんどのライブラリー、および解析ツールの結果ビューアーで macOS* CPU がサポートされました。
  • Singularity コンテナーが新たにサポートされました。

インテル® oneAPI をぜひお試しください (英語)。beta08 は、インテル® DevCloud for oneAPI で利用することも、インテル® oneAPI ページからダウンロードすることも、コンテナーやリポジトリー経由で入手することもできます。


リモート・コラボレーションの未来を開く Huddl.ai

2020年7月22日 | Open WebRTC Toolkit (英語)、OpenVINO™ ツールキット (英語)、インテル® oneAPI

Slack* と Zoom* と Google Drive* を合わせたような新しいビデオ・コラボレーション・プラットフォームの Huddl.ai は、元サンフランシスコ 49ers の Ronnie Lott 選手をはじめとする著名な投資家の支援を受け、インテルのハードウェアおよびソフトウェア技術を搭載しています。リモート・コラボレーションを変革し、リアルタイムのメモ共有アプリケーション、音声を検索可能なテキストに変換する自動音声認識機能、参加者に基づいて会議の議題を提案する推奨エンジンを利用して、すべての会議内容を自動的に管理します。

「リモートコラボレーションの未来は、オーディオとビデオだけではありません。ディープラーニングと高度なメディア機能を活用して、場所に関係なく問題解決をより生産的に行えるようにするソリューションが求められます。Huddl.ai は、インテル® Xeon® プロセッサー・ベースのサーバー上にクラウド・データ・プラットフォームを展開し、ビデオ会議用のインテルの Open WebRTC Toolkit と、顔とテキストを検出する oneAPI のインテル® ディストリビューションの OpenVINO™ ツールキットを統合することで、高いスケーラビリティーと革新的な AI ベースの会議体験を実現します。」— インテル コーポレーション データセンター XPU 製品 & ソリューション担当副社長 Jeff McVeigh

「Huddl.ai は、21 世紀の仮想会議プラットフォームです。Nutanix では、Huddl.ai を使用することで、全体的により良い会議体験が得られました。具体的には、会議で話し合った案件のフォローアップが増え、会議時間を効率良く利用できるようになりました。」— Nutanix 社 CIO Wendy M. Pfeiffer 氏

プレスリリースを読む (英語)
Huddl.ai の詳細 (英語)


ベントレーとインテルのコラボレーションがデジタル・クラフトマンシップの未来を導く

2020年7月8日 | インテル® oneAPI レンダリング・ツールキット (英語)、インテル® OSPRay (英語)、インテル® oneAPI

高級車ベントレーのオンライン・コンフィギュレーター (英語) に新型のベンテイガが追加されたことで、未来のデジタル・クラフトマンシップの基準が確立されました。このコンフィギュレーターは、インテル® oneAPI レンダリング・ツールキット (英語) のコンポーネントである インテル® OSPRay (英語) の高度なレイ・トレーシング機能により、リアルタイムで高精度の視覚化を使用して 170 万以上のイメージをレンダリングし、ベントレーの全モデルで無限のオプションを提供します。

インテル® アーキテクチャー、インテル® OSPRay への人工知能 (AI) の統合、ベントレーからのデータとフィードバックにより、コンテンツが 600% 増加したにもかかわらず、エラーの発見が 33% 改善 され、画像をこれまで以上に高速にレンダリングできるようになりました。ベントレーのコンフィギュレーターは、顧客の自動車購入体験を高めることを目的としています。

詳細 (英語)


テクノロジーを進化させる 2 人の女性イノベーター

2020年7月7日 | インテル® DevMesh(英語)、インテル® oneAPI

テクノロジーは、ユニークなニーズを持つ多様な個人のために設計されており、性別、人種、文化、宗教、性的指向、思想など、多様性に富んだコミュニティーによって構築されるのが最善です。多くの女性が科学や技術などの分野のイノベーションを進めていますが、Forbes が発表した 2020年の アメリカで最も革新的なリーダートップ100 (英語) リストに含まれていた女性はたった 1 人でした。この記事では、インテル® DevCloud でインテル® oneAPI を使用してイノベーションに取り組む 2 人の女性について取り上げます。1 つのプロジェクトは、スペイン政府から資金提供を受け、Springer から出版されており、もう 1 つは、まだプロジェクトを開始したばかりです。これらはほんの一例にすぎません。どちらのプロジェクトも、有望でイノベーション精神に富んでおり、魅力的で向上心が掻き立てられるものです。

詳細 (英語)


インテルが高度な oneAPI DPC++ 機能を SYCL* 2020 暫定仕様に提供

2020年6月30日 | インテル® oneAPI DPC++ コンパイラー (英語)、インテル® oneAPI

グラフィックスとコンピュートの相互運用性規格を作成する、業界をリードする企業によるオープンなコンソーシアムである Khronos Group は、新たなプログラミング抽象化についてインテルが多大な貢献をした「SYCL* 2020 暫定仕様」を発表しました。新しい機能は、HPC、マシンラーニング、および計算集約型アプリケーション向けのヘテロジニアス並列プログラミングを高速化します。

インテルのデータセンター XPU 製品 & ソリューション担当副社長の Jeff McVeigh は次のように述べています。 「SYCL* 2020 暫定仕様は、生産性が高く、使い慣れた C++ プログラミング構造により、ヘテロジニアス・コンピューティング・システムのプログラミングにおいて、短期間でパフォーマンスを達成できるように支援する重要なマイルストーンです。Khronos Group との積極的なコラボレーションにより、新しい仕様には、SYCL* 2020 に組みこまれた統合共有メモリー、グループ・アルゴリズム、サブグループなど、oneAPI のデータ並列 C++ で開発された重要な機能が含まれています。今後、SYCL* ベースのインテル® oneAPI DPC++ コンパイラー (英語) を含む インテル® oneAPI ツールキットは、オープンなクロスアーキテクチャー・プログラミングに生産性とパフォーマンスをもたらします。」

詳細は、次のリンクを参照してください。


TensorFlow* による oneAPI 業界イノベーションのサポート

2020年6月24日 | インテル® oneaAPIエコシステム・サポート (英語)

AI、マシンラーニング、データ中心のアプリケーションの成長に伴い、業界は、プロセッサー・アーキテチャーの急速なイノベーションを開発者が利用できるプログラミング・モデルを必要としています。TensorFlow* は、oneAPI 業界イニシアチブと標準ベースのオープン仕様をサポートしています。oneAPI は、TensorFlow* のモジュール設計を補完し、ハードウェア・ベンダーとソフトウェア・アーキテクチャーの選択肢を広げ、次世代アクセラレーターを迅速にサポートできるようにします。TensorFlow* は、現在インテル® Xeon® プロセッサー上で oneAPI を使用していますが、今後のインテル® アーキテクチャー上で oneAPI を使用して実行できることを楽しみにしています。

oneAPI 業界イニシアチブの詳細 (英語) とエコシステム・サポート (英語)


SeRC とインテルが oneAPI Center-of-Excellence を設立

2020年6月22日 | インテル® oneAPISeRC (英語)

Swedish e-Science Research Center (SeRC) は、インテル初の学術研究拠点 (COE) として oneAPI イニシアチブに対する支援を広げることを発表しました。ストックホルム大学と KTH 王立工科大学が主催のこのセンターでは、oneAPI の統合ヘテロジニアス・プログラミング・モデルを使用して、分子動力学シミュレーション向けに設計され、広く利用されている無料のオープンソース・アプリケーションである GROMACS を使用する研究を加速させます。

詳細 (英語)


インテル® oneAPI beta07 リリース

2020年6月20日 | インテル® oneAPIインテル® oneAPI AI アナリティクス・ツールキット (英語)、DPC++ (英語)

本リリースでの変更点は、インテル® AI アナリティクス・ツールキットの多くの新機能 (Model Zoo、DBSCAN および SVM アルゴリズムの GPU サポート、scikit-learn アルゴリズム向けの CPU の最適化)、DPC++ コンパイラーのパフォーマンス、言語定義、およびインテル® DPC++ 互換性ツールの向上、インテル® VTune™ プロファイラーおよびインテル® MPI ライブラリーの機能強化、およびインテル® システム・デバッガーの新機能などです。

詳細:

  • インテル® AI アナリティクス・ツールキットの新しい Model Zoo。インテル® アーキテクチャー向けに最適化された一般的なオープンソースのディープラーニング・トポロジー用のトレーニング済みモデルとサンプルスクリプトが含まれます。
  • インテル® AI アナリティクス・ツールキットに DBSCAN および SVM アルゴリズムの GPU サポートと、scikit-learn アルゴリズム向けの CPU の最適化が追加されました。画像処理関数を高速化する scikit-image パッケージのドロップイン置換である scikit-ipp 1.0.0、およびインテル® CPU 向けにトレーニングを高速化するように最適化された最新のヒストグラム木成長法を備えた XGBoost 1.1 リリースを含みます。
  • CPU プラットフォームにおける DPC++ コンパイラーのパフォーマンスが向上しました。
  • 新しい C++ 言語標準機能を使用して DPC++ 言語定義を簡素化および現代化しました。
  • インテル® VTune™ プロファイラーが最新のインテル® GPU (Gen9 および Gen11 統合グラフィックス、プレリリースの Gen12 統合 GPU とディスクリート GPU) をサポートし、GPU ハードウェア・パフォーマンス・メトリックでアノテーションされた GPU メモリー階層ダイアグラムが追加されました。
  • インテル® MPI ライブラリーがインテル® Xe アーキテクチャー・デバイスの GPU ピニングを初期サポートし、Mellanox ConnectX* サポートを拡張しました。
  • インテル® DPC++ 互換性ツールにおける CUDA* の数学、テクスチャー、および並列ライブラリー呼び出しの移行が向上しました。
  • インテル® System Debugger のターゲット接続アシスタントに新しい自動検出メカニズムが追加され、ターゲットシステムへのデバッグ接続を素早く確立できるようになりました。また、システム TraceCLI 設定サポートが拡張され、開発者は、インタラクティブ・モードとスクリプトモードのインターフェイスを容易に設定できるようになり、システム・デバッグ・サンプルにより、システムデバッグ機能の使用法を簡単に学ぶことができます。

インテル® oneAPI をぜひお試しください (英語)。Beta07 は、インテル® DevCloud で利用することも、インテル® oneAPI ページからダウンロードすることも、コンテナーやリポジトリー経由で入手することもできます。

関連記事