新しいインテル® Core™ i9 X シリーズ・プロセッサー・ベースのシステムの強力な計算処理能力で究極のメガタスクを実現

この記事は、インテル® デベロッパー・ゾーンに公開されている「Raw Compute Power of New Intel® Core™ i9 Processor-based Systems Enables Extreme Megatasking」の日本語参考訳です。


この記事の PDF 版はこちらからご利用になれます。

初期のコンピューターは、ハードドライブの読み書き、メモリーのスワップ、計算の高速処理の合間に単一のタスクを実行するだけで処理能力の限界に達することがよくありました。Microsoft* Windows* 3.1、そして Windows* 95 で、システムが同時に複数のプログラムを処理できるようになると、マルチタスクが普及し始めました。今日では、2 桁のコア数を搭載した CPU の登場により、「メガタスク」の概念が注目されています。そして、「メガタスク」向けの待望の最新 CPU が、4 ~ 18 コア搭載のインテル® Core™ i9 X シリーズ・プロセッサー・ファミリーです。インテル® Core™ i9 X シリーズ・プロセッサーは、これまで複数のシステムを必要としていたタスクを同時に処理し、究極のメガタスクを実現します。

インテル® Core™ i9 X シリーズ・プロセッサー

仮想現実 (VR) ゲームのプレイ、録画、ストリーミングを同時に行う課題について考えてみてください。ゲーム制作会社は、新しい VR タイトルの販促にビデオトレーラーを利用しますが、単純にプレーヤーの視点で録画した場合ゲームの一部しか分からないため、2D ビデオで 3D ゲーム体験を紹介することは常に課題となっていました。この課題を解決する 1 つの方法が複合現実 (MR) です。MR は、クロマキーを使用してプレーヤーをキャプチャーし、プレーヤーがゲームに熱中している様子を第三者の視点で捉えたものと合成します(この手法の詳細は、こちらの記事 (英語) を参照してください)。通常、1 台の PC でゲームのプレイとキャプチャーを行い、別の PC でゲーマーのカメラフィードを取得します。そして、そのセッション全体を世界中にライブ・ストリーミングするには、出力を高画質のアップロード可能な形式にエンコードする 3 台目の PC が必要です。しかし、インテルは最近、CPU 負荷の高いこれらの作業をすべて 1 台のインテル® Core™ i9 X シリーズ・プロセッサー・ベースのシステムで、それぞれのコアがうまく連携して行えることを示しました。

ムーアの法則とシステム仕様

1965 年、インテルの共同設立者である Gordon Moore提唱 (英語) した「ムーアの法則」は、集積回路上のトランジスター数が約 2 年ごとに倍増することを予測しました (図 1)。トランジスター数と周波数が増加を続ける一方、今日では計算処理能力は利用可能なコア数で示される (英語) ことが多くなりました。各コアは CPU の役割を果たし、異なるタスクを処理できるため、効率良いマルチタスクが可能です。単純なマルチタスクは、目的に応じて同時に実行可能な計算負荷の高いマルチスレッド・ワークロードにすることで、究極のメガタスクになります。

ムーアの法則によるテクノロジーの変化
図 1. ムーアの法則はテクノロジーの変化の加速率を示している (出典: time.com (英語))

FLOPS (1 秒あたりの浮動小数点演算数) は、元々スーパーコンピューターのパフォーマンスを評価するためのものでしたが、今日ではゲーム用デスクトップ PC にも適用されています。整数演算よりも扱いが難しい、浮動小数点数演算を評価します。次の式を使用します。

FLOPS = (ソケット数) x (ソケットごとのコア数) x (1 秒あたりのサイクル数) x (1 サイクルあたりの FLOPS)

3.46GHz で動作し、1 サイクルあたり 8 (単精度) または 16 (倍精度) FLOPS を使用する、6 コア搭載のシングルソケットの CPU では、結果は、166GFLOPS (単精度) または 83GFLOPS (倍精度) になります。かつての (1976 年) Cray-1* スーパーコンピューターはわずか 160MFLOPS にすぎませんでした。最新のインテル® Core™ i9-7980XE エクストリーム・エディション・プロセッサーは、約 4.30GHz (オーバークロックの場合はさらに高速) で動作し、1.3TFLOPS になります。参考までに、世界最速のスーパーコンピューターは、106.5 万コア (英語) を搭載しており、124.5PFLOPS です。1961 年に 1GFLOPS を達成するためのハードウェア費用は約 190 億ドル (今日の 1450 億ドル相当) でした。2017 年には、この費用が 3000 万ドルにまで下がりました。

強力な計算処理能力を達成するため、インテル® Core™ i9-7980XE エクストリーム・エディション・プロセッサーは、いくつかの新しいテクノロジーを採用しています。最大 68 レーンの PCIe* 3.0 に対応しており、、ゲーマーは高速なインテル® Solid State Drive (インテル® SSD)、最大 4 つのディスクリート・グラフィックス・カード、超高速 Thunderbolt™ 3 テクノロジー・ソリューションを利用してシステムを拡張できます。改善されたインテル® ターボ・ブースト・マックス・テクノロジー 3.0 は、コアのパフォーマンスを向上します。インテル® スマート・キャッシュには、要求に基づいてメモリーを動的にフラッシュする新しい省電力機能が備わっています。インテル® Core™ i9 X シリーズ・プロセッサー・ファミリーはアンロックにも対応しており、オーバークロックによりさらなるパフォーマンスを引き出すことができます。新機能として、各コアの個別オーバークロック、インテル® アドバンスト・ベクトル・エクステンション 512 (インテル® AVX-512) の比率制御による安定性の向上、究極のシナリオを可能にする VccU 電圧制御などがあります。インテル® エクストリーム・チューニング・ユーティリティー (インテル® XTU) やインテル® エクストリーム・メモリー・プロファイル (インテル® XMP) などのツールと組み合わせることで、パフォーマンスを最大化できます。

インテルの報告では、前世代のインテル® プロセッサーと比較して、VR コンテンツ作成では最大 20% のパフォーマンス向上、4K ビデオの編集では最大 30% のスピードアップが期待できるとしています (図 2)。つまり、待ち時間が減り、新しい世界と体験の設計により多くの時間をかけることができます。ゲーマーやファンは、前世代と比較して最大 30 %高速に究極のメガタスクを実行できます。

インテル コーポレーションの上級副社長兼クライアント・コンピューティング・グループ本部長の Gregory Bryant は、2017 Computex Taipei において次のように述べています。

「この新しいプロセッサーはエコシステム全体の創造的な可能性を解き放ちます。コンテンツ・クリエーターは、高速イメージ・レンダリング、ビデオ・エンコーディング、オーディオ制作、リアルタイム・プレビューをすべてシームレスに並列実行できるため、待機時間が軽減され、創作により多くの時間をかけることができます。ゲーマーは、好きなゲームをプレイしながら、ゲームプレイをストリーム、録画、エンコードして、ソーシャルメディアで共有できます。そして、これらはすべて、最大 4 つのディスクリート・グラフィックス・カードと複数の画面を利用して 12K で行うことができます。」

インテル® Core™ i9 X シリーズ・プロセッサー・ファミリーの仕様の一部
図 2. インテル® Core™ i9 X シリーズ・プロセッサー・ファミリーの仕様の一部

システム・パフォーマンスを評価する別の方法として、Microsoft* Windows* PC の [タスク マネージャー] > [リソース モニター] で確認できる、CPU 使用率があります。インテル・デベロッパー・リレーションズのコンテンツ・スペシャリストであり、ゲームおよび VR コミュニティーと共同で取り組みを行っている Josh Bancroft は、2017 年前半に台北で開催された Computex (英語) において、インテル® Core™ i9 X シリーズ・プロセッサーの発表に立ち会い、CPU 使用率を示す際に「究極のメガタスク」という用語を提案しました。Bancroft は、新しいインテル® Core™ i9 X シリーズ・プロセッサー・ベースの PC を使用して、クロマキー合成の VR 複合現実のデモを行いました。VR タイトルを 90fps でプレイしながら、ゲームプレイを録画し、別のカメラからプレーヤーをシーンに合成して、これらのイメージを結合および同期したものを Twitch* へライブ・ストリーミングしました。

後日ロサンゼルスで開催された E3 (英語) でも、Bancroft はインテル® Core™ i9 X シリーズ・プロセッサーの発表に立ち会い、18 コア搭載のマシンで同じデモを紹介しました。Bancroft はこのイベントを次のように振り返っています。

「18 コア搭載のインテル® Core™ i9 X シリーズ・プロセッサー・ベースのシステムでの世界初の公開デモは、非常にエキサイティングでした。大きな筐体で、2 つのウォーターチューブが青色の不透明な液体で満たされており、とても格好良かったです。」

Gregory Bryant によるデモは順調に進み、会場は熱気に包まれていました。

「極端に負荷の高い 4 ~ 5 つのタスクを同時に実行しようとすると、システムは過負荷となり処理できません。しかし、18 コア搭載のインテル® Core™ i9 X シリーズ・プロセッサー・ベースのシステムでは問題なく実行され、CPU 使用率のグラフでその状況を確認できます。録画を開始したり、ストリーミングを開始したり、その他の処理を開始すると、36 個のグラフは 90% 強の使用率を示し、すべてのスレッドが一生懸命に働いているのが見て取れました。」

このデモ (英語) は、VR、PC ゲーム、マルチコア処理能力に対するインテルの取り組みをうまく 1 つにまとめています。スムーズな動作に膨大なリソースを必要とする VR は、一般に新しいシステムのデモに最適です。Bancroft の MR 手法は、実際にヘッドセットを装着しなくても VR 体験を見せることができるトレーラーの作成が可能なことを、開発者、ストリーマー、コンテンツ・クリエーターに示しました。最も重要なことは、1 台の新しいシステムでこれまで必要だった複数のデバイスを置き換えられることです。

トレーラーは、インディーゲーム開発者にとって最も重要な販促ツールの 1 つです。迫力があり魅力的なトレーラーは、VR ゲームにとって極めて重要です。しかし、VR の 3D 体験を 2D トレーラーで表現することは困難です。そこで、MR 手法を使用します。複合現実 VR は、カナダのバンクーバーを拠点とする、Northway 夫妻が経営する Northway Games* (英語) が同社の Unity* ベースの Fantastic Contraption* ゲーム (図 3) にイネーブリング・コードを追加したことで誕生しました。ゲームをプレイするゲーマーの視点に加えて、それを傍観する第三者の視点を録画することで、体験をうまく伝えることができ、VR タイトルの販促に大いに役立ちます。さらに、Northway Games* は、ソファーに座った観客がプレイする様子を見て笑っているショットを含めることで、同社のゲームがいかに面白いかを見せています。

Fantastic Contraption*
図 3. この Fantastic Contraption* のような複合現実トレーラーの作成とストリーミングに 1 台の PC で対応可能

考案したのではなく、拡張しただけ

Bancroft は、複合現実を使用したシングルマシンのデモの作成過程も共有しました。デモは、足場、照明、グリーンスクリーン、複数のカメラが完備された狭いスタジオで作成され、作業の開始にあたって、関連タスクの段階的なガイド (英語) を提供してくれた Northway 夫妻のブログが大いに役立ったことを紹介しました。ガイドをベースに Bancroft とチームは、いくつかの追加の機能を実装しました。それらはすべて、オープンに開発および共有されました。

多くのソフトウェア・プログラムは莫大な処理能力を必要とします。Oculus* Rift* (英語) や HTC* VIVE* (英語) 向けの VR タイトルを 90fps でプレイするだけでも相当なタスクです。低いフレームレートでは、プレーヤーがめまいや吐き気、その他の身体的な反応を経験する可能性があるため、負荷の高い処理を行う前に、ゲームを適切にプレイするのに十分な処理能力がマシンに備わっていなければなりません。

複合と合成には、複合現実ビデオの作成プロセスを容易にする、VR ブロードキャストおよびプレゼンテーション・ツールである MixCast* (英語) が便利です。Blueprint Studios* (英語) は、カナダのバンクーバーを拠点とする、インタラクティブ空間テクノロジー分野のリーダーであり、そのツールである MixCast* VR SDK は Unity* プロジェクトにドラッグアンドドロップするだけで使用できるため、エンドユーザーはリアルタイムで体験を見せることができます。

さらに、合成、録画、ライブ・ストリーミングには、ほとんどのストリーマーが知っている Open Broadcaster Software (OBS) も使用しました。OBS は、ハイパフォーマンスなリアルタイムのオーディオ/ビデオ・キャプチャーとミキシングに加えて、イメージマスキング、色補正、クロマキー用のビデオフィルター、さらに Twitch* (英語)、Facebook*、YouTube* (英語) などのストリーミング・プラットフォームのサポートを提供します。

もちろん、同様の結果を生成するツールは多数ありますが、これが Bancroft とチームが使用したソフトウェア・スタックです。Bancroft の取り組みの詳細は、https://software.intel.com/en-us/articles/megatasking-making-mixed-reality-magic-work-for-your-virtual-reality-game (英語) を参照してください。

インテル® ソフトウェア TV ビデオ・プロデューサーの Jerry Makare は、Josh Bancroft と共同で究極のメガタスクの限界をテストするビデオを作成しています。VR に1 台の強力なシステムを使用する重要な利点について、Makare は次のように述べています。

「タスクを複数に分割できることは、特にレンダリングでは大きな利点となります。レンダリングを開始すると、一般にマシンが無応答になり、ほかの作業を行えません。レンダリングや合成のような大きく計算負荷の高いタスクを複数に分割できることは、大幅な時間の節約になります。」

Makare は特に、大きなスケーリングの可能性を備えたインテル® Core™ i9 プロセッサー・ベースのシステムでタスクを実行して、3D モデリング・プログラムを使用して実行時間の向上を評価するためベースラインを取得することに関心を示しています。また、チームメンバーの知識向上のため、新しいシステムで実際のアプリケーションを実行してみたいと考えています。

今後の動向

非常に強力な処理能力が利用できるため、これらの新しいシステムではさまざまな利用法が考えられます。ゲーマーは、より鮮明で没入感のある現実的な体験を期待できます。生の 4K 画像からビデオを作成および編集することは、複雑で処理負荷の高い作業でしたが、今日では、プロであっても、初心者であっても、生の 4K 画像を編集して、素晴らしい視覚効果を作成したり、より深みとニュアンスに富んだ音楽を作曲できます。VR の適用範囲は、ゲームだけでなく、仮想ウォークスルー、建設計画、都市モデリング、多数のシミュレーション・シナリオに拡大しています。生物学、地質学、化学、医学、天文学などの分野の科学者は、究極のメガタスクの背後にある強力な処理能力によって、さらに多くの神秘を解明できるかもしれません。

関連情報

コンパイラーの最適化に関する詳細は、最適化に関する注意事項を参照してください。

関連記事