最適化

HPC

NUMA ハードウェアによるパフォーマンスの向上

この記事は、インテル® デベロッパー・ゾーンに公開されている「Performance Improvement Opportunities with NUMA Hardware」( の日本語参考訳です。この記事の PDF 版はこちらからご利用...
インテル® Advisor

キャッシュを考慮したルーフライン解析を使用してベクトル化とメモリーの最適化を詳しく調査する

このセッションは、インテル® デベロッパー・ゾーンに公開されている「Fast Insights to Optimized Vectorization and Memory Using Cache-aware Roofline Analysi...
インテル® Advisor

インテル® AVX-512 ハードウェアを使用することなくインテル® AVX-512 を最適化する (全 2 回)

【コース後半も公開開始!】このセッションは、インテル® デベロッパー・ゾーンに公開されている「Optimize for AVX-512 with or without AVX-512 hardware」( の日本語版です。インテル® Xeo...
その他

インテル Parallel Universe 27 号日本語版の公開

インテル Parallel Universe マガジンの最新号が公開されました。この号では、20 周年を迎える OpenMP* について取り上げます。また、新しいインテル® AVX-512 命令セットにより以前は不可能だったベクトル化を行う...
インテル® oneMKL

インテル® MKL の DNN プリミティブ

この記事は、インテル® デベロッパー・ゾーンに公開されている「Introducing DNN primitives in Intel® Math Kernel Library」( の日本語参考訳です。この記事の PDF 版はこちらからご利用...
インテル® oneMKL

インテル® Distribution for Python* におけるより高速な乱数生成

この記事は、インテル® デベロッパー・ゾーンに公開されている「Faster random number generation in Intel® Distribution for Python*」( の日本語参考訳です。インテル® Dist...
インテル® oneMKL

インテルが推進するディープラーニング・フレームワーク

この記事は、インテルの The Parallel Universe Magazine 27 号に収録されている、インテルが推進するディープラーニング・フレームワークに関する章を抜粋翻訳したものです。人工知能 (AI) は、本来は人の知能が必...
インテル® Advisor

インテル® Advisor のルーフライン解析

この記事は、インテルの The Parallel Universe Magazine 27 号に収録されている、インテル® Advisor の新しいルーフライン解析機能を利用して、パフォーマンス最適化のトレードオフを視覚化する方法に関する章...
HPC

インテル® AVX-512 で向上したベクトル化のパフォーマンス

この記事は、インテルの The Parallel Universe Magazine 27 号に収録されている、インテル® コンパイラーでインテル® AVX-512 命令セットを利用してループをベクトル化し、スピードアップするさまざまな例に...
HPC

並列アプリケーションのスケーラビリティーの問題を特定する

この記事は、インテルの The Parallel Universe Magazine 27 号に収録されている、NUMA 向けの最適化を行う開発者必見の章を抜粋翻訳したものです。システムの計算コア数が増え続ける中、効率良く並列化されたソフト...
HPC

行列-行列乗算のパックのオーバーヘッドを減らす

この記事は、インテルの The Parallel Universe Magazine 27 号に収録されている、マシンラーニング向けの小規模行列に対応する新機能に関する章を抜粋翻訳したものです。汎用行列-行列乗算 (GEMM) は、多くの科...
ビッグデータ

マシンラーニングに注目すべき理由

この記事は、インテル® デベロッパー・ゾーンに公開されている「Why Should You Care About Machine Learning?」( の日本語参考訳です。この記事の PDF 版はこちらからご利用になれます。マシンラーニン...
インテル® Parallel Studio XE

Python* プログラムの並列パフォーマンスを引き出そう

この記事は、インテル® デベロッパー・ゾーンに公開されている「Unleash Parallel Performance of Python* Programs」( の日本語参考訳です。インテル® Distribution for Pytho...
インテル® GPA

インテルの x86 プラットフォーム向け Unity* 最適化ガイド: パート 4

この記事は、インテル® デベロッパー・ゾーンに公開されている「Unity* Optimization Guide for Intel x86 Platforms: Part 4」( の日本語参考訳です。この記事の PDF 版はこちらからご利...
インテル® VTune™ プロファイラー

インテル® VTune™ Amplifier XE の General Exploration (一般解析) がどのように動作するかを理解する

この記事は、インテル® デベロッパー・ゾーンに公開されている「Understanding How General Exploration Works in Intel® VTune™ Amplifier XE」の日本語参考訳です。インテル®...