最適化

インテル® VTune™ プロファイラー

インテル® VTune™ Amplifier XE 2015 Update 2 による、ドライバーなしでのハードウェア・イベント・サンプリング (コールスタック付き) のサポート

この記事は、インテル® デベロッパー・ゾーンに公開されている「VTune™ Amplifier XE 2015 Update 2 supports for driverless hardware event-based sampling w...
インテル® VTune™ プロファイラー

OS X* から Linux* へのリモートデータ収集ができない理由

この記事は、インテル® デベロッパー・ゾーンに公開されている「Why didn't remote data collector work from OS X* to Linux?」( の日本語参考訳です。 以前、Windows* ホストと ...
ビッグデータ

インテル® Xeon® プロセッサー E7 v3 ファミリー向けのソフトウェア最適化によるビジネス・インテリジェンスと見識の加速

この記事は、インテル® デベロッパー・ゾーンに公開されている「Accelerating Business Intelligence and Insights with Software Optimized for the Intel® Xe...
インテル® VTune™ プロファイラー

ループで呼び出される大きな関数を分割して命令キャッシュを最適化する

この記事は、インテル® デベロッパー・ゾーンに公開されている「Split huge function if called by loop for best utilizing Instruction Cache」 ( の日本語参考訳です。 ...
HPC

とらえどころのないアルゴリズム – 並列スキャン (追記)

この記事は、インテル® デベロッパー・ゾーンに公開されている「Elusive Algorithms - Parallel Scan」( の日本語参考訳です。 先月、IDZ の MIC フォーラムでの問い合わせ "C 言語でインテル® Cil...
インテル® MPI ライブラリー

すべてのノード上で MPI プロセスをプロファイルするには?

この記事は、インテル® デベロッパー・ゾーンに公開されている「How to profile MPI processes on all nodes?」( の日本語参考訳です。 インテル® VTune™ Amplifier XE 2015 は、...
インテル® DPC++/C++ コンパイラー

インテル® コンパイラー 15.0 最適化 クイック・リファレンス・ガイド 日本語版を公開

インテル® コンパイラー 15.0 最適化 クイック・リファレンス・ガイドの日本語版が公開されました。 このガイドは、インテル® Parallel Studio XE 2015 に含まれるインテル® コンパイラー 15.0 によるアプリケー...
インテル® DPC++/C++ コンパイラー

新しい最適化レポートを使用してインテル® コンパイラーをさらに活用する

この記事は、インテル® デベロッパー・ゾーンに公開されている「Getting the Most out of your Intel® Compiler with the New Optimization Reports」( の日本語参考訳で...
HPC

ヘテロジニアス・コンピューティングのパイプライン化

この記事は、インテル® デベロッパー・ゾーンに公開されている「Heterogeneous Computing Pipelining」( の日本語参考訳です。 目次 はじめに インテル® Core™ プロセッサー・ファミリーおよびインテル® ...
インテル® DPC++/C++ コンパイラー

#pragma SIMD を使用してループをベクトル化するための条件

この記事は、インテル® デベロッパー・ゾーンに公開されている「Requirements for Vectorizing Loops with #pragma SIMD」( の日本語参考訳です。 インテル® アーキテクチャー上でパフォーマンス...
HPC

オープンソース Python*、R、Julia ベースの HPC アプリケーションの高速化

インテル® コンパイラーとインテル® マス・カーネル・ライブラリー (インテル® MKL) によるパフォーマンスの向上 HPC コミュニティーでは、Python*、R、新しい Julia などのオープンソース言語に対する関心が高まっています...
インテル® oneTBB

インテル® VTune™ Amplifier XE によるマルチスレッド化とタスク解析

パフォーマンス向上の可能性を求める開発者は、実行のシリアルステージと並列ステージを組み合わせたパイプラインを構成できるアプリケーションのクラスを検討することがあるでしょう。その場合スレッドの管理には注意が必要です。インテル® スレッディング...
インテル® DPC++/C++ コンパイラー

インテル® MKL を Numpy/Scipy に実装

この記事は、インテル® デベロッパー・ゾーンに公開されている「Numpy/Scipy with Intel® MKL」の日本語参考訳です。 *著者注: この記事は 2014 年 8 月 27 日更新されました。 NumPy/SciPy アプ...
ゲーム

GCC 5.0 での x86 向けの最適化新機能

この記事は、インテル® デベロッパー・ゾーンに公開されている「New optimizations for X86 in upcoming GCC 5.0」( の日本語参考訳です。パート 1 ロード/ストアグループのベクトル化GCC 5.0 ...
インテル® oneMKL

小さな問題サイズにおけるインテル® MKL パフォーマンスの向上: MKL_DIRECT_CALL の使用

この記事は、インテル® デベロッパー・ゾーンに掲載されている「Improve Intel MKL Performance for Small Problems: The Use of MKL_DIRECT_CALL」( の日本語参考訳です。...