インテル® C++ コンパイラーのベクトル化ガイド
同カテゴリーの次の記事
インテル® コンパイラーによる OpenMP* 入門 (全8回)
このガイドは、インテル® C++ コンパイラーのベクトル化機能に関するガイドラインを提供します。インテル® ストリーミング SIMD 拡張命令 (インテル® SSE) などの SIMD 命令に対応したインテル® プロセッサー、または互換性のあるインテル以外のプロセッサー・ベースのシステムを使用する C/C++ 開発者を対象としています。インテル® 64 およびほとんどの IA-32 システムが対象となりますが、インテル® Itanium® プロセッサー・ベースのシステムは対象外です。
ここで紹介する例ではインテル® SSE を使用しますが、多くの原則はほかの SIMD 命令セットにも適用されます。また、例では C++ プログラムを使用しますが、その概念のほとんどは、Fortran プログラムにもあてはまります。
関連記事
コードの現代化を成功に導く 3 つのアドバイス この記事は、インテル® デベロッパー・ゾーンに公開されている「Three Pieces of Advice for Code Modernization […]
GCC 5.0 での x86 向けの最適化新機能 この記事は、インテル® デベロッパー・ゾーンに公開されている「New optimizations for X86 in upcoming GCC 5.0」(https://software.intel.com/en-us/blogs/2014/11/24/what-is-new-for-x86-in-upcoming-gcc-50) […]
等方性 3 次元有限差分 (3DFD) 波動方程式コード向けの NUMA を理解する この記事は、インテル® デベロッパー・ゾーンに公開されている「Understanding NUMA for 3D isotropic Finite Difference (3DFD) wave equation […]
将来に対応したコードの最適化によるソフトウェアの現代化 この記事は、インテル® デベロッパー・ゾーンに公開されている「Modernizing Software with Future-Proof Code […]
インテル® TBB を使用したインテル® IPP のイメージリサイズのスレッド化 この記事は、インテル® デベロッパー・ゾーンに公開されている「Threading Intel® Integrated Performance Primitives Image Resize with Intel® Threading Building […]
-
-
C++ 開発者が陥りやすい OpenMP* の 32 の罠 2011年12月22日
-
マルチコア向け並列プログラミングの 8 つのルール 2020年4月28日
-
セグメンテーション・フォルト SIGSEGV や SIGBUS エラーの原因を特定する 2012年2月24日
-
StdAfx.h に関する考察 2015年7月29日
-
プログラミング、リファクタリング、そしてすべてにおける究極の疑問 2018年5月15日
-
インテル® SSE およびインテル® AVX 世代 (SSE2、SSE3、SSSE3、ATOM_SSSE3、SSE4.1、SSE4.2、ATOM_SSE4.2、AVX、AVX2、AVX-512) 向けのインテル® コンパイラー・オプションとプロセッサー固有の最適化 2017年12月26日
-
インテル® ソフトウェア開発製品 技術ウェビナーシリーズ 2018年8月28日
-
コンパイラー最適化入門: 第1回 SIMD 命令とプロセッサーの関係 2011年5月5日
-
ゲーム AI の設計 (その 1) – 設計と実装 2011年7月22日
-
x64 アセンブリーの概要 2012年3月23日
-