インテル® VTune™ Amplifier XE によるマルチスレッド化とタスク解析
同カテゴリーの次の記事
MIC アプリケーションの SIMD ベクトル化ループでベクトル強度 0.0 がなる問題
パフォーマンス向上の可能性を求める開発者は、実行のシリアルステージと並列ステージを組み合わせたパイプラインを構成できるアプリケーションのクラスを検討することがあるでしょう。その場合スレッドの管理には注意が必要です。インテル® スレッディング・ビルディング・ブロック (インテル® TBB) を使用すると、適切なスレッド管理によって並列性が向上し、パイプラインの構築など並列アルゴリズムの設計とサポートにかかる時間や労力を軽減できます。インテル® TBB により、プログラマーは実行ステージをスレッドにマップしてスレッド間のワークバランスを取るという困難な作業をしなくて済みます。問題を実行タスクのセットとして表現するだけで、インテル® TBB は、システムで利用可能なハードウェア・スレッドへタスクを動的に割り当てます。タスク管理はアプリケーションの複雑さに応じて重要になります。インテル® VTune™ Amplifier XE のタスク解析では、問題調査向けの便利なビジュアル・インストルメントが提供されるため、プログラマーは時間をかけることなく、ユーザータスクを調整することができます。ここでは、実際の問題を単純化した例を用いて、パフォーマンス向上を実現する並列化、パイプラインの構築、タスク解析について説明します。
関連記事
スレッドローカル変数へのアクセスに隠されたパフォーマンス・コスト この記事は、インテル® ソフトウェア・ネットワークに掲載されている「The hidden performance cost of accessing thread-local variables」の日本語参考訳です。 コードを並列化した後に期待していたパフォーマンスが得られなかったことはありませんか? […]
イベント・ベース・サンプリング (EBS) を使用した FLOPS の推定 この記事は、インテル® ソフトウェア・ネットワークに掲載されている「Estimating FLOPS using Event Based Sampling (EBS)」の日本語参考訳です。 FLOPS (flops や flop/s ともいう) は floating point operations per second […]
[Bottom-up (ボトムアップ)] ペインと [Call Stack (コールスタック)] ペインの不一致 この記事は、インテル® ソフトウェア・ネットワークに掲載されている「Mismatched Call Stacks between Bottom-up tree and Call Stack pane」の日本語参考訳です。 hotspot、コンカレンシー、ロックと待機などのスタックのサンプル収集を行う解析では、[Bottom-up […]
インテル® Fortran Studio XE によるマンデルブロー描画プログラムの高速化 1. はじめに インテル® Fortran Studio XE 2011 (Windows* 版および Linux* 版) は、ソフトウェア開発用言語として Fortran を採用している開発者を対象とするソフトウェア開発スイートです。インテル® (Visual) Fortran Composer XE 2011 […]
OpenSimulator 仮想世界サーバーのケーススタディー (パート 3) この記事は、インテル® ソフトウェア・ネットワークに掲載されている「Virtual World Server Power Savings by Dynamic Physics […]
-
-
C++ 開発者が陥りやすい OpenMP* の 32 の罠 2011年12月22日
-
マルチコア向け並列プログラミングの 8 つのルール 2020年4月28日
-
セグメンテーション・フォルト SIGSEGV や SIGBUS エラーの原因を特定する 2012年2月24日
-
StdAfx.h に関する考察 2015年7月29日
-
プログラミング、リファクタリング、そしてすべてにおける究極の疑問 2018年5月15日
-
インテル® SSE およびインテル® AVX 世代 (SSE2、SSE3、SSSE3、ATOM_SSSE3、SSE4.1、SSE4.2、ATOM_SSE4.2、AVX、AVX2、AVX-512) 向けのインテル® コンパイラー・オプションとプロセッサー固有の最適化 2017年12月26日
-
インテル® ソフトウェア開発製品 技術ウェビナーシリーズ 2018年8月28日
-
コンパイラー最適化入門: 第1回 SIMD 命令とプロセッサーの関係 2011年5月5日
-
ゲーム AI の設計 (その 1) – 設計と実装 2011年7月22日
-
x64 アセンブリーの概要 2012年3月23日
-