キャッシュを考慮したルーフライン解析を使用してベクトル化とメモリーの最適化を詳しく調査する
同カテゴリーの次の記事
インテル® Advisor を利用したガイド付きコードのベクトル化

このセッションは、インテル® デベロッパー・ゾーンに公開されている「Fast Insights to Optimized Vectorization and Memory Using Cache-aware Roofline Analysis」の日本語版です。
完璧なベクトル化およびスレッド化がおこなれている場合でも、開発者は、CPU、ベクトル、スレッドの利用率と、メモリー・サブシステムのデーター・ボトルネックのバランスを調整する必要があります。
この Webinar で紹介されている「ルーフライン・モデル」を使うことで、アプリケーションのパフォーマンスの問題にどのように適切に対象するかを直観的に理解できます。
本コースでは、まず、ルーフライン・モデルとは何かを説明し、その後、インテル® Advisor によるルーフライン解析、ケーススタディー、そして、現在の最新バージョンおよび次期バージョンの新機能をご紹介します。
オンライン・トレーニング
※システム要件の詳細については、こちらのページをご覧ください。
関連情報
インテル® Advisor に関する情報は、インテル® Advisor 紹介ページ をご覧ください。
関連記事
コードを GPU にオフロードする このセッションは、Tech.Decoded で公開されている「Offload Your Code from CPU to GPU … and Optimize […]
インテル® AVX-512 ハードウェアを使用することなくインテル® AVX-512 を最適化する (全 2 回) 【コース後半も公開開始!】このセッションは、インテル® デベロッパー・ゾーンに公開されている「Optimize for AVX-512 with or without AVX-512 hardware」の日本語版です。 インテル® Xeon Phi™ プロセッサー (Knights Landing) […]
OpenMP* とインテル® TBB タスクグラフ: インテル® Advisor のフローグラフ・アナライザーで問題を解明する このセッションは、Tech.Decoded で公開されている「OpenMP and TBB Task Graphs: Unraveling the Spaghetti with Flow Graph […]
ハイブリッド・クラウド: オンプレミスとクラウドでの HPC パフォーマンスのベスト・プラクティス このセッションは、Tech.Decoded で公開されている「Hybrid Cloud: Best Practices for HPC Performance On Premise and On […]
インテル® VTune™ Amplifier + OpenMP* によりスレッドのパフォーマンスとスケーラビリティーを向上する (全 2回) このセッションは、インテル® デベロッパー・ゾーンに公開されている「Better Threaded Performance and Scalability with Intel® VTune™ Amplifier + OpenMP*」の日本語版です。 このセッションでは、インテル® VTune™ Amplifier と […]
-
-
C++ 開発者が陥りやすい OpenMP* の 32 の罠 2011年12月22日
-
マルチコア向け並列プログラミングの 8 つのルール 2020年4月28日
-
セグメンテーション・フォルト SIGSEGV や SIGBUS エラーの原因を特定する 2012年2月24日
-
StdAfx.h に関する考察 2015年7月29日
-
プログラミング、リファクタリング、そしてすべてにおける究極の疑問 2018年5月15日
-
インテル® SSE およびインテル® AVX 世代 (SSE2、SSE3、SSSE3、ATOM_SSSE3、SSE4.1、SSE4.2、ATOM_SSE4.2、AVX、AVX2、AVX-512) 向けのインテル® コンパイラー・オプションとプロセッサー固有の最適化 2017年12月26日
-
インテル® ソフトウェア開発製品 技術ウェビナーシリーズ 2018年8月28日
-
コンパイラー最適化入門: 第1回 SIMD 命令とプロセッサーの関係 2011年5月5日
-
ゲーム AI の設計 (その 1) – 設計と実装 2011年7月22日
-
x64 アセンブリーの概要 2012年3月23日
-