インテル® VTune™ プロファイラー・パフォーマンス解析クックブック: チューニング・レシピ
この記事は、インテル® デベロッパー・ゾーンに公開されている『Intel® VTune™ Profiler Performance Analysis Cookbook』の「Tuning Recipes」の日本語参考訳です。
インテル® VTune™ プロファイラーと従来のインテル® VTune™ Amplifier で検出可能な最も一般的なパフォーマンスの問題を調査し、パフォーマンスを最適化するためのステップを提供します。
- NEW! セグメント化されたキャッシュ環境におけるキャッシュ関連のレイテンシー問題
このレシピは、キャッシュ・アロケーション・テクノロジー (CAT) を使用して、コア間のキャッシュを分割する際にキャッシュ関連のレイテンシー問題 (キャッシュミス) を制御する方法を示します。 - フォルス・シェアリング
このレシピは、インテル® VTune™ Amplifier の全般解析とメモリーアクセス解析を使用してメモリー依存の linear_regression アプリケーションをプロファイルします。 - 頻繁な DRAM アクセス
このレシピは、インテル® VTune™ Amplifier のマイクロアーキテクチャー全般解析とメモリーアクセス解析を使用してメモリー依存の matrix アプリケーションをプロファイルし、頻繁な DRAM アクセスの原因を理解します。 - 低いポート使用率
このレシピは、インテル® VTune™ Amplifier のマイクロアーキテクチャー全般解析を使用してコア依存の matrix アプリケーションをプロファイルし、低いポート使用率の原因を理解します。また、インテル® Advisor を使用してコンパイラーがベクトル化を行うようにします。 - NEW! ページフォールト
このレシピは、インテル® VTune™ プロファイラーのマイクロアーキテクチャー全般、システム概要、メモリー消費解析を使用して、ページフォールトがターゲット・アプリケーションのパフォーマンスに与える影響を特定して測定する方法を説明します。 - 命令キャッシュミス
このレシピは、インテル® VTune™ Amplifier の全般解析を使用してフロントエンド依存のアプリケーションをプロファイルし、PGO オプションを指定して ICache ミスを減らします。 - 非効率な同期
このレシピは、スタック収集を有効にしてインテル® VTune™ Amplifier の高度な hotspot 解析を実行し、コードの非効率な同期を特定する方法を説明します。 - 非効率な TCP/IP 同期
このレシピは、タスク収集を有効にしてインテル® VTune™ Amplifier のロックと待機解析を実行し、コードの非効率な TCP/IP 同期を特定する方法を説明します。 - I/O 問題: 高いレイテンシーと低い PCIe* 帯域幅
このレシピは、I/O 依存のサンプル・アプリケーションに対してインテル® VTune™ Amplifier のディスク I/O 解析を実行します。そして、PCIe* デバイス向けにアフィニティーを変更して、読み取りアクセスの帯域幅が向上するように最適化します。 - OS スレッド・マイグレーション
このレシピは、インテル® VTune™ Amplifier の高度な hotspot 解析を使用して NUMA アーキテクチャーの OS スレッド・マイグレーションを特定する手順を説明します。 - OpenMP* インバランスとスケジュール・オーバーヘッド
このレシピは、バリアやスケジュール・オーバーヘッドのインバランスなど、OpenMP* プログラムでよくある並列ボトルネックを検出して修正する方法を説明します。 - 低いプロセッサー・コア利用率: OpenMP* シリアル時間
このレシピは、OpenMP* で並列化されたアプリケーションのシリアル実行部分を特定し、追加の並列化の機会を見つけ、アプリケーションのスケーラビリティーを向上します。 - インテル® TBB アプリケーションのスケジュール・オーバーヘッド
このレシピは、インテル® スレッディング・ビルディング・ブロック (インテル® TBB) アプリケーションのスケジュール・オーバーヘッドを検出して修正する方法を説明します。 - PMDK アプリケーションのオーバーヘッド
このレシピは、PMDK ベースのアプリケーションのメモリーアクセスのオーバーヘッドを検出して修正する方法を説明します。
製品とパフォーマンス情報
1実際の性能は利用法、構成、その他の要因によって異なります。詳細は、www.Intel.com/PerformanceIndex (英語) を参照してください。