インテル® VTune™ プロファイラー・ユーザーガイド
パイプラインのメモリー操作をスリム化するため、ロード中に先行するストアがまだロード中のデータを書き込んでいる場合、ロードはメモリー待機を回避できます (「ストアフォワード」処理)。しかし、先行するストアがロードが読み取るメモリー幅よりも小さいデータを書き込んでいる場合など状況によっては、ストアフォワードが完了するまでかなりの時間ロードがブロックされます。このメトリックは、ブロックされたロードなどのパフォーマンス・ペナルティーを測定します。
ストアフォワード中にサイクルの大部分でロードがブロックされました。
[ソース/アセンブリー] ビューを使用して、ブロックされたロードを特定して、問題のあるストアフォワードを見つけます。通常ストア命令はロードの 10 命令以内にあります。ストアフォワードのデータ幅がロードよりも小さい場合、ストアとロードのデータ幅を同じにします。