この記事は、インテル® デベロッパー・ゾーンに掲載されている「Diagnostic 15517: loops in this subroutine cannot be vectorized due to use of EBX/RBX register in inline ASM」(https://software.intel.com/en-us/articles/cdiag15517) の日本語参考訳です。
このベクトル診断メッセージは、インテル® C++ コンパイラー 15.0 以降で生成されます。
原因:
この診断メッセージは、関数が EBX/RBX レジスターを変更すると出力されます。ベクトル化にはアライメントされたスタックフレームが必要です。XMM は 16 バイト、YMM は 32 バイト、ZMM は 64 バイトにアライメントする必要があります。インライン・アセンブリーで EBX/RBX レジスターが使用されると、スタックフレームをアライメントできなくなり、ベクトル化されません。
例:
void foo(int *A, int *B, int n){
int i;
__asm {
push rbx
mov ebx, eax
}
for (i=0;i<n;i++){
B[i] += A[i];
}
__asm {
pop rbx
}
}
$ icl 15517.c /c /O2 /Qopt-report:2 /Qopt-report-phase:vec /QxAVX
(Linux* では -fasm-blocks を指定)
以下の診断メッセージは、インテル® C++ コンパイラー for Windows* 19.1.0.166 (ビルド 20191121) で生成しました。
最適化レポート開始: foo(int *, int *, int)
レポート: ベクトルの最適化 [vec]
リマーク #15517: インライン・アセンブリーで EBX/RBX レジスターが使用されているため、このサブルーチンのループはベクトル化できません。[ D:\15517.c(1,32) ]
ループの開始 D:\15517.c(7,3)
<マルチバージョン v1>
ループの終了
ループの開始 D:\15517.c(7,3)
<剰余, マルチバージョン v1>
ループの終了
ループの開始 D:\15517.c(7,3)
<マルチバージョン v2>
ループの終了
ループの開始 D:\15517.c(7,3)
<剰余, マルチバージョン v2>
ループの終了
コンパイラーの最適化に関する詳細は、最適化に関する注意事項を参照してください。

