このオプションを使用して、GPU ルーフライン・データを収集する 1 つまたは複数の GPU アダプターを指定します。これにより、必要なアダプターだけを組み込むことで、データ収集のオーバーヘッドを最小限に抑えることができます。このオプションが設定されていない場合 (デフォルト設定)、使用可能なすべての GPU が解析されます。
--target-gpu=<string> |
<string> は、次の形式の 10 進数で表現される GPU アダプターのバス/デバイス/関数アドレスです。<domain>:<bus>:<device-number>.<function-number>説明:domain、<bus>、<device-number>、<function-number> は数値です。
次に例を示します。--target-gpu=0:77:0.0
複数のアダプターを指定するには、次のようにカンマで区切ったリストを使用します。--target-gpu=0:77:0.0,0:154:0.0
このオプションが指定されていない場合 (デフォルトの動作)、インテル® Advisor は利用可能なすべての GPU アダプターのデータを収集します。
collect=survey --profile-gpu
collect=tripcounts --profile-gpu
collect=roofline --profile-gpu
サーベイとトリップカウント収集の両方に利用できます。サーベイ解析とトリップカウントと FLOP 解析では、同じデバイス設定を使用します。
GPU のバス/デバイス/関数アドレスのリストは以下で確認してください。
Windows* : タスクマネージャーで確認します。
Linux* : lspci -D を実行します。
システムで利用可能な GPU アダプターのリストを表示するには、advisor --help target-gpu を実行して、オプションの説明を調査してください。
--target-gpu オプションは、GPU アドレスに 10 進数のみを受け入れます。使用可能な引数を許容される形式で一覧表示するには、オプションのヘルプを使用することをお勧めします。GPU アダプターリストを取得する別の方法 (例えば、lspci -D コマンド) を使用すると、16 進形式の数字で GPU アドレスが取得されます。この場合、--target-gpu オプションに渡す前に 10 進形式に変換する必要があります。
例えば、0:4d:0.0 アドレスの場合、10 進数に変換し 0:77:0.0 をインテル® Advisor に渡します。
target -gpu オプションと target-device オプションを混同しないでください。
GPU アダプター 0:0:2.0、0:77:0.0、0:154:0.0 のサーベイ解析を実行します。
advisor --collect=survey --profile-gpu --target-gpu=0:0:2.0,0:77:0.0,0:154:0.0 --project-dir=./advi_results -- ./myApplication同じアダプターの特性化ステージのトリップカウント & FLOP 解析を実行します。
advisor --collect=tripcounts --flop --profile-gpu --target-gpu=0:0:2.0,0:77:0.0,0:154:0.0 --project-dir=./advi_results -- ./myApplication