target-gpu

このオプションを使用して、GPU ルーフライン・データを収集する 1 つまたは複数の GPU アダプターを指定します。これにより、必要なアダプターだけを組み込むことで、データ収集のオーバーヘッドを最小限に抑えることができます。このオプションが設定されていない場合 (デフォルト設定)、使用可能なすべての GPU が解析されます。

構文

--target-gpu=<string>

引数

<string> は、次の形式の 10 進数で表現される GPU アダプターのバス/デバイス/関数アドレスです。<domain>:<bus>:<device-number>.<function-number>説明:domain<bus><device-number><function-number> は数値です。

次に例を示します。--target-gpu=0:77:0.0

複数のアダプターを指定するには、次のようにカンマで区切ったリストを使用します。--target-gpu=0:77:0.0,0:154:0.0

デフォルト

このオプションが指定されていない場合 (デフォルトの動作)、インテル® Advisor は利用可能なすべての GPU アダプターのデータを収集します。

影響するアクション

collect=survey --profile-gpu

collect=tripcounts --profile-gpu

collect=roofline --profile-gpu

使用法

サーベイとトリップカウント収集の両方に利用できます。サーベイ解析とトリップカウントと FLOP 解析では、同じデバイス設定を使用します。

GPU のバス/デバイス/関数アドレスのリストは以下で確認してください。

システムで利用可能な GPU アダプターのリストを表示するには、advisor --help target-gpu を実行して、オプションの説明を調査してください。

重要

--target-gpu オプションは、GPU アドレスに 10 進数のみを受け入れます。使用可能な引数を許容される形式で一覧表示するには、オプションのヘルプを使用することをお勧めします。GPU アダプターリストを取得する別の方法 (例えば、lspci -D コマンド) を使用すると、16 進形式の数字で GPU アドレスが取得されます。この場合、--target-gpu オプションに渡す前に 10 進形式に変換する必要があります。

例えば、0:4d:0.0 アドレスの場合、10 進数に変換し 0:77:0.0 をインテル® Advisor に渡します。

target -gpu オプションと target-device オプションを混同しないでください。

  1. GPU アダプター 0:0:2.0、0:77:0.0、0:154:0.0 のサーベイ解析を実行します。

    advisor --collect=survey --profile-gpu --target-gpu=0:0:2.0,0:77:0.0,0:154:0.0 --project-dir=./advi_results -- ./myApplication
  2. 同じアダプターの特性化ステージのトリップカウント & FLOP 解析を実行します。

advisor --collect=tripcounts --flop --profile-gpu --target-gpu=0:0:2.0,0:77:0.0,0:154:0.0 --project-dir=./advi_results -- ./myApplication

関連情報