インテル® VTune™ プロファイラー・ユーザーガイド

QNX* ターゲット

インテル® VTune™ プロファイラーは、QNX* ターゲットシステム上でパフォーマンス・データの収集をサポートします。

Windows* や Linux* を実行するホストシステムから、ターゲット QNX* システムへのコマンドライン・インターフェイスを介したデータ収集が可能です。収集されたトレースは、イーサーネット経由でホストシステムに転送され、以降の確認のため保存されます。収集が完了すると、パフォーマンス結果をインポートしてインテル® VTune™ プロファイラーのユーザー・インターフェイスで表示することができます。

ターゲットコレクターは、イメージビルド中にターゲット QNX* イメージに統合でき、ターゲットのファイルシステムの 1MB しか必要としません。トレースはホストシステムに転送されるため、限られたストレージ容量を持つターゲットシステムや、読み取り専用のファイルシステムを使用するターゲットでも収集できます。

  1. 要件

  2. システムの設定

  3. 解析を実行

  4. 結果の表示と解釈

要件

システムの設定

ホストとターゲットシステムで次の手順に従って、コレクターをインストールし、インテル® VTune™ プロファイラーを使用してパフォーマンス解析を有効にします。

  1. ホストシステムがイーサーネット経由でターゲットの QNX* システムに接続されていることを確認し、コマンドウィンドウからターゲット QNX* システムにログインします。

  2. ホスト上の <install-dir>/target/qnx_x86_64/bin64/sep ファイルをターゲット QNX* システムにコピーし、共有ネットワークをマウントするか、ターゲットイメージに統合します。

  3. ホストシステムで、インテル® VTune™ プロファイラーの ユーザー・インターフェイスを起動して、[新しいプロジェクト] をクリックしてプロジェクト名を指定し、[プロジェクトを作成] をクリックします。

  4. [解析の設定] をクリックし、[どこを] ペインで [ローカルホスト] を選択して、[バイナリーを検索] をクリックします。

  5. [バイナリー/シンボル検索] ウィンドウで、ホストシステム上のカーネルおよびアプリケーションのターゲットモジュールの場所を参照して、[OK] をクリックします。

解析の実行

解析は、ターゲット QNX* システムに以前インストールされたコレクターと、ホストの Windows* または Linux* システムで起動されたコマンドから実行されます。すべての結果はホストシステム保存されます。

  1. ターゲットの QNX* システムで次のコマンドを実行します。<sep-dir>/sep

    <sep-dir>sep ファイルがコピーされた場所です。ターゲットのコレクターがロードされ、ホストシステムが接続されるのを待ちます。

  2. ホストシステムでは、次の解析コマンドを実行します。

    • コールスタック付きのホットスポット: <install-dir>/bin64/sep -start -d <duration> -target-ip <target-ip-address> -target-port 9321 -lbr call_stack -out <filename>.tb7

      コマンド例:

      /opt/intel/vtune_profiler/bin64/sep -start -d 60 -target-ip 12.345.67.89 -target-port 9321 -lbr call_stack -out hotspots_callstacks.tb7

      コールスタックはハードウェア・ベースであり、16 フレームの深さに制限されます。ハードウェアの制限により、取得されたコールスタックの深さは 16 フレーム未満になる可能性があります。

    • カスタム CPU イベント: <install-dir>/bin64/sep.exe -start -d <duration> -target-ip <target-ip-address> -target-port 9321 -ec "<event-list>" -out <filename>.tb7

      コマンド例:

      /opt/intel/vtune_profiler/bin64/sep.exe -start -d 60 -target-ip 12.345.67.89 -target-port 9321 -ec "MEM_LOAD_UOPS_RETIRED.DRAM_HIT,MEM_LOAD_UOPS_RETIRED.HITM,MEM_LOAD_UOPS_RETIRED.L2_HIT" -out custom.tb7

      詳細については、サンプリングを有効にする製品ユーザーガイド (英語) をご覧ください。

  3. 解析を始めたら、ターゲット QNX* システムでアプリケーションを実行するか、またはすでに実行中であることを確認してください。解析はシステム全体のデータを収集します。指定した時間が経過すると、収集は自動的に停止します。

  4. 解析が完了したら、ターゲット QNX* システムでアプリケーションを停止するか、または停止していることを確認してください。

結果の表示と解釈

収集が完了すると、*.tb7 結果ファイルがホストシステムで利用できます。

  1. ホストシステムで、*.tb7 ファイルを作成しているプロジェクトにインポートします。

  2. [ホットスポット] ビューポイントに切り替えて、収集されたパフォーマンス・データを確認します。

    • ホットスポット・データを収集した場合、[ホットスポット] ビューポイントの [サマリー] ウィンドウから開始します。[上位のホットスポット] リストには、最も CPU 時間を消費した上位 5 つの関数が表示されます。[ボトムアップ] ウィンドウに表示される関数をダブルクリックすると、集計されたパフォーマンス・データと、収集全体のアクティビティーを示すタイムラインが表示されます。詳細については、ホットスポット・ビューをご覧ください。

    • CPU イベントデータを収集した場合、[マイクロアーキテクチャー全般] ビューポイントから始めます。詳細は、「マイクロアーキテクチャー全般ビュー」を参照してください。

関連情報