aclnet-int8#
ユースケースと概要説明#
AclNet-int8 モデルは、音響分類を実行するように設計された AclNet モデルの NNCF バリアントを使用して量子化され、調整されています。AclNet-int8 モデルは、<omz_dir>/data/dataset_classes/aclnet_53cl.txt ファイルにリストされている 53 の異なるクラスの環境音響の内部データセットでトレーニングされます。モデルの詳細については、論文 を参照してください。
モデル入力は、N, C, 1, L 形式の PCM オーディオサンプルのセグメントです。
AclNet-int8 のモデル出力は、内部音響データベースから 53 の異なる環境音響クラスの音響分類器出力です。
仕様#
メトリック |
値 |
|---|---|
タイプ |
分類 |
GFLOPs |
2.71 |
MParams |
1.41 |
ソース・フレームワーク |
PyTorch* |
精度#
メトリック |
値 |
|---|---|
上位 1 |
87.1% |
上位 5 |
93.0% |
入力#
元のモデル#
オーディオ、名前 - result.1、形状 - 1, 1, 1, L、形式 - N, C, 1, L、ここで:
N- バッチサイズC- チャネルL- PCM サンプル数 (最小値は 16000)
変換されたモデル#
オーディオ、名前 - result.1、形状 - 1, 1, 1, L、形式 - N, C, 1, L、ここで:
N- バッチサイズC- チャネルL- PCM サンプル数 (最小値は 16000)
出力#
元のモデル#
音響分類子 (ラベルファイル、<omz_dir>/data/dataset_classes/aclnet_53cl.txt)、名前 - 出力 - 486、形状 - 1, 53、出力データ形式 - N, C、ここで:
N- バッチサイズC- [0, 1] 範囲の各クラスの予測ソフトマックスのスコア
変換されたモデル#
音響分類子 (ラベルファイル、<omz_dir>/data/dataset_classes/aclnet_53cl.txt)、名前 - 出力 - 486、形状 - 1, 53、出力データ形式 - N, C、ここで:
N- バッチサイズC- [0, 1] 範囲の各クラスの予測ソフトマックスのスコア
モデルをダウンロードして OpenVINO™ IR 形式に変換#
以下の例に示すように、モデルをダウンロードし、必要に応じてモデル・ダウンローダーやその他の自動化ツールによってモデルを OpenVINO™ IR 形式に変換できます。
モデル・ダウンローダーの使用例:
omz_downloader --name <model_name>モデル・コンバーターの使用例:
omz_converter --name <model_name>デモの使い方#
このモデルは、Open Model Zoo が提供する次のデモで使用して、その機能を示します:
法務上の注意書き#
元のモデルは、Apache License バージョン 2.0 に基づいて配布されています。