icnet-camvid-ava-sparse-60-0001#
ユースケースと概要説明#
TensorFlow* フレームワークを使用して CamVid データセットで最初からトレーニングされた、高速セマンティック・セグメント化用の ICNet のトレーニング済みモデル。トレーニングされたモデルには 60% のスパース性 (すべての畳み込みカーネルの重み内のゼロの比率) があります。オリジナルの浮動小数点モデルの詳細については、高解像度画像のリアルタイムのセマンティック・セグメント化に関する ICNet を確認してください。
モデル入力は、BGR 順に 1, 720, 960, 3 の単一イメージで構成されるブロブです。ピクセル値は [0, 255] の範囲の整数です。
icnet-camvid-ava-sparse-60-0001 のモデル出力は、CamVid データセットの 12 クラスのいずれかに属する各入力ピクセルの予測クラス・インデックスです。
空
建物
電柱
道路
舗装
木
標識
柵
車両
歩行者
自転車
ラベルなし
仕様#
メトリック |
値 |
|---|---|
GFlops |
75.8180 |
MParams |
26.7043 |
ソース・フレームワーク |
TensorFlow* |
精度#
品質メトリックは CamVid 検証データセットに基づいて計算されました。ラベルのないクラスはメトリックの計算中に無視されました。
メトリック |
値 |
|---|---|
mIoU |
75.79% |
IOU=TP/(TP+FN+FP), ここで:TP- 指定されたクラスの真陽性ピクセルの数FN- 指定されたクラスの偽陰性ピクセルの数FP- 指定されたクラスの誤検知ピクセルの数
入力#
画像、名前: data、形状: 1, 720, 960, 3、形式: B, H, W, C、ここで:
B- バッチサイズH- 髙さW- 幅C- チャネル
チャネルの順番は BGR です。
出力#
セマンティック・セグメント化クラス予測マップ、形状 - 1, 720, 960、出力データ形式 - B, H, W、ここで:
B- バッチサイズH- 入力ピクセルの水平座標W- 入力ピクセルの垂直座標
出力には、各ピクセルのクラス予測結果が含まれます。
デモの使い方#
このモデルは、Open Model Zoo が提供する次のデモで使用して、その機能を示します:
法務上の注意書き#
* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。