unet-camvid-onnx-0001#

ユースケースと概要説明#

これは、セマンティック・セグメント化を実行するように設計された U-Net モデルです。モデルは、PyTorch* フレームワークを使用して、CamVid データセットで最初からトレーニングされました。トレーニングでは、クラスの重み付けに中央値頻度バランシングを使用しました。オリジナルの浮動小数点モデルの詳細については、U-Net: 生物医学画像セグメント化のための畳み込みネットワークを参照してください。

モデル入力は、BGR 順に 1, 3, 368, 480 の単一イメージで構成されるブロブです。ピクセル値は [0, 255] の範囲の整数です。

unet-camvid-onnx-0001 のモデル出力は、CamVid データセットの 12 クラスのいずれかに属する各入力ピクセルのピクセルごとの確率です。

空
建物
電柱
道路
舗装
木
標識
柵
車両
歩行者
自転車
ラベルなし

仕様#

メトリック	値
GFlops	260.1
MParams	31.03
ソース・フレームワーク	PyTorch*

精度#

品質メトリックは CamVid 検証データセットに基づいて計算されました。ラベルのないクラスはメトリックの計算中に無視されました。

メトリック	値
mIoU	71.95%

IOU=TP/(TP+FN+FP), ここで:
- TP - 指定されたクラスの真陽性ピクセルの数
- FN - 指定されたクラスの偽陰性ピクセルの数
- FP - 指定されたクラスの誤検知ピクセルの数

入力#

画像、形状: 1, 3, 368, 480、形式: B, C, H, W、ここで:

B - バッチサイズ
C - チャネル
H - 髙さ
W - 幅

チャネルの順番は BGR です

出力#

セマンティック・セグメント化クラス確率マップ、形状 - 1, 12, 368, 480、出力データ形式 - B, C, H, W、ここで:

B - バッチサイズ
C - [0, 1] 範囲のクラス C に属する入力ピクセルの予測確率
H - 入力ピクセルの水平座標
W - 入力ピクセルの垂直座標

デモの使い方#

このモデルは、Open Model Zoo が提供する次のデモで使用して、その機能を示します:

法務上の注意書き#

* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。