landmarks-regression-retail-0009#
ユースケースと概要説明#
これは、スマート・クラスルーム・シナリオ用の軽量のランドマーク・リグレッサーです。スタックされた 3x3 畳み込み、バッチ正規化、PReLU 活性化、およびプーリングといった古典的な畳み込みの設計が採用されています。最終的な回帰は、グローバルな深さ方向のプーリングヘッドと FullyConnected レイヤーによって実行されます。このモデルは、2 つの目、鼻、2 つの口角の 5 つの顔のランドマークを予測します。
例#

仕様#
メトリック |
値 |
|---|---|
平均正規誤差 (VGGFace2 で) |
0.0705 |
顔の位置要件 |
タイトなクロップ |
GFlops |
0.021 |
MParams |
0.191 |
ソース・フレームワーク |
PyTorch* |
i 番目のサンプルの正規誤差 (NE) は次の形式になります:

ここで、N はランドマークの数、p-hat と p は、対応して、i 番目のサンプルの k 番目のランドマークの予測ベクトルとグラウンド・トゥルース・ベクトル、di は i 番目のサンプルの眼間距離です。
入力#
画像、名前: 0、形状: 1, 3, 48, 48、形式: B, C, H, W、ここで:
B- バッチサイズC- チャネル数H- 画像の髙さW- 画像の幅
予想される色の順序は BGR です。
出力#
ネットは、形状 1, 10, 1, 1 のブロブを出力します。これには、形式 (x0、y0、x1、y1、…、x4、y4) の 5 つのランドマーク座標に対する 10 個の浮動小数点値の行ベクトルが含まれます。すべての座標は範囲 [0, 1] 内に収まるように正規化されます。
デモの使い方#
このモデルは、Open Model Zoo が提供する次のデモで使用して、その機能を示します:
法務上の注意書き#
* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。