セマンティックセグメンテーションで利用されるloss関数（損失関数）について⑥

本記事は連載６回目になります。

f:id:knowwell-livewell:20220130221411p:plain — https://github.com/JunMa11/SegLossより引用

今回はBoundary-based LossのBoundary Lossについて紹介します。

⑧Boundary Loss

不均衡データ（画像に占める対象物体の面積がとても小さいような画像）に対して学習がうまく進むように、というモチベーションで提案された手法をこれまでいくつも紹介してきましたが、"過度に"不均衡なデータにおいて、精度、学習安定性を高めるために境界同士の距離を考慮に入れたLoss関数がBoundary Loss*1です。
Boundary Lossにおいて、実際に求めたい境界同士の距離とは以下のように表すことが出来ます。

f:id:knowwell-livewell:20220212133950p:plain — 境界同士の距離

f:id:knowwell-livewell:20220212134042p:plain — https://arxiv.org/pdf/1812.07032.pdfより引用

ここで、 $\partial G$ は領域 $G$ の境界を表し、 $\partial S$ は領域 $S$ の境界を表し、 $p$ は境界 $\partial G$ 上の点、 $y_{\partial S}(p)$ は $p$ からの $\partial G$ の法線と $\partial S$ との交点です。この数式の意味は分かりやすいですが、この式では直接 $S$ にモデル出力を適用することができません（モデル出力である確率に対する境界を表現するのが困難であるため）。そこで、以下のように近似することを考えます。

f:id:knowwell-livewell:20220212141240p:plain — 境界同士の距離の近似

f:id:knowwell-livewell:20220212141348p:plain — https://arxiv.org/pdf/1812.07032.pdfより引用

$D_{G}(q)$ は境界同士の差の領域 $\Delta S$ 内の任意の点 $q$ と $\partial G$ 上の近傍点 $z_{\partial G}(q)$ との距離 $||q - z_{\partial G}(q)||$ です。このように近似できるのは、以下の式を考えることで理解することが出来ます。

f:id:knowwell-livewell:20220212143652p:plain — $D_G$ と $||y_{\partial S}(p)-p||^2$ の関係

$q$ を $p$ から $y_{\partial S}(p)$ まで動かしたときの $2D_{G}(q)$ の積分結果は、 $D_{G}$ を0から $||y_{\partial S}(p)-p||$ まで動かしたときの積分結果と同じになるので、第２辺を直接計算することで、 $||y_{\partial S} (p)-p||^2$ になることが分かります。上式の第１辺と第３辺で $\int_{\partial G} dp$ を計算すれば、近似できることが分かりますね。
さらに、Dist $(\partial G,\partial S)$ （の1/2）を以下のように表すことで、計算を楽にすることが出来ます。

f:id:knowwell-livewell:20220212192735p:plain — 計算方法の改変

第１辺から第２辺への変換は $\triangle{S}$ 内の点の距離を $S$ 内の点の距離と $G$ 内の点の距離の差分で表現するようにしており、第２辺から第３辺への変換は、 $s(q)$ と $g(q)$ を導入して表現するようにしています。ここで、 $\phi_{G} (q)$ は学習に関係なく正解マスク画像 $G$ から直接計算できるため、計算効率が良くなっています。また、第３辺における２項目はモデル出力（およびパラメータ）とは関係ないため、最終的にBoudnary Lossは以下のようになります。