最近开始看 CSR-DCF 这篇论文,有一些公式推导及不懂的地方记在此处。
公式推导
公式 (3) 的推导
${\bf N{\scriptsize OTE}}.$
原公式中后半部分的 $\lambda\sum\limits_{d=1}^{N_c}\left|{\bf \hat{h}}\right|2^2$ 似不正确,以下都修正为 $\lambda\sum\limits{d=1}^{N_c}\left|{\bf \hat{h}_d}\right|_2^2$。但修正后的结果与公式(5)冲突(公式(5)相对(3)的唯一区别只在此处,若进行此修正,则公式(5)无单独列出的意义;但不进行此修正,则无法推导(3)得出结果(4)。
原公式为
对 $\hat{\bf h}_d$ 进行求导:
分别对两部分进行求导:
令 ${\bf c} = \sum\limits_{d=1}^{N_c}\hat{\bf f}_d \odot \overline{\hat {\bf h}}_d - \hat {\bf g}$,则
又
因此
故
又
因此
故
令 $\dfrac{\partial\epsilon}{\partial\overline{\hat{\bf h}}_d} = 0$,解得
${\bf N{\scriptsize OTE}}.$
最后的 $\lambda$ 应向量化作 $\lambda {\bf \vec1}$。