课程视频地址:http://open.163.com/special/opencourse/machinelearning.html

课程主页:http://cs229.stanford.edu/

更具体的资料链接:https://www.jianshu.com/p/0a6ef31ff77a

作业地址:https://github.com/Doraemonzzz/CS229

参考资料:https://github.com/zyxue/stanford-cs229

从今天开始整理CS229的作业,一共做了两个版本,分别是2017版和老版本,虽说一部分有官方解答了,但还是想根据自己的理解做一遍,解答的pdf版本在我的github上。

这次的作业是回顾线性代数。

1.Gradients and Hessians

(a)首先计算$f(x) =\frac 1 2 x^T Ax +b^Tx$

接着计算$\frac{\partial f(x)}{\partial x_k}$,注意$A$为对称矩阵,记$A$的第$k$行为$A_k$

所以

(b)计算$\frac{\partial f(x)}{\partial x_k}$

所以

(c)接着(a)计算$\nabla^2 f(x)$,我们计算$\frac{\partial^2 f(x)}{\partial x_l \partial x_k}$

所以

(d)记$h(x) = a^Tx$,所以$f(x)=g(h(x))$,所以利用(b)计算$\nabla f(x)$,

接着计算$\frac{\partial^2 f(x)}{\partial x_l \partial x_k}$

所以

2.Positive definite matrices

(a)任取$x \in \mathbb R^n$,那么

(b)考虑$A$的零空间,任取$x\in N(A)$,那么

这说明$x\in N(z^T)$。反之,任取$x\in N(z^T)$,那么

从而$x\in N(A)$,因此

因为$z \in \mathbb R^n$,所以$\text{rank}(z) \le 1$,因为$z$非零,所以$\text{rank}(z) \ge 1$,从而$\text{rank}(z)=1$,利用这个结论以及$N(A) = N(z^T)$来计算$\text{rank}(A) $

(c)任取$x \in \mathbb R^m$,那么

记$z= B^Tx$,结合$A$的半正定性可得

所以$BA B^T$半正定

3.Eigenvectors, eigenvalues, and the spectral theorem

(a)对$A = T ΛT^{ -1}$两边右乘$T$可得

考虑两边的第$i$列得到

所以$A$的特征值即其对应的向量为$(\lambda_i,t^{(i)})$

(b)注意$U$为正交矩阵,对$A = UΛU^T$两边右乘$U$可得

考虑两边的第$i$列得到

(c)取$x_i$,使得

计算$x_i^TAx_i$可得

所以结论得证。