距离上次更新已经 2104 天了,文章内容可能已经过时。

课程主页:https://see.stanford.edu/Course/EE263

这次回顾第十六讲,这一讲继续介绍了对称矩阵的一些性质。

二次型

如下形式的函数f:RnR

f(x)=xTAx=i,j=1nAijxixj

被称为二次型。

在二次型中,我们可以假设A=AT,因为

xTAx=xT((A+AT)/2)x

(A+AT)/2被称为A的对称部分)

唯一性:如果对任意xRnxTAx=xTBx,并且A=AT,B=BT,那么A=B

证明:取x=ei可得

eiTAei=aiieiTBei=biiaii=bii

x=ei+ej得到

(ei+ej)TA(ei+ej)=aii+ajj+aij+aji=aii+ajj+2aij(ei+ej)TB(ei+ej)=bii+bjj+bij+bji=bii+bjj+2bijaij=bij

例子

  • |Bx|2=xTBTBx
  • i=1n1(xi+1xi)2
  • |Fx|2|Gx|2

二次型定义的集合:

  • {x|f(x)=a}被称为二次曲面
  • {x|f(x)a}被称为二次区域

二次型的不等式

假设A=AT,A=QΛQT,并且特征值满足λ1λn,那么

xTAx=xTQΛQTx=(QTx)TΛ(QTx)=i=1nλi(qiTx)2λ1i=1n(qiTx)2=λ1x2

即,我们有

xTAxλ1xTx

同理可得xTAxλn|x|2,所以我们有

λnxTxxTAxλ1xTx

有时λ1被称为λmaxλn被称为λmin

注意到

q1TAq1=λ1q12,qnTAqn=λnqn2

所以不等式是紧的。

正定型和半正定型

假设A=ATRn×n

我们称A为半正定矩阵,如果对所有x,我们有xTAx0

  • 表示为A0(有时表示为A0
  • A0当且仅当λmin(A)0,即所有的特征值非负
  • 这和Aij0不同

我们称A是正定矩阵,如果对所有x0,我们有xTAx>0

  • 表示为A>0
  • A>0当且仅当λmin(A)>0

矩阵不等式

  • 我们称A是半负定,如果A0
  • 我们称A是负定,如果A>0
  • 否则,我们称A不定

矩阵不等式:如果B=BTRn,我们称AB,如果AB0;$A0$,以此类推

例如:

  • A0意味着A是正定矩阵
  • A>B意味着对所有x0xTAx>xTBx

常用的性质:

  • AB,CDA+CB+D
  • B0A+BA
  • A0,α0,αA0
  • A20
  • A>0A1>0

矩阵不等式只是半序,即可能有

AB,BA

椭球

如果A=AT>0,集合

E={x|xTAx1}

Rn中的椭球,中心为原点,图像如下:

半轴由si=λi1/2qi给出,即:

  • 特征向量决定半轴的方向
  • 特征值决定半轴的长度

注意到:

  • 在方向q1xTAx很大,因此在q1方向椭圆很瘦
  • 在方向qnxTAx很小,因此在qn方向椭圆很胖
  • λmax/λmin给出最大偏心率

给定B>0,E~={x|xTBx1},那么

EE~AB

矩阵在方向上的增益

假设ARm×n(不需要是方阵或对称)

对于xRn|Ax|/|x|给出了A在方向x的放大因子

显然,随着输入x的变换,增益会变化

于是产生如下问题:

  • A的最大增益是多少(以及对应的方向)?
  • A的最小增益是多少(以及对应的方向)?
  • A的增益随着方向的变换如何改变?

矩阵范数

最大收益

maxx0Axx

被称为A的矩阵范数或谱范数,用|A|表示,由之前的结论可得

maxx0Ax2x2=maxx0xTATAxx2=λmax(ATA)

所以我们有

A=λmax(ATA)

类似的,最小增益为

minx0Ax/x=λmin(ATA)

注意到

  • ATARn×n对称,并且ATA0,所以λmin,λmax0
  • 最大收益方向为x=q1ATAλmax对应的特征项向量
  • 最小收益方向为x=qnATAλmin对应的特征项向量

矩阵范数的性质

  • 和向量范数兼容:aRn×1的矩阵范数为

    λmax(aTa)=aTa
  • 对任意x|Ax||A||x|

  • 缩放:|aA|=|a||A|

  • 三角不等式:|A+B||A|+|B|

  • definiteness:|A|=0A=0

  • 范数的乘积:|AB||A||B|