不变子空间
A-不变子空间下的矩阵结构
设A∈L(V),U是A的d维不变子空间,0<d<n. 则存在V的一组基使得A在该基底下的矩阵为
A=(BOCD)
其中B∈Md(F)是AU的某个矩阵表示,这是因为当A作用于e1,…,ed时得到的结果不能有关于ed+1,…,en的坐标,所以坐标是(BO)
以及,可以看出这个矩阵的k次幂具有如下形式
Ak=(BkO∗Dk)
其中∗是某个d×(n−d)的矩阵,由此我们可以推广到对于任意f∈F[t]有
f(A)=(f(B)O∗f(D))
所以μA(A)=On×n意味着
(μA(B)O∗μA(D))=On×n
故而我们有μA(B)=Od×d,μA(D)=O(n−d)×(n−d),并且由整除判别法,μB∣μA,μD∣μA且μAU∣μA
常见的不变子空间的例子
设A∈L(V)满足AB=BA,则ker(B),im(B)是A的不变子空间
特别地,因为F[A]是交换环,所以有
- 设A∈L(V),f∈F[t]. 则ker(f(A))和im(f(A))都是A的不变子空间
- 更特别地,ker(A),im(A)是A的不变子空间
由A∈L(V)和v∈V生成的循环子空间F[A]⋅v是A的不变子空间,且是包含v的最小的A-不变子空间
设λ∈F是A的特征值,则特征子空间Vλ是A的不变子空间
核核分解及极小多项式版
一般多项式版本
若A∈Hom(V,V),f∈F[x]且f(A)=O, 如果
f=p1⋯pm
其中p1,…,pm∈F[x]两两互素,则
V=K1⊕⋯⊕Km
其中Ki=ker(pi(A))
极小多项式版本
设A∈L(V),μA=p1m1⋯Psms, 其中p1,…,ps∈F[t]\F不可约且两两互素,m1,…,ms∈Z+,令
Ki=ker(Pimi(A))
则
V=K1⊕⋯⊕Ks
且A∣Ki的极小多项式是pimi
这就是说,对μA的不可约因子分解可以看作是对空间的一个划分,其中每一个空间都是某个因子作用于A后的核空间
特征值和特征向量
特征多项式
设A∈Mn(F),t是F上的未定元,则多项式
det(tE−A)∈F[t]
称为A的特征多项式,记为χA(t)
特征多项式满足χA(A)=0,进而由整除判别法,μA∣χA
特征子空间
设λ∈F是A的特征值,令
Vλ={x∈V∣A(x)=λx}
称为A关于λ的特征子空间,可以验证Vλ是A的不变子空间
由定义,特征子空间可以写成
Vλ=ker(λE−A)
以下三个结论等价
- A是可对角化的
- V=Vλ1+⋯+Vλk
- Vλ1+⋯+Vλk是直和
几何重数和代数重数
我们把dimVλ称为λ的几何重数,而把λ在χA(t)中的重数称为λ的代数重数
λ的代数重数总是大于等于它的几何重数
对角化条件和方法
判别法
- n个特征向量线性无关(充要)
- n个不同的特征根(充分不必要)
- V是特征子空间的和(充要)
- dimV是特征子空间的维数和(充要)
- 几何重数等于代数重数(充要)
- 极小多项式可以分解为两两互素的一次因子之积(充要)
方法
如果A可对角化,那么在对V作直和分解V=Vλ1⊕⋯⊕Vλk后得到的一组基下有A的矩阵是
λ1EO⋮OOλ2E⋮O⋯⋯⋱⋯OO⋮λkE
这对应了这样的对角化形式
Λ=diag(d1 timesλ1,…,λ1,d2 timesλ2,…,λ2,⋯,dk timesλk,…,λk)
其中di=dimVλi,如果要把A写成对角形式我们有变换
A=P−1ΛP
若设e1,…,en是上述直和分解从左往右对应的一组基底,则由矩阵的基底变换可知有
P=(e1,e2,…,en)
性质
如果A是可对角化的,且拥有不同的特征值λ1,…,λd,那么A的极小多项式就是
μA=i=1∏d(t−λi)
循环子空间
零化某个向量的极小多项式
设A∈L(V),v∈V,f(t)∈F[t]. 如果f(A)(v)=0, 则称f(t)是通过A零化v的多项式.
非零、次数最小的这样的多项式称为通过A零化v的极小多项式,记为μA,v, 它通常是首一的.
对任意f∈F[t], 我们有μA,v=μA,f(A)v⋅gcd(μA,v,f),利用这一点,当我们知道零化v的极小多项式时,就可以很方便地求出零化f(A)v的极小多项式
类似于dim(F[A])=deg(μA),我们有dim(F[A]⋅v)=deg(μA,v),其中F[A]⋅v表示循环子空间
对∀A∈L(V),总存在v∈V使得μA,v=μA. 也就是说,总是存在这样一个v使得f(A)(v)=0⟹f(A)=O (要把它'杀死'就必须先把A '杀死',称其为同归于尽向量)
循环子空间的定义
设A∈L(V)和v∈V. 由v,A(v),A2(v),…生成的子空间被称为由A和v生成的循环子空间. 记为F[A]⋅v,或者表示成线性轨道的形式[v]
循环子空间包含了任意A的多项式在v上的作用,也就是说F[A]⋅v={p(A)(v)∣p(t)∈F[t]}
特别地,如果v是A的特征向量,则有F[A]⋅v=[v]=⟨v⟩
设A∈L(V),v∈V. 如果V=F[A]⋅v,则称A是V上的循环算子,v是V中的循环向量,V是关于A,v的循环空间,简称 A-循环空间
我们可以用任意的A∈L(V),v∈V生成一个循环子空间,当我们选择一个合适的v使得这个循环子空间就是V本身时,我们才能称V是A-循环空间
循环子空间的性质
V是A-循环的当且仅当μA=χA
F[A]⋅v是A-不变的,因为F[A]⋅v自然包含了所有对A的多项式作用的结果,它自然是A封闭的
循环空间的所有不变子空间都是循环空间
循环子空间的维数和A的零化v的极小多项式的次数一致,即dim(F[A]⋅v)=degμA,v
如果V=F[A]⋅v是循环空间,则dim(V)=degμA,v,又degμA≤degχA=dim(V)且μA,v∣μA⟹deg(μA,v)≤deg(μA),故有dim(V)=degμA,v=degμA,且μA,v=μA
反过来,若设d=degμA则存在v∈V使得
dim(F[A]⋅v)=d
且不存在维数大于d的A-循环子空间,也就是说,有A,v生成的循环子空间的最大维数就是A的极小多项式的次数
空间分划
不可分子空间分解
判定规则
设A∈L(V), U是A-子空间,则U是A-不可分的当且仅当下述两个条件都成立
- U是A-循环子空间
- μAU是F[t]中某个不可约多项式的幂次. 特别地,在F=C也就是复数域上时,μAU应当为某个一次多项式的幂次,及μAU(t)=(t−λ)m
由此可知,A-不可分子空间一定是A-循环的,不可分的条件比循环更强
不可分子空间直和分解
设A∈L(V). 则存在A-不可分子空间W1,…,Wk使得
V=W1⊕⋯⊕Wk
且Wi是A-循环的,μAWi是F[t]中的某个不可约多项式的幂次,i=1,2,…,k
同样地,如果F=C,则μAWi=(t−λi)di,其中di=dim(Wi),从而AWi在Wi上的某一个矩阵表示是一个Jordan块Jdi(λ)
分解在多项式作用下的不变性
设A∈L(V),f∈F[t],设V的A-不可分子空间直和分解为
V=U1⊕⋯⊕Uℓ
则
f(A)(V)=f(A)(U1)⊕⋯⊕f(A)(Uℓ)
Jordan标准型
Jordan块
设A∈L(V). 则V是A-不可分的当且仅当存在λ∈C使得极小多项式μA=(t−λ)n. 此时,A在V的某组基下的矩阵是
Jn(λ)=λ00⋮001λ0⋮0001λ⋮00⋯⋯⋯⋱⋯⋯000⋮λ0000⋮1λ
我们称此矩阵为关于λ的n阶Jordan块
事实上,满足P−1AP=Jn(λ)的那个转移矩阵P为
P=(ϵ1,…,ϵn)
其中ϵj=(A−λE)n−j(v),且v满足V=F[A]⋅v. 或者说v∈Kλ是特征值λ对应的一个广义特征向量,而ϵ1,…,ϵn代表了v的一个广义特征向量循环
由矩阵的基底变换可知有Jn(λ)=P−1AP⟹A=PJn(λ)P−1
Jordan块的基本性质如下
- 如果λ=0,则rank(Jn(λ))=n,而rank(Jn(0))=n−1
- Jn(λ)=λEn+Jn(0)
- Jn(λ)的极小多项式和特征多项式都等于(t−λ)n,从而把Jn(λ)看成Cn上的算子后,Cn是Jn(λ)-循环的
- Jn(λ)的唯一特征值为λ,从而对应的特征子空间的维数为1,这是因为
Jn(λ)−λEn=Jn(0)
于是
Jn(λ)v⟹dimVλ=λv⟹Jn(0)v=0=dimkerJn(0)=n−(n−1)=1
- Jn(λ)可对角化当且仅当n=1
- Jnt(λ)=B−1Jn(λ)B=BJn(λ)B−1,其中
B=00⋮0100⋮10⋯⋯⋱⋯⋯01⋮0010⋯00
低阶矩阵JA的求法
一般方法
给定一个F上的线性空间V和一个定义在其上的线性算子A∈L(V),我们可以对V作不可分子空间直和分解
V=W1⊕⋯⊕Wk
其中每一个Wi都是A-不可分子空间,这个性质等价于一下两条的联立:
- Wi是A-循环子空间
- 设Ai=AWi为把A的定义域限制在Wi上的新算子,则Ai的极小多项式μi=μAi是F[t]中某个不可约多项式的幂次
我们称这里的每一个μi为A的一个初等因子,这些μi是可以重复的,所以我们通过一个重集来将这些初等因子放在一起,称为A关于上述不可分因子直和分解的初等因子组,记为{μ1,…,μk}
考虑每一个初等因子pm,其中p是F[t]中的一个不可约元,它们都对应着一个Jordan块Jm(λ),其中Jordan块的大小m就是p在该初等因子中的重数,而λ则是p(λ)=0的解. 如果λ不唯一或者不存在,我们这样的A的Jordan标准型就有可能不存在,具体细节不在此讨论
假设相同的初等因子pm在初等因子组中出现了n次,在最后的Jordan标准型中Jm(λ)也就相应地出现了n次
把这些Jn(λ)在对角线上排列后(无所谓顺序)得到的大矩阵就是A的Jordan标准型JA,也就是
JA=diag(Jn1(λ1),…,Jnk(λk))
所以要计算Jordan标准型,关键就是要确定这些初等因子,也就是
- 有哪些可能的初等因子pm
- 每一种初等因子分别出现了几次
对第一个问题,我们只需要计算A对应的矩阵表示A的特征多项式,根据Hamilton-Cayley定理加强版,A的特征多项式和极小多项式具有相同的不可约因子,而由于μAi∣μA,所以μi=μAi的全部不可约因子都可以在χA中找到,且χA中的每一个不可约因子都是某个μi的不可约因子
对于第二个问题,如果我们已经找到了所有可能的p,我们就可以利用一个递推公式来计算pm在初等因子组中出现的次数
我们设从χA找到的所有不可约因子为p1,…,ps,且设degpi=di,那么piℓ在初等因子组中出现的次数N(i,ℓ)为
N(i,ℓ)=di1(R(i,ℓ−1)+R(i,ℓ+1)−2R(i,ℓ))
其中R(i,j)=rank(pij(A)),j∈N,这给出了计算Jordan标准型的一般方法
复数域的情况
我们来具体讨论复数域上的特例,因为C[t]中的不可约因子都是一次的,所以这时候初等因子的形式为μi=(t−λi)mi,其中mi=dim(Wi),这是因为Wi是循环空间,所以μi和Ai的特征多项式χi相同,又χA的次数等于Wi的维数,所以deg(μi)=dim(Wi)
对于每一个特征根λi,(t−λi)ℓ出现的次数为
N(i,ℓ)=R(i,ℓ−1)+R(i,ℓ+1)−2R(i,ℓ)
其中R(i,j)=rank((A−λiE)j).
利用更多的信息
上面的计算对于高阶矩阵来说比较麻烦,所以我们考虑是否有其他的信息能帮助我们更方便地确定Jordan标准型的形式
我们可以直接从A的矩阵表示求出χA,上面的标准算法中我们只利用了χA的不可约因子,而没有利用它们对于的重数(也就是所谓的代数重数),考虑所有初等因子的乘积
pμ=μ1⋯μn
由于Wi都是循环的,所以deg(μi)=deg(χi)=dim(Wi),根据直和的性质,我们知道deg(pμ)=i∑deg(μi)=i∑dim(Wi)=dim(V)=deg(χA),而又由于μi∣μA=χA,所以pμ∣χA,这两者又恰好维数相等,故而
χA=μ1⋯μn
这说明了χA中每个不可约因子(t−λi)的重数就是每个λi的Jordan块的大小的和,也就是对应的λi在Jordan标准型的对角线上出现的次数
如果我们还知道极小多项式μA,我们就得到了每一个p=t−λ在μA中的重数,事实上,由于μi∣μA,故我们有
μA=lcm(μ1,…,μn)
从而如果某个t−λ在μA的重数m,那么必然存在一个初等因子(t−λ)m
以上两个新增信息可以帮我们快速确定一些矩阵的Jodran标准型,例如
已知复方阵A的特征多项式和极小多项式分别为
χAμA=(t−1)4(t+1)3t2=(t−1)3(t+1)3t2
对于特征值1,其代数重数为4,则知1在对角线上出现了4次;而由于t−1在μA中的重数为3,则知存在一个J3(1),且这是最大的1的Jordan块
所以只能有一种情况,就是存在两个关于1的Jordan块J3(1),J1(1)
对于特征值−1和0,同理知道它们对应的Jordan块只能是J3(−1);J2(0)
综上
A∼diag(J1(1),J3(1),J3(−1),J2(0))
矩阵相似的判断
有共同的初等因子组
设A∈Mn(C),在不计Jordan块出现的顺序的前提下,A的Jordan标准型由A的初等因子组唯一确定
设A,B∈Mn(F),则A∼sB当且仅当A和B有共同的初等因子组
相等多项式和秩
设A,B∈Mn(F),则A∼sB当且仅当下述两点同时成立
- χA=χB或μA=μB
- 设p1,…,ps是χA或μA在F[t]中两两互素的(首一的)不可约因子,且
∀i∈{0,1,…,n+1},j∈{1,2,…,s},rank(pj(A)i)=rank(pj(B)i)
任意多项式下秩相等
设A,B∈Mn(F),则A∼sB当且仅当对任意f∈F[t],rank(f(A))=rank(f(B))
欧式空间
向量代数和内积运算
内积
设f(x,y)是V上的对称双线性型满足f(x,x)是正定的,则称(V,f)是一个欧式空间,f是V上的内积,记f(x,y)=(x∣y)
内积的基本性质如下
(αx+βy∣z)=α(x∣z)+β(y∣z),(x∣αy+βz)=α(x∣y)+β(x∣z)
- 对称性:对任意x,y∈V,(x∣y)=(y∣x)
- 正定性:对任意x∈V
(x∣x)≥0 且 (x∣x)=0⟺x=0
长度
设V是欧式空间,x∈V. 称(x∣x)是x的长度,记为∥x∥. 再设y∈V. 则∥x−y∥称为x到y之间的距离
(Cauchy-Bunyakovsky不等式)设x,y∈V,则
∣(x∣y)∣≤∥x∥∥y∥
特别地∣(x∣y)∣=∥x∥∥y∥当且仅当x,y线性相关
在Rn上,该不等式的形式是
∣x1y1+⋯+xnyn∣≤x12+⋯+xn2y12+⋯+yn2
在Mn(R)上,该不等式的形式是
tr(AtB)≤tr(AtA)tr(BtB)
夹角和正交
设x,y∈V\{0},称
arccos(∥x∥∥y∥(x∣y))
是x,y的夹角,其通常的取值范围为[0,π]
设x,y∈V. 如果(x∣y)=0,则称x和y正交,记为x⊥y
设x,x1,…,xk∈V,其中x1,…,xk非零,则
- x⊥x⟺x=0
- 如果x1,…,xk两两正交,则它们线性无关
(勾股定理)设x,y∈V,则x⊥y当且仅当
∥x+y∥2=∥x∥2+∥y∥2
Gram-Schmidt正交化
正交化
设dim(V)=n,e1,…,en是V中两两正交的单位向量,则称它们为V的一组单位正交基
设v1,…,vk∈V线性无关,则存在两两正交的单位向量ϵ1,…,ϵk使得
⟨v1,…,vi⟩=⟨ϵ1,…,ϵi⟩
其中i=1,2,…,k. 特别地,V有单位正交基
可以利用如下递推式构造ϵi,
ϵi′=vi−(vi∣ϵ1)ϵ1−⋯−(vi∣ϵi−1)ϵi−1⟹ϵi=∥ϵi′∥ϵi′
正交基的性质
内积的形式
设V的一组单位正交基是e1,…,en,x,y∈V在这组基下的坐标分别是(x1,…,xn)t和(y1,…,yn)t,则有
(x∣y)=x1y1+⋯+xnyn
内积取坐标分量
设V的一组单位正交基是e1,…,en,x∈V. 则x在该基下的第i个坐标分量为(x∣ei),i=1,2,…,n
维数相等的欧式空间线性同构且保持内积不变
设V,W是两个n-维欧式空间,其中的内积分别记为(∣)V和(∣)W,则存在线性同构ϕ:V→W满足对任意x,y∈V
(x∣y)V=(ϕ(x)∣ϕ(y))W
正交投影和正交补
设v∈V\{0},x∈V,称
(x∣∥v∥v)∥v∥v
为x在v上的投影
设v∈V\{0},x∈V,y是x在v上的投影,则(v−y)⊥y
设X,Y⊂V. 如果对任意的x∈X和y∈Y都有x⊥y,则称X和Y正交,记为X⊥Y. 特别地,当X={x}时,则X⊥Y也记为x⊥Y
设U⊂V是子空间,x∈V,则存在唯一的u∈U使得(x−u)⊥U,称这里的u是x在子空间U上的正交投影. 特别地,向量x在v∈V\{0}上的投影就是x在⟨v⟩上的正交投影
我们记x在子空间U上的正交投影为πU(x)
在上面的例子中u=πU(x),此时考虑∀y∈U,容易证明∥x−u∥≤∥x−y∥,故我们称∥x−πU(x)∥成为x到W的距离,记为d(x,W)
设U⊂V是子空间,令U⊥:={x∈V∣x⊥U},则
- U⊥是子空间且U⊥U⊥
- V=U⊕U⊥,故称U⊥是U的正交补
- (U⊥)⊥=U,这是(2)的直接推论
由第(2)点我们知道,设e1,…,ed是V中的单位正交向量,则e1,…,ed可以扩充为V的一组单位正交基,比如说,设标准欧式空间R3的标准基为e1,e2,e3,则有
⟨e1⟩⊥=⟨e2,e3⟩,⟨e1⟩⊥⊥=⟨e2,e3⟩⊥=⟨e1⟩
正交和正规
正交矩阵
设P∈GLn(R). 如果Pt=P−1,则称P是正交矩阵. 所有n阶正交矩阵的集合记为On(R)
集合On(R)是GLn(R)的子群
正交矩阵有如下性质
- 如果P∈On(R),则det(P)=±1,这说明了正交矩阵是一个旋转矩阵或者是一个反射矩阵
- P∈On(R)当且仅当P的列向量是标准欧式空间Rn中的一组单位正交基
- P∈On(R)当且仅当P的行向量是标准欧式空间R1×n中的一组单位正交基
特别地,P∈O2(R)当且仅当存在θ使得
P=(cosθsinθ−sinθcosθ) or P=(cosθsinθsinθ−cosθ)
前面这种行列式为1,代表旋转;后面这种行列式为−1,代表反射
设欧式空间V由基e1,…,en和ϵ1,…,ϵn,矩阵P∈GLn(R)满足
(ϵ1,…,ϵn)=(e1,…,en)P
再设e1,…,en是单位正交基,则ϵ1,…,ϵn是单位正交基当且仅当P∈On(R)
正交等价
设A,B∈Mn(R). 如果存在P∈On(R)使得B=P−1AP,则称A与B正交等价(或正交相似),记为A∼oB
可以验证,∼o是等价关系. 且若A∼oB,则由A∼sB且A∼cB,这是因为正交矩阵的逆和转置相等. 由此可得,矩阵的相似不变量和合同不变量都是正交等价的不变量. 但是反之不然,不能用合同等价及相似等价同时成立推出正交等价
在正交等价下,可以同时用B=P−1AP和B=PtAP来表示基底变换
伴随算子
设A∈L(V),如果算子B∈L(V)满足对任意x,y∈V都有(A(x)∣y)=(x∣B(y)),则称B是A的伴随算子(Adjoint Operator)
设A∈L(V),则A的伴随算子存在且唯一. 如果A在V的单位正交基e1,…,en下的矩阵等于A,则其伴随算子在该基下的矩阵等于At
我们把A的伴随算子记为A∗
正规算子
设A∈L(V),如果AA∗=A∗A,则称A是正规算子(Normal Operator),类似地,设A∈Mn(R),如果AAt=AtA,则称A是正规矩阵(Normal Matrix)
特别地,若AA∗=E,则称A是正交算子(Orthogonal Operator)
由定义,设A∈L(V),A在V的单位正交基e1,…,en下的矩阵为A,则A正规当且仅当A正规
设A∈L(V),如果A∗=A,则称A是对称算子(Symmetric Operator),如果A∗=−A,则称A是斜对称算子(Skew-symmetrix Operator) . 由此可知,对称和斜对称算子都是正规算子,对称和斜对称矩阵都是正规矩阵
正交矩阵是正规矩阵,这是因为设P∈On(R),则有PtP=E=PPt
正规算子的保内性
设A∈L(V),如果对于任意x,y∈V
(x∣y)=(A(x)∣A(y))
则称A是保内(积)的(preserve the inner product)
若A在V的单位正交基e1,…,en下的矩阵为A,则下列断言等价
- A保内
- A∈On(R)
- 对任意x∈V,∥x∥=∥A(x)∥ (保长)
- 对任意x,y∈V,∥x−y∥=∥A(x)−A(y)∥(保距离)
上述等价命题说明了正交矩阵的“旋转”性质,且保内算子是正规算子,也称为正交(保长,保距)算子,因为正交算子一定是正规算子
正交标准型
正规矩阵的标准型
设dim(V)=1,则任意的A∈L(V)都是正规算子,这是因为对V中的单位向量v,A(v)=λv,其中λ是某个实数
设dim(V)=2,A∈L(V)正规,且V是A-不可分的(在可分的情形下A可以通过一维形式的直和得到),则A在V的任意单位正交基下的矩阵式
A=(αβ−βα)
其中α,β∈R且β=0
设A∈L(V)正规,则存在V的一组单位正交基e1,…,en和α1,β1,…,αs,βs,λ2s+1,λn∈R,其中β1,…,βs=0,使得A在这组基下的矩阵等于
B=N(α1,β1)⋱N(αs,βs)λ2s+1⋱λn
其中
N(α,β)=(αβ−βα)
也就是说,存在如上这样一个标准型B使得A正交等价于B,即A∼oB,弱化这个结论就是有A相似于B,即A∼sB
实对称矩阵的标准型
求解该对角矩阵的算法
- 计算A的特征根,设互不相同的特征根是λ1,…,λk
- 对i∈{1,2,…,k},求Vλi的一组基
- 对i∈{1,2,…,k},利用Gram-Schmidt正交化求Vλi的一组单位正交基ei,1,…,ei,di
- 由此得到的e1,1,…,e1,d1,…,ek,1,…,ek,dk是V的一组单位正交基,且在该基下A是对角的
例如,设
A=011−110−111−101−1110∈SM4(R)
则可计算χA(t)=(t−1)3(t+3)⟹λ1=1,λ2=−3,由于4=dimVλ1+dimVλ2且dimVλ2至少为1且其最大值为λ2的代数重数也为1,故dimVλ2=1,dimVλ1=3,(事实上,由于A是可对角化的,故λ1的代数重数必然等于其几何重数),考虑到
Vλ1=ker(λ1E−A)=ker1−1−11−111−1−111−11−1−11
只需要考虑方程
x1−x2−x3+x4=0
的解空间即可,直接得出
Vλ1=⟨1100,0011,100−1⟩
再计算Vλ2,因为Vλ1⊥Vλ2且R4=Vλ1⊕Vλ2,所以Vλ2为Vλ1的正交补,由于上述方程已经给出了
(1,−1,−1,1)⋅(x1,x2,x3,x4)=0
故
Vλ2=⟨1−1−11⟩
利用Gram-Schmidt正交化可分别求出Vλ1,Vλ2的单位正交基
ϵ1=21(1,1,0,0)t,ϵ2=21(0,0,1,1)t,ϵ3=21(1,−1,1,−1)t;ϵ4=21(1,−1,−1,1)t
故
P=21210000212121−2121−2121−21−2121
我们得到PtAP=diag(1,1,1,−3)
惯性指数的求法
设A∈SMn(R),则A的正(负)惯性指数等于spec(A)中正(负)根的个数(在记重数的意义下),特别地,A(半)正定当且仅当A的特征根都是正的(非负的)
特别地,设A,B∈SMn(R)且A正定,则存在P∈GLn(R)使得PtAP=E和PtBP是对角阵,这是因为
- 由于A正定,所以存在P1∈GLn(R)使得P1tAP1=E
- 令C=P1tBP1,则C也对称,故存在P2∈On(R)使得D=P2tCP2是对角阵
- 令P=P1P2,则PtBP=P2tCP2=D且
P2∈On(R)⟹PtAP=P2tEP2=P2tP2=E
由此可以证明对于正定矩阵
det(A+B)≥det(A)+det(B)
由于存在P∈GLn(R)使得PtAP=E,PtBP=diag(α1,…,αn),于是
Pt(A+B)P=diag(1+α1,…,1+αn)
两边取行列式有
det(P)2det(A+B)=i=1∏n(1+αi)
而
det(P)2(det(A)+det(B))=det(PtAP)+det(PtBP)=1+i=1∏nαi
因为B正定,所以α1,…,αn∈R+,于是∏(1+αi)≥1+∏αi,故命题得证
斜对称矩阵的标准型
设A∈L(V)斜对称,则存在β1,…,βs∈R\{0},使得A在V的某组单位正交基下的矩阵为
M=N(0,β1)⋱N(0,βs)0⋱0
设A∈SSMn(R),则A正交相似于上述形式的矩阵
实斜对称矩阵和欧式空间上的斜对称算子的特征根或者是纯虚数,或者等于0
正交矩阵的标准型
设A∈L(V)正交,则存在θ1,…,θs∈(0,π)∪(π,2π)和λ2s+1,…,λn∈{−1,1}使得A在V的某组单位正交基下的矩阵为
M=N(cosθ1,sinθ1)⋱N(cosθs,sinθs)λ2s+1⋱λn
设A∈On(R),则A正交相似于上述形式的矩阵M
正交矩阵和正交算子的(复)特征根的模长都等于1
必考题
给定具体的矩阵,计算特征多项式,特征值和特征子空间,并判断是否可以对角化
Hamilton-Cayley定理
确定低阶矩阵的Jordan标准型
Gram-Schmidt正交化,正交补的构造
计算正交矩阵的标准型
例题
T1
设复数矩阵A=100010a01. 计算A的特征多项式和Jordan标准型.
由于tE−A为上三角矩阵,故χA=det(tE−A)=(t−1)3,考虑到
A−E=000000a00,(A−E)2=000000000
故若a=0,则μA=t−1,那么最大的Jordan块是一阶的,所以JA=diag(1,1,1)
若a=0,则μA=(t−1)2,那么最大的Jordan块是二阶的,所以JA=diag(J1(1),J2(1))
T2
设复数方阵A的特征多项式是(t−2)2(t+3)3.
(i). 设A的极小多项式是(t−2)2(t+3)2. 计算A的Jordan标准型
(ii). 设rank(A−2E)=3,rank(A+3E)=4,计算A的Jordan标准型和极小多项式
(i). 由特征多项式我们知道JA的对角线上出现了两个2和三个−3,又根据极小多项式存在J2(2)和J2(−3),故JA=diag(J2(2),J2(−3),J1(−3))
(ii). 注意到几何重数的定义mλ=dimVλ=dimker(A−λE)=n−rank(A−λE),从而我们知道2的几何重数为5−3=2和−3的几何重数5−4=1,所以我们有两个J(2)和一个J(−3),故JA只能为JA=diag(J1(2),J1(2),J3(−3)),其中最大的2的Jordan块是1阶的,而最大的−3的Jordan块是3阶的,故μA=(t−2)(t+3)3
T3
设标准欧式空间R3中的子空间U是方程x1−x2+x3的解空间.
(i). 计算U的正交补U⊥的一组基
(ii). 计算R3的一组单位正交基u1,u2,u3,其中u1,u2∈U且u3∈U⊥
(i). 由题意,U中所有的元素(x1,x2,x3)T都满足
x1−x2+x3=0⟺(1,−1,1)⋅(x1,x2,x3)=0
于是U⊥=⟨1−11⟩
(ii). 先直接写出u3=31(1,−1,1)T. 接着我们再来求解U的一组基,不妨直接用x1,x3来表示x2即x2=x1+x3,由此我们容易写出U的一组基为
v1=(1,1,0)T,v2=(0,1,1)T
考虑Gram-Schmidt正交化,有
u1′=(1,1,0)T⟹u1=21(1,1,0)Tu2′=v2−(v2∣u1)u1=(0,1,1)T−21(1,1,0)T=(−21,21,1)T
从而有
u1=21(1,1,0)T,u2=61(−1,1,2)T,u3=31(1,−1,1)T
T4
设实对称矩阵A=0−11−1−10−111−10−1−11−10,已知A的特征多项式为(t−3)(t+1)3,计算正交矩阵P和对角矩阵D使得PtAP=D
我们需要计算V3和V−1,显然后者好看一些,考虑矩阵
A+E=1−11−1−11−111−11−1−11−11
容易看出rank(A+E)=1,从而dimV−1=4−1=3,dimV3=4−3=1,而A+E的第一行就直接告诉我们了V3的一个基底
V3=⟨(1,−1,1,−1)T⟩
考虑x1−x2+x3−x4=0,把x1,x2,x3作为自由变量,则写出V−1的一组基(先省略转置)
v1=(1,0,0,1),v2=(0,1,0,−1),v3=(0,0,1,1)
然后正交化
e1′=v1=(1,0,0,1)⟹e1=21(1,0,0,1)e2′=v2−(v2∣e1)e1=(0,1,0,−1)−(−21)(1,0,0,1)=(21,1,0,−21)⟹e2=61(1,2,0,−1)e3′=v3−(v3∣e1)e1−(v3∣e2)e2=(0,0,1,1)−21(1,0,0,1)+61(1,2,0,−1)=(−31,31,1,31)⟹e3=231(−1,1,3,1)
故而我们有
P=21002161620−61−23123123323121−2121−21
从而PtAP=diag(−1,−1,−1,3)
T5
设P=(cosθsinθsinθ−cosθ),Q=(01−10)和A=(POOQ). 计算A的极小多项式和A2023
A的极小多项式为μP和μQ的乘积,我们直接计算χP=t2−1,χQ=t2+1,而μP,μQ显然都不能是一次的,故μP=χP=t2−1,μQ=χQ=t2+1,从而μA=μPμQ=t4−1
由对角分块矩阵的性质有A2023=(P2023OOQ2023),而P2=E,Q2=−E,从而
A2023=(POO−Q)
T6
设V是域F上的有限维线性空间,A是V上的线性算子,v1和v2是A的两个线性无关的特征向量. 证明:v1+v2是A的特征向量⟺v1,v2在同一个特征子空间中
右边推左边是显然的,故我们来证明左边推右边,设Av1=λ1v1,Av2=λ2v2和A(v1+v2)=λ3(v1+v2),第三个式子减去前面两个式子就有
(λ3−λ1)v1+(λ3−λ2)v2=0
由于v1,v2线性无关,故λ1=λ2=λ3,所以它们在一个特征子空间中
T7
设V是域F上的n维线性空间,A是V上的线性算子. 证明:A在F中有n个互不相同的特征根当且仅当以下两个条件同时满足 (i). A可对角化; (ii). V是A-循环的
先证明充分性,因为A可对角化,故A的Jordan标准型中每一个Jordan块的大小均为一,所以A的极小多项式中每一个不可约元的重数都为1,即
μA=(t−λ1)(t−λ2)⋯(t−λs)
其中λ1,…,λs两两不同,而又因为V是A-循环的,所以deg(μA)=deg(χA)=n,故s=n,从而A有n个互不相同的特征根
再证必要性,如果A有n个互补相同的特征根,则
χA=(t−λ1)(t−λ2)⋯(t−λn)
由Hamilton-Cayley定理,χA的不可约元都是μA的不可约元,从而μA=χA,故V是A-循环的,且A的Jordan标准型中每一个Jordan块的大小均为一,进而A可对角化
T8
设V是n维欧氏空间
(i). 设n=2,e1,e2是V的一组单位正交基,且A∈L(V)由A(e1)=e2,A(e2)=−e1确定,证明A可逆且对任意x∈V有x⊥A(x)
(ii). 设n=3,是否存在V上的可逆线性算子B使得对于任意x∈V,x⊥B(x)?
(i). 设A∗由A(e1)=−e2,A(e2)=e1确定,那么对于任意的v=xe1+ye2∈V,我们有(A∗A)v=A∗(−ye1+xe2)=xe1+ye2=v,从而A∗A=E,故A可逆. 同时又因为(x∣A(x))=(−ye1+xe2∣xe1+ye2)=−yx+xy=0,于是∀x∈V,x⊥A(x)
(ii). 因为χB的次数等于3,所以B有实特征根λ(三次方程一定有一个实根),因为B可逆,所以λ=0,设v为λ对应的特征向量,则
(v∣B(v))=(v∣λv)=λ∥v∥2=0
所以这样的B不存在
或者,设e1,e2,e3为V的一组单位正交基,则B在该基底下的矩阵为B=(bi,j)∈M3(R),因为特别地有ei⊥B(ei),所以bii=0,而对∀v=xe1+ye2+ze3∈V,我们有
v⊥B(v)⟹x(b12y+b13z)+y(b21x+b23z)+z(b31x+b32y)=0
整理后得到(b12+b21)xy+(b13+b31)xz+(b23+b32)yz=0,所以bij+bji=0,从而B是斜对称的,可以计算三阶斜对称矩阵的行列式总是为0,故B不可逆,进而B不存在
T9
(i). 设P是n阶正交矩阵,证明−n≤tr(P)≤n
(ii). 设A,B∈SMn(R)都正定,证明如果A−B正定,那么B−1−A−1正定
(i). 由矩阵乘法的定义(AB)ij=k=1∑ni=1∑mj=1∑sAikBkj,知
n=tr(En)=tr(PPt)=i=1∑n(PPt)ii=i=1∑nj=1∑nPijPjit=i=1∑nj=1∑nPij2
于是我们有
i=1∑nPii2≤i=1∑nj=1∑nPij2=n
由Cauchy不等式
(i=1∑nPii2)(i=1∑n12)≥(i=1∑nPii⋅1)2
即有n⋅n≥(tr(P))2⟹−n≤tr(P)≤n
或者说,因为P是正交矩阵,所以P的列向量都是单位向量,P中的每一个元素的绝对值都不大于1,所以命题得证
(ii). 因为A正定,所以存在P∈GLn(R)使得E=PtAP,D=PtBP,其中D=diag(λ1,…,λn),又因为B正定,所以λ1,…,λn>0. 又因为A−B正定,所以E−D正定,于是
1−λ1,…,1−λn>0⟹0<λi<1,i=1,2,…,n
从而D−1−E=diag(λ11−1,…λn1−1)正定,所以B−1−A=(Pt)−1(D−1−E)P−1正定,命题得证
T10
设A∈Mn(C),它的特征多项式是(t−λ1)d1⋯(t−λs)ds,其中λ1,…,λs∈C两两不同,d1,…,ds≥1,再设k是大于1的正整数
(i). 证明Ak的特征多项式是(t−λ1k)d1⋯(t−λsk)ds
(ii). 再设A与Ak相似,证明A的非零特征值都是单位根,即满足方程zm=1(m∈N∗)的复数根
(i). 设JA的对角线是
d1λ1,…,λ1,…,dsλs,…,λs
因为JA是上三角的,所以JAk的对角线就是
d1λ1k,…,λ1k,…,dskλsk,…,λsk
因为Ak和JAk相似,所以Ak的特征多项式就是JAk的,也就是(t−λ1k)d1⋯(t−λsk)ds
(ii). 由于特征多项式是相似不变量,故而
(t−λ1)d1⋯(t−λs)ds=(t−λ1k)d1⋯(t−λsk)ds
故而左边和右边的特征根一一对应,我们设λi和λjk的对应关系用一个置换σ∈Ss来表示,使得对任意i=1,2,…,s有λi=λσ(i)k,从而我们有
λi=λσ(i)k=λσ2(i)k2=⋯=λσm(i)km=λikm
其中m为σ的阶数,进而λikm−1=1,命题得证
T11
计算J52(0)和J53(0)的Jordan标准型
由T10的(i)我们知道J5(0),J52(0),J53(0)的特征多项式都为t5,而它们的极小多项式分别为t5,t3,t2(J52(0)需要乘三次才能大于等于5次,J53(0)需要乘两次才能大于等于5次),又注意到它们的秩分别为4,3,2,也即是说它们的几何重数分别为1,2,3,进而唯一确定它们的Jordan标准型分别为J5(0),diag(J3(0),J2(0)),diag(J2(0),J2(0),J1(0))
也可以直接通过秩序列公式nℓ=rank(J5ℓ+1(0))+rank(J5ℓ−1(0))−2rank(J5ℓ(0))来求
T12
若A∈L(V)可逆,且W⊂V是A-不变子空间,证明W也是A−1-不变子空间
因为A可逆,所以AW是单射,即kerA={0},则dim(im(A))=dimW−0=dimW,所以im(A)=W,从而AW也是满射,进而AW是双射. 所以对任意w∈W,存在v∈W使得A(v)=w⟹A−1(w)∈W,故W也是A−1-不变子空间
另外,由矩阵求逆的多项式法可知,A−1∈F[A],所以该命题是显然的
T13
设V是域F上的线性空间,A∈L(V). 设p∈F[t]\F使得μA=pkq,其中q∈F[t],且有gcd(p,q)=1,证明ker(p(A)k−1)ker(p(A)k)=ker(p(A)k+1)
因为μA(A)=0,且gcd(p,q)=1,故由核核分解定理
V=ker(pk)⊕ker(q)
设P=ker(pk),Q=ker(q),则P,Q都是A-不变子空间且μAP=pk,μAQ=q(因为这两者显然是AP和AQ的零化多项式,且它们的次数最小,否则它们乘起来就会有比μA次更小的零化A的多项式)
于是ker(p(A)k−1)=ker(p(A)k),因为如果不然pk就不是AP的极小多项式;另一方面,由于pk+1q=pμA自然也零化A且gcd(pk+1,q)=0,故再利用核核分解
V=ker(pk+1)⊕ker(q)
故必然有ker(p(A)k)=ker(p(A)k+1)
T14
设A,B∈Mn(R)证明
(i). 如果A是正交矩阵且det(A)=−1,则−1是A的特征根
(ii). 如果A是正定矩阵且B是斜对称矩阵,则A+B可逆
(i). 因为A正交,所以存在P∈On(R)使得
PtAP=M=diag(N(cosθ1,sinθ1),…,N(cosθs,sinθs),1,…,1,−1,…,−1)
故det(M)=det(PtAP)=det(P−1AP)=det(A)=−1,而det(N(cosα,sinα))=1,故A必有−1作为特征根
(ii). 因为A正定,所以存在P∈GLn(R)使得PtAP=E,从而
det(A+B)=0⟺det(Pt(A+B)P)=0⟺det(E+PtBP)=0
而其中PtBP+(PtBP)t=PtBP+PtBtP=Pt(B+Bt)P=PtOP=O,故PtBP也是斜对称的,故要证明原命题,只需证明对任意B∈SSMn(R),E+B可逆
由于B是斜对称的,所以存在Q∈On(R)使得
QtBQ=M=diag(N(0,β1),…,N(0,βs),0,…,0)
从而
Qt(E+B)Q=Q−1EQ+QtBQ=diag(N(1,β1),…,N(1,βs),1,…,1)
故det(E+B)=det(Qt(E+B)Q)=detN(1,β1)⋯detN(1,βs)≥1,于是E+B可逆, 原命题进而也得证
T15
设A,B∈Mn(R). 证明AB和BA的特征多项式相等; 如果考虑一般域F, 该命题还成立吗
如果B可逆, 则有B(AB)B−1=BA即AB和BA相似, 故它们有相同的特征多项式.
由于可逆矩阵在Mn(R)上是稠密的, 所以存在实数a>0使得对任意的ε∈(0,a), 我们有εE+B可逆, 故而A(εE+B)和(ε+B)A相似, 所以它们拥有相同的特征多项式, 即
det(tE−A(εE+B))=det(tE−(εE+B)A)
注意到上式两侧都是关于ε的多项式, 故而取ε=0时上述等式依然成立, 即AB和BA的特征多项式相等
如果考虑一般域, 命题也是成立的. 这是因为我们设ε∈F, 则εE+B∈Mn(F[ε]), 且det(εE+B)是关于ε的n次多项式, 故而不等于0, ε+B可逆, 所以我们仍然能通过上面的方式证明AB和BA的特征多项式相等
T16
设M∈Mm(F)和N∈Mn(F). 证明(m+n)阶矩阵(MOON)和(NOOM)相似
同一算子在不同基底下的矩阵表示是相似的, 故而上述两个矩阵可以看成某个线性算子在两组基底的交换后的结果, 从而我们容易给出
Q−1(MOON)Q=(NOOM)
其中
Q=(OEnEmO),Q−1=(OEmEnO)
T17
设V是域F上的n维线性空间, A是V上的线性算子. 如果W既是A-循环子空间又是A的一个特征子空间, 计算dim(W)
因为W是A的一个特征子空间, 所以AW是一个数乘算子, 记为AW=λE, 所以它的极小多项式是μAW=t−λ, 又因为W是A-循环的, 所以就有dim(W)=degχAW=degμAW=1
T18
设Rn是标准欧式空间, 其中的向量为列向量. 设v∈Rn是单位向量. 令n阶方阵Hv=E−2vvt, 计算Hv的所有特征根和它们的几何重数
考虑到
Hvv=v−2vvtv=v−2v⋅1=−v
故−1是Hv的特征根. 而由v出发可以得到V的一组单位正交基v,e2,…,en, 则有
Hvei=ei−2vvtei=ei−2v⋅0=ei
所以1也是Hv的特征根, 并且V1=⟨e2,…,en⟩是1的特征子空间, 所以自然有1的几何重数为n−1, 而−1的几何重数为1, 不可能存在其他的特征根
这里的H实际上是Householder矩阵
T19
设A∈Mn(R)是正规矩阵, 证明A和At正交相似
由于A正规, 则存在P∈On(R)使得
PtAP=M=diag(N(α1,β1),…,N(αs,βs),λ2s+1,…,λn)
两边取转置, 则有
PtAtP=Mt=diag(Nt(α1,β1),…,Nt(αs,βs),λ2s+1,…,λn)
要证明A∼oAt, 只需证明M∼oMt, 考虑最小的单位, 容易发现
(−1001)(αβ−βα)(−1001)=(α−ββα)
也就是QtN(α,β)Q=Nt(α,β), 其中Q=(−1901)是正交矩阵, 从而就有QtMQ=Mt, 故M和Mt正交相似, 原命题也得证
T20
设V是域F上的n维线性空间, 且A是V上的线性算子. 如果V是A-循环的, 证明对于任意的A-不变子空间U, 存在p∈F[t]使得U=ker(p(A))
我们取p=μAU, 其中AU∈L(U)是限制在U上的线性算子A, 那么对任意u∈U, 都有p(A)(u)=0, 故有U⊂ker(p(A))
设K=ker(p(A)), 因为V是循环空间, 所以它的所有不变子空间都是循环的, 从而U和K都是A-循环的, 则有dim(U)=deg(μAU)=deg(p)和dim(K)=deg(μAK), 而p是K中的零化多项式, 所以有μAK∣p, 故有deg(μAK)≤deg(p)即dim(K)≤dim(U), 又U⊂K, 所以就有dim(K)=dim(U), 进而K=U