不变子空间

$A$ -不变子空间下的矩阵结构

设 $A \in L (V)$ , $U$ 是 $A$ 的 $d$ 维不变子空间, $0 < d < n$ . 则存在 $V$ 的一组基使得 $A$ 在该基底下的矩阵为

A = (B O C D)

其中 $B \in M_{d} (F)$ 是 $A_{U}$ 的某个矩阵表示, 这是因为当 $A$ 作用于 $e_{1}, \dots, e_{d}$ 时得到的结果不能有关于 $e_{d + 1}, \dots, e_{n}$ 的坐标, 所以坐标是 $(B O)$

以及, 可以看出这个矩阵的 $k$ 次幂具有如下形式

A^{k} = (B^{k} O * D^{k})

其中 $*$ 是某个 $d \times (n - d)$ 的矩阵, 由此我们可以推广到对于任意 $f \in F [t]$ 有

f (A) = (f (B) O * f (D))

所以 $μ_{A} (A) = O_{n \times n}$ 意味着

(μ_{A} (B) O * μ_{A} (D)) = O_{n \times n}

故而我们有 $μ_{A} (B) = O_{d \times d}, μ_{A} (D) = O_{(n - d) \times (n - d)}$ , 并且由整除判别法, $μ_{B} ∣ μ_{A}, μ_{D} ∣ μ_{A}$ 且 $μ_{A_{U}} ∣ μ_{A}$

常见的不变子空间的例子

设 $A \in L (V)$ 满足 $A B = B A$ , 则 $ker (B), im (B)$ 是 $A$ 的不变子空间

特别地, 因为 $F [A]$ 是交换环, 所以有

Note

设 $A \in L (V), f \in F [t]$ . 则 $ker (f (A))$ 和 $im (f (A))$ 都是 $A$ 的不变子空间

更特别地, $ker (A), im (A)$ 是 $A$ 的不变子空间

由 $A \in L (V)$ 和 $v \in V$ 生成的循环子空间 $F [A] \cdot v$ 是 $A$ 的不变子空间, 且是包含 $v$ 的最小的 $A$ -不变子空间

设 $λ \in F$ 是 $A$ 的特征值, 则特征子空间 $V^{λ}$ 是 $A$ 的不变子空间

核核分解及极小多项式版

一般多项式版本

若 $A \in Hom (V, V), f \in F [x]$ 且 $f (A) = O$ , 如果

f = p_{1} \dots p_{m}

其中 $p_{1}, \dots, p_{m} \in F [x]$ 两两互素, 则

V = K_{1} \oplus \dots \oplus K_{m}

其中 $K_{i} = ker (p_{i} (A))$

极小多项式版本

设 $A \in L (V), μ_{A} = p_{1}^{m_{1}} \dots P_{s}^{m_{s}}$ , 其中 $p_{1}, \dots, p_{s} \in F [t] \ F$ 不可约且两两互素, $m_{1}, \dots, m_{s} \in Z^{+}$ , 令

K_{i} = ker (P_{i}^{m_{i}} (A))

则

V = K_{1} \oplus \dots \oplus K_{s}

且 $A ∣_{K_{i}}$ 的极小多项式是 $p_{i}^{m_{i}}$

这就是说, 对 $μ_{A}$ 的不可约因子分解可以看作是对空间的一个划分, 其中每一个空间都是某个因子作用于 $A$ 后的核空间

特征值和特征向量

特征多项式

设 $A \in M_{n} (F), t$ 是 $F$ 上的未定元, 则多项式

det (tE - A) \in F [t]

称为 $A$ 的特征多项式, 记为 $χ_{A} (t)$

特征多项式满足 $χ_{A} (A) = 0$ , 进而由整除判别法, $μ_{A} ∣ χ_{A}$

特征子空间

设 $λ \in F$ 是 $A$ 的特征值, 令

V^{λ} = {x \in V ∣ A (x) = λ x}

称为 $A$ 关于 $λ$ 的特征子空间, 可以验证 $V^{λ}$ 是 $A$ 的不变子空间

由定义, 特征子空间可以写成

V^{λ} = ker (λ E - A)

以下三个结论等价

$A$ 是可对角化的
$V = V^{λ_{1}} + \dots + V^{λ_{k}}$
$V^{λ_{1}} + \dots + V^{λ_{k}}$ 是直和

几何重数和代数重数

我们把 $dim V^{λ}$ 称为 $λ$ 的几何重数, 而把 $λ$ 在 $χ_{A} (t)$ 中的重数称为 $λ$ 的代数重数

$λ$ 的代数重数总是大于等于它的几何重数

对角化条件和方法

判别法

$n$ 个特征向量线性无关（充要）
$n$ 个不同的特征根（充分不必要）
$V$ 是特征子空间的和（充要）
$dim V$ 是特征子空间的维数和（充要）
几何重数等于代数重数（充要）
极小多项式可以分解为两两互素的一次因子之积（充要）

方法

如果 $A$ 可对角化, 那么在对 $V$ 作直和分解 $V = V^{λ_{1}} \oplus \dots \oplus V^{λ_{k}}$ 后得到的一组基下有 $A$ 的矩阵是

λ_{1} E O ⋮ O O λ_{2} E ⋮ O \dots \dots ⋱ \dots O O ⋮ λ_{k} E

这对应了这样的对角化形式

Λ = diag (d_{1} times λ_{1}, \dots, λ_{1}, d_{2} times λ_{2}, \dots, λ_{2}, \dots, d_{k} times λ_{k}, \dots, λ_{k})

其中 $d_{i} = dim V^{λ_{i}}$ , 如果要把 $A$ 写成对角形式我们有变换

A = P^{- 1} Λ P

若设 $e_{1}, \dots, e_{n}$ 是上述直和分解从左往右对应的一组基底, 则由矩阵的基底变换可知有

P = (e_{1}, e_{2}, \dots, e_{n})

性质

如果 $A$ 是可对角化的, 且拥有不同的特征值 $λ_{1}, \dots, λ_{d}$ , 那么 $A$ 的极小多项式就是

μ_{A} = i = 1 \prod d (t - λ_{i})

循环子空间

零化某个向量的极小多项式

设 $A \in L (V), v \in V, f (t) \in F [t]$ . 如果 $f (A) (v) = 0$ , 则称 $f (t)$ 是通过 $A$ 零化 $v$ 的多项式.

非零、次数最小的这样的多项式称为通过 $A$ 零化 $v$ 的极小多项式, 记为 $μ_{A, v}$ , 它通常是首一的.

对任意 $f \in F [t]$ , 我们有 $μ_{A, v} = μ_{A, f (A) v} \cdot g cd (μ_{A, v}, f)$ , 利用这一点, 当我们知道零化 $v$ 的极小多项式时, 就可以很方便地求出零化 $f (A) v$ 的极小多项式

类似于 $dim (F [A]) = de g (μ_{A})$ , 我们有 $dim (F [A] \cdot v) = de g (μ_{A, v})$ , 其中 $F [A] \cdot v$ 表示循环子空间

对 $\forall A \in L (V)$ , 总存在 $v \in V$ 使得 $μ_{A, v} = μ_{A}$ . 也就是说, 总是存在这样一个 $v$ 使得 $f (A) (v) = 0 ⟹ f (A) = O$ (要把它'杀死'就必须先把 $A$ '杀死', 称其为同归于尽向量)

循环子空间的定义

设 $A \in L (V)$ 和 $v \in V$ . 由 $v, A (v), A^{2} (v), \dots$ 生成的子空间被称为由 $A$ 和 $v$ 生成的循环子空间. 记为 $F [A] \cdot v$ , 或者表示成线性轨道的形式 $[v]$

循环子空间包含了任意 $A$ 的多项式在 $v$ 上的作用, 也就是说 $F [A] \cdot v = {p (A) (v) ∣ p (t) \in F [t]}$

特别地, 如果 $v$ 是 $A$ 的特征向量, 则有 $F [A] \cdot v = [v] = ⟨ v ⟩$

设 $A \in L (V), v \in V$ . 如果 $V = F [A] \cdot v$ , 则称 $A$ 是 $V$ 上的循环算子, $v$ 是 $V$ 中的循环向量, $V$ 是关于 $A, v$ 的循环空间, 简称 $A$ -循环空间

Tip

我们可以用任意的 $A \in L (V), v \in V$ 生成一个循环子空间, 当我们选择一个合适的 $v$ 使得这个循环子空间就是 $V$ 本身时, 我们才能称 $V$ 是 $A$ -循环空间

循环子空间的性质

$V$ 是 $A$ -循环的当且仅当 $μ_{A} = χ_{A}$

$F [A] \cdot v$ 是 $A$ -不变的, 因为 $F [A] \cdot v$ 自然包含了所有对 $A$ 的多项式作用的结果, 它自然是 $A$ 封闭的

循环空间的所有不变子空间都是循环空间

循环子空间的维数和 $A$ 的零化 $v$ 的极小多项式的次数一致, 即 $dim (F [A] \cdot v) = de g μ_{A, v}$

如果 $V = F [A] \cdot v$ 是循环空间, 则 $dim (V) = de g μ_{A, v}$ , 又 $de g μ_{A} \leq de g χ_{A} = dim (V)$ 且 $μ_{A, v} ∣ μ_{A} ⟹ de g (μ_{A, v}) \leq de g (μ_{A})$ , 故有 $dim (V) = de g μ_{A, v} = de g μ_{A}$ , 且 $μ_{A, v} = μ_{A}$

反过来, 若设 $d = de g μ_{A}$ 则存在 $v \in V$ 使得

dim (F [A] \cdot v) = d

且不存在维数大于 $d$ 的 $A$ -循环子空间, 也就是说, 有 $A, v$ 生成的循环子空间的最大维数就是 $A$ 的极小多项式的次数

空间分划

不可分子空间分解

判定规则

设 $A \in L (V)$ , $U$ 是 $A$ -子空间, 则 $U$ 是 $A$ -不可分的当且仅当下述两个条件都成立

$U$ 是 $A$ -循环子空间
$μ_{A_{U}}$ 是 $F [t]$ 中某个不可约多项式的幂次. 特别地, 在 $F = C$ 也就是复数域上时, $μ_{A_{U}}$ 应当为某个一次多项式的幂次, 及 $μ_{A_{U}} (t) = (t - λ)^{m}$

Tip

由此可知, $A$ -不可分子空间一定是 $A$ -循环的, 不可分的条件比循环更强

不可分子空间直和分解

设 $A \in L (V)$ . 则存在 $A$ -不可分子空间 $W_{1}, \dots, W_{k}$ 使得

V = W_{1} \oplus \dots \oplus W_{k}

且 $W_{i}$ 是 $A$ -循环的, $μ_{A_{W_{i}}}$ 是 $F [t]$ 中的某个不可约多项式的幂次, $i = 1, 2, \dots, k$

同样地, 如果 $F = C$ , 则 $μ_{A_{W_{i}}} = (t - λ_{i})^{d_{i}}$ , 其中 $d_{i} = dim (W_{i})$ , 从而 $A_{W_{i}}$ 在 $W_{i}$ 上的某一个矩阵表示是一个Jordan块 $J_{d_{i}} (λ)$

分解在多项式作用下的不变性

设 $A \in L (V), f \in F [t]$ , 设 $V$ 的 $A$ -不可分子空间直和分解为

V = U_{1} \oplus \dots \oplus U_{ℓ}

则

f (A) (V) = f (A) (U_{1}) \oplus \dots \oplus f (A) (U_{ℓ})

Jordan标准型

Jordan块

设 $A \in L (V)$ . 则 $V$ 是 $A$ -不可分的当且仅当存在 $λ \in C$ 使得极小多项式 $μ_{A} = (t - λ)^{n}$ . 此时, $A$ 在 $V$ 的某组基下的矩阵是

J_{n} (λ) = λ 00 ⋮ 00 1 λ 0 ⋮ 00 01 λ ⋮ 00 \dots \dots \dots ⋱ \dots \dots 000 ⋮ λ 0 000 ⋮ 1 λ

我们称此矩阵为关于 $λ$ 的 $n$ 阶Jordan块

事实上, 满足 $P^{- 1} A P = J_{n} (λ)$ 的那个转移矩阵 $P$ 为

P = (ϵ_{1}, \dots, ϵ_{n})

其中 $ϵ_{j} = (A - λ E)^{n - j} (v)$ , 且 $v$ 满足 $V = F [A] \cdot v$ . 或者说 $v \in K_{λ}$ 是特征值 $λ$ 对应的一个广义特征向量, 而 $ϵ_{1}, \dots, ϵ_{n}$ 代表了 $v$ 的一个广义特征向量循环

由矩阵的基底变换可知有 $J_{n} (λ) = P^{- 1} A P ⟹ A = P J_{n} (λ) P^{- 1}$

Jordan块的基本性质如下

如果 $λ \neq = 0$ ,则 $rank (J_{n} (λ)) = n$ , 而 $rank (J_{n} (0)) = n - 1$
$J_{n} (λ) = λ E_{n} + J_{n} (0)$
$J_{n} (λ)$ 的极小多项式和特征多项式都等于 $(t - λ)^{n}$ , 从而把 $J_{n} (λ)$ 看成 $C^{n}$ 上的算子后, $C^{n}$ 是 $J_{n} (λ)$ -循环的
$J_{n} (λ)$ 的唯一特征值为 $λ$ , 从而对应的特征子空间的维数为 $1$ , 这是因为

J_{n} (λ) - λ E_{n} = J_{n} (0)

于是

J_{n} (λ) v ⟹ dim V^{λ} = λ v ⟹ J_{n} (0) v = 0 = dim ker J_{n} (0) = n - (n - 1) = 1

$J_{n} (λ)$ 可对角化当且仅当 $n = 1$
$J_{n}^{t} (λ) = B^{- 1} J_{n} (λ) B = B J_{n} (λ) B^{- 1}$ , 其中

B = 00 ⋮ 01 00 ⋮ 10 \dots \dots ⋱ \dots \dots 01 ⋮ 00 10 \dots 00

低阶矩阵 $J_{A}$ 的求法

一般方法

给定一个 $F$ 上的线性空间 $V$ 和一个定义在其上的线性算子 $A \in L (V)$ , 我们可以对 $V$ 作不可分子空间直和分解

V = W_{1} \oplus \dots \oplus W_{k}

其中每一个 $W_{i}$ 都是 $A$ -不可分子空间, 这个性质等价于一下两条的联立:

$W_{i}$ 是 $A$ -循环子空间
设 $A_{i} = A_{W_{i}}$ 为把 $A$ 的定义域限制在 $W_{i}$ 上的新算子, 则 $A_{i}$ 的极小多项式 $μ_{i} = μ_{A_{i}}$ 是 $F [t]$ 中某个不可约多项式的幂次

我们称这里的每一个 $μ_{i}$ 为 $A$ 的一个初等因子, 这些 $μ_{i}$ 是可以重复的, 所以我们通过一个重集来将这些初等因子放在一起, 称为 $A$ 关于上述不可分因子直和分解的初等因子组, 记为 ${μ_{1}, \dots, μ_{k}}$

考虑每一个初等因子 $p^{m}$ , 其中 $p$ 是 $F [t]$ 中的一个不可约元, 它们都对应着一个Jordan块 $J_{m} (λ)$ , 其中Jordan块的大小 $m$ 就是 $p$ 在该初等因子中的重数, 而 $λ$ 则是 $p (λ) = 0$ 的解. 如果 $λ$ 不唯一或者不存在, 我们这样的 $A$ 的Jordan标准型就有可能不存在, 具体细节不在此讨论

假设相同的初等因子 $p^{m}$ 在初等因子组中出现了 $n$ 次, 在最后的Jordan标准型中 $J_{m} (λ)$ 也就相应地出现了 $n$ 次

把这些 $J_{n} (λ)$ 在对角线上排列后（无所谓顺序）得到的大矩阵就是 $A$ 的Jordan标准型 $J_{A}$ , 也就是

J_{A} = diag (J_{n_{1}} (λ_{1}), \dots, J_{n_{k}} (λ_{k}))

所以要计算Jordan标准型, 关键就是要确定这些初等因子, 也就是

有哪些可能的初等因子 $p^{m}$
每一种初等因子分别出现了几次

对第一个问题, 我们只需要计算 $A$ 对应的矩阵表示 $A$ 的特征多项式, 根据Hamilton-Cayley定理加强版, $A$ 的特征多项式和极小多项式具有相同的不可约因子, 而由于 $μ_{A_{i}} ∣ μ_{A}$ , 所以 $μ_{i} = μ_{A_{i}}$ 的全部不可约因子都可以在 $χ_{A}$ 中找到, 且 $χ_{A}$ 中的每一个不可约因子都是某个 $μ_{i}$ 的不可约因子

对于第二个问题, 如果我们已经找到了所有可能的 $p$ , 我们就可以利用一个递推公式来计算 $p^{m}$ 在初等因子组中出现的次数

我们设从 $χ_{A}$ 找到的所有不可约因子为 $p_{1}, \dots, p_{s}$ , 且设 $de g p_{i} = d_{i}$ , 那么 $p_{i}^{ℓ}$ 在初等因子组中出现的次数 $N (i, ℓ)$ 为

N (i, ℓ) = \frac{1}{d _{i}} (R (i, ℓ - 1) + R (i, ℓ + 1) - 2 R (i, ℓ))

其中 $R (i, j) = rank (p_{i}^{j} (A)), j \in N$ , 这给出了计算Jordan标准型的一般方法

复数域的情况

我们来具体讨论复数域上的特例, 因为 $C [t]$ 中的不可约因子都是一次的, 所以这时候初等因子的形式为 $μ_{i} = (t - λ_{i})^{m_{i}}$ , 其中 $m_{i} = dim (W_{i})$ , 这是因为 $W_{i}$ 是循环空间, 所以 $μ_{i}$ 和 $A_{i}$ 的特征多项式 $χ_{i}$ 相同, 又 $χ_{A}$ 的次数等于 $W_{i}$ 的维数, 所以 $de g (μ_{i}) = dim (W_{i})$

对于每一个特征根 $λ_{i}$ , $(t - λ_{i})^{ℓ}$ 出现的次数为

N (i, ℓ) = R (i, ℓ - 1) + R (i, ℓ + 1) - 2 R (i, ℓ)

其中 $R (i, j) = rank ((A - λ_{i} E)^{j})$ .

利用更多的信息

上面的计算对于高阶矩阵来说比较麻烦, 所以我们考虑是否有其他的信息能帮助我们更方便地确定Jordan标准型的形式

我们可以直接从 $A$ 的矩阵表示求出 $χ_{A}$ , 上面的标准算法中我们只利用了 $χ_{A}$ 的不可约因子, 而没有利用它们对于的重数（也就是所谓的代数重数）, 考虑所有初等因子的乘积

p_{μ} = μ_{1} \dots μ_{n}

由于 $W_{i}$ 都是循环的, 所以 $de g (μ_{i}) = de g (χ_{i}) = dim (W_{i})$ , 根据直和的性质, 我们知道 $de g (p_{μ}) = i \sum de g (μ_{i}) = i \sum dim (W_{i}) = dim (V) = de g (χ_{A})$ , 而又由于 $μ_{i} ∣ μ_{A} = χ_{A}$ , 所以 $p_{μ} ∣ χ_{A}$ , 这两者又恰好维数相等, 故而

χ_{A} = μ_{1} \dots μ_{n}

这说明了 $χ_{A}$ 中每个不可约因子 $(t - λ_{i})$ 的重数就是每个 $λ_{i}$ 的Jordan块的大小的和, 也就是对应的 $λ_{i}$ 在Jordan标准型的对角线上出现的次数

如果我们还知道极小多项式 $μ_{A}$ , 我们就得到了每一个 $p = t - λ$ 在 $μ_{A}$ 中的重数, 事实上, 由于 $μ_{i} ∣ μ_{A}$ , 故我们有

μ_{A} = lcm (μ_{1}, \dots, μ_{n})

从而如果某个 $t - λ$ 在 $μ_{A}$ 的重数 $m$ , 那么必然存在一个初等因子 $(t - λ)^{m}$

以上两个新增信息可以帮我们快速确定一些矩阵的Jodran标准型, 例如

已知复方阵 $A$ 的特征多项式和极小多项式分别为

χ_{A} μ_{A} = (t - 1)^{4} (t + 1)^{3} t^{2} = (t - 1)^{3} (t + 1)^{3} t^{2}

对于特征值 $1$ , 其代数重数为 $4$ , 则知 $1$ 在对角线上出现了 $4$ 次；而由于 $t - 1$ 在 $μ_{A}$ 中的重数为 $3$ , 则知存在一个 $J_{3} (1)$ , 且这是最大的 $1$ 的Jordan块

所以只能有一种情况, 就是存在两个关于 $1$ 的Jordan块 $J_{3} (1), J_{1} (1)$

对于特征值 $- 1$ 和 $0$ , 同理知道它们对应的Jordan块只能是 $J_{3} (- 1); J_{2} (0)$

综上

A \sim diag (J_{1} (1), J_{3} (1), J_{3} (- 1), J_{2} (0))

矩阵相似的判断

有共同的初等因子组

设 $A \in M_{n} (C)$ , 在不计Jordan块出现的顺序的前提下, $A$ 的Jordan标准型由A的初等因子组唯一确定

设 $A, B \in M_{n} (F)$ , 则 $A \sim_{s} B$ 当且仅当 $A$ 和 $B$ 有共同的初等因子组

相等多项式和秩

设 $A, B \in M_{n} (F)$ , 则 $A \sim_{s} B$ 当且仅当下述两点同时成立

$χ_{A} = χ_{B}$ 或 $μ_{A} = μ_{B}$
设 $p_{1}, \dots, p_{s}$ 是 $χ_{A}$ 或 $μ_{A}$ 在 $F [t]$ 中两两互素的（首一的）不可约因子, 且

\forall i \in {0, 1, \dots, n + 1}, j \in {1, 2, \dots, s}, rank (p_{j} (A)^{i}) = rank (p_{j} (B)^{i})

任意多项式下秩相等

设 $A, B \in M_{n} (F)$ , 则 $A \sim_{s} B$ 当且仅当对任意 $f \in F [t], rank (f (A)) = rank (f (B))$

欧式空间

向量代数和内积运算

内积

设 $f (x, y)$ 是 $V$ 上的对称双线性型满足 $f (x, x)$ 是正定的, 则称 $(V, f)$ 是一个欧式空间, $f$ 是 $V$ 上的内积, 记 $f (x, y) = (x ∣ y)$

内积的基本性质如下

双线性: 对任意的 $x, y, x \in V, α, β \in R$ ,

(α x + β y ∣ z) = α (x ∣ z) + β (y ∣ z), (x ∣ α y + β z) = α (x ∣ y) + β (x ∣ z)

对称性: 对任意 $x, y \in V, (x ∣ y) = (y ∣ x)$
正定性: 对任意 $x \in V$

(x ∣ x) \geq 0 且 (x ∣ x) = 0 ⟺ x = 0

长度

设 $V$ 是欧式空间, $x \in V$ . 称 $(x ∣ x)$ 是 $x$ 的长度, 记为 $∥ x ∥$ . 再设 $y \in V$ . 则 $∥ x - y ∥$ 称为 $x$ 到 $y$ 之间的距离

（Cauchy-Bunyakovsky不等式）设 $x, y \in V$ , 则

∣ (x ∣ y) ∣ \leq ∥ x ∥∥ y ∥

特别地 $∣ (x ∣ y) ∣ = ∥ x ∥∥ y ∥$ 当且仅当 $x, y$ 线性相关

在 $R^{n}$ 上, 该不等式的形式是

∣ x_{1} y_{1} + \dots + x_{n} y_{n} ∣ \leq x_{1}^{2} + \dots + x_{n}^{2} y_{1}^{2} + \dots + y_{n}^{2}

在 $M_{n} (R)$ 上, 该不等式的形式是

tr (A^{t} B) \leq tr (A^{t} A) tr (B^{t} B)

夹角和正交

设 $x, y \in V \ {0}$ , 称

arccos (\frac{( x ∣ y )}{∥ x ∥∥ y ∥})

是 $x, y$ 的夹角, 其通常的取值范围为 $[0, π]$

设 $x, y \in V$ . 如果 $(x ∣ y) = 0$ , 则称 $x$ 和 $y$ 正交, 记为 $x ⊥ y$

设 $x, x_{1}, \dots, x_{k} \in V$ ,其中 $x_{1}, \dots, x_{k}$ 非零, 则

$x ⊥ x ⟺ x = 0$
如果 $x_{1}, \dots, x_{k}$ 两两正交, 则它们线性无关

（勾股定理）设 $x, y \in V$ , 则 $x ⊥ y$ 当且仅当

∥ x + y ∥^{2} = ∥ x ∥^{2} + ∥ y ∥^{2}

Gram-Schmidt正交化

正交化

设 $dim (V) = n, e_{1}, \dots, e_{n}$ 是 $V$ 中两两正交的单位向量, 则称它们为 $V$ 的一组单位正交基

设 $v_{1}, \dots, v_{k} \in V$ 线性无关, 则存在两两正交的单位向量 $ϵ_{1}, \dots, ϵ_{k}$ 使得

⟨ v_{1}, \dots, v_{i} ⟩ = ⟨ ϵ_{1}, \dots, ϵ_{i} ⟩

其中 $i = 1, 2, \dots, k$ . 特别地, $V$ 有单位正交基

可以利用如下递推式构造 $ϵ_{i}$ ,

ϵ_{i}^{'} = v_{i} - (v_{i} ∣ ϵ_{1}) ϵ_{1} - \dots - (v_{i} ∣ ϵ_{i - 1}) ϵ_{i - 1} ⟹ ϵ_{i} = \frac{ϵ _{i}^{'}}{∥ ϵ _{i}^{'} ∥}

正交基的性质

内积的形式

设 $V$ 的一组单位正交基是 $e_{1}, \dots, e_{n}, x, y \in V$ 在这组基下的坐标分别是 $(x_{1}, \dots, x_{n})^{t}$ 和 $(y_{1}, \dots, y_{n})^{t}$ , 则有

(x ∣ y) = x_{1} y_{1} + \dots + x_{n} y_{n}

内积取坐标分量

设 $V$ 的一组单位正交基是 $e_{1}, \dots, e_{n}, x \in V$ . 则 $x$ 在该基下的第 $i$ 个坐标分量为 $(x ∣ e_{i})$ , $i = 1, 2, \dots, n$

维数相等的欧式空间线性同构且保持内积不变

设 $V, W$ 是两个 $n$ -维欧式空间, 其中的内积分别记为 $(∣)_{V}$ 和 $(∣)_{W}$ , 则存在线性同构 $ϕ : V \to W$ 满足对任意 $x, y \in V$

(x ∣ y)_{V} = (ϕ (x) ∣ ϕ (y))_{W}

正交投影和正交补

设 $v \in V \ {0}, x \in V$ ,称

(x ∣ \frac{v}{∥ v ∥}) \frac{v}{∥ v ∥}

为 $x$ 在 $v$ 上的投影

设 $v \in V \ {0}, x \in V$ , $y$ 是 $x$ 在 $v$ 上的投影, 则 $(v - y) ⊥ y$

设 $X, Y \subset V$ . 如果对任意的 $x \in X$ 和 $y \in Y$ 都有 $x ⊥ y$ , 则称 $X$ 和 $Y$ 正交, 记为 $X ⊥ Y$ . 特别地, 当 $X = {x}$ 时, 则 $X ⊥ Y$ 也记为 $x ⊥ Y$

设 $U \subset V$ 是子空间, $x \in V$ , 则存在唯一的 $u \in U$ 使得 $(x - u) ⊥ U$ , 称这里的 $u$ 是 $x$ 在子空间 $U$ 上的正交投影. 特别地, 向量 $x$ 在 $v \in V \ {0}$ 上的投影就是 $x$ 在 $⟨ v ⟩$ 上的正交投影

我们记 $x$ 在子空间 $U$ 上的正交投影为 $π_{U} (x)$

在上面的例子中 $u = π_{U} (x)$ , 此时考虑 $\forall y \in U$ , 容易证明 $∥ x - u ∥ \leq ∥ x - y ∥$ , 故我们称 $∥ x - π_{U} (x) ∥$ 成为 $x$ 到 $W$ 的距离, 记为 $d (x, W)$

设 $U \subset V$ 是子空间, 令 $U^{⊥} : = {x \in V ∣ x ⊥ U}$ , 则

$U^{⊥}$ 是子空间且 $U ⊥ U^{⊥}$
$V = U \oplus U^{⊥}$ , 故称 $U^{⊥}$ 是 $U$ 的正交补
$(U^{⊥})^{⊥} = U$ , 这是 $(2)$ 的直接推论

由第 $(2)$ 点我们知道, 设 $e_{1}, \dots, e_{d}$ 是 $V$ 中的单位正交向量, 则 $e_{1}, \dots, e_{d}$ 可以扩充为 $V$ 的一组单位正交基, 比如说, 设标准欧式空间 $R^{3}$ 的标准基为 $e_{1}, e_{2}, e_{3}$ , 则有

⟨ e_{1} ⟩^{⊥} = ⟨ e_{2}, e_{3} ⟩, ⟨ e_{1} ⟩^{⊥⊥} = ⟨ e_{2}, e_{3} ⟩^{⊥} = ⟨ e_{1} ⟩

正交和正规

正交矩阵

设 $P \in GL_{n} (R)$ . 如果 $P^{t} = P^{- 1}$ , 则称 $P$ 是正交矩阵. 所有 $n$ 阶正交矩阵的集合记为 $O_{n} (R)$

集合 $O_{n} (R)$ 是 $GL_{n} (R)$ 的子群

正交矩阵有如下性质

如果 $P \in O_{n} (R)$ , 则 $det (P) = \pm 1$ , 这说明了正交矩阵是一个旋转矩阵或者是一个反射矩阵
$P \in O_{n} (R)$ 当且仅当 $P$ 的列向量是标准欧式空间 $R^{n}$ 中的一组单位正交基
$P \in O_{n} (R)$ 当且仅当 $P$ 的行向量是标准欧式空间 $R^{1 \times n}$ 中的一组单位正交基

特别地, $P \in O_{2} (R)$ 当且仅当存在 $θ$ 使得

P = (cos θ sin θ - sin θ cos θ) or P = (cos θ sin θ sin θ - cos θ)

前面这种行列式为 $1$ , 代表旋转；后面这种行列式为 $- 1$ , 代表反射

设欧式空间 $V$ 由基 $e_{1}, \dots, e_{n}$ 和 $ϵ_{1}, \dots, ϵ_{n}$ , 矩阵 $P \in GL_{n} (R)$ 满足

(ϵ_{1}, \dots, ϵ_{n}) = (e_{1}, \dots, e_{n}) P

再设 $e_{1}, \dots, e_{n}$ 是单位正交基, 则 $ϵ_{1}, \dots, ϵ_{n}$ 是单位正交基当且仅当 $P \in O_{n} (R)$

正交等价

设 $A, B \in M_{n} (R)$ . 如果存在 $P \in O_{n} (R)$ 使得 $B = P^{- 1} A P$ , 则称 $A$ 与 $B$ 正交等价（或正交相似）, 记为 $A \sim_{o} B$

可以验证, $\sim_{o}$ 是等价关系. 且若 $A \sim_{o} B$ , 则由 $A \sim_{s} B$ 且 $A \sim_{c} B$ , 这是因为正交矩阵的逆和转置相等. 由此可得, 矩阵的相似不变量和合同不变量都是正交等价的不变量. 但是反之不然, 不能用合同等价及相似等价同时成立推出正交等价

在正交等价下, 可以同时用 $B = P^{- 1} A P$ 和 $B = P^{t} A P$ 来表示基底变换

伴随算子

设 $A \in L (V)$ , 如果算子 $B \in L (V)$ 满足对任意 $x, y \in V$ 都有 $(A (x) ∣ y) = (x ∣ B (y))$ , 则称 $B$ 是 $A$ 的伴随算子（Adjoint Operator）

设 $A \in L (V)$ , 则 $A$ 的伴随算子存在且唯一. 如果 $A$ 在 $V$ 的单位正交基 $e_{1}, \dots, e_{n}$ 下的矩阵等于 $A$ , 则其伴随算子在该基下的矩阵等于 $A^{t}$

我们把 $A$ 的伴随算子记为 $A^{*}$

正规算子

Tip

我们只在 $V = R^{n}$ 时讨论正规算子

设 $A \in L (V)$ , 如果 $A A^{*} = A^{*} A$ , 则称 $A$ 是正规算子（Normal Operator）, 类似地, 设 $A \in M_{n} (R)$ , 如果 $A A^{t} = A^{t} A$ , 则称 $A$ 是正规矩阵（Normal Matrix）

特别地, 若 $A A^{*} = E$ , 则称 $A$ 是正交算子（Orthogonal Operator）

由定义, 设 $A \in L (V)$ , $A$ 在 $V$ 的单位正交基 $e_{1}, \dots, e_{n}$ 下的矩阵为 $A$ , 则 $A$ 正规当且仅当 $A$ 正规

设 $A \in L (V)$ , 如果 $A^{*} = A$ , 则称 $A$ 是对称算子（Symmetric Operator）, 如果 $A^{*} = - A$ , 则称 $A$ 是斜对称算子（Skew-symmetrix Operator） . 由此可知, 对称和斜对称算子都是正规算子, 对称和斜对称矩阵都是正规矩阵

Tip

正交矩阵是正规矩阵, 这是因为设 $P \in O_{n} (R)$ , 则有 $P^{t} P = E = P P^{t}$

正规算子的保内性

设 $A \in L (V)$ , 如果对于任意 $x, y \in V$

(x ∣ y) = (A (x) ∣ A (y))

则称 $A$ 是保内(积)的（preserve the inner product）

若 $A$ 在 $V$ 的单位正交基 $e_{1}, \dots, e_{n}$ 下的矩阵为 $A$ , 则下列断言等价

$A$ 保内
$A \in O_{n} (R)$
对任意 $x \in V, ∥ x ∥ = ∥ A (x) ∥$ （保长）
对任意 $x, y \in V, ∥ x - y ∥ = ∥ A (x) - A (y) ∥$ （保距离）上述等价命题说明了正交矩阵的"旋转"性质, 且保内算子是正规算子, 也称为正交（保长, 保距）算子, 因为正交算子一定是正规算子

正交标准型

正规矩阵的标准型

设 $dim (V) = 1$ , 则任意的 $A \in L (V)$ 都是正规算子, 这是因为对 $V$ 中的单位向量 $v$ , $A (v) = λ v$ , 其中 $λ$ 是某个实数

设 $dim (V) = 2, A \in L (V)$ 正规, 且 $V$ 是 $A$ -不可分的（在可分的情形下 $A$ 可以通过一维形式的直和得到）, 则 $A$ 在 $V$ 的任意单位正交基下的矩阵式

A = (α β - β α)

其中 $α, β \in R$ 且 $β \neq = 0$

设 $A \in L (V)$ 正规, 则存在 $V$ 的一组单位正交基 $e_{1}, \dots, e_{n}$ 和 $α_{1}, β_{1}, \dots, α_{s}, β_{s}, λ_{2 s + 1}, λ_{n} \in R$ , 其中 $β_{1}, \dots, β_{s} \neq = 0$ , 使得 $A$ 在这组基下的矩阵等于

B = N (α_{1}, β_{1}) ⋱ N (α_{s}, β_{s}) λ_{2 s + 1} ⋱ λ_{n}

其中

N (α, β) = (α β - β α)

也就是说, 存在如上这样一个标准型 $B$ 使得 $A$ 正交等价于 $B$ , 即 $A \sim_{o} B$ , 弱化这个结论就是有 $A$ 相似于 $B$ , 即 $A \sim_{s} B$

实对称矩阵的标准型

求解该对角矩阵的算法

计算 $A$ 的特征根, 设互不相同的特征根是 $λ_{1}, \dots, λ_{k}$
对 $i \in {1, 2, \dots, k}$ , 求 $V^{λ_{i}}$ 的一组基
对 $i \in {1, 2, \dots, k}$ , 利用Gram-Schmidt正交化求 $V^{λ_{i}}$ 的一组单位正交基 $e_{i, 1}, \dots, e_{i, d_{i}}$
由此得到的 $e_{1, 1}, \dots, e_{1, d_{1}}, \dots, e_{k, 1}, \dots, e_{k, d_{k}}$ 是 $V$ 的一组单位正交基, 且在该基下 $A$ 是对角的

例如, 设

A = 011 - 1 10 - 1 1 1 - 1 01 - 1 110 \in SM_{4} (R)

则可计算 $χ_{A} (t) = (t - 1)^{3} (t + 3) ⟹ λ_{1} = 1, λ_{2} = - 3$ , 由于 $4 = dim V^{λ_{1}} + dim V^{λ_{2}}$ 且 $dim V^{λ_{2}}$ 至少为 $1$ 且其最大值为 $λ_{2}$ 的代数重数也为 $1$ , 故 $dim V^{λ_{2}} = 1, dim V^{λ_{1}} = 3$ , (事实上, 由于 $A$ 是可对角化的, 故 $λ_{1}$ 的代数重数必然等于其几何重数), 考虑到

V^{λ_{1}} = ker (λ_{1} E - A) = ker 1 - 1 - 1 1 - 1 11 - 1 - 1 11 - 1 1 - 1 - 1 1

只需要考虑方程

x_{1} - x_{2} - x_{3} + x_{4} = 0

的解空间即可, 直接得出

V^{λ_{1}} = ⟨ 1100, 0011, 100 - 1 ⟩

再计算 $V^{λ_{2}}$ , 因为 $V^{λ_{1}} ⊥ V^{λ_{2}}$ 且 $R^{4} = V^{λ_{1}} \oplus V^{λ_{2}}$ , 所以 $V^{λ_{2}}$ 为 $V^{λ_{1}}$ 的正交补, 由于上述方程已经给出了

(1, - 1, - 1, 1) \cdot (x_{1}, x_{2}, x_{3}, x_{4}) = 0

故

V^{λ_{2}} = ⟨ 1 - 1 - 1 1 ⟩

利用Gram-Schmidt正交化可分别求出 $V^{λ_{1}}, V^{λ_{2}}$ 的单位正交基

ϵ_{1} = \frac{1}{2} (1, 1, 0, 0)^{t}, ϵ_{2} = \frac{1}{2} (0, 0, 1, 1)^{t}, ϵ_{3} = \frac{1}{2} (1, - 1, 1, - 1)^{t}; ϵ_{4} = \frac{1}{2} (1, - 1, - 1, 1)^{t}

故

P = \frac{1}{2} \frac{1}{2} 00 00 \frac{1}{2} \frac{1}{2} \frac{1}{2} - \frac{1}{2} \frac{1}{2} - \frac{1}{2} \frac{1}{2} - \frac{1}{2} - \frac{1}{2} \frac{1}{2}

我们得到 $P^{t} A P = diag (1, 1, 1, - 3)$

惯性指数的求法

设 $A \in SM_{n} (R)$ , 则 $A$ 的正（负）惯性指数等于 $spec (A)$ 中正（负）根的个数（在记重数的意义下）, 特别地, $A$ （半）正定当且仅当 $A$ 的特征根都是正的（非负的）

特别地, 设 $A, B \in SM_{n} (R)$ 且 $A$ 正定, 则存在 $P \in GL_{n} (R)$ 使得 $P^{t} A P = E$ 和 $P^{t} BP$ 是对角阵, 这是因为

由于 $A$ 正定, 所以存在 $P_{1} \in GL_{n} (R)$ 使得 $P_{1}^{t} A P_{1} = E$
令 $C = P_{1}^{t} B P_{1}$ , 则 $C$ 也对称, 故存在 $P_{2} \in O_{n} (R)$ 使得 $D = P_{2}^{t} C P_{2}$ 是对角阵
令 $P = P_{1} P_{2}$ , 则 $P^{t} BP = P_{2}^{t} C P_{2} = D$ 且

P_{2} \in O_{n} (R) ⟹ P^{t} A P = P_{2}^{t} E P_{2} = P_{2}^{t} P_{2} = E

由此可以证明对于正定矩阵

det (A + B) \geq det (A) + det (B)

由于存在 $P \in G L_{n} (R)$ 使得 $P^{t} A P = E, P^{t} BP = diag (α_{1}, \dots, α_{n})$ , 于是

P^{t} (A + B) P = diag (1 + α_{1}, \dots, 1 + α_{n})

两边取行列式有

det (P)^{2} det (A + B) = i = 1 \prod n (1 + α_{i})

而

det (P)^{2} (det (A) + det (B)) = det (P^{t} A P) + det (P^{t} BP) = 1 + i = 1 \prod n α_{i}

因为 $B$ 正定, 所以 $α_{1}, \dots, α_{n} \in R^{+}$ , 于是 $\prod (1 + α_{i}) \geq 1 + \prod α_{i}$ , 故命题得证

斜对称矩阵的标准型

设 $A \in L (V)$ 斜对称, 则存在 $β_{1}, \dots, β_{s} \in R \ {0}$ , 使得 $A$ 在 $V$ 的某组单位正交基下的矩阵为

M = N (0, β_{1}) ⋱ N (0, β_{s}) 0 ⋱ 0

设 $A \in SSM_{n} (R)$ , 则 $A$ 正交相似于上述形式的矩阵

实斜对称矩阵和欧式空间上的斜对称算子的特征根或者是纯虚数, 或者等于 $0$

正交矩阵的标准型

设 $A \in L (V)$ 正交, 则存在 $θ_{1}, \dots, θ_{s} \in (0, π) \cup (π, 2 π)$ 和 $λ_{2 s + 1}, \dots, λ_{n} \in {- 1, 1}$ 使得 $A$ 在 $V$ 的某组单位正交基下的矩阵为

M = N (cos θ_{1}, sin θ_{1}) ⋱ N (cos θ_{s}, sin θ_{s}) λ_{2 s + 1} ⋱ λ_{n}

设 $A \in O_{n} (R)$ , 则 $A$ 正交相似于上述形式的矩阵 $M$

正交矩阵和正交算子的（复）特征根的模长都等于 $1$

必考题

给定具体的矩阵, 计算特征多项式, 特征值和特征子空间, 并判断是否可以对角化

Hamilton-Cayley定理

确定低阶矩阵的Jordan标准型

Gram-Schmidt正交化, 正交补的构造

计算正交矩阵的标准型

例题

T1

设复数矩阵 $A = 100010 a 01$ . 计算 $A$ 的特征多项式和Jordan标准型.

由于 $tE - A$ 为上三角矩阵, 故 $χ_{A} = det (tE - A) = (t - 1)^{3}$ , 考虑到

A - E = 000000 a 00, (A - E)^{2} = 000000000

故若 $a = 0$ , 则 $μ_{A} = t - 1$ , 那么最大的Jordan块是一阶的, 所以 $J_{A} = diag (1, 1, 1)$ 若 $a \neq = 0$ , 则 $μ_{A} = (t - 1)^{2}$ , 那么最大的Jordan块是二阶的, 所以 $J_{A} = diag (J_{1} (1), J_{2} (1))$

T2

设复数方阵 $A$ 的特征多项式是 $(t - 2)^{2} (t + 3)^{3}$ . (i). 设 $A$ 的极小多项式是 $(t - 2)^{2} (t + 3)^{2}$ . 计算 $A$ 的Jordan标准型 (ii). 设 $rank (A - 2 E) = 3, rank (A + 3 E) = 4$ , 计算 $A$ 的Jordan标准型和极小多项式

(i). 由特征多项式我们知道 $J_{A}$ 的对角线上出现了两个 $2$ 和三个 $- 3$ , 又根据极小多项式存在 $J_{2} (2)$ 和 $J_{2} (- 3)$ , 故 $J_{A} = diag (J_{2} (2), J_{2} (- 3), J_{1} (- 3))$

(ii). 注意到几何重数的定义 $m_{λ} = dim V^{λ} = dim ker (A - λ E) = n - rank (A - λ E)$ , 从而我们知道 $2$ 的几何重数为 $5 - 3 = 2$ 和 $- 3$ 的几何重数 $5 - 4 = 1$ , 所以我们有两个 $J (2)$ 和一个 $J (- 3)$ , 故 $J_{A}$ 只能为 $J_{A} = diag (J_{1} (2), J_{1} (2), J_{3} (- 3))$ , 其中最大的 $2$ 的Jordan块是 $1$ 阶的, 而最大的 $- 3$ 的Jordan块是 $3$ 阶的, 故 $μ_{A} = (t - 2) (t + 3)^{3}$

T3

设标准欧式空间 $R^{3}$ 中的子空间 $U$ 是方程 $x_{1} - x_{2} + x_{3}$ 的解空间. (i). 计算 $U$ 的正交补 $U^{⊥}$ 的一组基 (ii). 计算 $R^{3}$ 的一组单位正交基 $u_{1}, u_{2}, u_{3}$ , 其中 $u_{1}, u_{2} \in U$ 且 $u_{3} \in U^{⊥}$

(i). 由题意, $U$ 中所有的元素 $(x_{1}, x_{2}, x_{3})^{T}$ 都满足

x_{1} - x_{2} + x_{3} = 0 ⟺ (1, - 1, 1) \cdot (x_{1}, x_{2}, x_{3}) = 0

于是 $U^{⊥} = ⟨ 1 - 1 1 ⟩$ (ii). 先直接写出 $u_{3} = \frac{1}{3} (1, - 1, 1)^{T}$ . 接着我们再来求解 $U$ 的一组基, 不妨直接用 $x_{1}, x_{3}$ 来表示 $x_{2}$ 即 $x_{2} = x_{1} + x_{3}$ , 由此我们容易写出 $U$ 的一组基为

v_{1} = (1, 1, 0)^{T}, v_{2} = (0, 1, 1)^{T}

考虑Gram-Schmidt正交化, 有

u_{1}^{'} = (1, 1, 0)^{T} ⟹ u_{1} = \frac{1}{2} (1, 1, 0)^{T} u_{2}^{'} = v_{2} - (v_{2} ∣ u_{1}) u_{1} = (0, 1, 1)^{T} - \frac{1}{2} (1, 1, 0)^{T} = (- \frac{1}{2}, \frac{1}{2}, 1)^{T}

从而有

u_{1} = \frac{1}{2} (1, 1, 0)^{T}, u_{2} = \frac{1}{6} (- 1, 1, 2)^{T}, u_{3} = \frac{1}{3} (1, - 1, 1)^{T}

T4

设实对称矩阵 $A = 0 - 1 1 - 1 - 1 0 - 1 1 1 - 1 0 - 1 - 1 1 - 1 0$ , 已知 $A$ 的特征多项式为 $(t - 3) (t + 1)^{3}$ , 计算正交矩阵 $P$ 和对角矩阵 $D$ 使得 $P^{t} A P = D$

我们需要计算 $V^{3}$ 和 $V^{- 1}$ , 显然后者好看一些, 考虑矩阵

A + E = 1 - 1 1 - 1 - 1 1 - 1 1 1 - 1 1 - 1 - 1 1 - 1 1

容易看出 $rank (A + E) = 1$ , 从而 $dim V^{- 1} = 4 - 1 = 3, dim V^{3} = 4 - 3 = 1$ , 而 $A + E$ 的第一行就直接告诉我们了 $V^{3}$ 的一个基底

V^{3} = ⟨ (1, - 1, 1, - 1)^{T} ⟩

考虑 $x_{1} - x_{2} + x_{3} - x_{4} = 0$ , 把 $x_{1}, x_{2}, x_{3}$ 作为自由变量, 则写出 $V^{- 1}$ 的一组基（先省略转置）

v_{1} = (1, 0, 0, 1), v_{2} = (0, 1, 0, - 1), v_{3} = (0, 0, 1, 1)

然后正交化

e_{1}^{'} = v_{1} = (1, 0, 0, 1) ⟹ e_{1} = \frac{1}{2} (1, 0, 0, 1) e_{2}^{'} = v_{2} - (v_{2} ∣ e_{1}) e_{1} = (0, 1, 0, - 1) - (- \frac{1}{2}) (1, 0, 0, 1) = (\frac{1}{2}, 1, 0, - \frac{1}{2}) ⟹ e_{2} = \frac{1}{6} (1, 2, 0, - 1) e_{3}^{'} = v_{3} - (v_{3} ∣ e_{1}) e_{1} - (v_{3} ∣ e_{2}) e_{2} = (0, 0, 1, 1) - \frac{1}{2} (1, 0, 0, 1) + \frac{1}{6} (1, 2, 0, - 1) = (- \frac{1}{3}, \frac{1}{3}, 1, \frac{1}{3}) ⟹ e_{3} = \frac{1}{2 3} (- 1, 1, 3, 1)

故而我们有

P = \frac{1}{2} 00 \frac{1}{2} \frac{1}{6} \frac{2}{6} 0 - \frac{1}{6} - \frac{1}{2 3} \frac{1}{2 3} \frac{3}{2 3} \frac{1}{2 3} \frac{1}{2} - \frac{1}{2} \frac{1}{2} - \frac{1}{2}

从而 $P^{t} A P = diag (- 1, - 1, - 1, 3)$

T5

设 $P = (cos θ sin θ sin θ - cos θ), Q = (01 - 1 0)$ 和 $A = (P O O Q)$ . 计算 $A$ 的极小多项式和 $A^{2023}$

$A$ 的极小多项式为 $μ_{P}$ 和 $μ_{Q}$ 的乘积, 我们直接计算 $χ_{P} = t^{2} - 1, χ_{Q} = t^{2} + 1$ , 而 $μ_{P}, μ_{Q}$ 显然都不能是一次的, 故 $μ_{P} = χ_{P} = t^{2} - 1, μ_{Q} = χ_{Q} = t^{2} + 1$ , 从而 $μ_{A} = μ_{P} μ_{Q} = t^{4} - 1$ 由对角分块矩阵的性质有 $A^{2023} = (P^{2023} O O Q^{2023})$ , 而 $P^{2} = E, Q^{2} = - E$ , 从而

A^{2023} = (P O O - Q)

T6

设 $V$ 是域 $F$ 上的有限维线性空间, $A$ 是 $V$ 上的线性算子, $v_{1}$ 和 $v_{2}$ 是 $A$ 的两个线性无关的特征向量. 证明: $v_{1} + v_{2}$ 是 $A$ 的特征向量 $⟺ v_{1}, v_{2}$ 在同一个特征子空间中

右边推左边是显然的, 故我们来证明左边推右边, 设 $A v_{1} = λ_{1} v_{1}, A v_{2} = λ_{2} v_{2}$ 和 $A (v_{1} + v_{2}) = λ_{3} (v_{1} + v_{2})$ , 第三个式子减去前面两个式子就有

(λ_{3} - λ_{1}) v_{1} + (λ_{3} - λ_{2}) v_{2} = 0

由于 $v_{1}, v_{2}$ 线性无关, 故 $λ_{1} = λ_{2} = λ_{3}$ , 所以它们在一个特征子空间中

T7

设 $V$ 是域 $F$ 上的 $n$ 维线性空间, $A$ 是 $V$ 上的线性算子. 证明: $A$ 在 $F$ 中有 $n$ 个互不相同的特征根当且仅当以下两个条件同时满足 (i). $A$ 可对角化; (ii). $V$ 是 $A$ -循环的

先证明充分性, 因为 $A$ 可对角化, 故 $A$ 的Jordan标准型中每一个Jordan块的大小均为一, 所以 $A$ 的极小多项式中每一个不可约元的重数都为 $1$ , 即

μ_{A} = (t - λ_{1}) (t - λ_{2}) \dots (t - λ_{s})

其中 $λ_{1}, \dots, λ_{s}$ 两两不同, 而又因为 $V$ 是 $A$ -循环的, 所以 $de g (μ_{A}) = de g (χ_{A}) = n$ , 故 $s = n$ , 从而 $A$ 有 $n$ 个互不相同的特征根

再证必要性, 如果 $A$ 有 $n$ 个互补相同的特征根, 则

χ_{A} = (t - λ_{1}) (t - λ_{2}) \dots (t - λ_{n})

由Hamilton-Cayley定理, $χ_{A}$ 的不可约元都是 $μ_{A}$ 的不可约元, 从而 $μ_{A} = χ_{A}$ , 故 $V$ 是 $A$ -循环的, 且 $A$ 的Jordan标准型中每一个Jordan块的大小均为一, 进而 $A$ 可对角化

T8

设 $V$ 是 $n$ 维欧氏空间 (i). 设 $n = 2$ , $e_{1}, e_{2}$ 是 $V$ 的一组单位正交基, 且 $A \in L (V)$ 由 $A (e_{1}) = e_{2}, A (e_{2}) = - e_{1}$ 确定, 证明 $A$ 可逆且对任意 $x \in V$ 有 $x ⊥ A (x)$ (ii). 设 $n = 3$ , 是否存在 $V$ 上的可逆线性算子 $B$ 使得对于任意 $x \in V$ , $x ⊥ B (x)$ ?

(i). 设 $A^{*}$ 由 $A (e_{1}) = - e_{2}, A (e_{2}) = e_{1}$ 确定, 那么对于任意的 $v = x e_{1} + y e_{2} \in V$ , 我们有 $(A^{*} A) v = A^{*} (- y e_{1} + x e_{2}) = x e_{1} + y e_{2} = v$ , 从而 $A^{*} A = E$ , 故 $A$ 可逆. 同时又因为 $(x ∣ A (x)) = (- y e_{1} + x e_{2} ∣ x e_{1} + y e_{2}) = - y x + x y = 0$ , 于是 $\forall x \in V, x ⊥ A (x)$

(ii). 因为 $χ_{B}$ 的次数等于 $3$ , 所以 $B$ 有实特征根 $λ$ （三次方程一定有一个实根）, 因为 $B$ 可逆, 所以 $λ \neq = 0$ , 设 $v$ 为 $λ$ 对应的特征向量, 则

(v ∣ B (v)) = (v ∣ λ v) = λ ∥ v ∥^{2} \neq = 0

所以这样的 $B$ 不存在

或者, 设 $e_{1}, e_{2}, e_{3}$ 为 $V$ 的一组单位正交基, 则 $B$ 在该基底下的矩阵为 $B = (b_{i, j}) \in M_{3} (R)$ , 因为特别地有 $e_{i} ⊥ B (e_{i})$ , 所以 $b_{ii} = 0$ , 而对 $\forall v = x e_{1} + y e_{2} + z e_{3} \in V$ , 我们有

v ⊥ B (v) ⟹ x (b_{12} y + b_{13} z) + y (b_{21} x + b_{23} z) + z (b_{31} x + b_{32} y) = 0

整理后得到 $(b_{12} + b_{21}) x y + (b_{13} + b_{31}) x z + (b_{23} + b_{32}) yz = 0$ , 所以 $b_{ij} + b_{ji} = 0$ , 从而 $B$ 是斜对称的, 可以计算三阶斜对称矩阵的行列式总是为 $0$ , 故 $B$ 不可逆, 进而 $B$ 不存在

T9

(i). 设 $P$ 是 $n$ 阶正交矩阵, 证明 $- n \leq tr (P) \leq n$ (ii). 设 $A, B \in SM_{n} (R)$ 都正定, 证明如果 $A - B$ 正定, 那么 $B^{- 1} - A^{- 1}$ 正定

(i). 由矩阵乘法的定义 $(A B)_{ij} = k = 1 \sum n i = 1 \sum m j = 1 \sum s A_{ik} B_{kj}$ , 知

n = tr (E_{n}) = tr (P P^{t}) = i = 1 \sum n (P P^{t})_{ii} = i = 1 \sum n j = 1 \sum n P_{ij} P_{ji}^{t} = i = 1 \sum n j = 1 \sum n P_{ij}^{2}

于是我们有

i = 1 \sum n P_{ii}^{2} \leq i = 1 \sum n j = 1 \sum n P_{ij}^{2} = n

由Cauchy不等式

(i = 1 \sum n P_{ii}^{2}) (i = 1 \sum n 1^{2}) \geq (i = 1 \sum n P_{ii} \cdot 1)^{2}

即有 $n \cdot n \geq (tr (P))^{2} ⟹ - n \leq tr (P) \leq n$

或者说, 因为 $P$ 是正交矩阵, 所以 $P$ 的列向量都是单位向量, $P$ 中的每一个元素的绝对值都不大于 $1$ , 所以命题得证

(ii). 因为 $A$ 正定, 所以存在 $P \in GL_{n} (R)$ 使得 $E = P^{t} A P, D = P^{t} BP$ , 其中 $D = diag (λ_{1}, \dots, λ_{n})$ , 又因为 $B$ 正定, 所以 $λ_{1}, \dots, λ_{n} > 0$ . 又因为 $A - B$ 正定, 所以 $E - D$ 正定, 于是

1 - λ_{1}, \dots, 1 - λ_{n} > 0 ⟹ 0 < λ_{i} < 1, i = 1, 2, \dots, n

从而 $D^{- 1} - E = diag (\frac{1}{λ _{1}} - 1, \dots \frac{1}{λ _{n}} - 1)$ 正定, 所以 $B^{- 1} - A = (P^{t})^{- 1} (D^{- 1} - E) P^{- 1}$ 正定, 命题得证

T10

设 $A \in M_{n} (C)$ , 它的特征多项式是 $(t - λ_{1})^{d_{1}} \dots (t - λ_{s})^{d_{s}}$ , 其中 $λ_{1}, \dots, λ_{s} \in C$ 两两不同, $d_{1}, \dots, d_{s} \geq 1$ , 再设 $k$ 是大于 $1$ 的正整数 (i). 证明 $A^{k}$ 的特征多项式是 $(t - λ_{1}^{k})^{d_{1}} \dots (t - λ_{s}^{k})^{d_{s}}$ (ii). 再设 $A$ 与 $A^{k}$ 相似, 证明 $A$ 的非零特征值都是单位根, 即满足方程 $z^{m} = 1 (m \in N^{*})$ 的复数根

(i). 设 $J_{A}$ 的对角线是

d_{1} λ_{1}, \dots, λ_{1}, \dots, d_{s} λ_{s}, \dots, λ_{s}

因为 $J_{A}$ 是上三角的, 所以 $J_{A}^{k}$ 的对角线就是

d_{1} λ_{1}^{k}, \dots, λ_{1}^{k}, \dots, d_{s}^{k} λ_{s}^{k}, \dots, λ_{s}^{k}

因为 $A^{k}$ 和 $J_{A}^{k}$ 相似, 所以 $A^{k}$ 的特征多项式就是 $J_{A}^{k}$ 的, 也就是 $(t - λ_{1}^{k})^{d_{1}} \dots (t - λ_{s}^{k})^{d_{s}}$

(ii). 由于特征多项式是相似不变量, 故而

(t - λ_{1})^{d_{1}} \dots (t - λ_{s})^{d_{s}} = (t - λ_{1}^{k})^{d_{1}} \dots (t - λ_{s}^{k})^{d_{s}}

故而左边和右边的特征根一一对应, 我们设 $λ_{i}$ 和 $λ_{j}^{k}$ 的对应关系用一个置换 $σ \in S_{s}$ 来表示, 使得对任意 $i = 1, 2, \dots, s$ 有 $λ_{i} = λ_{σ (i)}^{k}$ , 从而我们有

λ_{i} = λ_{σ (i)}^{k} = λ_{σ^{2} (i)}^{k^{2}} = \dots = λ_{σ^{m} (i)}^{k^{m}} = λ_{i}^{k^{m}}

其中 $m$ 为 $σ$ 的阶数, 进而 $λ_{i}^{k^{m} - 1} = 1$ , 命题得证

T11

计算 $J_{5}^{2} (0)$ 和 $J_{5}^{3} (0)$ 的Jordan标准型

由T10的(i)我们知道 $J_{5} (0), J_{5}^{2} (0), J_{5}^{3} (0)$ 的特征多项式都为 $t^{5}$ , 而它们的极小多项式分别为 $t^{5}, t^{3}, t^{2}$ （ $J_{5}^{2} (0)$ 需要乘三次才能大于等于 $5$ 次, $J_{5}^{3} (0)$ 需要乘两次才能大于等于 $5$ 次）, 又注意到它们的秩分别为 $4, 3, 2$ , 也即是说它们的几何重数分别为 $1, 2, 3$ , 进而唯一确定它们的Jordan标准型分别为 $J_{5} (0), diag (J_{3} (0), J_{2} (0)), diag (J_{2} (0), J_{2} (0), J_{1} (0))$

也可以直接通过秩序列公式 $n_{ℓ} = rank (J_{5}^{ℓ + 1} (0)) + rank (J_{5}^{ℓ - 1} (0)) - 2 rank (J_{5}^{ℓ} (0))$ 来求

T12

若 $A \in L (V)$ 可逆, 且 $W \subset V$ 是 $A$ -不变子空间, 证明 $W$ 也是 $A^{- 1}$ -不变子空间

因为 $A$ 可逆, 所以 $A_{W}$ 是单射, 即 $ker A = {0}$ , 则 $dim (im (A)) = dim W - 0 = dim W$ , 所以 $im (A) = W$ , 从而 $A_{W}$ 也是满射, 进而 $A_{W}$ 是双射. 所以对任意 $w \in W$ , 存在 $v \in W$ 使得 $A (v) = w ⟹ A^{- 1} (w) \in W$ , 故 $W$ 也是 $A^{- 1}$ -不变子空间

另外, 由矩阵求逆的多项式法可知, $A^{- 1} \in F [A]$ , 所以该命题是显然的

T13

设 $V$ 是域 $F$ 上的线性空间, $A \in L (V)$ . 设 $p \in F [t] \ F$ 使得 $μ_{A} = p^{k} q$ , 其中 $q \in F [t]$ , 且有 $g cd (p, q) = 1$ , 证明 $ker (p (A)^{k - 1})  ker (p (A)^{k}) = ker (p (A)^{k + 1})$

因为 $μ_{A} (A) = 0$ , 且 $g cd (p, q) = 1$ , 故由核核分解定理

V = ker (p^{k}) \oplus ker (q)

设 $P = ker (p^{k}), Q = ker (q)$ , 则 $P, Q$ 都是 $A$ -不变子空间且 $μ_{A_{P}} = p^{k}, μ_{A_{Q}} = q$ （因为这两者显然是 $A_{P}$ 和 $A_{Q}$ 的零化多项式, 且它们的次数最小, 否则它们乘起来就会有比 $μ_{A}$ 次更小的零化 $A$ 的多项式）

于是 $ker (p (A)^{k - 1}) \neq = ker (p (A)^{k})$ , 因为如果不然 $p^{k}$ 就不是 $A_{P}$ 的极小多项式；另一方面, 由于 $p^{k + 1} q = p μ_{A}$ 自然也零化 $A$ 且 $g cd (p^{k + 1}, q) = 0$ , 故再利用核核分解

V = ker (p^{k + 1}) \oplus ker (q)

故必然有 $ker (p (A)^{k}) = ker (p (A)^{k + 1})$

T14

设 $A, B \in M_{n} (R)$ 证明 (i). 如果 $A$ 是正交矩阵且 $det (A) = - 1$ , 则 $- 1$ 是 $A$ 的特征根 (ii). 如果 $A$ 是正定矩阵且 $B$ 是斜对称矩阵, 则 $A + B$ 可逆

(i). 因为 $A$ 正交, 所以存在 $P \in O_{n} (R)$ 使得

P^{t} A P = M = diag (N (cos θ_{1}, sin θ_{1}), \dots, N (cos θ_{s}, sin θ_{s}), 1, \dots, 1, - 1, \dots, - 1)

故 $det (M) = det (P^{t} A P) = det (P^{- 1} A P) = det (A) = - 1$ , 而 $det (N (cos α, sin α)) = 1$ , 故 $A$ 必有 $- 1$ 作为特征根 (ii). 因为 $A$ 正定, 所以存在 $P \in GL_{n} (R)$ 使得 $P^{t} A P = E$ , 从而

det (A + B) \neq = 0 ⟺ det (P^{t} (A + B) P) \neq = 0 ⟺ det (E + P^{t} BP) \neq = 0

而其中 $P^{t} BP + (P^{t} BP)^{t} = P^{t} BP + P^{t} B^{t} P = P^{t} (B + B^{t}) P = P^{t} OP = O$ , 故 $P^{t} BP$ 也是斜对称的, 故要证明原命题, 只需证明对任意 $B \in SSM_{n} (R)$ , $E + B$ 可逆

由于 $B$ 是斜对称的, 所以存在 $Q \in O_{n} (R)$ 使得

Q^{t} BQ = M = diag (N (0, β_{1}), \dots, N (0, β_{s}), 0, \dots, 0)

从而

Q^{t} (E + B) Q = Q^{- 1} EQ + Q^{t} BQ = diag (N (1, β_{1}), \dots, N (1, β_{s}), 1, \dots, 1)

故 $det (E + B) = det (Q^{t} (E + B) Q) = det N (1, β_{1}) \dots det N (1, β_{s}) \geq 1$ , 于是 $E + B$ 可逆, 原命题进而也得证

T15

设 $A, B \in M_{n} (R)$ . 证明 $A B$ 和 $B A$ 的特征多项式相等; 如果考虑一般域 $F$ , 该命题还成立吗

如果 $B$ 可逆, 则有 $B (A B) B^{- 1} = B A$ 即 $A B$ 和 $B A$ 相似, 故它们有相同的特征多项式.

由于可逆矩阵在 $M_{n} (R)$ 上是稠密的, 所以存在实数 $a > 0$ 使得对任意的 $ε \in (0, a)$ , 我们有 $εE + B$ 可逆, 故而 $A (εE + B)$ 和 $(ε + B) A$ 相似, 所以它们拥有相同的特征多项式, 即

det (tE - A (εE + B)) = det (tE - (εE + B) A)

注意到上式两侧都是关于 $ε$ 的多项式, 故而取 $ε = 0$ 时上述等式依然成立, 即 $A B$ 和 $B A$ 的特征多项式相等

如果考虑一般域, 命题也是成立的. 这是因为我们设 $ε \in F$ , 则 $εE + B \in M_{n} (F [ε])$ , 且 $det (εE + B)$ 是关于 $ε$ 的 $n$ 次多项式, 故而不等于 $0$ , $ε + B$ 可逆, 所以我们仍然能通过上面的方式证明 $A B$ 和 $B A$ 的特征多项式相等

T16

设 $M \in M_{m} (F)$ 和 $N \in M_{n} (F)$ . 证明 $(m + n)$ 阶矩阵 $(M O O N)$ 和 $(N O O M)$ 相似

同一算子在不同基底下的矩阵表示是相似的, 故而上述两个矩阵可以看成某个线性算子在两组基底的交换后的结果, 从而我们容易给出

Q^{- 1} (M O O N) Q = (N O O M)

其中

Q = (O E_{n} E_{m} O), Q^{- 1} = (O E_{m} E_{n} O)

T17

设 $V$ 是域 $F$ 上的 $n$ 维线性空间, $A$ 是 $V$ 上的线性算子. 如果 $W$ 既是 $A$ -循环子空间又是 $A$ 的一个特征子空间, 计算 $dim (W)$

因为 $W$ 是 $A$ 的一个特征子空间, 所以 $A_{W}$ 是一个数乘算子, 记为 $A_{W} = λ E$ , 所以它的极小多项式是 $μ_{A_{W}} = t - λ$ , 又因为 $W$ 是 $A$ -循环的, 所以就有 $dim (W) = de g χ_{A_{W}} = de g μ_{A_{W}} = 1$

T18

设 $R^{n}$ 是标准欧式空间, 其中的向量为列向量. 设 $v \in R^{n}$ 是单位向量. 令 $n$ 阶方阵 $H_{v} = E - 2 v v^{t}$ , 计算 $H_{v}$ 的所有特征根和它们的几何重数

考虑到

H_{v} v = v - 2 v v^{t} v = v - 2 v \cdot 1 = - v

故 $- 1$ 是 $H_{v}$ 的特征根. 而由 $v$ 出发可以得到 $V$ 的一组单位正交基 $v, e_{2}, \dots, e_{n}$ , 则有

H_{v} e_{i} = e_{i} - 2 v v^{t} e_{i} = e_{i} - 2 v \cdot 0 = e_{i}

所以 $1$ 也是 $H_{v}$ 的特征根, 并且 $V^{1} = ⟨ e_{2}, \dots, e_{n} ⟩$ 是 $1$ 的特征子空间, 所以自然有 $1$ 的几何重数为 $n - 1$ , 而 $- 1$ 的几何重数为 $1$ , 不可能存在其他的特征根

这里的 $H$ 实际上是Householder矩阵

T19

设 $A \in M_{n} (R)$ 是正规矩阵, 证明 $A$ 和 $A^{t}$ 正交相似

由于 $A$ 正规, 则存在 $P \in O_{n} (R)$ 使得

P^{t} A P = M = diag (N (α_{1}, β_{1}), \dots, N (α_{s}, β_{s}), λ_{2 s + 1}, \dots, λ_{n})

两边取转置, 则有

P^{t} A^{t} P = M^{t} = diag (N^{t} (α_{1}, β_{1}), \dots, N^{t} (α_{s}, β_{s}), λ_{2 s + 1}, \dots, λ_{n})

要证明 $A \sim_{o} A^{t}$ , 只需证明 $M \sim_{o} M^{t}$ , 考虑最小的单位, 容易发现

(- 1 0 01) (α β - β α) (- 1 0 01) = (α - β β α)

也就是 $Q^{t} N (α, β) Q = N^{t} (α, β)$ , 其中 $Q = (- 1 9 01)$ 是正交矩阵, 从而就有 $Q^{t} MQ = M^{t}$ , 故 $M$ 和 $M^{t}$ 正交相似, 原命题也得证

T20

设 $V$ 是域 $F$ 上的 $n$ 维线性空间, 且 $A$ 是 $V$ 上的线性算子. 如果 $V$ 是 $A$ -循环的, 证明对于任意的 $A$ -不变子空间 $U$ , 存在 $p \in F [t]$ 使得 $U = ker (p (A))$

我们取 $p = μ_{A_{U}}$ , 其中 $A_{U} \in L (U)$ 是限制在 $U$ 上的线性算子 $A$ , 那么对任意 $u \in U$ , 都有 $p (A) (u) = 0$ , 故有 $U \subset ker (p (A))$

设 $K = ker (p (A))$ , 因为 $V$ 是循环空间, 所以它的所有不变子空间都是循环的, 从而 $U$ 和 $K$ 都是 $A$ -循环的, 则有 $dim (U) = de g (μ_{A_{U})} = de g (p)$ 和 $dim (K) = de g (μ_{A_{K}})$ , 而 $p$ 是 $K$ 中的零化多项式, 所以有 $μ_{A_{K}} ∣ p$ , 故有 $de g (μ_{A_{K}}) \leq de g (p)$ 即 $dim (K) \leq dim (U)$ , 又 $U \subset K$ , 所以就有 $dim (K) = dim (U)$ , 进而 $K = U$

Lin's Notes Garden

Explorer

Linear Algebra 24 Spring Final

不变子空间

A-不变子空间下的矩阵结构

常见的不变子空间的例子

核核分解及极小多项式版

一般多项式版本

极小多项式版本

特征值和特征向量

特征多项式

特征子空间

几何重数和代数重数

对角化条件和方法

判别法

方法

性质

循环子空间

零化某个向量的极小多项式

循环子空间的定义

循环子空间的性质

空间分划

不可分子空间分解

判定规则

不可分子空间直和分解

分解在多项式作用下的不变性

Jordan标准型

Jordan块

低阶矩阵JA​的求法

一般方法

复数域的情况

利用更多的信息

矩阵相似的判断

有共同的初等因子组

相等多项式和秩

任意多项式下秩相等

欧式空间

向量代数和内积运算

内积

长度

夹角和正交

Gram-Schmidt正交化

正交化

正交基的性质

内积的形式

内积取坐标分量

维数相等的欧式空间线性同构且保持内积不变

正交投影和正交补

正交和正规

正交矩阵

正交等价

伴随算子

正规算子

正规算子的保内性

正交标准型

正规矩阵的标准型

实对称矩阵的标准型

惯性指数的求法

斜对称矩阵的标准型

正交矩阵的标准型

必考题

给定具体的矩阵, 计算特征多项式, 特征值和特征子空间, 并判断是否可以对角化

Hamilton-Cayley定理

确定低阶矩阵的Jordan标准型

Gram-Schmidt正交化, 正交补的构造

计算正交矩阵的标准型

例题

T1

T2

T3

T4

T5

T6

T7

T8

T9

T10

T11

T12

T13

$A$ -不变子空间下的矩阵结构

低阶矩阵 $J_{A}$ 的求法