线性代数是数学的一个分支,研究线性方程组、向量空间、线性变换和矩阵等概念和性质。它在各个科学领域和工程应用中起着重要的作用。
线性代数主要涉及以下内容:
向量和向量空间:研究向量的运算、线性组合、线性无关、基和维度等概念,以及向量空间的性质和子空间。
线性方程组:研究线性方程组的解集、解的存在唯一性、齐次方程组和非齐次方程组等。
矩阵和行列式:研究矩阵的运算、矩阵的秩、逆矩阵,并且行列式是矩阵的一个重要性质。
线性变换:研究线性变换的定义、线性变换的表示和矩阵乘法。
特征值与特征向量:研究矩阵的特征值和特征向量的定义、计算方法以及它们在线性代数中的应用。
线性代数在计算机图形学、机器学习、信号处理、物理学、经济学等领域都有广泛应用。它提供了一种数学工具和思维方式,用于描述和解决实际问题中的线性关系。
摘自MOOC东南大学和同济大学《线性代数》
矩阵
矩阵及其运算
矩阵(Matrix)的概念 : m × n m×n m × n 矩阵是指下列数表
( a 11 a 12 ⋯ a 1 n a 21 a 22 ⋯ a 2 n ⋮ ⋮ ⋱ ⋮ a m 1 a m 2 ⋯ a m n ) \begin{pmatrix}
a_{11}&a_{12}&\cdots&a_{1n} \\
a_{21}&a_{22}&\cdots&a_{2n} \\
\vdots&\vdots&\ddots&\vdots \\
a_{m1}&a_{m2}&\cdots&a_{mn} \\
\end{pmatrix}
⎝ ⎜ ⎜ ⎜ ⎛ a 1 1 a 2 1 ⋮ a m 1 a 1 2 a 2 2 ⋮ a m 2 ⋯ ⋯ ⋱ ⋯ a 1 n a 2 n ⋮ a m n ⎠ ⎟ ⎟ ⎟ ⎞
矩阵常用大写字母表示,如A A A 或A m × n A_{m× n} A m × n ,有时也记 ( a i j ) (a_{ij}) ( a i j ) 或( a i j ) m × n (a_{ij})_{m× n} ( a i j ) m × n 。
其中a i j a_{ij} a i j 叫做矩阵A A A 中的( i , j ) (i,j) ( i , j ) 元素 (entry)。
根据矩阵的元素所属的数域,可以将矩阵分为复矩阵和实矩阵。
几种特殊的矩阵
(1) 两个矩阵A = ( a i j ) m × n , B = ( a i j ) s × t A=(a_{ij})_{m× n},B=(a_{ij})_{s× t} A = ( a i j ) m × n , B = ( a i j ) s × t ,若m = s , n = t m=s,n=t m = s , n = t ,则A A A 与B B B 是同型矩阵 (Homomorphic matrix)。
(2) 元素全为零的矩阵称为零矩阵 (zero matrix),记作O m × n O_{m× n} O m × n 或O O O
(3) 行矩阵和列矩阵:1 × n 1× n 1 × n 型矩阵( a 1 , a 2 , ⋯ , a n ) (a_1,a_2,\cdots,a_n) ( a 1 , a 2 , ⋯ , a n ) 只有一行,称为行矩阵(row matrix)或行向量。m × 1 m× 1 m × 1 型矩阵( a 1 a 2 ⋮ a n ) \begin{pmatrix}a_1\\ a_2\\ \vdots \\ a_n\end{pmatrix} ⎝ ⎜ ⎜ ⎜ ⎛ a 1 a 2 ⋮ a n ⎠ ⎟ ⎟ ⎟ ⎞ 只有一列,称为列矩阵(column matrix)或列向量。
(4) 行数和列数相等的矩阵为n阶方阵 (n-order square matrix)或n阶矩阵。
几种特殊的方阵
(1) 上三角矩阵 (upper triangular matrix)与下三角矩阵 ,未显示部分都为0。
( a 11 a 12 ⋯ a 1 n a 22 ⋯ a 2 n ⋱ ⋮ a n n ) \begin{pmatrix}
a_{11}&a_{12}&\cdots&a_{1n} \\
&a_{22}&\cdots&a_{2n} \\
&&\ddots&\vdots \\
&&&a_{nn} \\
\end{pmatrix}\quad ⎝ ⎜ ⎜ ⎜ ⎛ a 1 1 a 1 2 a 2 2 ⋯ ⋯ ⋱ a 1 n a 2 n ⋮ a n n ⎠ ⎟ ⎟ ⎟ ⎞ 与( a 11 a 21 a 22 ⋮ ⋮ ⋱ a n 1 a n 2 ⋯ a n n ) \quad\begin{pmatrix}
a_{11}&&& \\
a_{21}&a_{22}&& \\
\vdots&\vdots&\ddots& \\
a_{n1}&a_{n2}&\cdots&a_{nn} \\
\end{pmatrix} ⎝ ⎜ ⎜ ⎜ ⎛ a 1 1 a 2 1 ⋮ a n 1 a 2 2 ⋮ a n 2 ⋱ ⋯ a n n ⎠ ⎟ ⎟ ⎟ ⎞
(2) 对角阵 (diagonal matrix):记作 d i a g ( a 11 , a 22 , ⋯ , a n n ) \mathrm{diag}(a_{11},a_{22},\cdots,a_{nn}) d i a g ( a 1 1 , a 2 2 , ⋯ , a n n ) ,当a 11 = a 22 = ⋯ = a n n a_{11}=a_{22}=\cdots=a_{nn} a 1 1 = a 2 2 = ⋯ = a n n 时,称为数量矩阵 (scalar matrix),未显示部分都为0。
( a 11 a 22 ⋱ a n n ) \begin{pmatrix}
a_{11} \\
&a_{22} \\
&&\ddots \\
&&&a_{nn} \\
\end{pmatrix} ⎝ ⎜ ⎜ ⎛ a 1 1 a 2 2 ⋱ a n n ⎠ ⎟ ⎟ ⎞
(3) 对角阵 d i a g ( 1 , 1 , ⋯ , 1 ) \mathrm{diag}(1,1,\cdots,1) d i a g ( 1 , 1 , ⋯ , 1 ) 称为单位阵 (identity matrix),记作E n E_n E n 或I n I_n I n
(4) 对称阵 (symmetric matrix)与反对称阵 (skew-symmetric matrix):n阶方阵A = ( a i j ) n × n A=(a_{ij})_{n× n} A = ( a i j ) n × n ,若a i j = a j i a_{ij}=a_{ji} a i j = a j i ,称为n阶对称阵,若a i j = − a j i a_{ij}=-a_{ji} a i j = − a j i 称为n阶反对称阵。
矩阵的线性运算 (Matrix Algebra)
(1) 同型矩阵A = ( a i j ) m × n 与 B = ( b i j ) m × n A=(a_{ij})_{m× n}与B=(b_{ij})_{m× n} A = ( a i j ) m × n 与 B = ( b i j ) m × n ,如果他们的元对应相等a i j = b i j a_{ij}=b_{ij} a i j = b i j ,则称矩阵A A A 与B B B 相等,记作A = B A=B A = B
(2) 矩阵的加法: 同型矩阵A = ( a i j ) m × n 与 B = ( b i j ) m × n A=(a_{ij})_{m× n}与B=(b_{ij})_{m× n} A = ( a i j ) m × n 与 B = ( b i j ) m × n ,A + B = ( a i j + b i j ) m × n A+B=(a_{ij}+b_{ij})_{m× n} A + B = ( a i j + b i j ) m × n
A + O = A A+O=A A + O = A
A + B = B + A A+B=B+A A + B = B + A
( A + B ) + C = A + ( B + C ) (A+B)+C=A+(B+C) ( A + B ) + C = A + ( B + C )
(3) 矩阵的数乘:数k k k 与矩阵A = ( a i j ) m × n A=(a_{ij})_{m× n} A = ( a i j ) m × n ,k A = ( k a i j ) m × n kA=(ka_{ij})_{m× n} k A = ( k a i j ) m × n
( k + l ) A = k A + l A , k ( A + B ) = k A + k B (k+l)A=kA+lA,\quad k(A+B)=kA+kB ( k + l ) A = k A + l A , k ( A + B ) = k A + k B
( k l ) A = k ( l A ) = l ( k A ) (kl)A=k(lA)=l(kA) ( k l ) A = k ( l A ) = l ( k A )
k A = O ⟺ k = 0 或 A = O kA=O\iff k=0\ 或\ A=O k A = O ⟺ k = 0 或 A = O
矩阵的乘法
(1)矩阵的乘法:设矩阵A = ( a i j ) m × n 与 B = ( b i j ) n × p A=(a_{ij})_{m× n}与B=(b_{ij})_{n× p} A = ( a i j ) m × n 与 B = ( b i j ) n × p ,定义A B = ( c i j ) m × p AB=(c_{ij})_{m× p} A B = ( c i j ) m × p ,其中c i j = ∑ k = 1 n a i k b k j , ( i = 1 , 2 , ⋯ , m ; j = 1 , 2 , ⋯ , p ) c_{ij}=\displaystyle\sum_{k=1}^{n}a_{ik}b_{kj},(i=1,2,\cdots,m;j=1,2,\cdots,p) c i j = k = 1 ∑ n a i k b k j , ( i = 1 , 2 , ⋯ , m ; j = 1 , 2 , ⋯ , p )
A ( B C ) = ( A B ) C A(BC)=(AB)C A ( B C ) = ( A B ) C
A ( B + C ) = A B + A C ; ( B + C ) A = B A + C A A(B+C)=AB+AC;\ (B+C)A=BA+CA A ( B + C ) = A B + A C ; ( B + C ) A = B A + C A
k ( A B ) = ( k A ) B = A ( k B ) k(AB)=(kA)B=A(kB) k ( A B ) = ( k A ) B = A ( k B )
A E = A ; E A = A AE=A;\ EA=A A E = A ; E A = A
矩阵乘法不满足交换律和消去律
A B = B A AB\ \xcancel{=}\ BA A B = B A ;
A B = A C ⇒ B = C AB=AC\xcancel{\Rarr} B=C A B = A C ⇒ B = C
(2) 方阵的幂:设A为n阶方阵,定义A 1 = A , A 2 = A A , ⋯ , A k + 1 = A k A A^1=A,\ A^2=AA,\cdots,A^{k+1}=A^kA A 1 = A , A 2 = A A , ⋯ , A k + 1 = A k A
A k A l = A k + l A^kA^l=A^{k+l} A k A l = A k + l
( A k ) l = A k l (A^k)^l=A^{kl} ( A k ) l = A k l
(3) 方阵的多项式:f ( A ) = a s A s + a s − 1 A s − 1 + ⋯ + a 1 A + a 0 E f(A)=a_sA^s+a_{s-1}A^{s-1}+\cdots+a_1A+a_0E f ( A ) = a s A s + a s − 1 A s − 1 + ⋯ + a 1 A + a 0 E
矩阵的转置 (transpose):设矩阵A = ( a i j ) m × n , A T = ( a j i ) n × m A=(a_{ij})_{m× n},\ A^T=(a_{ji})_{n× m} A = ( a i j ) m × n , A T = ( a j i ) n × m 叫做矩阵 A A A 的转置矩阵
( A T ) T = A (A^T)^T=A ( A T ) T = A
( A + B ) T = A T + B T (A+B)^T=A^T+B^T ( A + B ) T = A T + B T
( k A ) T = k A T (kA)^T=kA^T ( k A ) T = k A T
( A B ) T = B T A T (AB)^T=B^TA^T ( A B ) T = B T A T
矩阵的行列式 :由n阶方阵A的元素所构成的行列式,称为A的行列式,记为det A \det A det A 或∣ A ∣ |A| ∣ A ∣
det A T = det A \det A^T=\det A det A T = det A
det k A = k n det A \det kA=k^n\det A det k A = k n det A
det A B = det A ⋅ det B \det AB=\det A\cdot\det B det A B = det A ⋅ det B
分块矩阵
分块矩阵(Block matrix) :根据运算的需要,结合矩阵本身的特点,在矩阵的行间和列间,分别用横线和竖线将矩阵划分为若干个子矩阵(submatrix),此方法称为矩阵的分块,并称这种以子块为元的矩阵为分块矩阵。
( 1 0 0 0 0 1 0 0 0 0 1 5 ) = ( E 2 O α 1 α 2 ) \begin{pmatrix}
\begin{array}{cc:cc}
1&0 & 0 & 0 \\
0&1 & 0 &0 \\
\hdashline
0&0 & 1 & 5
\end{array}\end{pmatrix}
=\begin{pmatrix}
E_2 & O \\
\alpha_1 & \alpha_2
\end{pmatrix} ⎝ ⎛ 1 0 0 0 1 0 0 0 1 0 0 5 ⎠ ⎞ = ( E 2 α 1 O α 2 )
分块对角阵 (block diagonal matrix):其中A 1 , A 2 , ⋯ , A s A_1,A_2,\cdots,A_s A 1 , A 2 , ⋯ , A s 是方阵,未显示部分都为0。
A = ( A 1 A 2 ⋱ A s ) A=\begin{pmatrix}
A_1 \\
&A_2 \\
&&\ddots& \\
&&&A_s \\
\end{pmatrix} A = ⎝ ⎜ ⎜ ⎛ A 1 A 2 ⋱ A s ⎠ ⎟ ⎟ ⎞
按行和列分块 :A = ( A 1 , A 2 , ⋯ , A n ) ; A = ( α 1 α 2 ⋮ α m ) A=(A_1,A_2,\cdots,A_n);\quad A=\begin{pmatrix}α_1\\ α_2\\ \vdots \\ α_m\end{pmatrix} A = ( A 1 , A 2 , ⋯ , A n ) ; A = ⎝ ⎜ ⎜ ⎜ ⎛ α 1 α 2 ⋮ α m ⎠ ⎟ ⎟ ⎟ ⎞
证明 :A = O ⟺ A T A = O A=O\iff A^TA=O A = O ⟺ A T A = O
分块矩阵的运算
条件
A m × n ± B m × n = ( A r s ) p × q ± ( B r s ) p × q = ( A r s + B r s ) p × q A_{m× n}± B_{m× n}=(A_{rs})_{p× q}± (B_{rs})_{p× q}=(A_{rs}+B_{rs})_{p× q} A m × n ± B m × n = ( A r s ) p × q ± ( B r s ) p × q = ( A r s + B r s ) p × q
加减法:两个同型矩阵进行同样的分块
k A m × n = k ( A r s ) p × q = ( k A r s ) p × q kA_{m× n}=k(A_{rs})_{p× q}=(kA_{rs})_{p× q} k A m × n = k ( A r s ) p × q = ( k A r s ) p × q
数乘
A m × s B s × n = ( A i k ) p × t ( B k j ) t × q = ( C i j ) p × q A_{m× s}B_{s× n}=(A_{ik})_{p× t}(B_{kj})_{t× q}=(C_{ij})_{p× q} A m × s B s × n = ( A i k ) p × t ( B k j ) t × q = ( C i j ) p × q 其中C i j = ∑ k = 1 t a i k b k j ( i = 1 , 2 , ⋯ , p ; j = 1 , 2 , ⋯ , q ) C_{ij}=\displaystyle\sum_{k=1}^{t}a_{ik}b_{kj}\\ (i=1,2,\cdots,p;j=1,2,\cdots,q) C i j = k = 1 ∑ t a i k b k j ( i = 1 , 2 , ⋯ , p ; j = 1 , 2 , ⋯ , q )
乘法:B B B 的列分法和A A A 的行分法一致
A m × n = ( A r s ) p × q ⇒ A T = ( A r s T ) p × q A_{m× n}=(A_{rs})_{p× q}\Rarr A^T=(A^T_{rs})_{p× q} A m × n = ( A r s ) p × q ⇒ A T = ( A r s T ) p × q
分块转置
矩阵的初等变换
初等变换 (elementary transformation):行(列)初等变换
(1) 互换变换:r i ↔ r j 或 c i ↔ c j r_i\lrarr r_j或c_i\lrarr c_j r i ↔ r j 或 c i ↔ c j
(2) 倍乘变换:r i × k 或 c i × k , 其 中 k ≠ 0 r_i× k或c_i× k,其中k\neq0 r i × k 或 c i × k , 其 中 k = 0
(3) 倍加变换:r i + k r j 或 r i + k r j r_i+kr_j或r_i+kr_j r i + k r j 或 r i + k r j
若A A A 经有限次初等变换变为B B B ,则A A A 与B B B 等价 (equivalent),记为A ≅ B A \cong B A ≅ B
任何矩阵A经有限次初等变换都可化为以下形式之一
( E r O O O ) \begin{pmatrix}
E_r&O \\
O&O
\end{pmatrix} ( E r O O O ) 、( E r , O ) (E_r,O) ( E r , O ) 、( E r O ) \begin{pmatrix}
E_r \\
O
\end{pmatrix} ( E r O )
称为矩阵A的等价标准型 (equivalent standard form),其中r r r 为矩阵A A A 的秩。
行阶梯型矩阵 (Row echelon matrix):任何矩阵都可以通过初等变换化为行阶梯型
(1) 零行:元素全为0的行
(2) 非零行:元素不全为0的行
(3) 非零首元:非零行第一个不为0的元素
(4) 若有零行,则在最下方;非零首元的列随行的增加而严格递增
( 5 − 3 6 8 1 − 2 6 2 ) \begin{pmatrix}
5&-3&6&8 \\
&1&-2&6 \\
&&&2 \\
&&& \\
\end{pmatrix} ⎝ ⎜ ⎜ ⎛ 5 − 3 1 6 − 2 8 6 2 ⎠ ⎟ ⎟ ⎞
行最简型矩阵 (Row simplest matrix):任何矩阵都可以通过初等变换化为行最简型
(1) 行阶梯型矩阵
(2) 非零首元都是1
(3) 非零首元所在列的其他元素都是零
( 1 0 6 8 1 − 2 6 2 ) \begin{pmatrix}
1&0&6&8 \\
&1&-2&6 \\
&&&2
\end{pmatrix} ⎝ ⎛ 1 0 1 6 − 2 8 6 2 ⎠ ⎞
初等矩阵 (elementary matrix):由单位矩阵E E E 经一次初等变化得到的矩阵叫初等矩阵
三种初等变换对应着三种初等矩阵
初等变换
初等矩阵
逆变换
逆矩阵
r i ↔ r j r_i\lrarr r_j r i ↔ r j
E ( i , j ) E(i,j) E ( i , j )
r i ↔ r j r_i\lrarr r_j r i ↔ r j
E ( i , j ) − 1 = E ( i , j ) E(i,j)^{-1}=E(i,j) E ( i , j ) − 1 = E ( i , j )
r i × k r_i× k r i × k
E ( i ( k ) ) E(i(k)) E ( i ( k ) )
r i × 1 k r_i× \dfrac{1}{k} r i × k 1
E ( i ( k ) ) − 1 = E ( i ( 1 k ) ) E(i(k))^{-1}=E(i(\dfrac{1}{k})) E ( i ( k ) ) − 1 = E ( i ( k 1 ) )
r i + k r j r_i+kr_j r i + k r j
E ( i j ( k ) ) E(ij(k)) E ( i j ( k ) )
r i − k r j r_i-kr_j r i − k r j
E ( i j ( k ) ) − 1 = E ( i j ( − k ) ) E(ij(k))^{-1}=E(ij(-k)) E ( i j ( k ) ) − 1 = E ( i j ( − k ) )
定理 :对矩阵A m × n A_{m× n} A m × n 进行一次行初等变换,相当于m m m 阶初等矩阵左乘A A A ;进行一次列初等变换,相当于n n n 阶初等矩阵右乘A A A
推论 :设A A A 与B B B 为m × n m× n m × n 矩阵
(1) 存在m阶初等矩阵P 1 , P 2 , ⋯ , P s P_1,P_2,\cdots,P_s P 1 , P 2 , ⋯ , P s ,使得P 1 P 2 ⋯ P s A P_1P_2\cdots P_sA P 1 P 2 ⋯ P s A 为行阶梯型(行最简形)。
(2) 存在m阶初等矩阵P 1 , P 2 , ⋯ , P s P_1,P_2,\cdots,P_s P 1 , P 2 , ⋯ , P s 和n阶初等矩阵Q 1 , Q 2 , ⋯ , Q t Q_1,Q_2,\cdots,Q_t Q 1 , Q 2 , ⋯ , Q t ,使得P 1 P 2 ⋯ P s A Q 1 , Q 2 , ⋯ , Q t P_1P_2\cdots P_sAQ_1,Q_2,\cdots,Q_t P 1 P 2 ⋯ P s A Q 1 , Q 2 , ⋯ , Q t 为A的等价标准型。
(3) 若A ≅ B A\cong B A ≅ B
⟺ \iff ⟺ 存在可逆矩阵P , Q P,Q P , Q ,使得P A = A Q = B PA=AQ=B P A = A Q = B
⟺ \iff ⟺ 存在可逆矩阵P , Q P,Q P , Q ,使得P A Q = B PAQ=B P A Q = B
利用初等变换解矩阵方程 :
(1) A X = B ⇒ X = A − 1 B AX=B\Rarr X=A^{-1}B A X = B ⇒ X = A − 1 B
利用行初等变换:( A , B ) ≅ ( E , A − 1 B ) (A,B)\cong (E,A^{-1}B) ( A , B ) ≅ ( E , A − 1 B )
(2) Y A = C ⇒ Y = C A − 1 YA=C\Rarr Y=CA^{-1} Y A = C ⇒ Y = C A − 1
利用列初等变换:( A C ) ≅ ( E C A − 1 ) \begin{pmatrix}A\\ C\end{pmatrix}\cong\begin{pmatrix}E\\ CA^{-1}\end{pmatrix} ( A C ) ≅ ( E C A − 1 )
(3) 矩阵方程A X = B AX=B A X = B 有解 ⟺ r ( A ) = r ( A , B ) \iff r(A)=r(A,B) ⟺ r ( A ) = r ( A , B )
逆矩阵
概念 :对于n阶方阵A A A ,如果存在n阶方阵B B B ,使得A B = B A = E AB=BA=E A B = B A = E ,则 B B B 为A A A 的逆矩阵,称A A A 为可逆矩阵 (invertible matrix),记为B = A − 1 B=A^{-1} B = A − 1
( A − 1 ) − 1 = A (A^{-1})^{-1}=A ( A − 1 ) − 1 = A
( A T ) − 1 = ( A − 1 ) T (A^T)^{-1}=(A^{-1})^T ( A T ) − 1 = ( A − 1 ) T
( A B ) − 1 = B − 1 A − 1 (AB)^{-1}=B^{-1}A^{-1} ( A B ) − 1 = B − 1 A − 1
( k A ) − 1 = 1 k A − 1 , ( k ≠ 0 ) (kA)^{-1}=\dfrac{1}{k}A^{-1},(k\neq0) ( k A ) − 1 = k 1 A − 1 , ( k = 0 )
定理 1
(1) 初等矩阵都可逆,且逆矩阵仍是同类型的初等矩阵
(2) A的逆矩阵A − 1 A^{-1} A − 1 是唯一的
(3) 对于矩阵A A A ,存在可逆矩阵P , Q P,Q P , Q ,使得P A Q PAQ P A Q 为A A A 的等价标准型
(4) 分块对角矩阵A = d i a g ( A 1 , A 2 , ⋯ , A s ) A=\mathrm{diag}(A_1,A_2,\cdots,A_s) A = d i a g ( A 1 , A 2 , ⋯ , A s ) 可逆 ⟺ A 1 , A 2 , ⋯ , A s \iff A_1,A_2,\cdots,A_s ⟺ A 1 , A 2 , ⋯ , A s 均可逆
定理 2 :n n n 阶矩阵A A A 可逆
⟺ A \iff A ⟺ A 可以写成有限个初等矩阵的乘积
⟺ A ≅ E \iff A\cong E ⟺ A ≅ E (等价于单位矩阵)
⟺ det A ≠ 0 \iff \det A\neq0 ⟺ det A = 0 (非奇异矩阵)
⟺ r ( A ) = n \iff r(A)=n ⟺ r ( A ) = n (满秩矩阵)
⟺ A \iff A ⟺ A 的行(列)向量组线性无关
⟺ \iff ⟺ 齐次线性方程组A x = 0 Ax=0 A x = 0 只有零解
⟺ ∀ b ∈ R n \iff ∀ b\in \R^n ⟺ ∀ b ∈ R n ,非齐次方程组A x = b Ax=b A x = b 有唯一解
⟺ A \iff A ⟺ A 的特征值不全为零
⟺ A T A \iff A^TA ⟺ A T A 是正定矩阵
⟺ A \iff A ⟺ A 的行(列)向量组是 R n \R^n R n 的一组基
伴随矩阵 (Adjugate Matrix):由行列式∣ A ∣ |A| ∣ A ∣ 的各个元素的代数余子式A i j A_{ij} A i j ,所构成的矩阵
A ∗ = ( A 11 A 21 ⋯ A n 1 A 12 A 22 ⋯ A n 2 ⋮ ⋮ ⋱ ⋮ A 1 n A 2 n ⋯ A n n ) A^*=\begin{pmatrix}
A_{11}&A_{21}&\cdots&A_{n1} \\
A_{12}&A_{22}&\cdots&A_{n2} \\
\vdots&\vdots&\ddots&\vdots \\
A_{1n}&A_{2n}&\cdots&A_{nn} \\
\end{pmatrix}
A ∗ = ⎝ ⎜ ⎜ ⎜ ⎛ A 1 1 A 1 2 ⋮ A 1 n A 2 1 A 2 2 ⋮ A 2 n ⋯ ⋯ ⋱ ⋯ A n 1 A n 2 ⋮ A n n ⎠ ⎟ ⎟ ⎟ ⎞
叫做矩阵A A A 的伴随矩阵。A A ∗ = A ∗ A = ∣ A ∣ E AA^*=A^*A=|A|E A A ∗ = A ∗ A = ∣ A ∣ E
逆矩阵的计算
(1) 利用初等行变换:( A , E ) ≅ ( E , A − 1 ) (A,E)\cong (E,A^{-1}) ( A , E ) ≅ ( E , A − 1 )
(2) 利用初等列变换:( A E ) ≅ ( E A − 1 ) \begin{pmatrix}A\\ E\end{pmatrix}
\cong \begin{pmatrix} E\\ A^{-1} \end{pmatrix} ( A E ) ≅ ( E A − 1 )
(3) 利用伴随矩阵:A − 1 = 1 ∣ A ∣ A ∗ A^{-1}=\dfrac{1}{|A|}A^* A − 1 = ∣ A ∣ 1 A ∗
矩阵的秩
概念 :设矩阵A m × n A_{m× n} A m × n
(1) 在矩阵A A A 任取k行k列,位于这些行列交叉处的k 2 k^2 k 2 个元素,不改变它们在A A A 中所处的位置次序而得的k阶行列式,称为矩阵A A A 的 k阶子式 (minor)。
(2) 若矩阵A A A 中有一个不等于零的r r r 阶子式D D D ,且所有r + 1 r+1 r + 1 阶子式(如果存在的话)全等于零,那么D D D 称为矩阵A A A 的最高阶非零子式,数r r r 称为矩阵A A A 的秩 (rank),记作r ( A ) = r r(A)=r r ( A ) = r 。(规定零矩阵的秩等于零)
若r ( A n × n ) = n r(A_{n× n})=n r ( A n × n ) = n ,则称A A A 为满秩矩阵 (full rank matrix)
若∣ A n × n ∣ ≠ 0 |A_{n× n}|\neq 0 ∣ A n × n ∣ = 0 ,则称A A A 为非奇异矩阵 (non-singular matrix)
矩阵秩的性质 :
(1) 行阶梯形矩阵的秩就等于非零行的行数
(2) 初等变换不改变矩阵的秩
若A ≅ B A\cong B A ≅ B ,则 r ( A ) = r ( B ) r(A)=r(B) r ( A ) = r ( B )
若P , Q P,Q P , Q 可逆,则r ( P A Q ) = r ( A ) r(PAQ)=r(A) r ( P A Q ) = r ( A )
(3) 若∣ A n × n ∣ = 0 |A_{n× n}|=0 ∣ A n × n ∣ = 0 ,则 r ( A ) < n r(A)<n r ( A ) < n
(4) r ( A T ) = r ( A ) r(A^T)=r(A) r ( A T ) = r ( A )
(5) 矩阵秩的不等式:
0 ⩽ r ( A m × n ) ⩽ min { m , n } 0⩽ r(A_{m× n})⩽\min\{m,n\} 0 ⩽ r ( A m × n ) ⩽ min { m , n }
max { r ( A ) , r ( B ) } ⩽ r ( A , B ) ⩽ r ( A ) + r ( B ) \max\{r(A),r(B)\}⩽ r(A,B)⩽ r(A)+r(B) max { r ( A ) , r ( B ) } ⩽ r ( A , B ) ⩽ r ( A ) + r ( B )
r ( A B ) ⩽ min { r ( A ) , r ( B ) } r(AB) ⩽ \min\{r(A),r(B)\} r ( A B ) ⩽ min { r ( A ) , r ( B ) }
r ( A + B ) ⩽ r ( A ) + r ( B ) r(A+B)⩽ r(A)+r(B) r ( A + B ) ⩽ r ( A ) + r ( B )
线性方程组
概念
(1) 设有n个未知数m个方程的线性方程组(System of linear equations)
{ a 11 x 1 + a 12 x 2 + ⋯ + a 1 n x n = b 1 a 21 x 1 + a 22 x 2 + ⋯ + a 2 n x n = b 2 ⋯ a m 1 x 1 + a m 2 x 2 + ⋯ + a m n x n = b m \begin{cases}
a_{11}x_1+a_{12}x_2+\cdots+a_{1n}x_n=b_1 \\
a_{21}x_1+a_{22}x_2+\cdots+a_{2n}x_n=b_2 \\
\cdots \\
a_{m1}x_1+a_{m2}x_2+\cdots+a_{mn}x_n=b_m
\end{cases}
⎩ ⎪ ⎪ ⎪ ⎨ ⎪ ⎪ ⎪ ⎧ a 1 1 x 1 + a 1 2 x 2 + ⋯ + a 1 n x n = b 1 a 2 1 x 1 + a 2 2 x 2 + ⋯ + a 2 n x n = b 2 ⋯ a m 1 x 1 + a m 2 x 2 + ⋯ + a m n x n = b m
当b 1 , b 2 , ⋯ , b n b_1,b_2,\cdots,b_n b 1 , b 2 , ⋯ , b n 不全为零时称为非齐次线性方程组 (system of non-homogeneous linear equations),当b 1 = b 2 = ⋯ = b m = 0 b_1=b_2=\cdots=b_m=0 b 1 = b 2 = ⋯ = b m = 0 时称为齐次线性方程组 (system of homogeneous linear equations)
(2) 如果存在n个常数{ x 1 = s 1 x 2 = s 2 ⋯ x n = s n \begin{cases}
x_1=s_1 \\
x_2=s_2 \\
\cdots \\
x_n=s_n
\end{cases} ⎩ ⎪ ⎪ ⎪ ⎨ ⎪ ⎪ ⎪ ⎧ x 1 = s 1 x 2 = s 2 ⋯ x n = s n 满足线性方程组的所有方程,则称为线性方程组的一个解。
(3) 记A = ( a 11 a 12 ⋯ a 1 n a 21 a 22 ⋯ a 2 n ⋮ ⋮ ⋱ ⋮ a m 1 a m 2 ⋯ a m n ) A=\begin{pmatrix}
a_{11}&a_{12}&\cdots&a_{1n} \\
a_{21}&a_{22}&\cdots&a_{2n} \\
\vdots&\vdots&\ddots&\vdots \\
a_{m1}&a_{m2}&\cdots&a_{mn} \\
\end{pmatrix} A = ⎝ ⎜ ⎜ ⎜ ⎛ a 1 1 a 2 1 ⋮ a m 1 a 1 2 a 2 2 ⋮ a m 2 ⋯ ⋯ ⋱ ⋯ a 1 n a 2 n ⋮ a m n ⎠ ⎟ ⎟ ⎟ ⎞ ,x = ( x 1 x 2 ⋮ x n ) x=\begin{pmatrix}x_1\\ x_2\\ \vdots \\ x_n\end{pmatrix} x = ⎝ ⎜ ⎜ ⎜ ⎛ x 1 x 2 ⋮ x n ⎠ ⎟ ⎟ ⎟ ⎞ ,b = ( b 1 b 2 ⋮ b m ) , A ˉ = ( A , b ) b=\begin{pmatrix}b_1\\ b_2\\ \vdots \\ b_m\end{pmatrix},\bar{A}=(A,b) b = ⎝ ⎜ ⎜ ⎜ ⎛ b 1 b 2 ⋮ b m ⎠ ⎟ ⎟ ⎟ ⎞ , A ˉ = ( A , b )
其中A , b A,b A , b 分别是系数矩阵和常数项矩阵,A ˉ \bar{A} A ˉ 为增广矩阵 (augmented matrix),方程组可化为 A x = b Ax=b A x = b
线性方程组求解 :对增广矩阵作初等行变换变为行阶梯形矩阵(行最简形矩阵)
高斯消元法(Gaussian Elimination)
(1)两方程互换,解不变;
(2)一方程乘以非零数k,解不变;
(3)一方程乘以数k加上另一方程,解不变 。
由求解情况可知,解的情况完全由其系数 a i j a_{ij} a i j 和常数项 b 1 , b 2 , ⋯ , b n b_1,b_2,\cdots,b_n b 1 , b 2 , ⋯ , b n 决定。
定理 n n n 元线性方程组A x = b Ax=b A x = b
(1) 无解 ⟺ r ( A ) < r ( A , b ) \iff r(A)<r(A,b) ⟺ r ( A ) < r ( A , b )
(2) 有惟一解 ⟺ r ( A ) = r ( A , b ) = n \iff r(A)=r(A,b)=n ⟺ r ( A ) = r ( A , b ) = n
(3) 有无限多解 ⟺ r ( A ) = r ( A , b ) < n \iff r(A)=r(A,b)<n ⟺ r ( A ) = r ( A , b ) < n
解的性质和解的结构
(1) A x = 0 Ax=0 A x = 0 的任意两个解的线性组合仍是其解,一切解的集合构成向量空间,称为解空间
当r ( A ) = r < n r(A)=r<n r ( A ) = r < n 时,解空间的基础解系含有n − r n-r n − r 个线性无关的解向量 η 1 , η 2 , ⋯ , η n − r η_1,η_2,\cdots,η_{n-r} η 1 , η 2 , ⋯ , η n − r ,基础解系的一切线性组合x = k 1 η 1 + k 2 η 2 + ⋯ + k n − r η n − r x=k_1η_1+k_2η_2+\cdots+k_{n-r}η_{n-r} x = k 1 η 1 + k 2 η 2 + ⋯ + k n − r η n − r 就是 A x = 0 Ax=0 A x = 0 的通解
当r ( A ) = r = n r(A)=r=n r ( A ) = r = n 时,解空间为零空间,没有基础解系
(2) A x = b Ax=b A x = b 的任意两个解之差,必为其导出组A x = 0 Ax=0 A x = 0 的解
一切解的集合不构成向量空间
任一解 η 0 η_0 η 0 与其导出组通解 x ˉ \bar{x} x ˉ 之和 x = η 0 + x ˉ x=η_0+\bar{x} x = η 0 + x ˉ 为其通解
最小二乘解 (least squares solution):
x 0 x_0 x 0 为A x = b Ax=b A x = b 的最小二乘解,即∥ b − A x 0 ∥ = min x ∈ R n ∥ b − A x ∥ ⟺ x 0 \|b-Ax_0\|=\displaystyle\min_{x\in\R^n}\|b-Ax\| \iff x_0 ∥ b − A x 0 ∥ = x ∈ R n min ∥ b − A x ∥ ⟺ x 0 满足A T A x 0 = A T b A^TAx_0=A^Tb A T A x 0 = A T b
行列式
行列式的本质是什么?https://www.zhihu.com/question/36966326/answer/70687817
行列式 (determinant):行列式引自对线性方程组的求解
一阶行列式:∣ a 11 ∣ = a 11 |a_{11}|=a_{11} ∣ a 1 1 ∣ = a 1 1
二阶行列式:∣ a 11 a 12 a 21 a 22 ∣ = a 11 a 22 − a 12 a 21 \begin{vmatrix}
a_{11} & a_{12} \\
a_{21} & a_{22}
\end{vmatrix}=a_{11}a_{22}-a_{12}a_{21} ∣ ∣ ∣ ∣ a 1 1 a 2 1 a 1 2 a 2 2 ∣ ∣ ∣ ∣ = a 1 1 a 2 2 − a 1 2 a 2 1
三阶行列式:
∣ a 11 a 12 a 13 a 21 a 22 a 23 a 31 a 32 a 33 ∣ = a 11 ( − 1 ) 1 + 1 ∣ a 22 a 23 a 32 a 33 ∣ + a 12 ( − 1 ) 1 + 2 ∣ a 11 a 13 a 31 a 33 ∣ + a 13 ( − 1 ) 1 + 3 ∣ a 21 a 22 a 31 a 32 ∣ \begin{vmatrix}
a_{11} & a_{12}& a_{13} \\
a_{21} & a_{22} & a_{23} \\
a_{31} & a_{32} & a_{33}
\end{vmatrix}
=a_{11}(-1)^{1+1}\begin{vmatrix} a_{22} & a_{23} \\ a_{32} & a_{33} \end{vmatrix}
+a_{12}(-1)^{1+2}\begin{vmatrix} a_{11} & a_{13} \\ a_{31} & a_{33} \end{vmatrix}
+a_{13}(-1)^{1+3}\begin{vmatrix} a_{21} & a_{22} \\ a_{31} & a_{32} \end{vmatrix} ∣ ∣ ∣ ∣ ∣ ∣ a 1 1 a 2 1 a 3 1 a 1 2 a 2 2 a 3 2 a 1 3 a 2 3 a 3 3 ∣ ∣ ∣ ∣ ∣ ∣ = a 1 1 ( − 1 ) 1 + 1 ∣ ∣ ∣ ∣ a 2 2 a 3 2 a 2 3 a 3 3 ∣ ∣ ∣ ∣ + a 1 2 ( − 1 ) 1 + 2 ∣ ∣ ∣ ∣ a 1 1 a 3 1 a 1 3 a 3 3 ∣ ∣ ∣ ∣ + a 1 3 ( − 1 ) 1 + 3 ∣ ∣ ∣ ∣ a 2 1 a 3 1 a 2 2 a 3 2 ∣ ∣ ∣ ∣
n阶行列式:
∣ a 11 a 12 ⋯ a 1 n a 21 a 22 ⋯ a 2 n ⋮ ⋮ ⋱ ⋮ a n 1 a n 2 ⋯ a n n ∣ = ∑ k = 1 n a 1 k A 1 k \begin{vmatrix}
a_{11}&a_{12}&\cdots&a_{1n} \\
a_{21}&a_{22}&\cdots&a_{2n} \\
\vdots&\vdots&\ddots&\vdots \\
a_{n1}&a_{n2}&\cdots&a_{nn} \\
\end{vmatrix}=\displaystyle\sum_{k=1}^{n}a_{1k}A_{1k}
∣ ∣ ∣ ∣ ∣ ∣ ∣ ∣ ∣ a 1 1 a 2 1 ⋮ a n 1 a 1 2 a 2 2 ⋮ a n 2 ⋯ ⋯ ⋱ ⋯ a 1 n a 2 n ⋮ a n n ∣ ∣ ∣ ∣ ∣ ∣ ∣ ∣ ∣ = k = 1 ∑ n a 1 k A 1 k
其中,划去元a i j a_{ij} a i j 所在的第i i i 行与第j j j 列的元,剩下的元不改变原来的顺序所构成的n − 1 n-1 n − 1 阶行列式称为元a i j a_{ij} a i j 的余子式 (cofactor),记为M i j M_{ij} M i j ,元a i j a_{ij} a i j 的代数余子式 (algebraic cofactor) A i j = ( − 1 ) i + j M i j A_{ij}=(-1)^{i+j}M_{ij} A i j = ( − 1 ) i + j M i j
二三阶行列式计算满足对角线法则,四阶及以上行列式不满足对角线法则。
n阶行列式按行(列)展开
∑ k = 1 n a i k A j k = { D , ( i = j ) 0 , ( i ≠ j ) ∑ k = 1 n a k i A k j = { D , ( i = j ) 0 , ( i ≠ j ) \displaystyle\sum_{k=1}^{n}a_{ik}A_{jk}=\begin{cases}D,(i=j) \\
0,(i\neq j)\end{cases}\quad
\displaystyle\sum_{k=1}^{n}a_{ki}A_{kj}=\begin{cases}D,(i=j) \\
0,(i\neq j)\end{cases} k = 1 ∑ n a i k A j k = { D , ( i = j ) 0 , ( i = j ) k = 1 ∑ n a k i A k j = { D , ( i = j ) 0 , ( i = j )
其中A i j A_{ij} A i j 是行列式D中a i j a_{ij} a i j 的代数余子式。
行列式的性质
(1) 行列式与其转置行列式相等:D = D T D=D^T D = D T
(2) 互换行列式两行(列),行列式改变符号:
A → ( c i ↔ c j ) r i ↔ r j B ⇒ ∣ A ∣ = − ∣ B ∣ A\xrightarrow[(c_i\lrarr c_j)]{r_i\lrarr r_j}B\Rarr | A|=-| B| A r i ↔ r j ( c i ↔ c j ) B ⇒ ∣ A ∣ = − ∣ B ∣
(3) 用数k k k 乘行列式等于行列式某一行(列)全部乘数k k k 。
A → ( k c i ) k r i B ⇒ k ∣ A ∣ = ∣ B ∣ A\xrightarrow[(kc_i)]{kr_i}B\Rarr k| A|=| B| A k r i ( k c i ) B ⇒ k ∣ A ∣ = ∣ B ∣
由此可得
a. 行列式某一行(列)的公因子可以提取到外面
b. 行列式某一行(列)全为零,则行列式值为零
(4) 若行列式中两行(列)对应元素成比例,则行列式值为零
(5) 把行列式的某一行全部k k k 倍加到另一行对应元素,行列式值不变
A → ( c i + k c j ) r i + k r j B ⇒ ∣ A ∣ = ∣ B ∣ A\xrightarrow[(c_i+kc_j)]{r_i+kr_j}B\Rarr | A|=| B| A r i + k r j ( c i + k c j ) B ⇒ ∣ A ∣ = ∣ B ∣
(6) 行列式的分拆定理,如
∣ b 11 + c 11 b 12 + c 12 b 13 + c 13 a 21 a 22 a 23 a 31 a 32 a 33 ∣ = ∣ b 11 b 12 b 13 a 21 a 22 a 23 a 31 a 32 a 33 ∣ + ∣ c 11 c 12 c 13 a 21 a 22 a 23 a 31 a 32 a 33 ∣ \begin{vmatrix}
b_{11}+c_{11}&b_{12}+c_{12}&b_{13}+c_{13} \\
a_{21}&a_{22}&a_{23} \\
a_{31}&a_{32}&a_{33} \\
\end{vmatrix}=\begin{vmatrix}
b_{11}&b_{12}&b_{13} \\
a_{21}&a_{22}&a_{23} \\
a_{31}&a_{32}&a_{33} \\
\end{vmatrix}+\begin{vmatrix}
c_{11}&c_{12}&c_{13} \\
a_{21}&a_{22}&a_{23} \\
a_{31}&a_{32}&a_{33} \\
\end{vmatrix} ∣ ∣ ∣ ∣ ∣ ∣ b 1 1 + c 1 1 a 2 1 a 3 1 b 1 2 + c 1 2 a 2 2 a 3 2 b 1 3 + c 1 3 a 2 3 a 3 3 ∣ ∣ ∣ ∣ ∣ ∣ = ∣ ∣ ∣ ∣ ∣ ∣ b 1 1 a 2 1 a 3 1 b 1 2 a 2 2 a 3 2 b 1 3 a 2 3 a 3 3 ∣ ∣ ∣ ∣ ∣ ∣ + ∣ ∣ ∣ ∣ ∣ ∣ c 1 1 a 2 1 a 3 1 c 1 2 a 2 2 a 3 2 c 1 3 a 2 3 a 3 3 ∣ ∣ ∣ ∣ ∣ ∣
(7) 上、下三角行列式及主对角行列式等于主对角元素的乘积
副对角线上、下三角行列式及副对角行列式等于副对角元素的乘积× ( − 1 ) n ( n − 1 ) 2 × (-1)^{\frac{n(n-1)}{2}} × ( − 1 ) 2 n ( n − 1 )
(8) ∣ − A ∣ = ( − 1 ) n ∣ A ∣ | -A|=(-1)^n |A| ∣ − A ∣ = ( − 1 ) n ∣ A ∣
(9) ∣ A m × m C m × n O B n × n ∣ = ∣ A ∣ × ∣ B ∣ \begin{vmatrix}
A_{m× m} & C_{m× n} \\
O &B_{n× n}
\end{vmatrix}=|A|×| B| ∣ ∣ ∣ ∣ A m × m O C m × n B n × n ∣ ∣ ∣ ∣ = ∣ A ∣ × ∣ B ∣
(10) ∣ A 1 A 2 ⋱ A s ∣ = ∣ A 1 ∣ ∣ A 2 ∣ ⋯ ∣ A s ∣ \begin{vmatrix}
A_1 & & & \\
&A_2& & \\
& & \ddots& \\
& & & A_s
\end{vmatrix}=|A_1||A_2|\cdots|A_s| ∣ ∣ ∣ ∣ ∣ ∣ ∣ ∣ A 1 A 2 ⋱ A s ∣ ∣ ∣ ∣ ∣ ∣ ∣ ∣ = ∣ A 1 ∣ ∣ A 2 ∣ ⋯ ∣ A s ∣ ,其中A 1 , A 2 , ⋯ , A s A_1,A_2,\cdots,A_s A 1 , A 2 , ⋯ , A s 都是方阵
(11) ∣ A B ∣ = ∣ A ∣ × ∣ B ∣ |AB|=|A|×| B| ∣ A B ∣ = ∣ A ∣ × ∣ B ∣ ,其中A , B A,B A , B 为同阶方阵。
高阶行列式的计算
(1) 利用初等变换化为三角行列式
(2) 降价展开
范德蒙行列式 (Vandermonde determinant)
D n = ∣ 1 1 ⋯ 1 a 1 a 2 ⋯ a n a 1 2 a 2 2 ⋯ a n 2 ⋮ ⋮ ⋮ ⋮ a 1 n − 1 a 2 n − 1 ⋯ a n n − 1 ∣ = ∏ 1 ⩽ i < j ⩽ n ( a j − a i ) D_n=\begin{vmatrix}
1 & 1& \cdots &1 \\
a_1 &a_2&\cdots &a_n \\
a_1^2 &a_2^2&\cdots &a_n^2 \\
\vdots &\vdots&\vdots &\vdots \\
a_1^{n-1} &a_2^{n-1}&\cdots &a_n^{n-1}
\end{vmatrix}=\displaystyle\prod_{1⩽ i<j⩽ n}(a_j-a_i) D n = ∣ ∣ ∣ ∣ ∣ ∣ ∣ ∣ ∣ ∣ ∣ 1 a 1 a 1 2 ⋮ a 1 n − 1 1 a 2 a 2 2 ⋮ a 2 n − 1 ⋯ ⋯ ⋯ ⋮ ⋯ 1 a n a n 2 ⋮ a n n − 1 ∣ ∣ ∣ ∣ ∣ ∣ ∣ ∣ ∣ ∣ ∣ = 1 ⩽ i < j ⩽ n ∏ ( a j − a i )
克拉默法则 (Cramer rule):如果n元线性方程组
{ a 11 x 1 + a 12 x 2 + ⋯ + a 1 n x n = b 1 a 21 x 1 + a 22 x 2 + ⋯ + a 2 n x n = b 2 ⋯ a n 1 x 1 + a n 2 x 2 + ⋯ + a n n x n = b n \begin{cases}
a_{11}x_1+a_{12}x_2+\cdots+a_{1n}x_n=b_1 \\
a_{21}x_1+a_{22}x_2+\cdots+a_{2n}x_n=b_2 \\
\cdots \\
a_{n1}x_1+a_{n2}x_2+\cdots+a_{nn}x_n=b_n
\end{cases}
⎩ ⎪ ⎪ ⎪ ⎨ ⎪ ⎪ ⎪ ⎧ a 1 1 x 1 + a 1 2 x 2 + ⋯ + a 1 n x n = b 1 a 2 1 x 1 + a 2 2 x 2 + ⋯ + a 2 n x n = b 2 ⋯ a n 1 x 1 + a n 2 x 2 + ⋯ + a n n x n = b n
的系数行列式D ≠ 0 D\neq0 D = 0 ,那么他有唯一解
x j = D j D , ( j = 1 , 2 , ⋯ , n ) x_j=\frac{D_j}{D},(j=1,2,\cdots,n)
x j = D D j , ( j = 1 , 2 , ⋯ , n )
其中D j D_j D j 是把系数行列式D D D 中的第j j j 列换成常数项 b 1 , b 2 , ⋯ , b n b_1,b_2,\cdots,b_n b 1 , b 2 , ⋯ , b n 所得的行列式
n维向量
向量的概念和运算
n维向量 (N-dimensional vector):n个有次序的数 a 1 , a 2 , ⋯ , a n a_1,a_2,\cdots,a_n a 1 , a 2 , ⋯ , a n 所组成的数组称为n维向量。
行向量 a = ( a 1 , a 2 , ⋯ , a n ) \mathbf a=(a_1,a_2,\cdots,a_n) a = ( a 1 , a 2 , ⋯ , a n ) ,列向量 a = ( a 1 a 2 ⋯ a n ) \mathbf{a}=\begin{pmatrix}a_1\\ a_2\\ \cdots \\ a_n\end{pmatrix} a = ⎝ ⎜ ⎜ ⎛ a 1 a 2 ⋯ a n ⎠ ⎟ ⎟ ⎞
分量全为实数的向量称为实向量;分量全为复数的向量称为复向量;
每个分量都是零的向量称为零向量,记作 0 \mathbf{0} 0 ;
向量的线性运算及性质 :向量的线性运算及性质同行(列)矩阵线性运算一致。
向量组 :若干个同维数的列(行)向量所构成的集合叫做向量组 (vector group);含有限个向量的有序向量组与矩阵一一对应
向量组的线性表示与线性相关
向量的线性组合与线性表示 :设向量组 A : α 1 , α 2 , ⋯ , α r A: α_1,α_2,\cdots,α_r A : α 1 , α 2 , ⋯ , α r ,向量 β = k 1 α 1 + k 2 α 2 + ⋯ + k n α r β=k_1α_1+k_2α_2+\cdots+k_nα_r β = k 1 α 1 + k 2 α 2 + ⋯ + k n α r 则β β β 称为向量组的一个线性组合 (linear combination),或称β β β 可由向量组A A A 线性表示 (linear representations),k 1 , k 2 , ⋯ , k r k_1,k_2,\cdots,k_r k 1 , k 2 , ⋯ , k r 称为组合系数(combination coefficient)。
线性表示:β = k 1 α 1 + k 2 α 2 + ⋯ + k n α r β=k_1α_1+k_2α_2+\cdots+k_nα_r β = k 1 α 1 + k 2 α 2 + ⋯ + k n α r
⟺ \iff ⟺ 线性方程组A x = β Ax=β A x = β 有解 x = ( k 1 , k 2 , ⋯ , k r ) T x=(k_1,k_2,\cdots,k_r)^T x = ( k 1 , k 2 , ⋯ , k r ) T
⟺ r ( A ) = r ( A , β ) \iff r(A)=r(A,β) ⟺ r ( A ) = r ( A , β )
向量组的线性表示与等价 :设两向量组A : α 1 , α 2 , ⋯ , α r ; B : β 1 , β 2 , ⋯ , β s A: α_1,α_2,\cdots,α_r;\ B: β_1,β_2,\cdots,β_s A : α 1 , α 2 , ⋯ , α r ; B : β 1 , β 2 , ⋯ , β s
若向量组 B B B 中每一个向量皆可由向量组 A A A 线性表示,即 B = A K r × s B=AK_{r× s} B = A K r × s 则称向量组B B B 可以由向量组 A A A 线性表示 。若向量组 A A A 与向量组 B B B 能相互线性表示,则称这两个向量组等价 (equivalence)。
定理 :向量组 B B B 可以由向量组 A A A 线性表示
⟺ \iff ⟺ 矩阵方程A X = B AX=B A X = B 有解
⟺ r ( A ) = r ( A , B ) \iff r(A)=r(A,B) ⟺ r ( A ) = r ( A , B )
⟹ r ( B ) ⩽ r ( A ) \implies r(B)⩽ r(A) ⟹ r ( B ) ⩽ r ( A )
推论 :向量组B与向量组 A等价
⟺ \iff ⟺ 矩阵方程A X = B AX=B A X = B 与B Y = A BY=A B Y = A 同时有解
⟺ r ( A ) = r ( B ) = r ( A , B ) \iff r(A)=r(B)=r(A,B) ⟺ r ( A ) = r ( B ) = r ( A , B )
向量组线性相关与线性无关 :向量组 A : α 1 , α 2 , ⋯ , α r A: α_1,α_2,\cdots,α_r A : α 1 , α 2 , ⋯ , α r ,如果存在不全为零的数k 1 , k 2 , ⋯ , k r k_1,k_2,\cdots,k_r k 1 , k 2 , ⋯ , k r ,使得k 1 α 1 + k 2 α 2 + ⋯ + k n α r = 0 k_1α_1+k_2α_2+\cdots+k_nα_r=0 k 1 α 1 + k 2 α 2 + ⋯ + k n α r = 0 则称向量组A 线性相关 (linearly dependence)。否则向量组A 线性无关 (Linear Independence)。
向量组线性相关的判别
定理 :向量组 A : α 1 , α 2 , ⋯ , α m A: α_1,α_2,\cdots,α_m A : α 1 , α 2 , ⋯ , α m 线性相关
⟺ m \iff m ⟺ m 元线性方程组 A x = 0 Ax=0 A x = 0 有非零解
⟺ r ( A ) < m \iff r(A)<m ⟺ r ( A ) < m
(1) 向量组线性相关 ⟺ \iff ⟺ 向量组中至少存在一个向量可以由其余向量线性表示
向量组线性无关 ⟺ \iff ⟺ 向量组中任意一个向量都不能由其余向量线性表示
(2) 若部分向量组线性相关,则整体向量组线性相关;若整体向量组线性无关,则它的任何部分组也线性无关
(3) 两个向量α α α 与β β β 线性相关(无关) ⟺ α \iff α ⟺ α 与β β β 的分量对应成比例(不成比例)
(4) 向量个数多余n n n 的n n n 维向量组必线性相关;含零向量的向量组必线性相关。
(5) 设α 1 , α 2 , ⋯ , α m α_1,α_2,\cdots,α_m α 1 , α 2 , ⋯ , α m 线性无关,α 1 , α 2 , ⋯ , α m , β α_1,α_2,\cdots,α_m,β α 1 , α 2 , ⋯ , α m , β 线性相关,则β β β 可由α 1 , α 2 , ⋯ , α m α_1,α_2,\cdots,α_m α 1 , α 2 , ⋯ , α m 线性表示
(6) 设β β β 可由α 1 , α 2 , ⋯ , α m α_1,α_2,\cdots,α_m α 1 , α 2 , ⋯ , α m 线性表示,则表示法唯一的充分必要条件是α 1 , α 2 , ⋯ , α m α_1,α_2,\cdots,α_m α 1 , α 2 , ⋯ , α m 线性无关
向量组的秩
定义 :设向量组 A A A ,在A A A 选取r r r 个向量α 1 , α 2 , ⋯ , α r α_1,α_2,\cdots,α_r α 1 , α 2 , ⋯ , α r 满足:
(1) 向量组A 0 : α 1 , α 2 , ⋯ , α r A_0: α_1,α_2,\cdots,α_r A 0 : α 1 , α 2 , ⋯ , α r 线性无关
(2) 向量组A A A 中任取r + 1 r+1 r + 1 个向量(若存在)都线性相关
则称A 0 A_0 A 0 为最大(线性)无关组 (Maximum linearly independent group),所含的向量数r r r 叫做向量组A A A 的秩 ,记为r A = r r_A=r r A = r
注:
(1) 一个向量组的最大无关组是向量组中所含向量个数最多的线性无关的子组之一.
(2)一个向量组的最大无关组不一定是惟一的.
(3) 一个向量组与它的最大无关组是等价的
定理 :矩阵的秩等于它的列向量组的秩,也等于它的行向量组的秩.
向量空间的概念和性质
向量空间 (Vector spaces): 设 V V V 为 n n n 维向量的非空集合,F F F 是一个数域,若 V V V 对于向量的加法和数乘两种运算封闭,那么称集合 V V V 为数域 F F F 上的向量空间 。所谓封闭是指
(1) ∀ α , β ∈ V , α + β ∈ V ∀ \mathbf{α,β}\in V,\mathbf{α+β}\in V ∀ α , β ∈ V , α + β ∈ V
(2) ∀ α ∈ V , λ ∈ F , λ α ∈ V ∀ \mathbf{α}\in V, λ\in F, λ\mathbf{α}\in V ∀ α ∈ V , λ ∈ F , λ α ∈ V
示例
(1) n n n 维向量的全体R n \R^n R n 为向量空间:R n = { ( x 1 , x 2 , ⋯ , x n ) T ∣ x 1 , x 2 , ⋯ , x n ∈ R } \R^n=\{(x_1,x_2,\cdots,x_n)^T|x_1,x_2,\cdots,x_n\in\R\} R n = { ( x 1 , x 2 , ⋯ , x n ) T ∣ x 1 , x 2 , ⋯ , x n ∈ R }
(2) 由向量组 a 1 , a 2 , ⋯ , a m a_1,a_2,\cdots,a_m a 1 , a 2 , ⋯ , a m 所生成的向量空间为:L = { x = λ 1 a 1 + λ 2 a 2 + ⋯ + λ m a m ∣ λ 1 , λ 2 , ⋯ , λ m ∈ R } L=\{x=λ_1a_1+λ_2a_2+\cdots+λ_ma_m|λ_1,λ_2,\cdots,λ_m\in\R\} L = { x = λ 1 a 1 + λ 2 a 2 + ⋯ + λ m a m ∣ λ 1 , λ 2 , ⋯ , λ m ∈ R }
(3) n 元齐次线性方程组的解集{ x = ( x 1 , x 2 , ⋯ , x n ) T ∈ R n ∣ A x = 0 } \{x=(x_1,x_2,\cdots,x_n)^T\in\R^n|Ax=0\} { x = ( x 1 , x 2 , ⋯ , x n ) T ∈ R n ∣ A x = 0 } 是向量空间, 齐次线性方程组的解空间
等价的向量组生成相同的向量空间。
子空间 (subspaces): 设有线性空间V 1 , V 2 V_1,V_2 V 1 , V 2 ,若V 1 ⊆ V 2 V_1\sube V_2 V 1 ⊆ V 2 ,对于 V 1 V_1 V 1 中
所定义的加法及乘数两种运算是封闭的,则称V 1 V_1 V 1 是V 2 V_2 V 2 的子空间 (subspace)。
任何由 n n n 维向量组成的线性空间都是 R n \R^n R n 的子空间。
基和维数 (basis and dimension): 设V V V 为数域 F F F 上的向量空间,向量α 1 , α 2 , ⋯ , α r \mathbf{α_1,α_2,\cdots,α_r} α 1 , α 2 , ⋯ , α r 为 V V V 中的 r r r 个向量,并且满足
(1) α 1 , α 2 , ⋯ , α r \mathbf{α_1,α_2,\cdots,α_r} α 1 , α 2 , ⋯ , α r 线性无关
(2) V V V 中的每个向量都可由 α 1 , α 2 , ⋯ , α r \mathbf{α_1,α_2,\cdots,α_r} α 1 , α 2 , ⋯ , α r 线性表示
则称向量组α 1 , α 2 , ⋯ , α r \mathbf{α_1,α_2,\cdots,α_r} α 1 , α 2 , ⋯ , α r 为线性空间 V V V 的一个基 ,而基中所含向量的个数 r r r ,称为向量空间 V V V 的维数 ,称V V V 为r r r 维向量空间,记为 dim V = r \dim V=r dim V = r
n n n 维单位坐标向量组 e 1 , e 2 , ⋯ , e n \mathbf{e_1},\mathbf{e_2},\cdots,\mathbf{e_n} e 1 , e 2 , ⋯ , e n 是R n \R^n R n 的自然基,dim R n = n \dim \R^n=n dim R n = n
e 1 = ( 1 0 ⋮ 0 ) , e 2 = ( 0 1 ⋮ 0 ) , ⋯ , e n = ( 0 0 ⋮ 1 ) \mathbf{e_1}=\begin{pmatrix}1\\0\\\vdots\\0\end{pmatrix},\mathbf{e_2}=\begin{pmatrix}0\\1\\\vdots\\0\end{pmatrix},\cdots,\mathbf{e_n}=\begin{pmatrix}0\\0\\\vdots\\1\end{pmatrix} e 1 = ⎝ ⎜ ⎜ ⎜ ⎛ 1 0 ⋮ 0 ⎠ ⎟ ⎟ ⎟ ⎞ , e 2 = ⎝ ⎜ ⎜ ⎜ ⎛ 0 1 ⋮ 0 ⎠ ⎟ ⎟ ⎟ ⎞ , ⋯ , e n = ⎝ ⎜ ⎜ ⎜ ⎛ 0 0 ⋮ 1 ⎠ ⎟ ⎟ ⎟ ⎞
R n \R^n R n 中任意n n n 个线性无关的 n n n 维向量都是 R n \R^n R n 的一组基。
向量组 A : a 1 , a 2 , ⋯ , a m A: \mathbf{a_1},\mathbf{a_2},\cdots,\mathbf{a_m} A : a 1 , a 2 , ⋯ , a m 所生成的向量空间
L = { x = λ 1 a 1 + λ 2 a 2 + ⋯ + λ m a m ∣ λ 1 , λ 2 , ⋯ , λ m ∈ R } L=\{\mathbf{x}=λ_1\mathbf{a_1}+λ_2\mathbf{a_2}+\cdots+λ_m\mathbf{a_m}|λ_1,λ_2,\cdots,λ_m\in\R\} L = { x = λ 1 a 1 + λ 2 a 2 + ⋯ + λ m a m ∣ λ 1 , λ 2 , ⋯ , λ m ∈ R }
若a 1 , a 2 , ⋯ , a m \mathbf{a_1},\mathbf{a_2},\cdots,\mathbf{a_m} a 1 , a 2 , ⋯ , a m 线性无关,则它是L L L 的一个基;
若a 1 , a 2 , ⋯ , a m \mathbf{a_1},\mathbf{a_2},\cdots,\mathbf{a_m} a 1 , a 2 , ⋯ , a m 线性相关,他的最大无关组 A 0 : a 1 , a 2 , ⋯ , a r A_0:\mathbf{a_1},\mathbf{a_2},\cdots,\mathbf{a_r} A 0 : a 1 , a 2 , ⋯ , a r 为L L L 的一个基,dim L = r \dim L=r dim L = r
坐标 (coordinate):如果在 向量空间V V V 中选定一组基 a 1 , a 2 , ⋯ , a r \mathbf{a_1},\mathbf{a_2},\cdots,\mathbf{a_r} a 1 , a 2 , ⋯ , a r ,那么空间中任意一向量可唯一表示为 x = λ 1 a 1 + λ 2 a 2 + ⋯ + λ r a r \mathbf{x}=λ_1\mathbf{a_1}+λ_2\mathbf{a_2}+\cdots+λ_r\mathbf{a_r} x = λ 1 a 1 + λ 2 a 2 + ⋯ + λ r a r ,其中数组λ 1 , λ 2 , ⋯ , λ r λ_1,λ_2,\cdots,λ_r λ 1 , λ 2 , ⋯ , λ r 称为向量x \mathbf{x} x 在基a 1 , a 2 , ⋯ , a r \mathbf{a_1},\mathbf{a_2},\cdots,\mathbf{a_r} a 1 , a 2 , ⋯ , a r 中的坐标。并记作 x = ( λ 1 , λ 2 , ⋯ , λ r ) T \mathbf{x}=(λ_1,λ_2,\cdots,λ_r)^T x = ( λ 1 , λ 2 , ⋯ , λ r ) T
基变换与坐标变换
基变换(change of bases) :设α 1 , α 2 , ⋯ , α n \mathbf{α_1,α_2,\cdots,α_n} α 1 , α 2 , ⋯ , α n 及β 1 , β 2 , ⋯ , β n \mathbf{β_1,β_2,\cdots,β_n} β 1 , β 2 , ⋯ , β n 是V n V_n V n 的两组基,他们之间的关系式
( β 1 , β 2 , ⋯ , β n ) = ( α 1 , α 2 , ⋯ , α n ) P (\mathbf{β_1,β_2,\cdots,β_n})=(\mathbf{α_1,α_2,\cdots,α_n})P
( β 1 , β 2 , ⋯ , β n ) = ( α 1 , α 2 , ⋯ , α n ) P
称为由α 1 , α 2 , ⋯ , α n \mathbf{α_1,α_2,\cdots,α_n} α 1 , α 2 , ⋯ , α n 到β 1 , β 2 , ⋯ , β n \mathbf{β_1,β_2,\cdots,β_n} β 1 , β 2 , ⋯ , β n 的基变换公式 ,n n n 维可逆矩阵 P P P 为由基α 1 , α 2 , ⋯ , α n \mathbf{α_1,α_2,\cdots,α_n} α 1 , α 2 , ⋯ , α n 到基β 1 , β 2 , ⋯ , β n \mathbf{β_1,β_2,\cdots,β_n} β 1 , β 2 , ⋯ , β n 的过渡矩阵 (transition matrix),显然 P − 1 P^{-1} P − 1 为由基β 1 , β 2 , ⋯ , β n \mathbf{β_1,β_2,\cdots,β_n} β 1 , β 2 , ⋯ , β n 到基α 1 , α 2 , ⋯ , α n \mathbf{α_1,α_2,\cdots,α_n} α 1 , α 2 , ⋯ , α n 的过渡矩阵 。
坐标变换 (coordinate transformation):设 a ∈ V n \mathbf{a}\in V_n a ∈ V n ,它的基α 1 , α 2 , ⋯ , α n \mathbf{α_1,α_2,\cdots,α_n} α 1 , α 2 , ⋯ , α n 与基β 1 , β 2 , ⋯ , β n \mathbf{β_1,β_2,\cdots,β_n} β 1 , β 2 , ⋯ , β n 下的坐标分别为( x 1 , x 2 , ⋯ , x n ) T (x_1,x_2,\cdots,x_n)^T ( x 1 , x 2 , ⋯ , x n ) T 与( x 1 ′ , x 2 ′ , ⋯ , x n ′ ) T (x'_1,x'_2,\cdots,x'_n)^T ( x 1 ′ , x 2 ′ , ⋯ , x n ′ ) T ,则有坐标变换公式
( x 1 x 2 ⋮ x n ) = P ( x 1 ′ x 2 ′ ⋮ x n ′ ) 或 ( x 1 ′ x 2 ′ ⋮ x n ′ ) = P − 1 ( x 1 x 2 ⋮ x n ) \begin{pmatrix} x_1 \\ x_2 \\ \vdots\\ x_n \end{pmatrix}
=P\begin{pmatrix} x'_1 \\ x'_2 \\ \vdots\\ x'_n \end{pmatrix}\ 或\
\begin{pmatrix} x'_1 \\ x'_2 \\ \vdots\\ x'_n \end{pmatrix}
=P^{-1}\begin{pmatrix} x_1 \\ x_2 \\ \vdots\\ x_n \end{pmatrix}
⎝ ⎜ ⎜ ⎜ ⎛ x 1 x 2 ⋮ x n ⎠ ⎟ ⎟ ⎟ ⎞ = P ⎝ ⎜ ⎜ ⎜ ⎛ x 1 ′ x 2 ′ ⋮ x n ′ ⎠ ⎟ ⎟ ⎟ ⎞ 或 ⎝ ⎜ ⎜ ⎜ ⎛ x 1 ′ x 2 ′ ⋮ x n ′ ⎠ ⎟ ⎟ ⎟ ⎞ = P − 1 ⎝ ⎜ ⎜ ⎜ ⎛ x 1 x 2 ⋮ x n ⎠ ⎟ ⎟ ⎟ ⎞
向量的内积、长度与正交性
内积 (inner products):设n n n 维实向量 x = ( x 1 , x 2 , ⋯ , x n ) , y = ( y 1 , y 2 , ⋯ , y n ) \mathbf{x}=(x_1,x_2,\cdots,x_n),\mathbf{y}=(y_1,y_2,\cdots,y_n) x = ( x 1 , x 2 , ⋯ , x n ) , y = ( y 1 , y 2 , ⋯ , y n ) ,定义内积为
[ x , y ] = x 1 y 1 + x 2 y 2 + ⋯ + x n y n = x y T \mathbf{[x,y]}=x_1y_1+x_2y_2+\cdots+x_ny_n=\mathbf{xy}^T
[ x , y ] = x 1 y 1 + x 2 y 2 + ⋯ + x n y n = x y T
性质
表达式
对称性
[ x , y ] = [ y , x ] \mathbf{[x,y]}=\mathbf{[y,x]} [ x , y ] = [ y , x ]
线性
[ x + y , z ] = [ x , z ] + [ y , z ] [ k x , y ] = k [ x , y ] \mathbf{[x+y,z]=[x,z]+[y,z]} \\ [k\mathbf{x,y}]=k\mathbf{[x,y]} [ x + y , z ] = [ x , z ] + [ y , z ] [ k x , y ] = k [ x , y ]
正定性
[ x , x ] ⩾ 0 \mathbf{[x,x]}⩾ 0 [ x , x ] ⩾ 0
长度(模或范数) :实数 ∥ x ∥ = [ x , x ] = x 1 2 + x 2 2 + ⋯ + x n 2 \|\mathbf{x}\|=\sqrt{\mathbf{[x,x]}}=\sqrt{x_1^2+x_2^2+\cdots+x_n^2} ∥ x ∥ = [ x , x ] = x 1 2 + x 2 2 + ⋯ + x n 2
长度为1的向量称为单位向量。
性质
表达式
正定性
∥ x ∥ ⩾ 0 \Vert\mathbf{x}\Vert ⩾ 0 ∥ x ∥ ⩾ 0
齐次性
∥ k x ∥ = ∣ k ∣ ⋅ ∥ x ∥ \Vert k\mathbf{x}\Vert=\vert k\vert \cdot\Vert \mathbf{x}\Vert ∥ k x ∥ = ∣ k ∣ ⋅ ∥ x ∥
三角不等式
∥ x + y ∥ ⩽ ∥ x ∥ + ∥ y ∥ \Vert\mathbf{x+y}\Vert⩽ \Vert \mathbf{x}\Vert+\Vert \mathbf{y}\Vert ∥ x + y ∥ ⩽ ∥ x ∥ + ∥ y ∥
柯西-施瓦兹不等式
[ x , y ] 2 ⩽ [ x , x ] [ y , y ] \mathbf{[x,y]}^2⩽ \mathbf{[x,x]}\mathbf{[y,y]} [ x , y ] 2 ⩽ [ x , x ] [ y , y ]
向量之间的夹角 :x \mathbf{x} x 与y \mathbf{y} y 的夹角θ = arccos [ x , y ] ∥ x ∥ ∥ y ∥ , ( 0 ⩽ θ ⩽ π ) θ=\arccos\dfrac{\mathbf{[x,y]}}{\|\mathbf{x}\|\|\mathbf{y}\|}, (0 ⩽θ ⩽π) θ = arccos ∥ x ∥ ∥ y ∥ [ x , y ] , ( 0 ⩽ θ ⩽ π )
正交 (orthogonal):若[ x , y ] = 0 \mathbf{[x,y]}=0 [ x , y ] = 0 ,则称向量x , y \mathbf{x,y} x , y 正交
(1) 若向量组中的向量两两正交,且均为非零向量,则这个向量组称为正交(向量)组 。正交向量组线性无关。
(2) 由单位向量组成的正交组称为规范正交组 。如
e 1 = ( 1 , 0 , 0 ) T , e 2 = ( 0 , 1 , 0 ) T , e 3 = ( 0 , 0 , 1 ) T e_1=(1,0,0)^T,e_2=(0,1,0)^T,e_3=(0,0,1)^T e 1 = ( 1 , 0 , 0 ) T , e 2 = ( 0 , 1 , 0 ) T , e 3 = ( 0 , 0 , 1 ) T
(3) 若正交向量组为向量空间V V V 上的一个基,则称为向量空间上的一个正交基 (orthogonal basis)
(4) 若规范正交组为向量空间V V V 上的一个基,则称为向量空间上的一个规范正交基 (orthonormal basis)
向量组的正交化
若e 1 , e 2 , ⋯ , e r \mathbf{e_1},\mathbf{e_2},\cdots,\mathbf{e_r} e 1 , e 2 , ⋯ , e r 是向量空间V V V 的一个规范正交基
∀ x ∈ V , x = λ 1 e 1 + λ 2 e 2 + ⋯ + λ r e r ⟹ λ i = e i T x = [ x , e i ] ∀\mathbf{x}\in V,\mathbf{x}=λ_1\mathbf{e_1}+λ_2\mathbf{e_2}+\cdots+λ_r\mathbf{e_r}\implies λ_i=\mathbf{e_i}^T\mathbf{x}=[\mathbf{x,e_i}] ∀ x ∈ V , x = λ 1 e 1 + λ 2 e 2 + ⋯ + λ r e r ⟹ λ i = e i T x = [ x , e i ]
这就是向量在规范正交基中的坐标的计算公式,利用这个公式能方便地求得向量的坐标.
施密特正交化法 (Schimidt orthogonalization)
设α 1 , α 2 , ⋯ , α r \mathbf{α_1,α_2,\cdots,α_r} α 1 , α 2 , ⋯ , α r 是向量空间V V V 的一个基,寻找向量空间的一个规范正交基。也就是要找一组两两正交的单位向量 ξ 1 , ξ 2 , ⋯ , ξ r ξ_1,ξ_2,\cdots,ξ_r ξ 1 , ξ 2 , ⋯ , ξ r 与α 1 , α 2 , ⋯ , α r \mathbf{α_1,α_2,\cdots,α_r} α 1 , α 2 , ⋯ , α r 等价。
此问题称为把基 α 1 , α 2 , ⋯ , α r \mathbf{α_1,α_2,\cdots,α_r} α 1 , α 2 , ⋯ , α r 规范正交化 (orthonormalization)
(1) 正交化
令 β 1 = α 1 , β 2 = α 2 − [ β 1 , α 2 ] [ β 1 , β 1 ] β 1 , β 3 = α 3 − [ β 1 , α 3 ] [ β 1 , β 1 ] β 1 − [ β 2 , α 3 ] [ β 2 , β 2 ] β 2 , β_1=α_1,β_2=α_2-\dfrac{[β_1,α_2]}{[β_1,β_1]}β_1,β_3=α_3-\dfrac{[β_1,α_3]}{[β_1,β_1]}β_1-\dfrac{[β_2,α_3]}{[β_2,β_2]}β_2, β 1 = α 1 , β 2 = α 2 − [ β 1 , β 1 ] [ β 1 , α 2 ] β 1 , β 3 = α 3 − [ β 1 , β 1 ] [ β 1 , α 3 ] β 1 − [ β 2 , β 2 ] [ β 2 , α 3 ] β 2 ,
⋯ , β r = α r − ∑ k = 1 r − 1 [ β k , α r ] [ β k , β k ] β k \cdots,β_r=α_r-\displaystyle\sum_{k=1}^{r-1}\dfrac{[β_k,α_r]}{[β_k,β_k]}β_k ⋯ , β r = α r − k = 1 ∑ r − 1 [ β k , β k ] [ β k , α r ] β k
则 β 1 , β 2 , ⋯ , β r \mathbf{β_1,β_2,\cdots,β_r} β 1 , β 2 , ⋯ , β r 正交,且与α 1 , α 2 , ⋯ , α r \mathbf{α_1,α_2,\cdots,α_r} α 1 , α 2 , ⋯ , α r 等价
(2) 规范化
令ξ 1 = β 1 ∥ β 1 ∥ , ξ 2 = β 2 ∥ β 2 ∥ , ⋯ , ξ r = β r ∥ β r ∥ ξ_1=\dfrac{β_1}{\|β_1\|},ξ_2=\dfrac{β_2}{\|β_2\|},\cdots,ξ_r=\dfrac{β_r}{\|β_r\|} ξ 1 = ∥ β 1 ∥ β 1 , ξ 2 = ∥ β 2 ∥ β 2 , ⋯ , ξ r = ∥ β r ∥ β r
就得到V V V 的一个规范正交基
正交矩阵与正交变换
正交矩阵 (orthogonal matrix):如果n阶矩阵A满足A T A = E A^TA=E A T A = E (即A − 1 = A T A^{-1}=A^T A − 1 = A T ),那么称A为正交矩阵,简称正交阵。
正交矩阵的性质 :A A A 为正交阵
⟺ A \iff A ⟺ A 的行(列)向量组为规范正交向量组
⟺ A T \iff A^T ⟺ A T 为正交阵
⟺ A − 1 \iff A^{-1} ⟺ A − 1 为正交阵
⟹ ∣ A ∣ 2 = 1 \implies |A|^2=1 ⟹ ∣ A ∣ 2 = 1 为正交阵
A , B A,B A , B 为正交阵 ⟹ A B \implies AB ⟹ A B 为正交阵
正交变换 (orthogonal transformation):若为 P P P 正交矩阵,则线性变换 y = P x \mathbf{y}=P\mathbf{x} y = P x 称为正交变换。
∥ y ∥ = [ y , y ] = y T y = x T P T P x = x T x = [ x , x ] = ∥ x ∥ \|\mathbf{y}\|=\sqrt{[\mathbf{y,y}]}=\sqrt{\mathbf{y^T y}} \\
=\sqrt{\mathbf{x^T P^T Px}} \\
=\sqrt{\mathbf{x^T x}}=\sqrt{[\mathbf{x,x}]}=\|\mathbf{x}\| ∥ y ∥ = [ y , y ] = y T y = x T P T P x = x T x = [ x , x ] = ∥ x ∥
注:经正交变换后向量的长度保持不变,内积保持不变,从而夹角保持不变
相似矩阵
矩阵的特征值和特征向量
定义
(1) 设A A A 是n n n 阶矩阵,如果数λ λ λ 和n n n 维非零向量x \mathbf{x} x 满足
A x = λ x A\mathbf{x}=λ \mathbf{x}
A x = λ x
则这样的数λ λ λ 称为矩阵A A A 的特征值 (eigenvalues),向量x \mathbf{x} x 称为A A A 的对应于特征值λ λ λ 的特征向量 (eigenvectors)。
A x = λ x ⟺ ( A − λ E ) x = 0 A\mathbf{x}=λ \mathbf{x} \iff (A-λ E)\mathbf{x}=0 A x = λ x ⟺ ( A − λ E ) x = 0 有非零解 ⟺ ∣ A − λ E ∣ = 0 \iff |A-λ E|=0 ⟺ ∣ A − λ E ∣ = 0
(2) 以λ λ λ 为未知数的一元n次方程∣ A − λ E ∣ = 0 |A-λ E|=0 ∣ A − λ E ∣ = 0 称为A的特征方程 (characteristic equation)。矩阵A的特征值就是它的特征方程的根.
(3) f ( λ ) = ∣ A − λ E ∣ f(λ)=|A-λ E| f ( λ ) = ∣ A − λ E ∣ 称为矩阵A的特征多项式 (characteristic polynomial)
特征值与特征向量的性质 :
n 阶矩阵A = ( a i j ) A=(a_{ij}) A = ( a i j ) 在复数范围内有n个特征值,设特征值为λ 1 , λ 2 , ⋯ , λ n λ_1,λ_2,\cdots,λ_n λ 1 , λ 2 , ⋯ , λ n ,则
{ λ 1 + λ 2 + ⋯ + λ n = A = a 11 + a 22 + ⋯ + a n n λ 1 λ 2 ⋯ λ n = ∣ A ∣ \begin{cases}λ_1+λ_2+\cdots+λ_n=\mathrm{A}=a_{11}+a_{22}+\cdots+a_{nn} \\
λ_1λ_2\cdotsλ_n=|A|
\end{cases} { λ 1 + λ 2 + ⋯ + λ n = A = a 1 1 + a 2 2 + ⋯ + a n n λ 1 λ 2 ⋯ λ n = ∣ A ∣
设 λ λ λ 是方阵 A A A 的特征值,则
⟹ \implies ⟹ λ λ λ 是 A T A^T A T 的特征值
⟹ \implies ⟹ 当 A A A 可逆时,λ − 1 λ^{-1} λ − 1 是 A − 1 A^{-1} A − 1 的特征值.
⟹ \implies ⟹ ϕ ( λ ) ϕ(λ) ϕ ( λ ) 是ϕ ( A ) ϕ(A) ϕ ( A ) 的特征值
⟹ \implies ⟹ 属于不同特征值的特征向量是线性无关的
⟹ \implies ⟹ 对应于不同特征值的线性无关的特征向量组,合起来仍是线性无关的
特征值与特征向量的求法
步骤: (1) 写出A的特征多项式 ∣ A − λ E ∣ |A-λ E| ∣ A − λ E ∣
(2). 解特征方程得n个特征值 λ 1 , λ 2 , ⋯ , λ n λ_1,λ_2,\cdots,λ_n λ 1 , λ 2 , ⋯ , λ n
(3). 对每个特征值 λ i λ_i λ i ,求 ( A − λ i E ) x = 0 (A-λ_i E)\mathbf{x}=0 ( A − λ i E ) x = 0 的基础解系,写出其全体非零线性组合,即得 λ i λ_i λ i 的全体特征向量
相似矩阵
定义 :设 A , B A, B A , B 都是 n n n 阶矩阵,若存在可逆阵 P P P ,使得P − 1 A P = B P^{-1}AP=B P − 1 A P = B ,则称A与B相似 (Similar),记作A ∼ B A∼ B A ∼ B ,对 A 进行运算 P − 1 A P P^{-1}AP P − 1 A P 称为对 A进行相似变换 (similarity transformation)。
性质 :
(1) 相似关系为等价关系
反身性:A ∼ A A∼ A A ∼ A
对称性:A ∼ B ⟹ B ∼ A A∼ B\implies B∼ A A ∼ B ⟹ B ∼ A
传递性:A ∼ B , B ∼ C ⟹ A ∼ C A∼ B,B∼ C\implies A∼ C A ∼ B , B ∼ C ⟹ A ∼ C
(2) A ∼ B A∼ B A ∼ B
⟹ ϕ ( A ) ∼ ϕ ( B ) \implies ϕ(A)∼ ϕ(B) ⟹ ϕ ( A ) ∼ ϕ ( B ) ,其中ϕ ϕ ϕ 是一个多项式
⟹ r ( A ) = r ( B ) 且 ∣ A ∣ = ∣ B ∣ \implies r(A)=r(B)且|A|=|B| ⟹ r ( A ) = r ( B ) 且 ∣ A ∣ = ∣ B ∣
⟹ ∣ A − λ E ∣ = ∣ B − λ E ∣ \implies |A-λ E|= |B-λ E| ⟹ ∣ A − λ E ∣ = ∣ B − λ E ∣ ,特征多项式相同
⟹ A \implies A ⟹ A 与 B B B 的特征值相同
⟹ t r A = t r B \implies \mathrm{tr} A= \mathrm{tr} B ⟹ t r A = t r B 迹(trace)相等(主对角线上元素的和)
矩阵的相似对角化 (Similar diagonalization):若 A n × n ∼ Λ = d i a g ( λ 1 , λ 2 , ⋯ , λ n ) = P − 1 A P A_{n× n}∼Λ=\mathrm{diag}(λ_1,λ_2,\cdots,λ_n)=P^{-1}AP A n × n ∼ Λ = d i a g ( λ 1 , λ 2 , ⋯ , λ n ) = P − 1 A P ,则称 A A A 能相似对角化 ,对角线就是 A A A 的 n n n 个特征值。
假设已找到可逆阵 P = ( p 1 , p 2 , ⋯ , p n ) P=(p_1,p_2,\cdots,p_n) P = ( p 1 , p 2 , ⋯ , p n ) ,
由 P − 1 A P = Λ ⟹ A P = P Λ ⟹ A p i = λ i p i ( i = 1 , 2 , ⋯ , n ) P^{-1}AP=Λ \implies AP=PΛ\implies Ap_i=λ_ip_i(i=1,2,\cdots,n) P − 1 A P = Λ ⟹ A P = P Λ ⟹ A p i = λ i p i ( i = 1 , 2 , ⋯ , n )
可见 λ i λ_i λ i 是A A A 的特征值,而 P P P 的列向量 p i p_i p i 就是 A A A 的对应于特征值 λ i λ_i λ i 的特征向量。
定理 矩阵A n × n A_{n× n} A n × n 能相似对角化
⟺ A \iff A ⟺ A 有n个线性无关的特征向量
⟺ \iff ⟺ 对于A A A 的每个n i n_i n i 重特征值λ i λ_i λ i ,特征矩阵λ i E − A λ_iE-A λ i E − A 的秩为n − n i n-n_i n − n i
⟸ A \impliedby A ⟸ A 有n个互不相同的特征值
对称矩阵的对角化
对称矩阵特征值、特征向量的性质 :设 A n × n A_{n× n} A n × n 为对称阵,特征值为λ 1 , λ 2 , ⋯ , λ n λ_1,λ_2,\cdots,λ_n λ 1 , λ 2 , ⋯ , λ n
(1) λ 1 , λ 2 , ⋯ , λ n ∈ R λ_1,λ_2,\cdots,λ_n \in \R λ 1 , λ 2 , ⋯ , λ n ∈ R
(2) 设 λ 1 , λ 2 λ_1,λ_2 λ 1 , λ 2 是对称矩阵 A A A 的两个特征值,p 1 , p 2 p_1,p_2 p 1 , p 2 是对应的特征向量.,若 λ 1 ≠ λ 2 λ_1\neq λ_2 λ 1 = λ 2 则 p 1 , p 2 p_1,p_2 p 1 , p 2 正交,即 p 1 T p 2 = 0 p_1^Tp_2=0 p 1 T p 2 = 0
(3) 任意对称阵A A A ,必有正交阵 P P P ,使 P − 1 A P = P T A P = d i a g ( λ 1 , λ 2 , ⋯ , λ n ) P^{-1}AP=P^TAP=\mathrm{diag}(λ_1,λ_2,\cdots,λ_n) P − 1 A P = P T A P = d i a g ( λ 1 , λ 2 , ⋯ , λ n )
对称矩阵的正交对角化步骤 :设 A n × n A_{n× n} A n × n 为对称阵
(1) 求出 A A A 的全部特征值,设为 λ 1 , λ 2 , ⋯ , λ s λ_1,λ_2,\cdots,λ_s λ 1 , λ 2 , ⋯ , λ s (两两不同),每个特征值分别有l 1 , l 2 , ⋯ , l s l_1,l_2,\cdots,l_s l 1 , l 2 , ⋯ , l s 重(l 1 + l 2 + ⋯ + l s = n l_1+l_2+\cdots+l_s=n l 1 + l 2 + ⋯ + l s = n )
(2) 解 ( A − λ i E ) x = 0 (A-λ_iE)x=0 ( A − λ i E ) x = 0 ,求 A A A 的 l i l_i l i 个线性无关的 λ i λ_i λ i 特征向量
(3) 各组内部正交化、单位化
(4) 将各组向量并排得正交阵 P n × n P_{n× n} P n × n ,则P − 1 A P = P T A P = Λ = d i a g ( λ 1 , λ 2 , ⋯ , λ n ) P^{-1}AP=P^TAP=Λ=\mathrm{diag}(λ_1,λ_2,\cdots,λ_n) P − 1 A P = P T A P = Λ = d i a g ( λ 1 , λ 2 , ⋯ , λ n )
二次型
二次型及其标准型
概念 :n元二次齐次多项式 f ( x 1 , x 2 , ⋯ , x n ) = ∑ i = 1 n a i i x i 2 + ∑ 1 ⩽ i < j ⩽ n 2 a i j x i x j f(x_1,x_2,\cdots,x_n)=\displaystyle\sum_{i=1}^{n}a_{ii}x_i^2+\displaystyle\sum_{1⩽ i<j⩽ n}2a_{ij}x_ix_j f ( x 1 , x 2 , ⋯ , x n ) = i = 1 ∑ n a i i x i 2 + 1 ⩽ i < j ⩽ n ∑ 2 a i j x i x j
叫做二次型 (quadratic form),可表示为矩阵形式 f = x T A x f=\mathbf{x}^TA\mathbf{x} f = x T A x ,其中 x = ( x 1 , x 2 , ⋯ , x n ) T , A \mathbf{x}=(x_1,x_2,\cdots,x_n)^T,A x = ( x 1 , x 2 , ⋯ , x n ) T , A 为n n n 阶对称矩阵;(二次型f ↔ f \lrarr f ↔ 实对称矩阵)
只含有平方项的二次型称为二次型的标准形 (standard form);(标准型↔ \lrarr ↔ 对角矩阵)
系数全为"+1"或"-1"的标准型叫做(二次型)的规范型 (gauge form);
系数全为实数的二次型叫做实二次型 。
二次型可通过满秩(或可逆)线性变换化为标准型
用正交变换将二次型标准化 :具有保持几何形状不变的优点
定理 :任意二次型 f = ∑ i , j = 1 n a i j x i x j ( a i j = a j i ) f=\displaystyle\sum_{i,j=1}^{n}a_{ij}x_ix_j(a_{ij}=a_{ji}) f = i , j = 1 ∑ n a i j x i x j ( a i j = a j i ) ,总有正交变换 x = P y x=Py x = P y 化二次型为标准型 f = λ 1 y 1 2 + λ 2 y 2 2 + ⋯ + λ n y n 2 f=λ_1y_1^2+λ_2y_2^2+\cdots+λ_ny_n^2 f = λ 1 y 1 2 + λ 2 y 2 2 + ⋯ + λ n y n 2 ,其中λ 1 , λ 2 , ⋯ , λ n λ_1,λ_2,\cdots,λ_n λ 1 , λ 2 , ⋯ , λ n 是f f f 的矩阵A = ( a i j ) A=(a_{ij}) A = ( a i j ) 的特征值。
推论 :任意n n n 元二次型 f = x T A x ( A T = A ) f=\mathbf{x}^TA\mathbf{x} (A^T=A) f = x T A x ( A T = A ) ,总有可逆变换 x = C z x=Cz x = C z ,使 f ( C z ) f(Cz) f ( C z ) 为规范型。
具体步骤如下:
(1) 将二次型表成矩阵形式 f = x T A x f=\mathbf{x}^TA\mathbf{x} f = x T A x ,求出 A A A
(2) 求出 A A A 的所有特征值λ 1 , λ 2 , ⋯ , λ n λ_1,λ_2,\cdots,λ_n λ 1 , λ 2 , ⋯ , λ n
(3) 求出对应于特征值的特征向量 ξ 1 , ξ 2 , ⋯ , ξ n ξ_1,ξ_2,\cdots,ξ_n ξ 1 , ξ 2 , ⋯ , ξ n
(4) 将特征向量ξ 1 , ξ 2 , ⋯ , ξ n ξ_1,ξ_2,\cdots,ξ_n ξ 1 , ξ 2 , ⋯ , ξ n 正交化、单位化,得 P = ( p 1 , p 2 , ⋯ , p n ) P=(p_1,p_2,\cdots,p_n) P = ( p 1 , p 2 , ⋯ , p n )
(5) 作正交变换 x = P y x=Py x = P y 化二次型为标准型 f = λ 1 y 1 2 + λ 2 y 2 2 + ⋯ + λ n y n 2 f=λ_1y_1^2+λ_2y_2^2+\cdots+λ_ny_n^2 f = λ 1 y 1 2 + λ 2 y 2 2 + ⋯ + λ n y n 2
拉格朗日配方法化二次型为标准型
主要步骤如下:
(1) 设二次型含有x i x_i x i 的平方项,则把含有x i x_i x i 的项集中,然后按x i x_i x i 配成平方项,对其他变量也做类似处理,知道都配成平方项为止。
(2) 若在二次型中没有平方项,但 a i j ≠ 0 ( i ≠ j ) a_{ij}\neq 0(i\neq j) a i j = 0 ( i = j ) ,则做可逆线性变换 x i = y i − y j , x j = y i + y j , x k = y k ( k ≠ i , j ) x_i=y_i-y_j, x_j=y_i+y_j, x_k= y_k(k\neq i,j) x i = y i − y j , x j = y i + y j , x k = y k ( k = i , j ) ,化二次型为含平方项的二次型,再按(1) 中的方法配方。
矩阵的合同与惯性定理
合同矩阵 (congruent matrices;cogradient matrices):设 A A A 和 B B B 是 n n n 阶矩阵,若有可逆矩阵 C C C ,使 B = C T A C B=C^TAC B = C T A C ,则称矩阵 A A A 与 B B B 合同,记为A ≃ B A≃ B A ≃ B
合同矩阵的性质
(1). 合同关系为等价关系
反身性:A ≃ A A≃ A A ≃ A
对称性:A ≃ B ⟹ B ≃ A A≃ B\implies B≃ A A ≃ B ⟹ B ≃ A
传递性:A ≃ B , B ≃ C ⟹ A ≃ C A≃ B,B≃ C\implies A≃ C A ≃ B , B ≃ C ⟹ A ≃ C
(2). 与对称矩阵合同的矩阵也是对称矩阵
(3). 合同矩阵具有相同的秩.
惯性定理 (inertia theorem):设二次型f = x T A x f=\mathbf{x}^TA\mathbf{x} f = x T A x 的秩为r r r ,有两个可逆变换 x = C y x=Cy x = C y 及 x = P z x=Pz x = P z ,
使 f = k 1 y 1 2 + k 2 y 2 2 + ⋯ + k r y r 2 ( k i ≠ 0 ) f=k_1y_1^2+k_2y_2^2+\cdots+k_ry_r^2\quad(k_i\neq0) f = k 1 y 1 2 + k 2 y 2 2 + ⋯ + k r y r 2 ( k i = 0 )
及 f = λ 1 z 1 2 + λ 2 z 2 2 + ⋯ + λ r z r 2 ( λ i ≠ 0 ) f=λ_1z_1^2+λ_2z_2^2+\cdots+λ_rz_r^2\quad(λ_i\neq0) f = λ 1 z 1 2 + λ 2 z 2 2 + ⋯ + λ r z r 2 ( λ i = 0 )
则 k 1 , k 2 , ⋯ , k r k_1,k_2,\cdots,k_r k 1 , k 2 , ⋯ , k r 中正数得个数与λ 1 , λ 2 , ⋯ , λ r λ_1,λ_2,\cdots,λ_r λ 1 , λ 2 , ⋯ , λ r 中正数得个数相等。
二次型的标准形中,
负系数的个数称为二次型的负惯性指数 (Negative inertia index)
正系数的个数称为二次型的正惯性指数 (Positive inertia index)
若二次型 f f f 的正惯性指数为 p p p ,秩为 r r r ,
则 f f f 的规范形便可确定为 f = y 1 2 + y 2 2 + ⋯ + y p 2 − y p + 1 2 − ⋯ − y r 2 f=y_1^2+y_2^2+\cdots+y_p^2-y_{p+1}^2-\cdots-y_r^2 f = y 1 2 + y 2 2 + ⋯ + y p 2 − y p + 1 2 − ⋯ − y r 2
正定二次型
定义 :设二次型f ( x ) = x T A x f(\mathbf{x})=\mathbf{x}^TA\mathbf{x} f ( x ) = x T A x ,如果对任何 x ≠ 0 \mathbf{x}\neq\mathbf{0} x = 0 都有 f ( x ) > 0 f(\mathbf{x})>0 f ( x ) > 0 (显然f ( 0 ) = 0 f(\mathbf{0})=0 f ( 0 ) = 0 ),则称 f f f 为正定二次型 (positive definite quadratic form),并称对称阵 A A A 是正定矩阵 (positive definite matrix)。
非退化线性替换不改变二次型的正定性。
正定矩阵的判别法 :二次型f ( x ) = x T A x f(\mathbf{x})=\mathbf{x}^TA\mathbf{x} f ( x ) = x T A x 正定,其中x = ( x 1 , x 2 , ⋯ , x n ) T \mathbf{x}=(x_1,x_2,\cdots,x_n)^T x = ( x 1 , x 2 , ⋯ , x n ) T
⟺ ∀ x ≠ 0 , x T A x > 0 \iff ∀\mathbf{x}\neq\mathbf{0},\mathbf{x}^TA\mathbf{x}>0 ⟺ ∀ x = 0 , x T A x > 0
⟺ A \iff A ⟺ A 的特征值全大于零
⟺ f \iff f ⟺ f 的正惯性指数为 n n n
⟺ A \iff A ⟺ A 与单位矩阵合同
⟺ \iff ⟺ 存在可逆矩阵C C C ,使得 A = C C T A=CC^T A = C C T
⟺ A \iff A ⟺ A 的各阶顺序主子式均大于零
D 1 = a 11 > 0 , D 2 = ∣ a 11 a 12 a 21 a 22 ∣ > 0 , ⋯ , D n = ∣ A ∣ > 0 D_1=a_{11}>0,
D_2=\begin{vmatrix}
a_{11}&a_{12} \\
a_{21}&a_{22}
\end{vmatrix}>0,\cdots,D_n=|A|>0 D 1 = a 1 1 > 0 , D 2 = ∣ ∣ ∣ ∣ a 1 1 a 2 1 a 1 2 a 2 2 ∣ ∣ ∣ ∣ > 0 , ⋯ , D n = ∣ A ∣ > 0
线性变换
线性空间的定义与性质
线性空间 (linear space): 设 V V V 为 非空集合,R \R R 为实数域,若 V V V 对于向量的加法和数乘两种运算封闭,且满足八条运算规律,那么称集合 V V V 为实数域 R \R R 上的线性空间 。封闭是指
(1) ∀ α , β ∈ V , ∃ ! γ = α + β ∈ V ∀ \mathbf{α,β}\in V,∃! \mathbf{γ=α+β}\in V ∀ α , β ∈ V , ∃ ! γ = α + β ∈ V
(2) ∀ α ∈ V , λ ∈ R , ∃ ! δ = λ α ∈ V ∀ \mathbf{α}\in V, λ\in \R, ∃! \mathbf{δ}=λ\mathbf{α}\in V ∀ α ∈ V , λ ∈ R , ∃ ! δ = λ α ∈ V
八条运算规律
α , β , γ ∈ V , λ , μ ∈ R α,β,γ\in V,λ,μ\in\R α , β , γ ∈ V , λ , μ ∈ R
( i ) α + β = β + α (\mathbf{i})\ α+β=β+α ( i ) α + β = β + α
( i i ) ( α + β ) + γ = α + ( β + γ ) (\mathbf{ii})\ (α+β)+γ=α+(β+γ) ( i i ) ( α + β ) + γ = α + ( β + γ )
( i i i ) ∃ Θ ∈ V , ∀ α ∈ V , α + Θ = α (\mathbf{iii})\ ∃ Θ\in V,∀ α\in V,α+Θ=α ( i i i ) ∃ Θ ∈ V , ∀ α ∈ V , α + Θ = α (零元素)
( i v ) ∀ α ∈ V , ∃ β ∈ V , α + β = Θ (\mathbf{iv})\ ∀ α\in V,∃ β\in V, α+β=Θ ( i v ) ∀ α ∈ V , ∃ β ∈ V , α + β = Θ (负元素)
( v ) 1 α = α (\mathbf{v})\ 1α=α ( v ) 1 α = α
( v i ) ( λ μ ) α = λ ( μ α ) (\mathbf{vi})\ (λμ)α=λ(μα) ( v i ) ( λ μ ) α = λ ( μ α )
( v i i ) ( λ + μ ) α = λ α + μ α (\mathbf{vii})\ (λ+μ)α=λα+μα ( v i i ) ( λ + μ ) α = λ α + μ α
( v i i i ) λ ( α + β ) = λ α + λ β (\mathbf{viii})\ λ(α+β)=λα+λβ ( v i i i ) λ ( α + β ) = λ α + λ β
说明:
(1) 满足八条运算规律的加法与数乘运算,就称为线性运算,
凡定义了线性运算的集合就称为线性空间,元 素就称为向量.
(2) 向量不一定是有序数组.
(3) 线性空间的运算不一定是有序数组的加法及数乘运算.
注意:
线性空间的概念是集合与运算二者的结合。同一个集合,若 定义两种不同的线性运算,就构成不同的线性空间; 若定义的运算不是线性运算,就不能构成线性空间。
线性空间实例
向量类:
(1).全体 n 维向量 R \R R 在向量的加法与数乘下
(2).向量空间
(3).齐次线性方程组的解空间
矩阵类:
(1).全体 m × n m× n m × n 阵在矩阵加法和数乘下
(2).全体n阶方阵
(3).全体n阶对称阵
(4).全体n阶对角阵
多项式类:次数不超过 n 的实一元多项式的全体
P [ x ] n = { p = a n x n + ⋯ + a 1 x + a 0 ∣ a n , ⋯ , a 1 , a 0 ∈ R } P[x]_n=\{p=a_nx_n+\cdots+a_1x+a_0|a_n,\cdots,a_1,a_0\in\R\} P [ x ] n = { p = a n x n + ⋯ + a 1 x + a 0 ∣ a n , ⋯ , a 1 , a 0 ∈ R } ,
对于通常的多项式的加法和数乘多项式的乘法.
函数类:正弦函数的集合
S [ x ] = { s = A sin ( x + B ) ∣ A , B ∈ R } S[x]=\{s=A\sin(x+B)|A,B\in\R\} S [ x ] = { s = A sin ( x + B ) ∣ A , B ∈ R } ,
对于通常的函数加法和数乘函数的乘法.
线性空间的基本性质
(1) 零元素 Θ Θ Θ 是惟一的
(2) 任一向量的负向量是惟一的,α α α 的负向量记作 − α -α − α
(3) 0 α = Θ , ( − 1 ) α = − α , λ Θ = Θ 0α=Θ,(-1)α=-α,λΘ=Θ 0 α = Θ , ( − 1 ) α = − α , λ Θ = Θ
(4) λ α = Θ ⟹ λ = 0 或 α = Θ λα=Θ\implies λ=0或α=Θ λ α = Θ ⟹ λ = 0 或 α = Θ
子空间 (subspace):设 V V V 是一个线性空间,L L L 是 V V V 的一个非空子集,如果 L L L 对于V V V 中所定义的加法和数乘两种运算也构成一个线性空间,则称 L L L 为V V V 的子空间.
定理 线性空间V V V 的非空子集L L L 构成子空间 ⟺ L \iff L ⟺ L 对于V V V 中的线性运算封闭
基、维数和坐标 :定义同向量空间
同构 (isomorphism):设U 与V 是两个线性空间,如 果它们的向量之间有一一对应关系,且 这个对应关系保持线性组合的对应,就说线性空间U 与V 同构,记作 U ≅ V U\cong V U ≅ V
设在n 维线性空间 V n V_n V n 中取定一个基 α 1 , α 2 , ⋯ , α n α_1,α_2,\cdots,α_n α 1 , α 2 , ⋯ , α n ,则∀ α , β ∈ V n ∀α,β\in V_n ∀ α , β ∈ V n
α ↔ ( x 1 , x 2 , ⋯ , x n ) T , β ↔ ( y 1 , y 2 , ⋯ , y n ) T α\lrarr (x_1,x_2,\cdots,x_n)^T,β\lrarr (y_1,y_2,\cdots,y_n)^T α ↔ ( x 1 , x 2 , ⋯ , x n ) T , β ↔ ( y 1 , y 2 , ⋯ , y n ) T
这个一一对应关系保持线性组合的对应:
(1) α + β ↔ ( x 1 , x 2 , ⋯ , x n ) T + ( y 1 , y 2 , ⋯ , y n ) T α+β\lrarr (x_1,x_2,\cdots,x_n)^T+ (y_1,y_2,\cdots,y_n)^T α + β ↔ ( x 1 , x 2 , ⋯ , x n ) T + ( y 1 , y 2 , ⋯ , y n ) T
(2) λ α ↔ λ ( x 1 , x 2 , ⋯ , x n ) T λα\lrarr λ(x_1,x_2,\cdots,x_n)^T λ α ↔ λ ( x 1 , x 2 , ⋯ , x n ) T
称 V n V_n V n 与 R n \R^n R n 同构,记作 V n ≅ R n V_n\cong\R^n V n ≅ R n
任何n 维线性空间都与R n \R^n R n 同构,即维数相等的线性空间都同构。线性空间的结构完全被它的维数所决定。
基变换与坐标变换 :同向量空间
线性空间 p [ x ] 3 p[x]_3 p [ x ] 3 实例
(1) 取一个基p 1 = 1 , p 2 = x , p 3 = x 2 , p 4 = x 3 p_1=1,p_2=x,p_3=x^2,p_4=x^3 p 1 = 1 , p 2 = x , p 3 = x 2 , p 4 = x 3 ,求坐标
任一不超过3 次的多项式 p = a 3 x 3 + a 2 x 2 + a 1 x + a 0 p=a_3x^3+a_2x^2+a_1x+a_0 p = a 3 x 3 + a 2 x 2 + a 1 x + a 0
都可表示为 p = a 0 p 1 + a 1 p 2 + a 2 p 3 + a 3 p 4 p=a_0p_1+a_1p_2+a_2p_3+a_3p_4 p = a 0 p 1 + a 1 p 2 + a 2 p 3 + a 3 p 4
因此 p p p 在这个基中的坐标为( a 0 , a 1 , a 2 , a 3 ) T (a_0,a_1,a_2,a_3)^T ( a 0 , a 1 , a 2 , a 3 ) T
(2) 任取两个基,求坐标变换公式
a 1 = x 3 + 2 x 2 − x b 1 = 2 x 3 + x 2 + 1 a 2 = x 3 − x 2 + x + 1 b 2 = x 2 + 2 x + 2 a 3 = − x 3 + 2 x 2 + x + 1 b 3 = − 2 x 3 + x 2 + x + 2 a 4 = − x 3 − x 2 + 1 b 4 = x 3 + 3 x 2 + x + 2 \begin{array}{c:c}
a_1=x^3+2x^2-x & b_1=2x^3+x^2+1 \\
a_2=x^3-x^2+x+1 & b_2=x^2+2x+2 \\
a_3=-x^3+2x^2+x+1 & b_3=-2x^3+x^2+x+2 \\
a_4=-x^3-x^2+1 & b_4=x^3+3x^2+x+2 \\
\end{array} a 1 = x 3 + 2 x 2 − x a 2 = x 3 − x 2 + x + 1 a 3 = − x 3 + 2 x 2 + x + 1 a 4 = − x 3 − x 2 + 1 b 1 = 2 x 3 + x 2 + 1 b 2 = x 2 + 2 x + 2 b 3 = − 2 x 3 + x 2 + x + 2 b 4 = x 3 + 3 x 2 + x + 2
将 b 1 , b 2 , b 3 , b 4 b_1,b_2,b_3,b_4 b 1 , b 2 , b 3 , b 4 用 a 1 , a 2 , a 3 , a 4 a_1,a_2,a_3,a_4 a 1 , a 2 , a 3 , a 4 表示
( a 1 , a 2 , a 3 , a 4 ) = ( x 3 , x 2 , x , 1 ) A , ( b 1 , b 2 , b 3 , b 4 ) = ( x 3 , x 2 , x , 1 ) B (a_1,a_2,a_3,a_4)=(x^3,x^2,x,1)A ,\\
(b_1,b_2,b_3,b_4)=(x^3,x^2,x,1)B ( a 1 , a 2 , a 3 , a 4 ) = ( x 3 , x 2 , x , 1 ) A , ( b 1 , b 2 , b 3 , b 4 ) = ( x 3 , x 2 , x , 1 ) B ,求得
A = ( 1 1 − 1 − 1 2 − 1 2 − 1 − 1 1 1 0 0 1 1 1 ) , B = ( 2 0 − 2 1 1 1 1 3 0 2 1 1 1 2 2 2 ) A=\begin{pmatrix}
1&1&-1&-1 \\
2&-1&2&-1 \\
-1&1&1&0 \\
0&1&1&1 \\
\end{pmatrix},\
B=\begin{pmatrix}
2&0&-2&1 \\
1&1&1&3 \\
0&2&1&1 \\
1&2&2&2 \\
\end{pmatrix} A = ⎝ ⎜ ⎜ ⎛ 1 2 − 1 0 1 − 1 1 1 − 1 2 1 1 − 1 − 1 0 1 ⎠ ⎟ ⎟ ⎞ , B = ⎝ ⎜ ⎜ ⎛ 2 1 0 1 0 1 2 2 − 2 1 1 2 1 3 1 2 ⎠ ⎟ ⎟ ⎞
( b 1 , b 2 , b 3 , b 4 ) = ( a 1 , a 2 , a 3 , a 4 ) A − 1 B (b_1,b_2,b_3,b_4)=(a_1,a_2,a_3,a_4)A^{-1}B ( b 1 , b 2 , b 3 , b 4 ) = ( a 1 , a 2 , a 3 , a 4 ) A − 1 B
故坐标变换公式为 ( x 1 ′ x 2 ′ x 3 ′ x 4 ′ ) = B − 1 A ( x 1 x 2 x 3 x 4 ) \begin{pmatrix}
x_1' \\
x_2' \\
x_3' \\
x_4' \\
\end{pmatrix}=B^{-1}A\begin{pmatrix}
x_1 \\
x_2 \\
x_3 \\
x_4 \\
\end{pmatrix} ⎝ ⎜ ⎜ ⎛ x 1 ′ x 2 ′ x 3 ′ x 4 ′ ⎠ ⎟ ⎟ ⎞ = B − 1 A ⎝ ⎜ ⎜ ⎛ x 1 x 2 x 3 x 4 ⎠ ⎟ ⎟ ⎞
用矩阵的初等行变换求 B − 1 A B^{-1}A B − 1 A
( B , A ) ∼ ( E , B − 1 A ) (B,A)∼(E,B^{-1}A) ( B , A ) ∼ ( E , B − 1 A )
线性变换
变换 (transformation):设A , B A,B A , B 是两个非空集合,如果对于A A A 中任一元素α α α ,按某法则总有B B B 中唯一确定的元素β β β 与之对应,则称这个对应法则为从集合A A A 到集合B B B 的变换(或映射),若记此法则为T T T ,则上述变换可表示为:β = T ( α ) β=T(α) β = T ( α ) 或β = T α β=Tα β = T α ,并称α α α 为源,β β β 为像,A A A 为源集,像的全体组成的集合称为像集。
线性变换 (linear transformation):设V n , U m V_n,U_m V n , U m 分别为n n n 维和m m m 维线性空间,线性变换 T : V n → U m T: V_n\to U_m T : V n → U m 满足
(1) ∀ α , β ∈ V n , T ( α + β ) = T ( α ) + T ( β ) ∀ α,β\in V_n,T(α+β)=T(α)+T(β) ∀ α , β ∈ V n , T ( α + β ) = T ( α ) + T ( β )
(2) ∀ α ∈ V n , k ∈ R , T ( k α ) = k T ( α ) ∀ α\in V_n,k\in\R,T(kα)=kT(α) ∀ α ∈ V n , k ∈ R , T ( k α ) = k T ( α )
特别的,从V n V_n V n 到自身的线性变换叫做V n V_n V n 中的线性变换。
实例 :在线性空间 p [ x ] 3 p[x]_3 p [ x ] 3 中
任取 p = a 3 x 3 + a 2 x 2 + a 1 x + a 0 q = b 3 x 3 + b 2 x 2 + b 1 x + b 0 p=a_3x^3+a_2x^2+a_1x+a_0 \\
q=b_3x^3+b_2x^2+b_1x+b_0 p = a 3 x 3 + a 2 x 2 + a 1 x + a 0 q = b 3 x 3 + b 2 x 2 + b 1 x + b 0
微分运算D D D 是一个线性变换:D p = 3 a 3 x 2 + 2 a 2 x + a 1 ; D q = 3 b 3 x 2 + 2 b 2 x + b 1 Dp=3a_3x^2+2a_2x+a_1;\ Dq=3b_3x^2+2b_2x+b_1 D p = 3 a 3 x 2 + 2 a 2 x + a 1 ; D q = 3 b 3 x 2 + 2 b 2 x + b 1
D ( p + q ) = D p + D q D ( λ p ) = λ D p D(p+q)=Dp+Dq\\
D(λ p)=λ Dp D ( p + q ) = D p + D q D ( λ p ) = λ D p
线性变换的基本性质
(1) T ( Θ ) = Θ , T ( − α ) = − T ( α ) T(Θ)=Θ, T(-α)=-T(α) T ( Θ ) = Θ , T ( − α ) = − T ( α )
(2) 若 β = k 1 α 1 + k 2 α 2 + ⋯ + k m α m β=k_1α_1+k_2α_2+\cdots+k_mα_m β = k 1 α 1 + k 2 α 2 + ⋯ + k m α m ,则T ( β ) = k 1 T ( α 1 ) + k 2 T ( α 2 ) + ⋯ + k m T ( α m ) T(β)=k_1T(α_1)+k_2T(α_2)+\cdots+k_mT(α_m) T ( β ) = k 1 T ( α 1 ) + k 2 T ( α 2 ) + ⋯ + k m T ( α m )
(4) 线性变换T T T 的像集 T ( V n ) T(V_n) T ( V n ) 是一个线性空间,称为线性变换 T T T 的像空间 (image space)
(5) 集合 { α ∣ α ∈ V n , T ( α ) = Θ } \{α|α\in V_n,T(α)=Θ\} { α ∣ α ∈ V n , T ( α ) = Θ } 也是一个线性空间,称为线性变换 T T T 的核 (kernel)
线性变换的矩阵表示 :设线性空间V n V_n V n 的一组基为α 1 , α 2 , ⋯ , α n \mathbf{α_1,α_2,\cdots,α_n} α 1 , α 2 , ⋯ , α n ,此基的像分别为
T ( α 1 ) = P 11 α 1 + P 12 α 2 + ⋯ + P 1 n α n T ( α 2 ) = P 21 α 1 + P 22 α 2 + ⋯ + P 2 n α n ⋯ T ( α n ) = P n 1 α 1 + P n 2 α 2 + ⋯ + P n n α n T(α_1)=P_{11}α_1+P_{12}α_2+\cdots+P_{1n}α_n \\
T(α_2)=P_{21}α_1+P_{22}α_2+\cdots+P_{2n}α_n \\
\cdots \\
T(α_n)=P_{n1}α_1+P_{n2}α_2+\cdots+P_{nn}α_n T ( α 1 ) = P 1 1 α 1 + P 1 2 α 2 + ⋯ + P 1 n α n T ( α 2 ) = P 2 1 α 1 + P 2 2 α 2 + ⋯ + P 2 n α n ⋯ T ( α n ) = P n 1 α 1 + P n 2 α 2 + ⋯ + P n n α n
即 ( T ( α 1 ) , T ( α 2 ) , ⋯ , T ( α n ) ) = ( α 1 , α 2 , ⋯ , α n ) P (T(α_1),T(α_2),\cdots,T(α_n))=(\mathbf{α_1,α_2,\cdots,α_n})P ( T ( α 1 ) , T ( α 2 ) , ⋯ , T ( α n ) ) = ( α 1 , α 2 , ⋯ , α n ) P
此处的P = ( P 11 P 12 ⋯ P 1 n P 21 P 22 ⋯ p 2 n ⋮ ⋮ ⋱ ⋮ p n 1 p n 2 ⋯ p n n ) P=\begin{pmatrix}
P_{11}&P_{12}&\cdots&P_{1n} \\
P_{21}&P_{22}&\cdots&p_{2n} \\
\vdots&\vdots&\ddots&\vdots \\
p_{n1}&p_{n2}&\cdots&p_{nn} \\
\end{pmatrix} P = ⎝ ⎜ ⎜ ⎜ ⎛ P 1 1 P 2 1 ⋮ p n 1 P 1 2 P 2 2 ⋮ p n 2 ⋯ ⋯ ⋱ ⋯ P 1 n p 2 n ⋮ p n n ⎠ ⎟ ⎟ ⎟ ⎞
称为线性空间V n V_n V n 中线性变换T T T 在基α 1 , α 2 , ⋯ , α n \mathbf{α_1,α_2,\cdots,α_n} α 1 , α 2 , ⋯ , α n 下的矩阵
同一线性变换在不同基下的矩阵的关系
定理 :设线性空间V n V_n V n 取定两个基 α 1 , α 2 , ⋯ , α n ; β 1 , β 2 , ⋯ , β n α_1,α_2,\cdots,α_n;β_1,β_2,\cdots,β_n α 1 , α 2 , ⋯ , α n ; β 1 , β 2 , ⋯ , β n ,且两个基有变换公式 ( β 1 , β 2 , ⋯ , β n ) = ( α 1 , α 2 , ⋯ , α n ) P (β_1,β_2,\cdots,β_n)=(α_1,α_2,\cdots,α_n)P ( β 1 , β 2 , ⋯ , β n ) = ( α 1 , α 2 , ⋯ , α n ) P ,V n V_n V n 中的线性变换 T T T 在这两个基下的矩阵分别是 A A A 与 B B B ,则 B = P − 1 A P B=P^{-1}AP B = P − 1 A P
秩的定义 :线性变换 T T T 的像空间 T ( V n ) T(V_n) T ( V n ) 的维数, 称为线性变换 T T T 的秩 (rank)
(1) 若 A A A 是 T T T 的矩阵, 则 T T T 的秩就是 r ( A ) r(A) r ( A )
(2) 若 T T T 的秩为 r r r , 则 T T T 的核 N T N_T N T 的维数为 n − r n-r n − r