從特徵值、特徵向量到凱萊─漢米爾頓定理、矩陣的對角化(From Eigenvalues and Eigenvectors to Cayley-Hamilton Theorem and the Matrix Diagonalization)
從特徵值、特徵向量到凱萊─漢米爾頓定理、矩陣的對角化(From Eigenvalues and Eigenvectors to Cayley-Hamilton Theorem and the Matrix Diagonalization)
國立臺南第一高級中學數學科林倉億老師
特徵值與特徵向量
在〈矩陣乘法的限制及性質〉一文中,我們知道矩陣乘法的特殊性開啟了許多的可能性,比如說兩個均不為零方陣的同階方陣,相乘之後竟然可以是零方陣。接下來我們要看的是矩陣乘法的另一種重要應用,讓我們先從簡單的二階方陣看起。
給定方陣 \(A = \left[ {\begin{array}{*{20}{c}} 1&4\\ 3&2 \end{array}} \right]\),哪些 \(2\times 1\) 階矩陣 \(X = \left[ {\begin{array}{*{20}{c}} {{x_{1}}}\\ {{x_{2}}} \end{array}} \right]\) 會滿足 \(A \cdot X = \lambda\cdot X\),
其中 \(\lambda\) 是實數,而非矩陣。
方程式 \(A \cdot X =\lambda\cdot X\) 的意義就是 \(X\) 在乘以 \(A\) 之後,會變成原來的 \(\lambda\) 倍。
找法很簡單,算就對了,只不過借助一個小技巧,就是 \(\lambda\cdot X =\lambda\cdot I\cdot X\),其中是 \(I\) 單位方陣:
\(\left[ {\begin{array}{*{20}{c}} 1&4\\ 3&2 \end{array}} \right] \cdot \left[ {\begin{array}{*{20}{c}} {{x_{1}}}\\ {{x_{2}}} \end{array}} \right] = \lambda \cdot \left[ {\begin{array}{*{20}{c}} 1&0\\ 0&1 \end{array}} \right] \cdot \left[ {\begin{array}{*{20}{c}} {{x_{1}}}\\ {{x_{2}}} \end{array}} \right]\; = \;\left[ {\begin{array}{*{20}{c}} \lambda &0\\ 0&\lambda \end{array}} \right] \cdot \left[ {\begin{array}{*{20}{c}} {{x_{1}}}\\ {{x_{2}}} \end{array}} \right]\)
\(\Rightarrow \;\;\left[ {\begin{array}{*{20}{c}} 1&4\\ 3&2 \end{array}} \right] \cdot \left[ {\begin{array}{*{20}{c}} {{x_{1}}}\\ {{x_{2}}} \end{array}} \right] – \;\left[ {\begin{array}{*{20}{c}} \lambda &0\\ 0&\lambda \end{array}} \right] \cdot \left[ {\begin{array}{*{20}{c}} {{x_{1}}}\\ {{x_{2}}} \end{array}} \right] = \left[ {\begin{array}{*{20}{c}} 0\\ 0 \end{array}} \right]\)
\( \Rightarrow \;\;\left[ {\begin{array}{*{20}{c}} {1 – \lambda }&4\\ 3&{2 – \lambda } \end{array}} \right] \cdot \left[ {\begin{array}{*{20}{c}} {{x_{1}}}\\ {{x_{2}}} \end{array}} \right] = \left[ {\begin{array}{*{20}{c}} 0\\ 0 \end{array}} \right]\)
若 \(\left[ {\begin{array}{*{20}{c}} {1 – \lambda }&4\\ 3&{2 – \lambda } \end{array}} \right]\) 是可逆方陣,
那 \(\;\left[ {\begin{array}{*{20}{c}} {{x_{1}}}\\ {{x_{2}}} \end{array}} \right] = \;{\left[ {\begin{array}{*{20}{c}} {1 – \lambda }&4\\ 3&{2 – \lambda } \end{array}} \right]^{- 1}} \cdot \left[ {\begin{array}{*{20}{c}} 0&0\\ 0&0 \end{array}} \right] = \;\left[ {\begin{array}{*{20}{c}} 0\\ 0 \end{array}} \right]\)。
因此,如果我們希望找到的 \(\;\left[ {\begin{array}{*{20}{c}} {{x_{1}}}\\ {{x_{2}}} \end{array}} \right] \ne \left[ {\begin{array}{*{20}{c}} 0\\ 0 \end{array}} \right]\),那 \(\left[ {\begin{array}{*{20}{c}} {1 – \lambda }&4\\ 3&{2 – \lambda } \end{array}} \right]\) 一定要不可逆才行,
即其行列式值 \(\det \left( {\left[ {\begin{array}{*{20}{c}} {1 – \lambda }&4\\ 3&{2 – \lambda } \end{array}} \right]} \right) = 0\),由此可得:
\((1 – \lambda )(2 – \lambda ) – 3 \cdot 4 = 0\;\; \Rightarrow \;\;{\lambda ^2} – 3\lambda- 10 = 0\;\; \Rightarrow \;\;\lambda= 5\) 或 \(-2\)。
\(\lambda=5\) 時,\(\left[ {\begin{array}{*{20}{c}} { – 4}&4\\ 3&{ – 3} \end{array}} \right] \cdot \left[ {\begin{array}{*{20}{c}} {{x_{1}}}\\ {{x_{2}}} \end{array}} \right] = \left[ {\begin{array}{*{20}{c}} 0\\ 0 \end{array}} \right]\;\; \Rightarrow \;\;{x_{1}} – {x_{2}} = 0\),
取 \(\left[ {\,\begin{array}{*{20}{c}} 1\\ 1 \end{array}\,} \right]\) 作代表,即 \(\left[ {\begin{array}{*{20}{c}} 1&4\\ 3&2 \end{array}} \right] \cdot \left[ {\,\begin{array}{*{20}{c}} 1\\ 1 \end{array}\,} \right] = 5 \cdot \left[ {\,\begin{array}{*{20}{c}} 1\\ 1 \end{array}\,} \right]\;\)
\(\lambda=-2\) 時,\(\left[ {\begin{array}{*{20}{c}} 3&4\\ 3&4 \end{array}} \right] \cdot \left[ {\begin{array}{*{20}{c}} {{x_{1}}}\\ {{x_{2}}} \end{array}} \right] = \left[ {\begin{array}{*{20}{c}} 0\\ 0 \end{array}} \right]\;\; \Rightarrow \;\;3{x_{1}} + 4{x_{2}} = 0\),
取\(\left[ {\begin{array}{*{20}{c}} { – 4}\\ 3 \end{array}} \right]\)作代表,即 \(\left[ {\begin{array}{*{20}{c}} 1&4\\ 3&2 \end{array}} \right] \cdot \left[ {\begin{array}{*{20}{c}} { – 4}\\ 3 \end{array}} \right] = – 2 \cdot \left[ {\begin{array}{*{20}{c}} { – 4}\\ 3 \end{array}} \right]\;\)
也就是說,只要 \(X\) 是 \(\left[ {\,\begin{array}{*{20}{c}} t\\ t \end{array}\,} \right]\) 或 \(\left[ {\,\begin{array}{*{20}{c}} { – 4t}\\ {3t} \end{array}\,} \right]\),那就會滿足 \(A\cdot X=\lambda \cdot X\),其中 \(\lambda\) 分別是 \(5\) 和 \(-2\)。
因此,我們就稱 \(5\) 和 \(-2\) 是方陣 \(A = \left[ {\begin{array}{*{20}{c}} 1&4\\ 3&2 \end{array}} \right]\) 的「特徵值」(eigenvalues),
\(\left[ {\,\begin{array}{*{20}{c}} 1\\ 1 \end{array}\,} \right]\) 和 \(\left[ {\begin{array}{*{20}{c}} { – 4}\\ 3 \end{array}} \right]\) 分別是特徵值 \(5\) 和 \(-2\) 所對應的「特徵向量」(eigenvectors)
(以此兩個作為代表,事實上只要是 \(\left[ {\,\begin{array}{*{20}{c}} t\\ t \end{array}\,} \right]\) 或 \(\left[ {\,\begin{array}{*{20}{c}} { – 4t}\\ {3t} \end{array}\,} \right]\) 均可),
至於產生特徵值的方程式 \(\det \left( {\left[ {\begin{array}{*{20}{c}} {1 – \lambda }&4\\ 3&{2 – \lambda } \end{array}} \right]} \right) = 0\),就稱為「特徵方程式」(characteristic equation)。
以下,我們給出一般化的定義:
\(A\) 為 \(n\) 階方陣,\(\det(A-\lambda I)=0\) 就稱為 \(A\) 的「特徵方程式」,
其解 \({\lambda _{i}}~(i=1\sim n)\) 就稱為 \(A\) 的「特徵值」,
滿足 \(A \cdot X = {\lambda _{i}} \cdot X\) 的 \(X\),就稱為特徵值 \(\lambda_i\) 所對應的「特徵向量」。
凱萊─漢米爾頓定理
回到上面例子的 \(A = \left[ {\begin{array}{*{20}{c}} 1&4\\ 3&2 \end{array}} \right]\),
這跟〈二階方陣的凱萊─漢米爾頓定理〉一文中的例子是同一個,
所以我們知道 \({A^2} -3A – 10I = O\)。
再看看 \(A\) 的特徵方程式 \(\det \left( {\left[ {\begin{array}{*{20}{c}} {1 – \lambda }&4\\ 3&{2 – \lambda } \end{array}} \right]} \right) = 0\),即 \({\lambda^2} – 3\lambda-10 = 0\),
顯然這兩者在係數上是一模一樣的。沒錯,事實上凱萊─漢米爾頓定理就是和特徵方程式有關。有了特徵方程式的概念後,我們就可以寫出一般化的凱萊─漢米爾頓定理:
\(A\) 為 \(n\) 階方陣,
\(\begin{array}{ll}f(\lambda )&=\det (A – \lambda I)\\&= {a_n}{\lambda ^n} + {a_{n – 1}}{\lambda ^{n – 1}} +\cdots+{a_1}\lambda+ {a_0} = 0\end{array}\) 為 \(A\) 的特徵方程式,
則 \(f(A) = {a_n}{A^n} + {a_{n – 1}}{A^{n – 1}} +\cdots+ {a_1}A + {a_0}I = O\),
其中 \(I\) 與 \(O\) 分別為單位方陣與零方陣。
至於證明,則是要請出特徵值與特徵向量來幫忙了,在此略去,請讀者查閱相關的資料。
有了 \(n\) 階方陣的凱萊─漢米爾頓定理後,
我們在求 \(A^n\),或是 \({A^4} -4{A^3} – 6{A^2} +8A – 11I\) 之值的時候,就有更簡便的工具了。
詳細的例子,請讀者參閱〈二階方陣的凱萊─漢米爾頓定理〉一文,此處就不再贅述了。
矩陣的對角化
希望讀者沒有被特徵值、特徵向量、特徵方程式這些專有名詞給弄昏頭了,因為接下來還需要用到它們來說明某些方陣 \(A\),可以很快地計算出它的任意次方 \(A^n\)。
我們還是先從簡單的實際例子看起。
還是同一個 \(A = \left[ {\begin{array}{*{20}{c}} 1&4\\ 3&2 \end{array}} \right]\),如何快速地求出 \(A^{100}\)?
由上文中已經知道 \(\lambda=5,-2\) 是 \(A\) 的特徵值,其對應的特徵向量分別是 \(\left[ {\,\begin{array}{*{20}{c}} 1\\ 1 \end{array}\,} \right]\) 和 \(\left[ {\begin{array}{*{20}{c}} { – 4}\\ 3 \end{array}} \right]\) 。
令 \(P = \left[ {\begin{array}{*{20}{c}} 1&{ – 4}\\ 1&3 \end{array}} \right]\) ,就是由特徵向量所組成的方陣,可求出 \({P^{\, – 1}} = \left[ {\begin{array}{*{20}{c}} {\frac{3}{7}}&{\frac{4}{7}}\\ {\frac{{ – 1}}{7}}&{\frac{1}{7}} \end{array}} \right]\) ,
接下來我們真的計算 \(P^{-1}AP\),看看有什麼神奇的事情會發生:
\(\begin{array}{ll}{P^{- 1}}AP &= \left[ {\begin{array}{*{20}{c}} {\frac{3}{7}}&{\frac{4}{7}}\\ {\frac{{ – 1}}{7}}&{\frac{1}{7}} \end{array}} \right]\left[ {\begin{array}{*{20}{c}} 1&4\\ 3&2 \end{array}} \right]\left[ {\begin{array}{*{20}{c}} 1&{ – 4}\\ 1&3 \end{array}} \right] \\&= \left[ {\begin{array}{*{20}{c}} {\frac{3}{7}}&{\frac{4}{7}}\\ {\frac{{ – 1}}{7}}&{\frac{1}{7}} \end{array}} \right]\left[ {\begin{array}{*{20}{c}} 5&{ – 8}\\ 5&6 \end{array}} \right] \\&= \left[ {\begin{array}{*{20}{c}} 5&0\\ 0&{ – 2} \end{array}} \right]\end{array}\)
得到的是一個很漂亮的矩陣,主對角線以外的元均為 \(0\),
這樣的矩陣我們稱之為「對角方陣」(diagonal matrix)。
更特別的,主對角線上的元剛好就是特徵值 \(5\) 和 \(-2\)。
因此,我們就可以把 \(A = \left[ {\begin{array}{*{20}{c}} 1&4\\ 3&2 \end{array}} \right]\)
改寫成 \(A = \left[ {\begin{array}{*{20}{c}} 1&4\\ 3&2 \end{array}} \right] = P\left[ {\begin{array}{*{20}{c}} 5&0\\ 0&{ – 2} \end{array}} \right]{P^{- 1}}\),那麼,
\(\begin{array}{ll}{A^{100}}&=\left( {P\left[ {\begin{array}{*{20}{c}} 5&0\\ 0&{ – 2} \end{array}} \right]{P^{- 1}}} \right)\left( {P\left[ {\begin{array}{*{20}{c}} 5&0\\ 0&{ – 2} \end{array}} \right]{P^{ – 1}}} \right) \cdots\left( {P\left[ {\begin{array}{*{20}{c}} 5&0\\ 0&{ – 2} \end{array}} \right]{P^{- 1}}} \right)\\&=P{\left[ {\begin{array}{*{20}{c}} 5&0\\ 0&{ – 2} \end{array}} \right]^{100}}{P^{ – 1}}=P\left[ {\begin{array}{*{20}{c}} {{5^{100}}}&0\\ 0&{{{( – 2)}^{100}}} \end{array}} \right]{P^{- 1}}\\&=\left[ {\begin{array}{*{20}{c}} 1&{ – 4}\\ 1&3 \end{array}} \right]\left[ {\begin{array}{*{20}{c}} {{5^{100}}}&0\\ 0&{{{( – 2)}^{100}}} \end{array}} \right]\left[ {\begin{array}{*{20}{c}} {\frac{3}{7}}&{\frac{4}{7}}\\ {\frac{{ – 1}}{7}}&{\frac{1}{7}} \end{array}} \right]\\&=\left[ {\begin{array}{*{20}{c}} {{5^{100}}}&{ – 4 \cdot {{( – 2)}^{100}}}\\ {{5^{100}}}&{3 \cdot {{( – 2)}^{100}}} \end{array}} \right]\left[ {\begin{array}{*{20}{c}} {\frac{3}{7}}&{\frac{4}{7}}\\ {\frac{{ – 1}}{7}}&{\frac{1}{7}} \end{array}} \right] = \left[ {\begin{array}{*{20}{c}} {\frac{{3 \cdot {5^{100}} + 4 \cdot {{( – 2)}^{100}}}}{7}}&{\frac{{4 \cdot {5^{100}} – 4 \cdot {{( – 2)}^{100}}}}{7}}\\ {\frac{{3 \cdot {5^{100}} – 3 \cdot {{( – 2)}^{100}}}}{7}}&{\frac{{4 \cdot {5^{100}} + 3 \cdot {{( – 2)}^{100}}}}{7}} \end{array}} \right]\end{array}\)
這樣是不是快多了!換句話說,若一個矩陣可「對角化」(diagonalizable),就是找到可逆方陣 \(P\) 使得 \(P^{-1}AP\) 是對角方陣,那麼,計算 \(A\) 的任意次方 \(A^n\) ,就只是小事一件而已。方陣的對角化是矩陣理論中至為重要的一環,但再談下去會牽涉到更多的大學數學內容,因此,我們不得不在此打住,不再追究下去了,讀者只要知道對角化會與特徵值、特徵向量有關即可。
簡略介紹對角化的目的在於許多高中數學參考書或講義中,常常有給出 \(P\),然後要求 \(P^{-1}AP\) 與 \(A^n\) 的題目。許多人僅是依樣畫葫蘆地算,不知道這樣子算的意義在哪!其實這些題目背後的數學概念就是對角化、特徵值與特徵向量,下次再遇到類似的題目,就知道它葫蘆裡賣的是什麼藥了。
第8行寫錯一個地方囉 [0,0,0,0]要改成[0,0]才對~
Nice!簡單易懂
3q very much
2 1 1
1 2 1
1 1 2
這個怎樣求特徵向量
特徵 值 2
特徵向量
變
0 1 1
1 0 1
1 1 0
這樣特徵向量互斥
要如何看
不好意思
矩陣對角化一開始的P-1AP的
第二條等式後面那個矩陣
-8應改為8,6改為-6才是吧?