從特徵值、特徵向量到凱萊─漢米爾頓定理、矩陣的對角化（From Eigenvalues and Eigenvectors to Cayley-Hamilton Theorem and the Matrix Diagonalization）

Posted on 2014/01/11 in 數學, 矩陣 with 有 4 則迴響 22,524 views

從特徵值、特徵向量到凱萊─漢米爾頓定理、矩陣的對角化（From Eigenvalues and Eigenvectors to Cayley-Hamilton Theorem and the Matrix Diagonalization）
國立臺南第一高級中學數學科林倉億老師

特徵值與特徵向量

在〈矩陣乘法的限制及性質〉一文中，我們知道矩陣乘法的特殊性開啟了許多的可能性，比如說兩個均不為零方陣的同階方陣，相乘之後竟然可以是零方陣。接下來我們要看的是矩陣乘法的另一種重要應用，讓我們先從簡單的二階方陣看起。

給定方陣 \(A = \left[ {\begin{array}{*{20}{c}} 1&4\\ 3&2 \end{array}} \right]\)，哪些 \(2\times 1\) 階矩陣 \(X = \left[ {\begin{array}{*{20}{c}} {{x_{1}}}\\ {{x_{2}}} \end{array}} \right]\) 會滿足 \(A \cdot X = \lambda\cdot X\)，

其中 \(\lambda\) 是實數，而非矩陣。

方程式 \(A \cdot X =\lambda\cdot X\) 的意義就是 \(X\) 在乘以 \(A\) 之後，會變成原來的 \(\lambda\) 倍。

找法很簡單，算就對了，只不過借助一個小技巧，就是 \(\lambda\cdot X =\lambda\cdot I\cdot X\)，其中是 \(I\) 單位方陣：

\(\left[ {\begin{array}{*{20}{c}} 1&4\\ 3&2 \end{array}} \right] \cdot \left[ {\begin{array}{*{20}{c}} {{x_{1}}}\\ {{x_{2}}} \end{array}} \right] = \lambda \cdot \left[ {\begin{array}{*{20}{c}} 1&0\\ 0&1 \end{array}} \right] \cdot \left[ {\begin{array}{*{20}{c}} {{x_{1}}}\\ {{x_{2}}} \end{array}} \right]\; = \;\left[ {\begin{array}{*{20}{c}} \lambda &0\\ 0&\lambda \end{array}} \right] \cdot \left[ {\begin{array}{*{20}{c}} {{x_{1}}}\\ {{x_{2}}} \end{array}} \right]\)

\(\Rightarrow \;\;\left[ {\begin{array}{*{20}{c}} 1&4\\ 3&2 \end{array}} \right] \cdot \left[ {\begin{array}{*{20}{c}} {{x_{1}}}\\ {{x_{2}}} \end{array}} \right] – \;\left[ {\begin{array}{*{20}{c}} \lambda &0\\ 0&\lambda \end{array}} \right] \cdot \left[ {\begin{array}{*{20}{c}} {{x_{1}}}\\ {{x_{2}}} \end{array}} \right] = \left[ {\begin{array}{*{20}{c}} 0\\ 0 \end{array}} \right]\)

\( \Rightarrow \;\;\left[ {\begin{array}{*{20}{c}} {1 – \lambda }&4\\ 3&{2 – \lambda } \end{array}} \right] \cdot \left[ {\begin{array}{*{20}{c}} {{x_{1}}}\\ {{x_{2}}} \end{array}} \right] = \left[ {\begin{array}{*{20}{c}} 0\\ 0 \end{array}} \right]\)

若 \(\left[ {\begin{array}{*{20}{c}} {1 – \lambda }&4\\ 3&{2 – \lambda } \end{array}} \right]\) 是可逆方陣，

那 \(\;\left[ {\begin{array}{*{20}{c}} {{x_{1}}}\\ {{x_{2}}} \end{array}} \right] = \;{\left[ {\begin{array}{*{20}{c}} {1 – \lambda }&4\\ 3&{2 – \lambda } \end{array}} \right]^{- 1}} \cdot \left[ {\begin{array}{*{20}{c}} 0&0\\ 0&0 \end{array}} \right] = \;\left[ {\begin{array}{*{20}{c}} 0\\ 0 \end{array}} \right]\)。

因此，如果我們希望找到的 \(\;\left[ {\begin{array}{*{20}{c}} {{x_{1}}}\\ {{x_{2}}} \end{array}} \right] \ne \left[ {\begin{array}{*{20}{c}} 0\\ 0 \end{array}} \right]\)，那 \(\left[ {\begin{array}{*{20}{c}} {1 – \lambda }&4\\ 3&{2 – \lambda } \end{array}} \right]\) 一定要不可逆才行，

即其行列式值 \(\det \left( {\left[ {\begin{array}{*{20}{c}} {1 – \lambda }&4\\ 3&{2 – \lambda } \end{array}} \right]} \right) = 0\)，由此可得：

\((1 – \lambda )(2 – \lambda ) – 3 \cdot 4 = 0\;\; \Rightarrow \;\;{\lambda ^2} – 3\lambda- 10 = 0\;\; \Rightarrow \;\;\lambda= 5\) 或 \(-2\)。

\(\lambda=5\) 時，\(\left[ {\begin{array}{*{20}{c}} { – 4}&4\\ 3&{ – 3} \end{array}} \right] \cdot \left[ {\begin{array}{*{20}{c}} {{x_{1}}}\\ {{x_{2}}} \end{array}} \right] = \left[ {\begin{array}{*{20}{c}} 0\\ 0 \end{array}} \right]\;\; \Rightarrow \;\;{x_{1}} – {x_{2}} = 0\)，

取 \(\left[ {\,\begin{array}{*{20}{c}} 1\\ 1 \end{array}\,} \right]\) 作代表，即 \(\left[ {\begin{array}{*{20}{c}} 1&4\\ 3&2 \end{array}} \right] \cdot \left[ {\,\begin{array}{*{20}{c}} 1\\ 1 \end{array}\,} \right] = 5 \cdot \left[ {\,\begin{array}{*{20}{c}} 1\\ 1 \end{array}\,} \right]\;\)

\(\lambda=-2\) 時，\(\left[ {\begin{array}{*{20}{c}} 3&4\\ 3&4 \end{array}} \right] \cdot \left[ {\begin{array}{*{20}{c}} {{x_{1}}}\\ {{x_{2}}} \end{array}} \right] = \left[ {\begin{array}{*{20}{c}} 0\\ 0 \end{array}} \right]\;\; \Rightarrow \;\;3{x_{1}} + 4{x_{2}} = 0\)，

取\(\left[ {\begin{array}{*{20}{c}} { – 4}\\ 3 \end{array}} \right]\)作代表，即 \(\left[ {\begin{array}{*{20}{c}} 1&4\\ 3&2 \end{array}} \right] \cdot \left[ {\begin{array}{*{20}{c}} { – 4}\\ 3 \end{array}} \right] = – 2 \cdot \left[ {\begin{array}{*{20}{c}} { – 4}\\ 3 \end{array}} \right]\;\)

也就是說，只要 \(X\) 是 \(\left[ {\,\begin{array}{*{20}{c}} t\\ t \end{array}\,} \right]\) 或 \(\left[ {\,\begin{array}{*{20}{c}} { – 4t}\\ {3t} \end{array}\,} \right]\)，那就會滿足 \(A\cdot X=\lambda \cdot X\)，其中 \(\lambda\) 分別是 \(5\) 和 \(-2\)。

因此，我們就稱 \(5\) 和 \(-2\) 是方陣 \(A = \left[ {\begin{array}{*{20}{c}} 1&4\\ 3&2 \end{array}} \right]\) 的「特徵值」(eigenvalues)，

\(\left[ {\,\begin{array}{*{20}{c}} 1\\ 1 \end{array}\,} \right]\) 和 \(\left[ {\begin{array}{*{20}{c}} { – 4}\\ 3 \end{array}} \right]\) 分別是特徵值 \(5\) 和 \(-2\) 所對應的「特徵向量」(eigenvectors)

（以此兩個作為代表，事實上只要是 \(\left[ {\,\begin{array}{*{20}{c}} t\\ t \end{array}\,} \right]\) 或 \(\left[ {\,\begin{array}{*{20}{c}} { – 4t}\\ {3t} \end{array}\,} \right]\) 均可），

至於產生特徵值的方程式 \(\det \left( {\left[ {\begin{array}{*{20}{c}} {1 – \lambda }&4\\ 3&{2 – \lambda } \end{array}} \right]} \right) = 0\)，就稱為「特徵方程式」(characteristic equation)。

以下，我們給出一般化的定義：

\(A\) 為 \(n\) 階方陣，\(\det(A-\lambda I)=0\) 就稱為 \(A\) 的「特徵方程式」，
其解 \({\lambda _{i}}~(i=1\sim n)\) 就稱為 \(A\) 的「特徵值」，
滿足 \(A \cdot X = {\lambda _{i}} \cdot X\) 的 \(X\)，就稱為特徵值 \(\lambda_i\) 所對應的「特徵向量」。

凱萊─漢米爾頓定理

回到上面例子的 \(A = \left[ {\begin{array}{*{20}{c}} 1&4\\ 3&2 \end{array}} \right]\)，

這跟〈二階方陣的凱萊─漢米爾頓定理〉一文中的例子是同一個，

所以我們知道 \({A^2} -3A – 10I = O\)。

再看看 \(A\) 的特徵方程式 \(\det \left( {\left[ {\begin{array}{*{20}{c}} {1 – \lambda }&4\\ 3&{2 – \lambda } \end{array}} \right]} \right) = 0\)，即 \({\lambda^2} – 3\lambda-10 = 0\)，

顯然這兩者在係數上是一模一樣的。沒錯，事實上凱萊─漢米爾頓定理就是和特徵方程式有關。有了特徵方程式的概念後，我們就可以寫出一般化的凱萊─漢米爾頓定理：

\(A\) 為 \(n\) 階方陣，

\(\begin{array}{ll}f(\lambda )&=\det (A – \lambda I)\\&= {a_n}{\lambda ^n} + {a_{n – 1}}{\lambda ^{n – 1}} +\cdots+{a_1}\lambda+ {a_0} = 0\end{array}\) 為 \(A\) 的特徵方程式，

則 \(f(A) = {a_n}{A^n} + {a_{n – 1}}{A^{n – 1}} +\cdots+ {a_1}A + {a_0}I = O\)，

其中 \(I\) 與 \(O\) 分別為單位方陣與零方陣。

至於證明，則是要請出特徵值與特徵向量來幫忙了，在此略去，請讀者查閱相關的資料。

有了 \(n\) 階方陣的凱萊─漢米爾頓定理後，
我們在求 \(A^n\)，或是 \({A^4} -4{A^3} – 6{A^2} +8A – 11I\) 之值的時候，就有更簡便的工具了。
詳細的例子，請讀者參閱〈二階方陣的凱萊─漢米爾頓定理〉一文，此處就不再贅述了。

矩陣的對角化

希望讀者沒有被特徵值、特徵向量、特徵方程式這些專有名詞給弄昏頭了，因為接下來還需要用到它們來說明某些方陣 \(A\)，可以很快地計算出它的任意次方 \(A^n\)。

我們還是先從簡單的實際例子看起。

還是同一個 \(A = \left[ {\begin{array}{*{20}{c}} 1&4\\ 3&2 \end{array}} \right]\)，如何快速地求出 \(A^{100}\)？

由上文中已經知道 \(\lambda=5,-2\) 是 \(A\) 的特徵值，其對應的特徵向量分別是 \(\left[ {\,\begin{array}{*{20}{c}} 1\\ 1 \end{array}\,} \right]\) 和 \(\left[ {\begin{array}{*{20}{c}} { – 4}\\ 3 \end{array}} \right]\) 。

令 \(P = \left[ {\begin{array}{*{20}{c}} 1&{ – 4}\\ 1&3 \end{array}} \right]\) ，就是由特徵向量所組成的方陣，可求出 \({P^{\, – 1}} = \left[ {\begin{array}{*{20}{c}} {\frac{3}{7}}&{\frac{4}{7}}\\ {\frac{{ – 1}}{7}}&{\frac{1}{7}} \end{array}} \right]\) ，

接下來我們真的計算 \(P^{-1}AP\)，看看有什麼神奇的事情會發生：

\(\begin{array}{ll}{P^{- 1}}AP &= \left[ {\begin{array}{*{20}{c}} {\frac{3}{7}}&{\frac{4}{7}}\\ {\frac{{ – 1}}{7}}&{\frac{1}{7}} \end{array}} \right]\left[ {\begin{array}{*{20}{c}} 1&4\\ 3&2 \end{array}} \right]\left[ {\begin{array}{*{20}{c}} 1&{ – 4}\\ 1&3 \end{array}} \right] \\&= \left[ {\begin{array}{*{20}{c}} {\frac{3}{7}}&{\frac{4}{7}}\\ {\frac{{ – 1}}{7}}&{\frac{1}{7}} \end{array}} \right]\left[ {\begin{array}{*{20}{c}} 5&{ – 8}\\ 5&6 \end{array}} \right] \\&= \left[ {\begin{array}{*{20}{c}} 5&0\\ 0&{ – 2} \end{array}} \right]\end{array}\)

得到的是一個很漂亮的矩陣，主對角線以外的元均為 \(0\)，

這樣的矩陣我們稱之為「對角方陣」(diagonal matrix)。

更特別的，主對角線上的元剛好就是特徵值 \(5\) 和 \(-2\)。

因此，我們就可以把 \(A = \left[ {\begin{array}{*{20}{c}} 1&4\\ 3&2 \end{array}} \right]\)

改寫成 \(A = \left[ {\begin{array}{*{20}{c}} 1&4\\ 3&2 \end{array}} \right] = P\left[ {\begin{array}{*{20}{c}} 5&0\\ 0&{ – 2} \end{array}} \right]{P^{- 1}}\)，那麼，

\(\begin{array}{ll}{A^{100}}&=\left( {P\left[ {\begin{array}{*{20}{c}} 5&0\\ 0&{ – 2} \end{array}} \right]{P^{- 1}}} \right)\left( {P\left[ {\begin{array}{*{20}{c}} 5&0\\ 0&{ – 2} \end{array}} \right]{P^{ – 1}}} \right) \cdots\left( {P\left[ {\begin{array}{*{20}{c}} 5&0\\ 0&{ – 2} \end{array}} \right]{P^{- 1}}} \right)\\&=P{\left[ {\begin{array}{*{20}{c}} 5&0\\ 0&{ – 2} \end{array}} \right]^{100}}{P^{ – 1}}=P\left[ {\begin{array}{*{20}{c}} {{5^{100}}}&0\\ 0&{{{( – 2)}^{100}}} \end{array}} \right]{P^{- 1}}\\&=\left[ {\begin{array}{*{20}{c}} 1&{ – 4}\\ 1&3 \end{array}} \right]\left[ {\begin{array}{*{20}{c}} {{5^{100}}}&0\\ 0&{{{( – 2)}^{100}}} \end{array}} \right]\left[ {\begin{array}{*{20}{c}} {\frac{3}{7}}&{\frac{4}{7}}\\ {\frac{{ – 1}}{7}}&{\frac{1}{7}} \end{array}} \right]\\&=\left[ {\begin{array}{*{20}{c}} {{5^{100}}}&{ – 4 \cdot {{( – 2)}^{100}}}\\ {{5^{100}}}&{3 \cdot {{( – 2)}^{100}}} \end{array}} \right]\left[ {\begin{array}{*{20}{c}} {\frac{3}{7}}&{\frac{4}{7}}\\ {\frac{{ – 1}}{7}}&{\frac{1}{7}} \end{array}} \right] = \left[ {\begin{array}{*{20}{c}} {\frac{{3 \cdot {5^{100}} + 4 \cdot {{( – 2)}^{100}}}}{7}}&{\frac{{4 \cdot {5^{100}} – 4 \cdot {{( – 2)}^{100}}}}{7}}\\ {\frac{{3 \cdot {5^{100}} – 3 \cdot {{( – 2)}^{100}}}}{7}}&{\frac{{4 \cdot {5^{100}} + 3 \cdot {{( – 2)}^{100}}}}{7}} \end{array}} \right]\end{array}\)

這樣是不是快多了！換句話說，若一個矩陣可「對角化」(diagonalizable)，就是找到可逆方陣 \(P\) 使得 \(P^{-1}AP\) 是對角方陣，那麼，計算 \(A\) 的任意次方 \(A^n\) ，就只是小事一件而已。方陣的對角化是矩陣理論中至為重要的一環，但再談下去會牽涉到更多的大學數學內容，因此，我們不得不在此打住，不再追究下去了，讀者只要知道對角化會與特徵值、特徵向量有關即可。

簡略介紹對角化的目的在於許多高中數學參考書或講義中，常常有給出 \(P\)，然後要求 \(P^{-1}AP\) 與 \(A^n\) 的題目。許多人僅是依樣畫葫蘆地算，不知道這樣子算的意義在哪！其實這些題目背後的數學概念就是對角化、特徵值與特徵向量，下次再遇到類似的題目，就知道它葫蘆裡賣的是什麼藥了。

Tags: 凱萊─漢米爾頓定理(Cayley-Hamilton Theorem), 對角化, 對角方陣, 特徵值, 特徵向量, 特徵方程式

There are 4 comments for this article

kobe 2014/05/29 at 13:58:33

第8行寫錯一個地方囉 [0,0,0,0]要改成[0,0]才對~
學量物中的路人 2014/05/31 at 16:30:13

Nice!簡單易懂
3q very much
joker 2016/01/24 at 12:20:49

2 1 1
1 2 1
1 1 2

這個怎樣求特徵向量
特徵值 2
特徵向量
變
0 1 1
1 0 1
1 1 0

這樣特徵向量互斥
要如何看
Savid 2016/05/09 at 18:59:35

不好意思
矩陣對角化一開始的P-1AP的
第二條等式後面那個矩陣
-8應改為8，6改為-6才是吧？

發表迴響 Cancel comment reply