從特徵值、特徵向量到凱萊─漢米爾頓定理、矩陣的對角化(From Eigenvalues and Eigenvectors to Cayley-Hamilton Theorem and the Matrix Diagonalization)

Print Friendly

從特徵值、特徵向量到凱萊─漢米爾頓定理、矩陣的對角化(From Eigenvalues and Eigenvectors to Cayley-Hamilton Theorem and the Matrix Diagonalization)
國立臺南第一高級中學數學科林倉億老師

特徵值與特徵向量

在〈矩陣乘法的限制及性質〉一文中,我們知道矩陣乘法的特殊性開啟了許多的可能性,比如說兩個均不為零方陣的同階方陣,相乘之後竟然可以是零方陣。接下來我們要看的是矩陣乘法的另一種重要應用,讓我們先從簡單的二階方陣看起。

給定方陣 \(A = \left[ {\begin{array}{*{20}{c}} 1&4\\ 3&2 \end{array}} \right]\),哪些 \(2\times 1\) 階矩陣 \(X = \left[ {\begin{array}{*{20}{c}} {{x_{1}}}\\ {{x_{2}}} \end{array}} \right]\) 會滿足 \(A \cdot X = \lambda\cdot X\),

其中 \(\lambda\) 是實數,而非矩陣。

方程式 \(A \cdot X =\lambda\cdot X\) 的意義就是 \(X\) 在乘以 \(A\) 之後,會變成原來的 \(\lambda\) 倍。

找法很簡單,算就對了,只不過借助一個小技巧,就是 \(\lambda\cdot X =\lambda\cdot I\cdot X\),其中是 \(I\) 單位方陣:

\(\left[ {\begin{array}{*{20}{c}} 1&4\\ 3&2 \end{array}} \right] \cdot \left[ {\begin{array}{*{20}{c}} {{x_{1}}}\\ {{x_{2}}} \end{array}} \right] = \lambda \cdot \left[ {\begin{array}{*{20}{c}} 1&0\\ 0&1 \end{array}} \right] \cdot \left[ {\begin{array}{*{20}{c}} {{x_{1}}}\\ {{x_{2}}} \end{array}} \right]\; = \;\left[ {\begin{array}{*{20}{c}} \lambda &0\\ 0&\lambda \end{array}} \right] \cdot \left[ {\begin{array}{*{20}{c}} {{x_{1}}}\\ {{x_{2}}} \end{array}} \right]\)

\(\Rightarrow \;\;\left[ {\begin{array}{*{20}{c}} 1&4\\ 3&2 \end{array}} \right] \cdot \left[ {\begin{array}{*{20}{c}} {{x_{1}}}\\ {{x_{2}}} \end{array}} \right] – \;\left[ {\begin{array}{*{20}{c}} \lambda &0\\ 0&\lambda \end{array}} \right] \cdot \left[ {\begin{array}{*{20}{c}} {{x_{1}}}\\ {{x_{2}}} \end{array}} \right] = \left[ {\begin{array}{*{20}{c}} 0\\ 0 \end{array}} \right]\)

\( \Rightarrow \;\;\left[ {\begin{array}{*{20}{c}} {1 – \lambda }&4\\ 3&{2 – \lambda } \end{array}} \right] \cdot \left[ {\begin{array}{*{20}{c}} {{x_{1}}}\\ {{x_{2}}} \end{array}} \right] = \left[ {\begin{array}{*{20}{c}} 0\\ 0 \end{array}} \right]\)

若 \(\left[ {\begin{array}{*{20}{c}} {1 – \lambda }&4\\ 3&{2 – \lambda } \end{array}} \right]\) 是可逆方陣,

那 \(\;\left[ {\begin{array}{*{20}{c}} {{x_{1}}}\\ {{x_{2}}} \end{array}} \right] = \;{\left[ {\begin{array}{*{20}{c}} {1 – \lambda }&4\\ 3&{2 – \lambda } \end{array}} \right]^{- 1}} \cdot \left[ {\begin{array}{*{20}{c}} 0&0\\ 0&0 \end{array}} \right] = \;\left[ {\begin{array}{*{20}{c}} 0\\ 0 \end{array}} \right]\)。

因此,如果我們希望找到的 \(\;\left[ {\begin{array}{*{20}{c}} {{x_{1}}}\\ {{x_{2}}} \end{array}} \right] \ne \left[ {\begin{array}{*{20}{c}} 0\\ 0 \end{array}} \right]\),那 \(\left[ {\begin{array}{*{20}{c}} {1 – \lambda }&4\\ 3&{2 – \lambda } \end{array}} \right]\) 一定要不可逆才行,

即其行列式值 \(\det \left( {\left[ {\begin{array}{*{20}{c}} {1 – \lambda }&4\\ 3&{2 – \lambda } \end{array}} \right]} \right) = 0\),由此可得:

\((1 – \lambda )(2 – \lambda ) – 3 \cdot 4 = 0\;\; \Rightarrow \;\;{\lambda ^2} – 3\lambda- 10 = 0\;\; \Rightarrow \;\;\lambda= 5\) 或 \(-2\)。

\(\lambda=5\) 時,\(\left[ {\begin{array}{*{20}{c}} { – 4}&4\\ 3&{ – 3} \end{array}} \right] \cdot \left[ {\begin{array}{*{20}{c}} {{x_{1}}}\\ {{x_{2}}} \end{array}} \right] = \left[ {\begin{array}{*{20}{c}} 0\\ 0 \end{array}} \right]\;\; \Rightarrow \;\;{x_{1}} – {x_{2}} = 0\),

取 \(\left[ {\,\begin{array}{*{20}{c}} 1\\ 1 \end{array}\,} \right]\) 作代表,即 \(\left[ {\begin{array}{*{20}{c}} 1&4\\ 3&2 \end{array}} \right] \cdot \left[ {\,\begin{array}{*{20}{c}} 1\\ 1 \end{array}\,} \right] = 5 \cdot \left[ {\,\begin{array}{*{20}{c}} 1\\ 1 \end{array}\,} \right]\;\)

\(\lambda=-2\) 時,\(\left[ {\begin{array}{*{20}{c}} 3&4\\ 3&4 \end{array}} \right] \cdot \left[ {\begin{array}{*{20}{c}} {{x_{1}}}\\ {{x_{2}}} \end{array}} \right] = \left[ {\begin{array}{*{20}{c}} 0\\ 0 \end{array}} \right]\;\; \Rightarrow \;\;3{x_{1}} + 4{x_{2}} = 0\),

取\(\left[ {\begin{array}{*{20}{c}} { – 4}\\ 3 \end{array}} \right]\)作代表,即 \(\left[ {\begin{array}{*{20}{c}} 1&4\\ 3&2 \end{array}} \right] \cdot \left[ {\begin{array}{*{20}{c}} { – 4}\\ 3 \end{array}} \right] = – 2 \cdot \left[ {\begin{array}{*{20}{c}} { – 4}\\ 3 \end{array}} \right]\;\)

也就是說,只要 \(X\) 是 \(\left[ {\,\begin{array}{*{20}{c}} t\\ t \end{array}\,} \right]\) 或 \(\left[ {\,\begin{array}{*{20}{c}} { – 4t}\\ {3t} \end{array}\,} \right]\),那就會滿足 \(A\cdot X=\lambda \cdot X\),其中 \(\lambda\) 分別是 \(5\) 和 \(-2\)。

因此,我們就稱 \(5\) 和 \(-2\) 是方陣 \(A = \left[ {\begin{array}{*{20}{c}} 1&4\\ 3&2 \end{array}} \right]\) 的「特徵值」(eigenvalues),

\(\left[ {\,\begin{array}{*{20}{c}} 1\\ 1 \end{array}\,} \right]\) 和 \(\left[ {\begin{array}{*{20}{c}} { – 4}\\ 3 \end{array}} \right]\) 分別是特徵值 \(5\) 和 \(-2\) 所對應的「特徵向量」(eigenvectors)

(以此兩個作為代表,事實上只要是 \(\left[ {\,\begin{array}{*{20}{c}} t\\ t \end{array}\,} \right]\) 或 \(\left[ {\,\begin{array}{*{20}{c}} { – 4t}\\ {3t} \end{array}\,} \right]\) 均可),

至於產生特徵值的方程式 \(\det \left( {\left[ {\begin{array}{*{20}{c}} {1 – \lambda }&4\\ 3&{2 – \lambda } \end{array}} \right]} \right) = 0\),就稱為「特徵方程式」(characteristic equation)。

以下,我們給出一般化的定義:

\(A\) 為 \(n\) 階方陣,\(\det(A-\lambda I)=0\) 就稱為 \(A\) 的「特徵方程式」,
其解 \({\lambda _{i}}~(i=1\sim n)\) 就稱為 \(A\) 的「特徵值」,
滿足 \(A \cdot X = {\lambda _{i}} \cdot X\) 的 \(X\),就稱為特徵值 \(\lambda_i\) 所對應的「特徵向量」。

凱萊─漢米爾頓定理

回到上面例子的 \(A = \left[ {\begin{array}{*{20}{c}} 1&4\\ 3&2 \end{array}} \right]\),

這跟〈二階方陣的凱萊─漢米爾頓定理〉一文中的例子是同一個,

所以我們知道 \({A^2} -3A – 10I = O\)。

再看看 \(A\) 的特徵方程式 \(\det \left( {\left[ {\begin{array}{*{20}{c}} {1 – \lambda }&4\\ 3&{2 – \lambda } \end{array}} \right]} \right) = 0\),即 \({\lambda^2} – 3\lambda-10 = 0\),

顯然這兩者在係數上是一模一樣的。沒錯,事實上凱萊─漢米爾頓定理就是和特徵方程式有關。有了特徵方程式的概念後,我們就可以寫出一般化的凱萊─漢米爾頓定理:

\(A\) 為 \(n\) 階方陣,

\(\begin{array}{ll}f(\lambda )&=\det (A – \lambda I)\\&= {a_n}{\lambda ^n} + {a_{n – 1}}{\lambda ^{n – 1}} +\cdots+{a_1}\lambda+ {a_0} = 0\end{array}\) 為 \(A\) 的特徵方程式,

則 \(f(A) = {a_n}{A^n} + {a_{n – 1}}{A^{n – 1}} +\cdots+ {a_1}A + {a_0}I = O\),

其中 \(I\) 與 \(O\) 分別為單位方陣與零方陣。

至於證明,則是要請出特徵值與特徵向量來幫忙了,在此略去,請讀者查閱相關的資料。

有了 \(n\) 階方陣的凱萊─漢米爾頓定理後,
我們在求 \(A^n\),或是 \({A^4} -4{A^3} – 6{A^2} +8A – 11I\) 之值的時候,就有更簡便的工具了。
詳細的例子,請讀者參閱〈二階方陣的凱萊─漢米爾頓定理〉一文,此處就不再贅述了。

矩陣的對角化

希望讀者沒有被特徵值、特徵向量、特徵方程式這些專有名詞給弄昏頭了,因為接下來還需要用到它們來說明某些方陣 \(A\),可以很快地計算出它的任意次方 \(A^n\)。

我們還是先從簡單的實際例子看起。

還是同一個 \(A = \left[ {\begin{array}{*{20}{c}} 1&4\\ 3&2 \end{array}} \right]\),如何快速地求出 \(A^{100}\)?

由上文中已經知道 \(\lambda=5,-2\) 是 \(A\) 的特徵值,其對應的特徵向量分別是 \(\left[ {\,\begin{array}{*{20}{c}} 1\\ 1 \end{array}\,} \right]\) 和 \(\left[ {\begin{array}{*{20}{c}} { – 4}\\ 3 \end{array}} \right]\) 。

令 \(P = \left[ {\begin{array}{*{20}{c}} 1&{ – 4}\\ 1&3 \end{array}} \right]\) ,就是由特徵向量所組成的方陣,可求出 \({P^{\, – 1}} = \left[ {\begin{array}{*{20}{c}} {\frac{3}{7}}&{\frac{4}{7}}\\ {\frac{{ – 1}}{7}}&{\frac{1}{7}} \end{array}} \right]\) ,

接下來我們真的計算 \(P^{-1}AP\),看看有什麼神奇的事情會發生:

\(\begin{array}{ll}{P^{- 1}}AP &= \left[ {\begin{array}{*{20}{c}} {\frac{3}{7}}&{\frac{4}{7}}\\ {\frac{{ – 1}}{7}}&{\frac{1}{7}} \end{array}} \right]\left[ {\begin{array}{*{20}{c}} 1&4\\ 3&2 \end{array}} \right]\left[ {\begin{array}{*{20}{c}} 1&{ – 4}\\ 1&3 \end{array}} \right] \\&= \left[ {\begin{array}{*{20}{c}} {\frac{3}{7}}&{\frac{4}{7}}\\ {\frac{{ – 1}}{7}}&{\frac{1}{7}} \end{array}} \right]\left[ {\begin{array}{*{20}{c}} 5&{ – 8}\\ 5&6 \end{array}} \right] \\&= \left[ {\begin{array}{*{20}{c}} 5&0\\ 0&{ – 2} \end{array}} \right]\end{array}\)

得到的是一個很漂亮的矩陣,主對角線以外的元均為 \(0\),

這樣的矩陣我們稱之為「對角方陣」(diagonal matrix)。

更特別的,主對角線上的元剛好就是特徵值 \(5\) 和 \(-2\)。

因此,我們就可以把 \(A = \left[ {\begin{array}{*{20}{c}} 1&4\\ 3&2 \end{array}} \right]\)

改寫成 \(A = \left[ {\begin{array}{*{20}{c}} 1&4\\ 3&2 \end{array}} \right] = P\left[ {\begin{array}{*{20}{c}} 5&0\\ 0&{ – 2} \end{array}} \right]{P^{- 1}}\),那麼,

\(\begin{array}{ll}{A^{100}}&=\left( {P\left[ {\begin{array}{*{20}{c}} 5&0\\ 0&{ – 2} \end{array}} \right]{P^{- 1}}} \right)\left( {P\left[ {\begin{array}{*{20}{c}} 5&0\\ 0&{ – 2} \end{array}} \right]{P^{ – 1}}} \right) \cdots\left( {P\left[ {\begin{array}{*{20}{c}} 5&0\\ 0&{ – 2} \end{array}} \right]{P^{- 1}}} \right)\\&=P{\left[ {\begin{array}{*{20}{c}} 5&0\\ 0&{ – 2} \end{array}} \right]^{100}}{P^{ – 1}}=P\left[ {\begin{array}{*{20}{c}} {{5^{100}}}&0\\ 0&{{{( – 2)}^{100}}} \end{array}} \right]{P^{- 1}}\\&=\left[ {\begin{array}{*{20}{c}} 1&{ – 4}\\ 1&3 \end{array}} \right]\left[ {\begin{array}{*{20}{c}} {{5^{100}}}&0\\ 0&{{{( – 2)}^{100}}} \end{array}} \right]\left[ {\begin{array}{*{20}{c}} {\frac{3}{7}}&{\frac{4}{7}}\\ {\frac{{ – 1}}{7}}&{\frac{1}{7}} \end{array}} \right]\\&=\left[ {\begin{array}{*{20}{c}} {{5^{100}}}&{ – 4 \cdot {{( – 2)}^{100}}}\\ {{5^{100}}}&{3 \cdot {{( – 2)}^{100}}} \end{array}} \right]\left[ {\begin{array}{*{20}{c}} {\frac{3}{7}}&{\frac{4}{7}}\\ {\frac{{ – 1}}{7}}&{\frac{1}{7}} \end{array}} \right] = \left[ {\begin{array}{*{20}{c}} {\frac{{3 \cdot {5^{100}} + 4 \cdot {{( – 2)}^{100}}}}{7}}&{\frac{{4 \cdot {5^{100}} – 4 \cdot {{( – 2)}^{100}}}}{7}}\\ {\frac{{3 \cdot {5^{100}} – 3 \cdot {{( – 2)}^{100}}}}{7}}&{\frac{{4 \cdot {5^{100}} + 3 \cdot {{( – 2)}^{100}}}}{7}} \end{array}} \right]\end{array}\)

這樣是不是快多了!換句話說,若一個矩陣可「對角化」(diagonalizable),就是找到可逆方陣 \(P\) 使得 \(P^{-1}AP\) 是對角方陣,那麼,計算 \(A\) 的任意次方 \(A^n\) ,就只是小事一件而已。方陣的對角化是矩陣理論中至為重要的一環,但再談下去會牽涉到更多的大學數學內容,因此,我們不得不在此打住,不再追究下去了,讀者只要知道對角化會與特徵值、特徵向量有關即可。

簡略介紹對角化的目的在於許多高中數學參考書或講義中,常常有給出 \(P\),然後要求 \(P^{-1}AP\) 與 \(A^n\) 的題目。許多人僅是依樣畫葫蘆地算,不知道這樣子算的意義在哪!其實這些題目背後的數學概念就是對角化、特徵值與特徵向量,下次再遇到類似的題目,就知道它葫蘆裡賣的是什麼藥了。

There are 4 comments for this article
  1. kobe at 13:58:33

    第8行寫錯一個地方囉 [0,0,0,0]要改成[0,0]才對~

  2. 學量物中的路人 at 16:30:13

    Nice!簡單易懂
    3q very much

  3. joker at 12:20:49

    2 1 1
    1 2 1
    1 1 2

    這個怎樣求特徵向量
    特徵 值 2
    特徵向量

    0 1 1
    1 0 1
    1 1 0

    這樣特徵向量互斥
    要如何看

  4. Savid at 18:59:35

    不好意思
    矩陣對角化一開始的P-1AP的
    第二條等式後面那個矩陣
    -8應改為8,6改為-6才是吧?

發表迴響

你的電子郵件位址並不會被公開。 必要欄位標記為 *


9 − 5 =