由問題的起源看導數的定義I

Print Friendly

由問題的起源看導數的定義I
臺北市立西松高中 蘇惠玉教師

前言

在高中的微積分教學脈絡中,一定先教授極限的觀念與函數的極限,然後在進入微分單元時,直接定義何謂導數,即多項式函數 \(f(x)\) 在點 \((a,f(a))\) 的導數為 \(f'(a)=\lim_{x\rightarrow a}\frac{f(x)-f(a)}{x-a}\),然後再說明導數的意義以及應用。

然而為何導數要這樣定義?我們在定義一個數學物件之前,通常是問題導向的,有需要,才有發明。那麼導數或是微積分來自於什麼需求?為何會導致這樣的定義形式?在這一系列的文章中,筆者試圖透過這一段數學史的發展,從問題的源頭說起,經由費馬求極值與牛頓求切線的方法,並利用問題來學習與思考,最後理解何以會以 \(f'(a)=\lim_{x\rightarrow a}\frac{f(x)-f(a)}{x-a}\) 這種形式來定義導數的必然性。

問題的來源

在數學發展史上,隨著解析幾何的發明與函數觀念的採用,微積分技術的出現似乎已水到渠成,而當時十七世紀科學研究與應用的需求,更為微積分技術的產生增強了社會脈絡面向的因素。在當時,主要的問題有四個類型:

  1. 求瞬間速度與瞬間加速度。
    在當時運動物體所涉及的速度與加速度是隨時間而變化的,已不能像計算平均速度時一般以距離除以時間來計算。
  2. 找曲線之切線與法線。
    由於透鏡設計的需求,當時研究光學的科學家們,如費馬(Pierre de Fermat, 1601~1665)、笛卡兒(René Descartes, 1596~1650)、惠更斯(Christiaan Huygens, 1629~1695)與牛頓(Isaac Newton, 1643~1727)等人必須知道光射向透鏡的角度,才能引用折射定律,因此,必須求出曲面的法線,而法線垂直切線,也轉換成求切線問題。另外,同樣來自於運動學的研究,運動物體在任意瞬間的運動方向,就是運動軌跡在那一點的切線方向,因此,也促進了曲線的切線求法之研究。
  3. 求函數的極大值與極小值。
    如在拋射運動中求能得到砲彈最大射程的角度以及拋射的最大高度;研究行星與太陽、地球之間的最大與最小距離。
  4. 求曲線的長度、曲線所圍的面積、曲面所圍的體積、物體的質量重心等。
    希臘人本來已有用逼近法求體積與面積,但方法缺乏一般性,又常無法得到正確的答案。於是,在阿基米德的作品在歐洲廣為流傳時,計算體積、面積及質量重心的興趣又再度興起。

在前面的四個問題類型中,前面三個問題本質上都是一種變量的瞬間變化率,而第四個問題為前三個的逆問題。

以求瞬間速度為例,當物體以變速運動時,每一瞬間此物體都有一個瞬時速度,但是若用平均速度的求法來看,此時移動距離是0,所花的時間也是0,而 \(\frac{0}{0}\) 是無意義的,所以,必須讓此時的變量時間有一段微小的變化(即微小的時間間隔),藉此來討論運動體在這一點左右的平均速度變化率。

當這個微小的增量極微小,或是說可以無限小時,變化率所逼近的數,即為所求的瞬時速度或切線斜率。然而,當吾人假設微小的增量然後順利求出變化率 \(\frac{\Delta y}{\Delta x}\) 之後,又該怎麼讓這個微小的增量「消失」呢?在微積分的基礎完善之前,許多偉大的數學家都曾糾結在這個問題上,微積分的方法也因為這一個問題備受攻擊。

費馬求極值的方法

在費馬於1637年寄出的一封信中,包含了他如何求函數極大值的方法,其中並收錄了他於1629年發現的切線求法:

求極大值與極小值的全部理論以二個未知量和下述法則為基礎:

設 \(a\) 是問題中的任一未知量,讓我們用包含 \(a\) 的次方的諸項來表示極大值或極小值。現在用 \(a+e\) 來代替原來的未知量 \(a\),並且用包含 \(a\) 和 \(e\) 次方的諸項來表示極大值或極小值。然後使這兩個極值表達式相逼近 (adequate,Diophantus的術語,表示盡可能的逼近一個數),並消去公共項,…用 \(e\) 或 \(e\) 的高次方除各項,使 \(e\) 從至少有一項中消失,然後捨棄所有仍有 \(e\) 的項,使兩邊的剩餘項相等。…最後這個方程式的解所產生的 \(a\)值,代入原來的表達式就可得出極大值或極小值。

這裡舉一個例子:

將線段 \(AC\) 分成兩段,分段點 \(E\),使得 \(AE\times EC\) 有最大值。

51839_p1

費馬的作法是這樣的,先假設 \(AC=b\),分成的兩線段長中一段為 \(a\),所以另一段長為 \(b-a\),

它們的乘積 \(AE\times EC\) 即為 \(a(b-a)=ba-a^2\),

我們要的就是這個積的極大值,這個也就是變數 \(a\) 的函數 \(f(a)\)。

然後讓 \(a\) 有一個微小的增量 \(e\),

即第一條線段為 \(a+e\) (\(e\) 為微小的變化量),第二線段將為 \(b-a-e\),

它們的積變為 \(f(a+e)=(a+e)(b-a-e)=ba-a^2+be-2ae-e^2\);

他說:「這個表達式必須逼近前一個表達式」,

也就是說 \(ba – {a^2} + be – 2ae – {e^2}\sim ba – {a^2}\),消去公共項後,

得 \(be\sim 2ae+e^2\),再消去 \(e\) 得 \(b=2a\)。為了解決所提問題,最後必須取 \(a\) 為 \(b\) 的一半。

費馬最後說:「我們很難指望有更一般的方法了。」

費馬求極大值的基本想法,就如同刻卜勒(Johannes Kepler, 1571~1630)在《測量酒桶的新立體幾何》中觀察到的結果一樣:「在最大值附近,在兩端的減少開始變得難以察覺」。所以,當a為極大值產生時的線段長,那麼在a的附近,如果增加了微小的長度e,那麼,增加後的乘積(函數值)與原本的差異「難以察覺」,於是,費馬只好以「將他們盡可以的逼近」的說法來表達。

在費馬的方法中,我們可以發現,以現在的符號來理解的話,

他的方法本質上即是計算當 \(e\) 是個很微小的量時(亦即趨近於 \(0\)),

讓 \(\frac{f(a+e)-f(a)}{e}\) 這個值「盡可能的逼近」\(0\),

只是在「不敢提」或是沒有完備的極限概念的情形下,

費馬僅能以如此模糊的方式說明這個「微小增加量」的處理原則:

盡可能的逼近,將 \(e\) 一下子當成不等於 \(0\) 的約分掉,一下子又當成等於 \(0\) 的忽略不計消失掉,

這一點接下來的牛頓也沒有處理的比較好,只是將方法精鍊許多而已,

我們下一篇文章在詳細說明。

連結:由問題的起源看導數的定義II

參考文獻

  • Calinger, R. ed. (1995). Classics of Mathematics. New Jersey: Prentice-Hall, Inc.
  • Katz, Victor J. (1993). A History of Mathematics: An Introduction. New York: HarperCoollins College Publishers.
  • 李文林主編 (2000).《數學珍寶》,台北:九章出版社。
  • Kline, M. (1983).《數學史—數學思想的發展》(林炎全、洪萬生、楊康景松譯),台北:九章出版社。
  • Kline, M.(2004).《數學確定性的失落》(趙學信、翁秉仁譯),台北:台灣商務印書館。

發表迴響

你的電子郵件位址並不會被公開。 必要欄位標記為 *


+ 9 = 15