来看看比尔盖茨当年写的BASIC解释器源代码吧,你就知道泰勒级数有什么用了

出处:编码珠玑(ID:gh_f65e0111d17a)

如若转载请联系原公众号

几年前当我刚上大学那会,我曾经问过我一位学计算机同学的一个问题:计算机是如何计算诸如  或者  这种运算的?当初这个问题曾经困扰了我好长时间,这个问题并非是我当年在微积分课堂上解决的,而是直到我后来接触编程后才彻底恍然大悟。那么计算机究竟是如何计算这类运算呢?带着这个问题,我们先来看看当年比尔盖茨在上世纪七十年代写的BASIC解释器的部分源代码吧。

代码部分内容:

完整源代码链接

https://www.pagetable.com/docs/M6502.MAC.txt

盖茨的这些代码公布于两年前,当时在网上引起了不小风波。

对于这段汇编代码,即便你看不懂,但你仅从注释部分(我标注的红框内)也能猜出是计算正弦sin函数的方法。如果你汇编基础好的话,仔细研究,发现盖茨用的正是泰勒公式来逼近这个  函数的。也即: 暂且不说编程逻辑、算法效率方面如何,单是从注释习惯方面已经足够秒杀现在大部分的软件从业人员了。如果非要说算法的话,这个算法已经是被盖茨压榨到了极限,开始部分就先判断象限,再将角度进行区间的转化。

要知道,在比尔盖茨那个年代,市场上还没有软件工程这个概念。。。而盖茨这部分代码却包含了完整的注释,极简的算法。想想多恐怖。

嗯,扯远了,今天我们不聊汇编,主要聊一聊盖茨使用的这个算法,也就是泰勒级数。

盖茨使用的这个算法,延续到了现代计算器上面。

无独有偶,前不久微软在GitHub上面开源了其Windows上面自带计算器应用的C++源代码(计算引擎部分用C++,UI部分使用C#)

部分C++源代码:

完整代码且看

https://github.com/Microsoft/calculator

对于上面的代码,得益于微软工程师完美的代码注释,即便你没有编程基础的话,你依然能够从注释里面看出本行代码的大致意思,没错,这段代码就是求余弦  的函数。再仔细观察注释部分,你能发现,哈哈,你能发现微软的工程师挺皮的,居然把  函数的泰勒展开给画出来了。我甚至怀疑微软的工程师是不是继承了盖茨的编码注释风格,居然如此详细。

如果那两段汇编你可能看不懂的话,那么上面这段C++代码你肯定能有所领悟。其实这段代码跟上面那段汇编有同样的功能,都是计算三角函数,而所用的方法也一样,都是泰勒展开。至于微软为什么不直接使用c++提供的math库函数,而非要再造一个轮子来计算这类函数,我个人猜测可能有两个原因,一个是历史遗留问题,也许早年c++还没有math库,另一个我觉得使用库函数的话会造成编译出来的二进制文件过大,也许微软也担心这个问题。当然这都是我个人的猜测,但这里不做重点讨论。

其实,计算器求解我们所知道的几乎所有的函数都是使用泰勒展开方法,例如  ,  ,  等等。

那么泰勒级数为什么能逼近我们我们所需要的函数曲线呢?为了解决这个问题,我们先从一个简单速度的问题说起。

假设小明坐在一辆车上,车的行驶速度随时间  变化为  .小明突然很想知道当  时刻他的行驶速度。这可把小明给难住了,因为他手上没计算器,又没三角函数表可查。如果是特殊的函数点位的话,大不了他运用运用和差公式直接就可以计算出来,但是这种情况该怎么办呢?

万般无奈的小明想到,如果我能把这个速度指数函数转化成只有加法或者乘法的函数,那该多好。

小明想到,如果定义一个只有加法乘法的函数  ,让它在某点的值与  的值一样,后面为了保证它们两个的增长趋势一样,让它们两个的速度的变化率(导数)一样,变化率的变化率(导数的导数)也一样,变化率的变化率的变化率(导数的导数的导数)也一样。。。,那么后面的两者函数的值不应该是很接近吗? 在一定条件下成立呢?

于是,小明定义了一个只有加法与乘法的函数  来表示所有可能的多项式: 可是如何才能让g(x)逼近f(x)呢,换句话说,如何取得合适的  才能让 成立呢?

小明观察了  的函数图像:

他发现,在(-π,π)区间之内,  函数的图像很像抛物线。舍繁取简,他也用抛物线来近似。于是他讲  简化,定义为:

可即便这样,还是要找出三个变量的值。于是小明进一步思考,已经知道  了,求得的  至少也得让他们两者在  处相等,也即: 代入计算:

也即  变成: 可是在那么多的  与  当中,如何取值呢?

于是,小明再观察图像,他为了保证在  附近这个抛物线逼近  ,他让两者的切线斜率一致,这样就保证了两个函数的加速度保持一致,也即:

代入计算: 也即  ,这样  也就更简单了,直接剩下最后一个系数: 这时候小明再观察图像,发现两者似乎又进了一步:

为了求出最后一个  ,小明再观察图像:

小明发现在  附近,也即(-π/2,π/2)附近,  是一个凸函数,而且斜率不断减小,这时为什么不让他们的斜率的增长率也保持一致呢?也就是说让两个函数在  处加速度的加速度也相等,也即他们的二阶导数相等: 代入计算: 求得  ,从而得到 再观察图像:

这时候发现,经过三次的求导运算,两者函数在  周围已经非常接近了。我们来实际验证一下用  逼近  的误差有多大:  两者误差仅为0.00005,完全在我们可接受的范围之内。于是乎,小明忽然明白了为什么  与  是等价无穷小了(当初的我曾经对这个公式大惑不解)。

可是小明依旧不满足,他在想我只求了两次的倒数,如果我让变化率的变化率的变化率的变化率的变化率。。。。也相等的话,误差会不会更小呢?

于是小明持续往下计算

发现越往后,越精确,但是代价就是计算量越大。而往往,我们直接舍去后面的高阶无穷小,仅需要前三四项即可满足我们的要求。

可是,小明突然又想到,这样只是计算在  处附近的函数值,如何让  逼近  的任意一点比如  呢?很简单只要将  替换成  即可,推导过程也一样,只是不会像x=0处那样把奇数项给消掉了:

小明大喜,用这种方法在没有计算器的情况下几乎可以计算任何函数的数值了,虽然有一定误差,但误差完全在我们容忍范围之内。于是他又用同样的方法计算了  在  处的泰勒展开:

具体步骤为:

1),先让函数值相同,也即 得到:  2),再让一阶导数相等

得到: ......

最后让n阶导数数相等 (  的  阶导数仍是  )

得到: 最后得出:

当  不断增大的时候,小明惊奇地发现在固定区间内,两者几乎完美地融合在了一起:

可是小明纵然知道了其中的推导原理,但他依然不太直观理解泰勒级数为什么会逼近原函数。我在上文「深入浅出线性代数的理解及应用」中曾经引用笛卡尔的名言,说明几何对抽象代数理解的重要性。同样,在这里也不例外,泰勒级数在几何上也有明确的意义:

泰勒级数的几何意义

如图下所示,我们假设黄色的曲线函数为  ,在  区间内连续。点  为点  周围(微小的邻域)内任意一点。

我们再定义一个积分函数: 由于  是  的原函数(注意,  是积分函数,  才是曲线函数),因此:

积分函数  连续,因此可以分成两个积分区间: 这两个积分区间实际上由三部分构成。根据积分的实际几何意义,我们知道  代表图中阴影部分的面积,我们记为  .而面积A由三部分构成,分别是  扫过的曲边多边形  ,矩形  ,曲边三角形  :

我们记三部分面积分别为  ,也即:

曲线  在任意一点的切线斜率为  ,也即  .如果  越接近  ,那么这个斜边越接近曲线  :

切线  在点  处的斜率为 也即 而这个矩形的高即  ,它的面积:

也即:

上面这个式子不正是泰勒级数展开的二次多项式吗,不过不要忘了,这个式子与  之间的关系是约等于。如果  无限逼近  ,那么我们完全可以用  来近似  ,也就是说省略掉后面的矩形与三角形,只剩下一项。而实际上我们省略了后面的高阶无穷小,在一般情况下,精度已经够高了。

这便是泰勒级数在几何上面的解释。

(0)

相关推荐