读《几何人生:丘成桐自传》的一点感想
最近在拜读《几何人生:丘成桐自传》这本书。作为一代宗师,丘先生的自传充满了精彩的人生智慧和深刻的学术思想。笔者觉得任何一个学者,都会从中得到启迪。特别是矢志投身科学事业的年轻人,如果能认真学习这本书的思想,肯定会受益终身。
工科研究生的基础科学训练相对比较薄弱,往往花费多年心血精心打造一个非常狭小领域的某个算法,但是缺乏关于基础数学,特别是拓扑与几何的宏观看法。因此学习丘先生高屋建瓴的观点和方法,不但对于纯粹数学的研究必不可少,对于工程技术的发展也是至关重要的。
例如,丘先生回顾在柏克莱读书的岁月,曾经写下这样的一段:“当我研究十九世纪中叶到二十世纪初期代数几何和算术几何的发展,觉得它们内容极为丰富,而它们重要的方法是用空间上函数的代数结构来决定代数空间的性质。我觉得这个想法很好,在一般的空间上,也可以用函数的结构来描述这些空间的几何性质。这些函数必须要和空间的几何有密切的关系才能派上用场,一般来说,他们都是线性或是非线性微分方程的解,但是函数的定义要推广,有时是纤维束上的截面。我花了很多工夫沿着这条路走,以后和大量的朋友和学生合作,解决了几何上很多重要问题,大家叫这个学科为几何分析。”
这段话写得从容徐缓,平淡无奇,但是笔者基于过去多年的研究经验,却觉得这段话平地惊雷,振聋发聩!这段话所凝练的思想非常广袤深邃,意蕴深远,其背后的历史故事更是跌宕起伏,波澜壮阔。笔者在计算机科学领域和应用数学领域耕耘不辍,亲眼目睹了不同工程领域很多算法的诞生和成长,本质上就是依随丘先生所指出的这条路线,历史一次次验证了几何分析的深刻和力量。
图1. 物联网路由。
一个最为简单的例子如下:考察欧几里得平面上,曲率处处为0,由Liouville定理,有界的调和函数必为常数;具有同样拓扑的双曲平面上,曲率处处为负,则存在非常数的有界调和函数。调和函数满足Laplace方程,刻画了平面上的黎曼度量。更为一般的,黎曼流形上的调和函数反映了流形的维数与曲率信息。在网络研究中,调和函数被用于估计局部网络的维数和曲率。例如,互联网的骨干(backbone)曲率为负,边缘(edge)曲率为正。与流形上随机行走相关的各种概率往往由调和函数来表示,由此我们可以通过随机行走的行为来推断流形的几何与拓扑性质。例如,欧几里得平面上从原点出发的随机行走会不断地回到原点,而双曲平面上从原点出发的随机行走一去不复返,不会回到原点。这些性质可以被用于网络安全,例如网络上的谣言制造者往往用随机行走进行路由以隐藏自己,通过监控网络特定节点收到谣言的概率,我们可以确定谣言制造者的位置。
图2. 相位展开和点云重建。
再如曲面余切丛上的调和截面,同样由Laplace方程来控制。所有的调和截面构成一个群,群的代数结构反应了曲面的拓扑,例如群的维数等于曲面亏格的两倍。对偶的,曲面上的光滑切矢量场可以唯一地分解为调和场,旋量为零的矢量场(梯度场)和散度为零的矢量场(散度场),这一定理被称为是Hodge分解定理。这一方法广泛应用于3D技术。目前,3D数据采集的一个主要方法是基于结构光的扫描方法。这种方法将距离变成相位信息,然后将相位编码成图像灰度。通过结构光得到条纹图像,可以反算出相对相位,即绝对相位模上2pi。通过相对相位来反算绝对相位是结构光3D扫描的关键,这一算法被称为是相位展开。本质上我们希望用相对相位计算梯度场,由于噪音的存在,如此得到的矢量场未必是梯度场,因此我们可以用Hodge分解来得到梯度场、无散场和调和场,那么梯度场的积分给出了绝对相位。由此我们得到了3D点云。进一步通过估计每个点处的曲面法向量,我们得到了定义在点云上的矢量场。这时,我们在3维空间中定义到达被扫描的曲面的距离函数,那么曲面的法向量场就是距离函数的梯度场。我们对点云上的矢量场进行Hodge分解,如此得到距离函数的梯度场,那么距离函数的零水平集,即为由点云重建的曲面。
我们再用几何分析的思想来考察曲面上Laplace-Beltrami算子的特征根与特征函数。曲面所有特征根构成了曲面的谱(spectrum),在工程和医学上谱经常被视为形状的指纹,进行形状分类。特征函数作为曲面上的推广Fourier分解,经常用于曲面上的信号处理,例如信号的压缩与滤波。特征根与特征函数的组合构成了流形的热核,而热核完全反映了黎曼度量信息,经常用于形状特征提取,曲面匹配。
图3. 黎曼面全纯线丛的亚纯截面。
可定向的度量曲面具有共形结构,可以被视为黎曼面。黎曼面的全纯线丛的亚纯截面构成群,其代数结构反映了曲面的共形结构。例如固定截面的奇异点(除子),截面构成线性空间的维数由黎曼-罗赫定理来刻画,与曲面的亏格相关,而除子由Abel定理来刻画,满足特定的方程。在计算力学和计算机辅助几何设计领域,曲面的规则四边形网格剖分,核心就是计算全纯线丛的亚纯截面。
图4. 动态人脸表情追踪。
再如,度量曲面上存在特殊的正值函数,其与黎曼度量张量的乘积得到了常曲率度量。这个特殊的度量取决于曲面的拓扑结构和共形结构,这正是曲面单值化定理。这个度量被广泛应用于计算机图形学中的曲面纹理贴图,计算机视觉中动态曲面追踪,医学影像领域中的虚拟肠镜技术等等。
图5. 最优传输映射。
如果流形上面具有概率测度,这时我们需要考虑最优传输映射,而这一映射由蒙日-安培类型的方程所控制。近期以来,人们逐渐认识到最优传输是深度学习的理论基础之一。丘先生团队将深度学习解耦成流形学习和概率测度学习,而概率测度学习主要是基于最优传输理论。蒙日-安培方程强烈非线性,求解算法相对复杂。由于深度学习的发展,最优传输的近似算法被广泛研究,各种生成模型也层出不穷。
上面所提到的计算机科学领域的算法,绝大多数都是在过去二十年间依随各种软硬件技术的发展而逐步发展起来的:依随核磁共振、CT扫描技术的成熟,医学图像中图像识别与配准发展起来;依随激光技术,mems结构光技术的成熟,3D扫描,点云重建,数字几何处理,自动驾驶技术逐步发展壮大;依随无线传感器网络的发展,几何路由算法和物联网技术发展成熟;依随数控机床,3D打印技术的发展,推动了曲面网格生成,超材料设计等算法的发展;依随Internet技术的发展,数码相机的普及,大数据科学迅猛发展;依随GPU技术的成熟,个人拥有的算力日益增长,基于统计的深度学习方法大行其道。虽然这些领域五花八门,各种技术迅猛发展,各种算法层出不穷,但是其数学基础一直没有变化。当然,依随时代的前进,计算机科学领域所用的数学日益艰深,日益现代。从线性偏微分方程到非线性方程,从平直空间到弯曲流形,从低维到高维。但是用偏微分方程来解决拓扑和几何问题,这一核心思想一直放之四海皆准。
丘先生在回忆录中也多次提到,在他求学的时代,几何学家对于偏微分方程领域的进展不太关心,反之分析学家对于几何领域也不太了解。丘先生主动打破领域壁垒,既和陈省身先生学习几何也和Morrey大师学习偏微分方程,从而石破天惊地创立了几何分析学派。这对于当代的学者更加具有启迪意义。目前,学术领域分工更加细致,行业壁垒更加高耸,跨领域研究需要更多的勇气和训练。例如,深度学习研究中的最优传输,可以归结为求解蒙日-安培方程,其本质工程难度在于解法的复杂度过高,精确解超过目前硬件算力。穷根溯源,在基础数学层面,为了保证解的存在性、唯一性和适定性,我们需要凸微分几何理论、最优传输和偏微分方程理论,关键蒙日-安培方程解的先验估计;有了基础数学的理论保证,在计算数学领域,我们需要设计各种离散化方法,时域频域变换,迭代格式,预处理方法,multigrid方法,收敛阶估计,误差估计,这一步需要大量的数值计算技巧,这些技巧与偏微分方程的先验估计技巧不同,但是先验估计会给数值算法设计带来本质的启发;有了稳定精确的数值方法,在计算机科学的各个领域,我们需要根据具体应用来设计具体算法,在计算机视觉领域,需要一般二维区域上的高精度算法,在图形学的曲面参数化需要平面方形区域内高精度的算法,医学图像中需要三维体图像间的高精度算法,在深度学习领域中需要高维低精度算法。不同应用,不同的精度要求,实时响应的要求,硬件预算的要求,需要不同的数据结构,算法设计,并行化设计,内存管理,数据流控制,硬件配置,界面设计等等。在这一层面,数值计算的方法往往被封装成库函数,被应用层来调用,因此所需要的技能与计算数学非常不同。由于社会分工、教育领域的精细化,计算机背景的技术人员一般不会具有偏微分方程先验估计的技能训练,深入精细的数值逼近理论训练也不足。但是,发明从零到一的革命性算法,仅有计算机科学领域的技巧往往是不够的,很多时候必须要深入理解基础数学的理论。我们目前设计的深度学习中的最优传输映射算法是基于丘先生有关Minkowski问题和蒙日-安培方程的理论,关于医学图像中最优传输算法,其收敛性本质上是基于丘先生、Caffarelli等人的蒙日-安培方程正则性理论。因此,年轻的学生应该拓展眼界,最好具备跨领域的训练,并且从自然的根本上去思考创造,这样才可能做出重大突破!
通过拜读《几何人生:丘成桐自传》,笔者体悟到很多学术上纵览全局的战略思想,这些思想比具体的几何或者偏微分技巧重要许多。同时,丘先生在回忆录中非常真挚诚恳地回顾了亲身经历的重大事件,总结了非常宝贵的人生经验,这些对于年轻人而言是极其难能可贵的。对于虚心求教的年轻人而言,这本书必然令他们受益终身!
【老顾谈几何】邀请国内国际著名纯粹数学家,应用数学家,理论物理学家和计算机科学家,讲授现代拓扑和几何的理论,算法和应用。