数学建模研究过程指导(精编版) Part VII
向上滑动阅览说明及建模指导目录
说明:此文稿为朱浩楠老师于2018年11月-12月北京地区联校数学建模活动的课题研究阶段中,每天一篇发布给各课题组的研究方法指导文件的汇总。为方便更多的同学参考使用,现调整为正序后通过遇见数学公众号发布,版权归朱老师和遇见数学公众号所有。
目录
1如何开题
2如何进行问题的分析和数据的获取
3挖掘情境中数学模式的两种方法
4连续模型的使用范围、建立和求解方法
5从连续模型到离散模型&离散模型的常见类型及其研究方法
6确定性与不确定性
7以支持向量机为例谈机器学习的本质
8以神经网络为例谈深度学习的本质
9到底算法能不能算作数学模型或研究成果?
10科学中的香芬迷雾
11问题重述与基本假设部分的检查表
12符号约定部分的检查表
13模型建立部分的检查表
14模型求解部分的检查表
15模型分析部分和参考文献部分的检查表
16数学建模论文摘要的写作建议
17从高中数学体会数学概貌和数学建模
18感性认知如何驱动理性认知
19我们应该抱着什么心态去学习数学与科学
20新生代青年在变革时代中的机会与责任
从高中数学体会数学概貌和数学建模
研究方法指导 17
新课标中将数学建模引为数学学科六大核心素养之一,并作为线索贯穿必修、选择性必修和选修各类课程之中,是为了通过数学建模的学习令大家对数学学科以及数学学科在其他学科和领域内的应用,有一个概观的、基本的、科学的认识。今天,我们就结合之前的课题研究方法指导的内容,将高中数学的各个板块及其在数学建模过程中的作用联系起来,以飨学子。
到了高中,大家最先学习集合,集合是什么呢?集合是一种数学语言,将具有某些共同特征的事物放在一起作为一个大类别。集合为什么那么重要呢?因为在集合出现之前,人们只能大概地讲“把这些东西放在一起”,这不严谨,因为放多放少,包不包含,都说不清。有了集合之后,就有了一个客观存在的研究对象。集合公理要求一个元素要么属于这个集合,要么不属于,不会有模凌两可。有的同学可能听说过集合的理发师悖论,那个和集合没关系,相关的数学概念叫“类”,类是比集合更为抽象和广大的概念。
所以集合可以看作是研究事物的语言和逻辑准备——如果所研究的东西不是逻辑严谨且客观存在,那么接下来的一切演绎都没有价值,因为从逻辑上“空集可以推导出一切真的或假的事物”(用反证法即可证明)。
有了集合,也就是研究对象,那么就需要在它们之间建立一些关联和操作,这就和人与人、人与自然之间的互动是一样的,在互动中才能感受对方的存在,也才能激发出对各自性质的感受。例如:我们想用眼睛看到一个物体,就需要光线被物体反射传入视网膜。但是也要避免一些“非正常互动”,例如:我们看一个物体,可能很多物体外貌都长一个样子,比如生鸡蛋和煮鸡蛋,但是一个鸡蛋不可能既是生鸡蛋,也是煮鸡蛋。
集合间的合理的关联与互动就叫做映射,我们规定不能一对多,就是怕出现玄学。
映射中有两个非常重要的概念,一个是“单射”,一个是“满射”,单射指的就是两样东西不能映为一样东西,满射指的是目标集合中的每样东西都是映射的像。数学家理解这两个概念力求直观,实际上,单射就是“不粘连”的映射,满射就是“不撕裂”的映射。如果两个集合之间存在着既不粘连也不撕裂的映射,那么这两个集合(作为集合)就视为等价的了,因为其中的元素可以一一对应,所以既单且满的映射也被称为双射,或1-1映射。著名的例子就是有理数集和正整数集之间存在1-1映射。
但是我们显然知道,有理数集和正整数集不一样,所以两个存在1-1映射的集合还不见得是一个东西。但是注意,仅仅从集合的角度是没法区分它们了,我们所谓的“有理数集和正整数集看起来就不同”,其实是因为我们考虑了有理数集和正整数集之中的“运算”,最基本的就是加减乘除。所以运算这件事的提出其实帮助我们可以更细致地分析事物,而不仅仅限于是否1-1对应这个层次。
运算其实也是一种映射,例如我们常说的整数的加法运算,就是从整数集与整数集的笛卡尔积,到整数集的一个映射。这里就出现了一个概念——笛卡尔积。平面欧式空间就是满足欧式距离公理的两个实数集之间的笛卡尔积。从这个层面可以理解笛卡尔作为一个伟大的哲学家对数学作出的贡献——千万不要以为笛卡尔的贡献仅仅是想出了平面直角坐标系,在笛卡尔的天平中,万物之间得以借由他创造的精妙结构和映射这一利器去构造运算。这是现代代数学的雏形。
我们最常见的函数,指的是数集到数集的映射。高中考试中常考有解析式的函数,但是我们需要知道绝大多数函数没有解析式,只有对应关系。有解析式的函数里,有几个函数最为基本,那就是幂函数、指数函数、对数函数、三角函数、反三角函数、常值函数。这五种函数被称为“基本初等函数”。所谓的能写出解析式的函数,其实就是整体或分段地表示为基本初等函数的拉伸、平移、翻折及基本函数间的加、减、乘、除、复合。这样来看,基本初等函数就是函数大厦中的砖块,而“拉伸、平移、翻折、加、减、乘、除、复合”就是砖块间的粘合剂,他们一同构筑起了庞大的摩天大楼。
有一些函数没法像上面这样被基本初等函数通过“拉伸、平移、翻折、加、减、乘、除、复合”表示,却可以通过基本初等函数的“极限”来表示。所以“极限”就成了有别于通常的初等运算体系下的“高等”运算。涉及到极限的数学都称为“高等数学”。极限作为理念出现得很早,大概从人类开始能够想象未来的时候开始就有了。但是极限概念真正严格起来作为一个逻辑严谨的系统,则是在欧拉和威尔斯特拉斯等数学家的努力之后。他们用惊人的洞察力和语言天赋,造就了一套简洁、优雅、准确的符号体系,将对无限的观察蕴含在了对有限的考察中,被人们津津乐道。
函数有图像——这也是笛卡尔的功劳,人们得以将自变量和因变量放在两个集合的笛卡尔积中去观察和体会——观察函数图像,无论是计算机还是人类,理论上都无法连续地观察到每个点,只能观察到其上的若干离散的点——用笔在纸面上画一条看上去很光滑的线,用显微镜放大,到了一定精度之后墨迹还是会开始呈现断断续续——所以人类的计算系统对于连续的函数的观察是通过在上面截取若干的数值来完成的,这也就是数列了。远古时代人们就开始用数列记录历法,其实就是对连续的时间变化的一种离散观察。
但是这一离散可了不得,给数列带来了非常独特的方法——递推。函数也可以实现递推,不过一般会更复杂,涉及到向量场和不动点理论。数列的递推则简单很多,所以放在高中课程中来讲。不过现在数列递推基本删掉了,北京高考考得很少,这多少是个遗憾——从大数学家庞加莱的观点来看,离散和连续密不可分,通过离散来观察连续是一项重要的技巧,甚至不逊色于用有限来观察无限的极限语言。
有了函数,如果它光滑的话,我们就能在上面得到很多切线方向,这些切线方向带有大小,大小用来衡量此处函数的因变量随自变量变化的速率,而方向反映函数图像的走势方向。像这样既有大小又有方向的量就是向量。向量将长度和角度放在同一个范畴里去度量,是个伟大的创造。
光滑函数图像每点有切向量,计算的方法被称为微分;已知切向量能否将函数还原呢?回答是“部分可以”,但是因为向量具有平移不变量,所以想要还原函数还得加上一个条件——给出函数图像上一点。由已知切向量还原函数的过程被称为不定积分,再给出一个初始值以进一步确定唯一函数的过程被称为定积分。著名的牛顿-莱布尼茨公式通过变上限积分给出了二者的联系。
如果你稍微知道更多一点微积分,你大概就知道:任何光滑函数局部上都与某个多项式函数非常接近。多项式函数是人们最为喜闻乐见的函数,因为它很容易求导,而且它的零点是多项式方程的解。多项式方程在几个世纪以来一直是数学研究的热点,留下了大量的工具、结论和技巧。局部上将函数变为多项式,使得这些历史宝藏得以使用。
所以研究多项式函数就是非常重要的,高中主要涉及最高次不超过3次的一元多项式函数,与结构最为优美的3类二元二次多项式函数。二元二次多项式函数(非退化,即,不可约)的零点是平面上的一条曲线,被称为圆锥曲线,也就是椭圆、双曲线、抛物线。希望你能因此而理解为什么它们都是高考考查的重点——因为它们真的在数学上异常重要。
从上面的观点来看,解析几何就是局部上多项式化了的一般几何,这也是现代代数几何学的雏形——局部上是多项式的零点,通过拓扑方法粘贴起来,就是一般的几何体。
一般几何体的另一种局部粘成整体的方式,是用三角形网格来剖分几何体。将光滑的几何体变成了类似于“多面体”的几何体,这在工业中很常用,最大的优势是可以使用网格相关的很多技巧,例如著名的“欧拉公式”,并且如此离散化之后容易利用计算机来计算。既然是三角剖分,那么每个小的面就都是三角形。这样一来,解三角形就不仅仅是对古希腊平面几何公理数学的继承了,而且还是现代工业技术的基石之一。
至于概率统计和立体几何,其重要性不言而喻,但这里还是要就大家可能不是非常了解的方面多说几句。
从前面的梳理可以看到,高中数学的一种理解方式是几何化的,这也是数学上的一种主流观察方式。之所以采用这种观察方式,我理解是因为几何化方便人们直观想象,更容易发现问题的走向而非陷入到琐碎的局部代数运算中去。
在工业中,乃至在理论物理或其他很多基础学科领域中,大家都喜欢从几何上观察,例如广义相对论就是依托黎曼几何企图将全宇宙的规律归结到某种几何规则中,关于这方面的科普著作很多,推荐大家拜读丘成桐先生的科普巨著《大宇之形》。
但是一旦我们要检验自然界的现象是否符合数学上的几何模型,例如雪花❄️的形状是否是对称的,我们必然需要观测数据,但是自然观测得到的数据带有系统误差、自然环境的随机干扰等随机扰动,所以不可能恰好符合数学模型。那么就要分析一下:到底多大概率偏离数学模型多少?如果偏离很大到底是大概率事件还是小概率事件?这决定了你的模型是否可以经得起实践的检验。而分析的方法,就是概率统计。
经过上个世纪统计学领袖C.R.Rao先生的努力,现代概率统计越来越几何化了,甚至很多问题从数学上看就是纯粹的几何问题。对于高中的概率统计来说,其实和平面几何与立体几何密切相关。甚至一些难一点的线性规划问题,也可以通过升维降维的技巧转化为某些经典的立体几何问题。所以立体几何对于建立初等概率统计的几何直观非常重要,虽然现在一般课堂上不这样讲,但是至少知识框架还是被保存下来。这还没考虑到立体几何的公理化推导对学生思维品质训练上的好处。
最后,希望各位同学通过今天的小文,对高中数学有一个比较有温度的整体认识,并且从情感上接受“高中数学很有用”到底事实,进而在接下来的学习中更加自主和出色。
感性认知如何驱动理性认知
研究方法指导 18
这个话题之所以选择在第18天发布,是因为我相信每个课题组在前17天的课题研究中,都经过了各种各样的实践和试错,你们中的不少应该也已经经历了“做出模型后觉得不对”的“大反工”阶段——只有经历了这些“折磨”之后,再来看今天的这篇小文,才会有切身的体会。事实上,要我举出最能让你迅速抓到问题的本质难点,且打开你的创造力大门,并且赋予你无穷的理性思维的力量的,正是你对于生活的感性认知。下面我将从课题研究必须经历的三个阶段来做出解释:
1.当你面对一个课题无从下手时。请你忘记数学,忘记科学,甚至忘记理性。如果这个问题和你的切身生活无关,你又不想逃避,那么请你立刻从你的切身生活中选择一个和这个课题相似的情境。例如:如果你去研究公司A和公司B对公司C某个项目的竞标,而你对竞标并不感冒,那么请你转而思考类似的一个你熟悉的情境——男生A和男生B对女生C的追求。我相信任何一个情智健全的高中生都会有很多话想说,这些话中的大部分其实并没有什么理性可言,因为这是人之常情。而当你打开了这个类似问题的思路,你就可以思考如下的两个问题了:
(1)这两个情境为什么相似?à因为它们满足相同的基本假设。对这个问题的思考可以帮助你快速地定位基本假设。
(2)如果要你帮男生A胜过男生B去获得女生C的青睐,那么如何选择你的策略?你如何去说服男生A采用你的策略?à这时你就必须给出一个让男生A认同你的理由,逻辑就此产生。当你将此处的解答和逻辑,用数学的语言,借由相似的基本假设嫁接到公司竞标的课题上时,你也就大概率可以获得一个极富感染力和说服力的数学模型了。所谓从感性激发理性,无非就是如此。
2.当你面对一堆数据无从分析时。请你不要将这些数字看成是冰冷的数字,而是将它们当作一些你觉得有趣的“小生命”——对于数据的分析,其实就是对于这些小生命“生命过程”的研究——数据聚类,就相当于依据这些小生命的特征找到同类;寻找状态量如何影响变化量,就相当于窥探这些小生命的生命状态如何影响它们的下一步行为;多个总和为定值的数据(例如在传染病模型中的S、I、R,这个模型在之前介绍过)的此消彼长,就相当于几个物种之间的种群竞争......类似的类比还有很多。事实上,在上个世纪50年代,著名的冯·诺依曼就为模拟生物发育中细胞的自我复制而提出了一种数学模型,也就是后来的元胞自动机的雏形。1970年,剑桥大学的J.H.Conway为复杂系统建立了“生命游戏”的概念,将复杂系统的演化看归结为元胞自动机。之后,Wolfram公司的创始人S.Wolfram在数学上给出了元胞自动机的很多性质定理,被认为是这一理论的最主要推动者。下图为元胞自动机的一个例子。
所以将数据的演变看成是生命过程,这并非是一个新的观点,对于挖掘复杂系统其实非常有效,因为再复杂的系统都远没有生命复杂,而我们对生命有先天的感性认知。
<< 向左滑动查看下一张图片 >>
图1 元胞自动机的例子(从左到右为一个生命过程不同阶段的剪影)。
3.当你无法抓住问题的本质难点时。所谓的本质难点,指的是该问题之所以会成为悬而未解的问题的根本原因,即人们研究这个问题时所遇到的根本障碍。有时这与你所掌握的数学层次相关,就好像小学生一般无法解出大学生的作业题目一样;但是更多的时候,是因为目前的数学技术就没有办法解决你所面对的问题,这时就涉及到原创理论了。原创理论是最高层次的创新,而创新的关键在于方向。方向对了,走出的每一步才有现实的呼应,才会有实践检验的对应,凭空在概念里做游戏是无法成功的,即使是抽象如代数几何学,格罗滕迪克在创立这门学科的各项概念与方法时,也是边建立理论边举例大量的代数曲线与曲面的例子来观察和佐证。
那么如何才能抓出本质难点?又如何才能找到适合的解决本质难点的创新方向呢?
问题的关键往往不在于数学,而是在于你对数学公式背后意义的敏锐感受。例如下面这个公式:
诚然,这就是高中概率统计中非常基本的概率加法公式。但是不知你是否会明白这个式子的伟大之处——正因为这个式子,所以才有了分工协作,它指出当事件独立时,各个局部中事件发生的概率可以独立计算;也正因为这个式子,所以原本纠缠的时间与空间得以在概率论中退化为统计关联。
再比如前几天我们提到的重整化方法用在图像识别领域以观测图像的轮廓(见11月29日发布的内容),其实就是对日常生活中“近视眼”这件事的模拟——即使一个人有近视,他也可以分辨出不远处模糊的身影到底是不是自己的父母,因为他们依然可以捕捉父母影像的基本特征。但是面对同样的问题,如果要通过拟合出图像中轮廓曲线的解析式去得到轮廓,就不仅显得笨拙而低效,很多时候甚至都无法达成。
图2 重整化方法观察轮廓。
综上所述,感性驱动理性,其实就是从生活中去汲取灵感,因为生活是感性的源泉,同时也是理性的源泉。从这个角度来理解,其实感性和理性只不过就是你的生命体验的两个侧面。当我们观察不清楚其中一个侧面时,借助另一个侧面去窥伺,是一个无比聪明和自然的选择。