【方志四川•庆祝中华人民共和国成立70周年】陈兰 ‖ 大数据专家周涛 科技创造未来
大数据专家周涛
科技创造未来
口述/周 涛
整理/陈 兰(书服家)
周涛,中国著名大数据专家,在Physics Reports、PNAS、Nature Communications等国际SCI期刊发表300余篇学术论文,被引用18000余次,H指数为66。2009年获教育部自然科学一等奖,2011年获第十二届中国青年科技奖(系我国最年轻的获奖者),2013年获四川省科技进步一等奖,2014年获中国计算机学会自然科学二等奖(一等奖空缺);2014年起历年入选 Elesvier 最具国际影响力中国科学家名单(物理天文类)。2015 年当选全国十大科技创新人物。2016年当选四川省首批杰出人才(三年评选一次)。2017年获全 国创新争先奖,2017年当选年度十大双创人物。2018年起任四川省政协常委。
我记忆中的成都是个非常“柔软”的城市。 成都人生活很闲逸,普通老百姓的生活全部是暴露在外的,那时候的农贸市场都是种菜的农民把菜推来卖,我们晾晒衣服、扔垃圾、买东西…… 这些琐碎的小事会产生很多人与人之间的交流。那是一种生活和城市功能完全紧密结合的样子。
而今天,垃圾分类、菜市场集中管理,老百姓的生活更加便利。城市变得更加现代化的同时,它的“柔性”也在降低,人和人的互动也在减少,我很怀念以前那个“脏乱差”却充满人情味的城市。现在的成都被划分成了不同的区域,像高新区的建设,它的生活和城市功能实际上是隔离开的。但有的区域在发展中仍然保留着老成都生活、文化的风格,比如说像青羊区这些老区。
麻将是四川本地最喜欢的休闲娱乐活动,在很多人看来,麻将是用来消遣、消磨时间的,但在我成长的过程中,麻将扮演了一个重要的角色。现在四川人打的麻将比较简单,我小时候打的麻将还比较复杂,数番,还有双断平缺无字等玩法。
打麻将要赢钱,是我小时候的“坚持”。也因此,打麻将培养出我很强的胜负感。以前的麻将规则复杂,有很大技术含量。人们是用手洗麻将牌,所以我在洗牌的过程中就可以记住我面前的牌。脑子里在想怎么记数字?怎么记最快速?你要在心里默念,不然就要忘掉,四方牌要来回记,这是很难的。除了记洗过的牌,还要记每个人出过的牌,并根据这个来判断别人手里还剩下什么牌……这些训练出我快速记东西的能力。
四川麻将对我有着非常正面的影响,可以说 我较强的记忆力和逻辑思维能力正是源于此。不过现在我已经不常打麻将了,一是没有空闲时间;二是现在的四川人都玩机麻,机器洗牌的过程我记不了牌。
18岁时,我被中国科技大学00班录取。本科时我做的是离散数学,或者说组合数学、图论。 大学里第一个带我做研究的是位博士生导师,那时候我才念大一,去上他的研究生课,大二进了他的实验室。当时我很想写东西、发表论文,我猜测老师应该会给一些相对比较容易的问题,或者先给一些很难的题目让我做。但老师并没有这样。我们当时有4个学生(2个博士、1个硕士和我),他给了我们一些重要的定理和5个猜想,十几二十年来组合图论里的一些猜想,让我们去考虑这些问题。一方面,我们要去读这七八个定理的证明,另外还要去考虑这些猜想。
这和我以前的学习思路不太一样,以前我一 天能做五六个比较难的题,这样我觉得这一天才是有收获的;那如果花一天时间一个题都做不出来,我会觉得这一天很浪费。老师给我讲:“你是要花一天两天,但如果你几天想一个问题一点儿都想不出来,那完成它时会有远远大于你几个小时就能做出来的题的成就感。”
所以从那个时候,我就开始考虑复杂定理的证明,去读懂它,甚至简化它,或是做一些新的猜想和证明。我开始习惯一周、一个月或更长时间, 一个问题一点儿进展都没有。虽然我现在做的是统计物理,但本科时我论文里有一小半儿都是图论文章,有些是证明了一些的新定理,有些是把原有的一些大定理简化了。我觉得后来的这些工作其实都始于那个时候,每天都在想问题,虽然 大部分失败了,但是总会有一些做出来。在这种海量的思考过程中,我的发展会非常快。如果老做那些简单的问题,说不定发展得会更慢。2007年,我转向研究如何利用统计物理学的理论与方法来解决信息科学的问题。从物理跳到大数据、AI 领域,我并没有遇到什么障碍和实际性挑战。因为大学教会我的不是用特定的方法解决特定的问题,而是怎么发现问题和解决问题。
我们一般把问题分为两大类:一类是用脑子解决的问题;一类是不用脑子解决的问题,比如体力活。用脑子解决的问题,我们可以分成干的科学和湿的科学,湿的科学比如说生物学的解剖实验,要做一些繁复的实验;干的科学是纯粹有脑子就可以做的科学。在大学里,我们就应该学会发现哪些大问题 是值得做研究的,应该怎么样去解决它,而不是只学会用特定的工具去解决特定的问题。
信息比物质更本质。大数据在任何领域的介入都可能使其成本降低,效果得到提升。从目前的规模来讲,大数据最大的4个应用方向是金融、医疗、工业和政府职能,这4个原本体量就很大,排在其次的就是教育、环保、零售这些方向。在应用过程中,我们有一个目标:要让人工智能、大数据的目标和人类命运共同体的发展目标一致,让它做有益的事情,不要让它失控。人工智能没有创造力。从数据的角度来讲,我们首先关注的是安全和隐私,这是第一个大问题。然后我们要在数据控制中间找到一个平衡点,在科学伦理方面,要严控通过数据自迭代让自己更智能这样的方式,深度评估它的安全性,尽量减少大数据直接作用。
目前,国内外基础设施层面的差距还比较明显,包括数据库和它的架构、文件、性能、记载模式等 ;国内的开源也做得比较差,涉及大体系结构的都还有一定不足,基础性问题研究得比较少。但在 AI 算法上,华人不说算半边天,但起码不亚于其他国家,可以和北美匹敌,在迭代方面甚至比他们要更快一点。
发展新经济正需要用好大数据。我担任了成都新经济发展研究院的执行院长,就目前来看,成都的新经济发展在国内处于 5—8 年的水平。总体来说,和成都的人均 GDP 相比是发展得非常好的,没有人均 GDP 比我们更低然后新经济发展得比我们好的。但和北京、上海、深圳、杭州相比,我们仍然有差距。一方面是我们的政策比较保守,整个四川相比沿海地区来说,缺少示范性特区;第二方面是成都新经济的支撑要素不充分,缺少像北京、上海那么好的资本,也缺乏人才;第三方面是政府引导新经济发展的直接财政支持不够;第四方面是缺少可以给新经济发展提供动力的传统企业,即便有他们也不大愿意提供支持。
种种原因让我们的发展有一些困难,但未来的发展趋势我还是很看好。成都是一个文化大城、美食大城,但光靠文化和美食支撑不起一个人口有 2000 万的大城市。成都已经认识到了一个超大城市的发展一定要走科技和经济相结合的道路,而且要围绕创新来发展。虽说有困难,但成都一直在努力。目前成都的很多政策举措,在有限的财力下,走到了全国前面。
早些年在国外留学的时候,我发现国内外的科研工作者其实大家的努力程度差不多,要说不同之处就是 :国外学者发现问题、提出问题的能力要强一些,中国学者把大部分精力用在了解决问题上。而国外学者常常想的是我这个问题够不 够原创,是不是有足够的价值,是不是有足够的挑战,是不是有长期的影响力,是不是能受到同行的尊重……他们会反复想这些问题。相比之下,国外的科研工作愿意在同一个问题上花费更长时间,能够研究很久,把问题解决得足够干净。我认为,这和国内的短考核机制有关,当然现在国内也在改进。
只要想做成一件事,条件其实不重要,不管是做企业还是做科研,条件都只是其次。今天做科研的基本条件无疑是变得更好了。我觉得现在国内的科研生态非常好,因为信息很开放。科研生态变好的同时,也出现了一些问题,很多人想来科研行业获取资源,这让高校这样纯粹的象牙塔变得更加社会,又因为它不是从商业时代进来社会,所以会显得更职业化,竞争更残酷,甚至文人相轻。
相比我读书的时候,现在的大学生能够从更多渠道获取知识,他们更加自由、奔放。但是也有一些缺点,比如缺乏敬畏,以自我为中心,心灵比较脆弱,习惯在付出之前先想回报,对西方一些理论和思想也缺乏批判。成熟的研究者要能够提出大问题,能否提出问题是划分科学家是否成熟的关键。如果你没有提出问题的能力,那说明你还不是一个有独立性的科学家。我希望中国的青年科研工作者能够认识到科研的长期性、艰巨性、纯粹性。做大项目的人不一定真正懂得科学的真谛。年轻人不要去追求这些,不要把科研社会化。新的一代需要独立自主的精神,要有格局,敢于质疑和挑战权威,敢做重大问题,并且有持之以恒的精神。青年人是未来科学的最大希望!
(载《巴蜀史志》2019年“庆祝中华人民共和国成立70周年”特刊)
来源:四川省地方志工作办公室