数据猿专访 | 雅捷信息首席数据科学家谢军:大数据会让教育机会更不平等
雅捷信息首席数据科学家谢军在接受数据猿采访时说到,虽然大数据可以根据每个学生的特点提供更有针对性的教学方法,但与此同时,也会形成更不平等的教育机会,有钱有资源的学校会获得大数据的服务而别的学校享受不到
雅捷信息副总经理兼首席数据科学家 谢军
来源:数据猿 记者:张艳飞
数据猿报道,“大数据行业应用高峰论坛”期间,正值数据六合实验室成立一周年。数据六合实验室旨在为有志于大数据的开发及应用的伯乐(高势能有经验的学者、成功人士和有耐心的资本财富)与千里马(高动能敢于试错勇于创新的青年、学生、创业者)提供交流分享共事共赢的平台。平台资源共享、风险共担、求同存异、互通有无、取长补短、各从其类、同频共振是数据六合实验室的服务宗旨。
现场有数十位重量级嘉宾莅临分享大数据在商业运营及决策中的应用,并有精选的4个大数据领域的早期创业项目,现场展示产品及服务。诚邀企业高管、大数据技术专家、行业应用实践者以及数据领域优秀创业者与会共商盛事。
以下是数据猿记者现场独家专访“雅捷信息副总经理兼首席数据科学家谢军”的内容实录:
数据猿记者:雅捷信息从事的业务是什么?现在是如何定义公司的?
谢军:虽然雅捷信息已成立13年,但我们现在就是一家大数据公司,而且定位更精准,业务领域做的是金融,技术领域做的是云计算。
雅捷信息大数据主要解决的是数据架构和查询服务。以往,通常银行客户的数据加工一个月要进行一次,每次大概需要耗时二三十个小时,面对这样的实际工作情况,客户对大数据就会抱有很高期望,但面临这样的情况,对大数据公司来说挑战很大,往往也很头疼,雅捷信息的优势就是用大规模并行的方法为这样的客户提供数据加工与处理服务。
雅捷信息可以做到,当一个人走进银行的时候,事先就能清楚地知道这个客户的人物画像。银行工作人员只需简单问几个问题就能知道顾客的收益需求、风险控制需求、流动性需求,当知道了顾客的这三个需求后,就会给到一个很好的建议,但暂时不做产品、服务等推荐,只是一个建议。比如,因为你对风险承受能力较弱,所以我建议你的财产最好在保值方面多做一些事情。
以上还仅仅是银行负债业务的例子,如果再把资产、贷款、贵金属、理财等业务也算进来,那服务就更丰富了。
这主要归功于雅捷目前采用的是大GPU处理方式,一块GPU卡4900个核,还有很多微机群是1600个核,但我们起步就是100万个核,把超算技术带到民间。毫不客气地说,这样的数据加工与处理技术,雅捷已跟华为这样的公司一样技术非常好也非常领先,排在世界前几名。雅捷已连续几年在HTC大会上做了主题演讲就是很好的实例证明。
数据猿记者:从这么多年的行业服务经历来看,如今进入大数据时代后,中国市场是否还存在着以往的“特殊性”?
谢军:中国市场比很多国家跟地区面临的业务命题都复杂,所以,市场上还是很容易出现技术顶尖的公司。但同时又存在消费、通信等很多权威性的垄断机构,数据作为一种资产就很难被开放出来,这在一定程度上制约了行业技术的进步。
但这样的行业现状其实也可以理解,毕竟大数据行业还处于非常早期的阶段,大家都在探索,非常谨慎是完全可以理解的。
就像如果数据作为资产去交换的话,肯定会考虑值不值,风险大不大,如果把数据输出后,发现收益小于风险肯定就不会尝试做了,但收益大小同时也取决于企业的技术实力跟执行力。
数据猿记者:除了像交易、通信这样的数据外,银行金融数据也很敏感,客户更难服务,雅捷是如何做的?
谢军:银行类数据确实非常敏感,甚至关系到国家命运。有些事情不是说企业愿意不愿意,可不可以去做,关键是别人拿到那样的数据就可以推算出国民经济、工业发展情况等各种各样的信息,如果是这样的话,那确实很难做,是一个很大的挑战。
但是,雅捷的工作有时候其实也像一个IT服务商,负责给客户建系统、解决IT问题,所以实际情况还好,而且在教育等很多非敏感行业也有很多客户,能做的事很多。
数据猿记者:虽然大家都知道教育行业市场规模庞大,但却一直很难爆发出类似“BAT”这样的大企业,这是为什么?
谢军:这主要是因为义务教育制限制了很多收费项目,所以商业行为很大程度上就被限制住了,实际上教育才是真正需要大数据的行业。
一个孩子的培养肯定需要数据的支持,类似的服务我们在浦东已尝试了很多年。比如,孩子到底学业跟什么有关,是父亲吗?是环境吗?数据可以告诉你,其实是跟母亲有关,这个结果是很多人没想到的。
还有,现在大家都讲一对一的教育,但现在的老师通常都是管一个班,不可能做到真正的一对一,尤其是纯代课老师,如果没有数据工具服务,甚至连每个学生的名字都记不住。
每个孩子的情况都是特殊不一样的,用统一的方法跟标准去对待不同的学生,很可能就会把学生的兴趣跟特长扼杀掉,但有了大数据的支持,就会非常清楚每个孩子的特征是什么,智力跟发育怎么样,否则就很容易打击孩子们的自信心,会觉得自己稍微学不好,老师就不关心我,有了流浪儿的感觉。
但教育行业也存在两个风险:
一、难收费,企业可以一年不收费,但如果10年不收费肯定就受不了了。
二、不平等,有钱有资源的学校会获得大数据的服务而别的学校享受不到。
所以,大数据在教育领域更多面临的其实还不是技术问题!
注:谢军是复旦大学本科,英国牛津大学应用统计学博士。从业25年,有18年数据仓库及数据挖掘工作经验,曾获人总行科技进步二等奖(项目奖),农总行科技进步二等奖(个人奖),银监会科技进步奖(项目奖)。
-The End-
●
●
●