疫情中的数据大战
在过去几年中,无论是企业政府还是产业投资,虽然诉求不同,但行动上都在积极推动大数据发展。众人拾柴火焰高,大数据成为瞩目的产业热点。这次疫情推动了大数据应用与发展三级跳:
大数据的第一跳:随着疫情的出现和发展,数据和分析的价值引起广泛关注。除了外部可见的信息和报道,影响决策的还有很多数据和分析,运营商就在其中扮演重要的角色。
大数据的第二跳:在这个时候,大数据不只关注舆情走向和宏观决策,更多的是对个体用户行为的信息查询和分析。为了对付疫情,多个企业和运营体系参与了对客户精准识别的工作,不同系统的大数据在共享和联动。几年来推不动的事情,如今搞定了。
大数据的第三跳:这次的实时查询以及对内容的及时更新,是直接面向最终客户推出了大数据查询服务,是新的大数据应用模式。如运营商提供的漫游地实时查询服务成为普及程度最高的复工助手。
早在2013年,中共中央政治局以实施创新驱动发展战略为题举行第九次集体学习,邀请百度创始人兼CEO李彦宏讲解大数据的发展情况。李彦宏在介绍中谈到,现在已经进入大数据时代,全球所有信息数据中90%产生于过去两年,大数据在两个方面表现出最重要的价值,一是促进信息消费,加快经济转型升级;二是关注社会民生,带动社会管理创新。
然而,我国的大数据发展仍不如人意,尤其体现在政府公共信息提供上。复旦大学郑磊教授指出。目前各级政府相关部门在各个渠道上发布的碎片化的、不连续的、不完整的数据,还不能满足公众的数据需求。当前的政府数据开放仍然面临着很多挑战和难点问题。笔者认为信息上报不及时,数据收集不完整恐怕是最大的问题,也是这次疫情发布迟缓的原因之一。
中共中央政治局常务委员会2月3日召开会议强调:这次疫情是对我国治理体系和能力的一次大考。其中疫情数据的采集与利用是体系能力的重要因素,缺乏数据支持就是缺乏对于疫情的快速响应机制、缺乏对于医疗资源合理调配的能力。在这次疫情中也暴露了我国大数据发展中的薄弱环节。对此中央提出,要健全国家应急管理体系,提高处理急难险重任务能力。
大数据时代,数据产品是各大媒体和平台竞争的利器。在这次疫情的新闻报道和信息服务中,主流媒体和互联网平台在数据应用上频频发力。主流媒体有人民日报、新华社等,新型媒体澎湃、凤凰新闻,互联网平台有腾讯、百度、网易、搜狐等。更值得欣慰的是各大媒体、互联网平台、科技公司和科研机构联手研发各种抗疫救灾的数据产品,他们通过协同创新推动大数据应用,不断研发新的数据产品,例如清博。
相对主流媒体和平台关于疫情基本数据的权威发布,清博的信息服务和数据分析极具特色,也很有创新。他们迅速组织起一支研究型志愿服务队伍,由来自海内外高校的学生、老师,一线媒体人等社会各界热心人士共同组成,其中90后、95后以近七成的占比成为团队中的绝对主力。雷火志愿者主要从“救援”和“研究”两方面发挥能量。
“雷火研究”负责编著疫情舆论深度报告,为政府、企业、媒体和海内外研究者提供参考。来自不同学科的“雷火研究”志愿者迅速集结,组成临时的“学术共同体”,共同编著《疫情舆论汇编㊣雷火明书》,针对疫情中的焦点问题、疫情动态、防控情况、舆情走势进行梳理、汇总、分析及趋势预警,对网络上的海量信息和数据进行抽丝剥茧、去伪存真,形成深度报告并为政府、企业决策提供参考。
清博不满足只做舆情分析,他们还进一步为战疫救援提供信息服务。雷火救援队将志愿者们划分为数据录入、电话回访、后勤心理、物资对接等6个小队开展工作。在信息报送方面,“雷火救援”主要通过“雷火求助快线”平台、微博、微信及个人渠道,收集求助信息并报送给相应的政府部门和民间组织,为求助者搭建绿色高效的援助通道。
此外,雷火志愿者还参与开发测试了清博大数据和北京青年互联网协会联合上线的公益性救助类小程序,包括谣言发现及挖掘系统、疫情防护知识问答平台、蔬菜合作社查询等。为了提高志愿者的服务水平,清博还邀请专家在网上给志愿者授课,进行战时理论指导。正面是清华大学沈阳教授和笔者在钉钉上讲课的截图。
从清博为防疫救灾所提供的信息嗠中可以看到,相比媒体常用舆情监测和的数据新闻,他们提供更积极主动的服务,直接服务于救援工作。同时我们也看到物联网应用也在其中发挥作用,即基于位置服务的公益性救助。
我们再来看看媒体对大数据的应用,这场疫情也是普及大数据、学习大数据的大课堂。我们还可以运用大数据分析当下和未来媒体的内容生产。近千家媒体机构是如何进行在线化生产?远程协同效率如何提升?新华社的媒体大脑MAGIC梳理了一份疫情期间媒体机构在线生产短视频数据报告,从这份数据报告中可以看出,在线化将是未来媒体主要的生产方式。下面是他们做的几幅数据可视化图表。
20万条疫情短视频覆盖哪些主题
新闻人搜索最多的数据 TOP 5
新闻内容分发到哪里?
大数据还要与其他高新科技手段结合起来才能充分发挥作用。外媒称,中国正利用最新科技防控疫情,大数据、人工智能、机器人、无人机等先进技术都在防止疫情蔓延上发挥重要作用。据日本《朝日新闻》2月15日报道,在新冠肺炎疫情严峻的中国,政府利用大数据等最先进的技术防止疫情蔓延。在中国很多地方政府的官方网站上,都有急寻公共交通工具同行乘客的信息。卫生部门呼吁那些与确诊病例同乘过公共交通工具的人能主动联系他们。这些信息具体到高铁、飞机、公共汽车的班次和具体时间。
报道称,还有不少企业为这次疫情启用了高科技设备。例如北京的清河高铁站启用了监控摄像头的人脸识别和体温监测功能。武汉市的集中隔离医院火神山医院开启了远程诊断系统。2月9日,火神山医院与北京某军队医院已经进行了首次远程诊疗。
另据日本《读卖新闻》2月15日报道,中国的手机用户近日收到了一条短信,称可以通过发送短信的方式,查询近15天和30天内途经的省市信息,助力疫情防控期间的复工复产安全。人们可以利用该服务证明自己没有湖北旅行史。中国官方表示,现在是大数据和互联网时代,每个人的动向都能被清晰地掌握,强调位置信息对防止疫情扩大起到重要作用。湖北省、江西省等地还通过无人机提醒户外活动的人员佩戴口罩、监测行人体温并播洒消毒液等。浙江省温州市利用机器人为隔离人员送饭送药。
2月14日,为防控新冠肺炎疫情传播,河北省滦州市范庄村使用无人植保机喷洒消毒液。(于爱双 摄)
数据战疫还是一项系统工程,只有让真实信息比谣言跑得更快,才能让谣言失去生存的“市场”。借助大数据,形成确诊人员和潜在感染对象的可视化行为路线图,才能保证信息管理的畅通高效。这项系统性工程不只需要数据技术人员努力,还需要相关方面部门的积极配合。同时,我们也要充分利用大数据打通媒体与用户、政府与公众、企业与市场的连接。
诚然,数据不都是真实的精确的,还会有假数据假流量,搞不好你也会被虚假的不完备的数据所误。算法也不是科学的合理的,搞不好也会形成“信息茧房“,成为”算法囚徒”。也许许多人不知道,如今假流量伪数据的数据交易也形成为一个庞大的黑色产业,成为互联网产业发展中的毒瘤。3月1日起,《网络信息内容生态治理规定》开始实施,政府对虚假信息和数据伪造将重拳打击。
从战争学习战争,从传播中研究传播。我们不仅要提高媒介素养,还是提高数据素养。我们需要加强对大数据的认识、学习和研究,发展数据科学及在各个领域的应用,这样才能充分利用数据而不被数据所利用。在本次疫情中,不少学者也抓住机会进行舆情分析、计算传播学等方面的研究。疫情过后,大数据、人工智能、物联网等新技术还会得到更广泛的应用。
主要参考资料:
疫情推动大数据三级跳
疫情袭来的背后是对数据能力的拷问!
抗击疫情 雷火志愿者们在行动
大数据、AI等大显身手!中国利用最新科技防止疫情蔓延
复旦教授郑磊:面对肺炎疫情,政府的数据开放还有很大空间
战"疫",近千家媒体机构是如何在线化生产的