华为视觉计划发布,要做“智能世界的眼睛”
来源:懂懂笔记
以现在图像采集设备的配置,让机器“看清”这个世界已经不在话下。但是,从“看清” 到“看懂”,我们还有很长的路要走。
在华为开发者大会2020(Cloud)上,华为宣布“沃土计划2.0”的进一步举措。华为将在2020年投入2亿美元推动鲲鹏计算产业发展,并公布面向高校、初创企业、开发人员及合作伙伴的扶持细则。作为沃土计划的一部分,今天田奇博士向开发者发布了“华为视觉计划”,旨在助力AI开发者,让计算机视觉技术在更多的应用领域落地,产生真正的商业价值。
计算机视觉技术
迎来了最好的时代
人的智能来自于人对外界的感知,包括视觉、听觉、触觉、嗅觉、味觉等。其中,视觉占到所有感知的87%,是人类感知外界信息的最重要的途径。视觉还是打开心灵的最有力的手段:一瞬间的影像信息,甚至在几十年后还能被准确地回忆起来。
从人类的智能到人工智能,需要跨越很大的技术壁垒。AI的实现,依赖于机器对于世界的感知:计算机视觉是机器感知最重要的入口,也可以说是智能世界的眼睛。智慧城市、机器人、自动驾驶、智慧医疗、工业视觉、AR等等这些我们经常听到的AI应用,都是要建立在“看懂世界”的基础上。
计算机视觉,给我们的生活带来了显著的改变。比如,我们对自动驾驶寄予极高期望。自动驾驶技术的实现,不仅依靠车身四周安装的各类传感器,还依靠计算机视觉技术的配合。只有实现了智能、精准的分析,才有可能从今天的L3级向未来的L4/L5级智能驾驶演进。智慧城市已经安装了海量的摄像头,而这些数据有80%还都未被充分利用和挖掘,计算机视觉可以让这些摄像头不仅“看清”城市还能“看懂”城市,从而提升城市管理的效率。在每个现代人都离不开的手机里,计算机视觉也起着重要的作用:AI技术为图像视频质量增强提供了有力的武器,而超分辨率、失焦修复等也已成为手机摄像的标准配置……
显然,今天计算机视觉已经无处不在,那么我们怎么理解计算机视觉的重要性呢?可以说,计算机视觉是万物感知的入口、行业数字化的抓手,在AI+云+5G的数字化底座基础上,激发智能世界新物种的爆发。所有前面提到的无人驾驶、安防、智慧金融、智慧商超等应用,都取决于计算机视觉技术的能力——娱乐与通信、生产与安全、智慧生活等,这将是一个千亿美元的巨型市场。
可以说,计算机视觉技术迎来了最好的时代。
技术要上天:
一年80多篇世界顶级论文
在过去一年多的时间里,他们还研发了许多先进技术并中稿了80多篇计算机视觉顶会论文,其中多项技术已经在华为内部多个应用场景中获得验证与应用。在今天田奇博士的演讲中,也把这些技术的进展与开发者一起分享。
华为全面赋能开发者
填补技术与应用之间的鸿沟
在技术研究与应用落地之间,还有一个条很难逾越的鸿沟。研究通常更注重理论化、通用性,并且要不断探索未知领域,而应用则是将技术落地,带来社会价值和商业价值。
正所谓“技术要上天,产业要落地”,华为计算机视觉处于全球领先的技术要在各行各业中产生价值,还是要依靠生态的力量,依靠更多的AI开发者将技术在产业中落地。作为黑土地赋能生态中的每一个企业、每一个开发者,这也恰恰是华为一贯以来的战略。
“开发者是改变世界的重要力量,也是企业创新的引擎和产业生态的灵魂。我们将携手全球开发者和产业伙伴,基于鲲鹏处理器多核、高并发的优势,为世界提供充裕且经济的算力,开拓万亿级的计算产业大蓝海,共享数字经济的红利。” 华为云与计算BG总裁侯金龙透露,目前华为云开发者已经增长到160万,通过沃土计划2.0,计划5年内发展500万开发者。
数据冰山计划:以极少量标注数据撬动海量无标注数据,支撑小样本场景下模型训练
数据魔方计划:利用多种模态相互辅助、增强模型在实际场景的学习能力
模型摸高计划:构建云侧大模型,刷新各类视觉任务性能上限
模型瘦身计划:打造端侧高效的计算模型,助力各种芯片完成复杂推理
万物预视计划:设计视觉预训练任务,打造视觉通用模型
虚实合一计划:在虚拟与现实的结合中,将计算机视觉引向真正的人工智能
“提供端到端的产品与方案,用'5G+AI+云+计算机视觉’加速智能世界到来和行业数字化转型。构建良好的产业生态,打造开放、共赢、健康的产业链,我们要让所有人从中受益。” 田奇博士这样总结华为视觉要承担的责任。
AI这个词在我们耳边萦绕多年,如今开始逐渐全面落地。作为最重要的机器感知入口,视觉是AI的核心技术和应用,迎来最好的时代。
怀揣“做智能世界的眼睛”的愿景,凭借80多篇世界顶级论文,华为计算机视觉在技术研发上已经走在了业界最前沿。随着华为视觉计划的发布,华为将通过使能AI开发者加速视觉技术的落地,也将加速AI的普惠。