关于开源AI框架领域那些事
关于开源AI框架领域那些事
2021年6月1日,北京智源人工智能研究院发布全球最大预训练模型—“悟道2.0”巨模型,参数量高达1.75万亿,比有1.6万亿个参数的谷歌最大模型Switch Transformer,足足多了1500亿个参数。悟道智能模型计划2023年实现开源,必将引发国内开源社区建设的高潮。
一、2020年成国内深度学习框架开源元年

2020年3月20日,清华大学计算机系图形实验室开源AI框架计图(Jittor),这是由中国学界开源的首个AI框架,直接对标PyTorch。计图采用创新的元算子融合和动态编译技术,深度优化内存,能有效提升系统的运行性能和通用性,确保实现和优化分离,大幅提升应用开发的灵活性、可拓展性和可移植性。
2020年3月25日AI独角兽旷视科技宣布开源天元(MegEngine),是训练推理一体化、动静态合一的工业级深度学习框架。天元(MegEngine)作为旷视Brain++的核心组件之一,是一套伴随旷视自身AI产业实战经验的框架,解决行业很多通用问题。
2020年3月28日华为在开发者大会2020宣布正式开源MindSpore,这是一款支持端边云全场景的深度学习训练推理框架。MindSpore在按需协同的基础上,通过实现AI算法即代码,着重提升易用性并降低AI开发者的开发门槛。
在短短8天时间里,中国AI开源框架纷纷向AI开源框架领域的霸主们亮剑,必将成为国产深度学习框架开源高光时刻。
目前深度学习开源框架领域巨头云集,其中TensorFlow、PyTorch最受欢迎,从技术能力到生态建设,它们能给AI落地提供有力支撑,可以满足大部分企业在其中构建自己的AI应用。国产AI开源框架,从市场影响力和使用规模来看,还难与前两者抗衡。
既然如此,在AI框架开源,并拥有完整框架生态的情况下,中国企业和机构为什么要自研AI开源框架?

要弄清楚这个问题,我们先来了解下AI框架以及开源的概念。
简单来说,AI框架是AI时代的“操作系统”,下接芯片、硬件系统,上连模型以及实际应用。
开源,英文名Open Source,即开放源代码,任何人可以在源代码的基础上进行学习与修改,本质上是一种人才、智慧的聚合,是产业升级的强大助推器。开源从黑客文化中缓缓演进,在包括AI在内的计算机发展史中起到重要作用,无论是上世纪九十年代的Linux开源社区,还是当下的TensorFlow,在推动各自行业发展的过程中发挥着举足轻重的作用。可以毫不夸张的说,如果没有开源社区,苹果、谷歌、Facebook都不会发展为现在的体量。
二、国内开源AI框架意义重大
1
掌握人工智能技术主动权
关键词:竞争、完善、掌握
中国目前AI专利申请量位居全球第一,在技术层呈现中美双寡头竞争格局,在应用层中国专利领先。但在AI基础技术及工具专利方面,我国落后明显。AI开源项目能推动AI技术更快落地到具体业务和应用中,不断完善AI算法。对推出AI框架的公司或者组织机构而言,通过将AI框架开源,借助开发者的力量可以提升代码的质量以及AI框架的易用性。最重要的是,通过开源掌握了开发者,便掌握了AI框架生态的主动权,掌握了人工智能技术主动权。
2
提升人工智能教育水平
关键词:鼓励、培养、交流
开源AI框架建设需要大量的人工智能开发者,所以应该鼓励高校加大培养开发者,使开发者愿意去从事难度大、成效未知的基础性研发工作。同时开源AI框架也是一个很好的学习平台,能极大激发学生的学习兴趣,加大学习过程中与各种AI大神的交流。
3
促进AI产业蓬勃发展
关键词:尝试、借助、推进
随着AI开源项目越来越多,更多不同行业的公司更愿意尝试AI,创建符合其自身业务需求的平台。借助开源,只要拥有海量的行业数据,招揽少量的AI开发者,即可在开源AI平台及模型的帮助下更高效、低成本的完成智能化任务。目前许多企业在构建AI解决方案时,都会大量用到开源的算法。在开源的推动下,中国AI企业数量大幅增加,AI应用如雨后春笋在各行各业快速推进。
原创 协会研究部 深圳市人工智能行业协会
