让AI抛弃“小作坊”，拥抱“工业化”：盘古大模型究竟是什么？

2024-07-31 14:13:28

如果你想要一台冰箱，结果只能买到压缩机，金属面板、塑料储物盒，需要自己进行组装；如果你想要一台汽车，结果拿到一坨橡胶，需要自己从头造轮胎，你将会是什么心情？

目前AI开发的状态与上面举的例子很像。熟悉AI的朋友知道，AI应用开发是碎片化、定制化的，场景稍有变化就要重新进行数据处理，海量参数调优，反复迭代。如果模型达不到期望的目标，还要把这个过程推倒重来，模型开发周期动辄一个月，甚至数月。这种耗费大量人工的方式说明AI开发还处于作坊模式中。

在2021WAIC期间，华为云盘古预训练大模型被评选为大会的“镇馆之宝”，为AI带来了工业化开发新模式。我们不妨就着“镇馆之宝”四个字，来掰扯掰扯盘古大模型究竟是什么，预训练模型又与AI工业化之间存在着怎样的关联。

2018年GPT 和 BERT的横空出世，引发了AI行业内外的共同关注。NLP领域的大规模预训练模型，从逻辑上来解释的话，就是采用自监督学习能力在大规模算力的支持下学习海量参数的数据。这不仅让NLP算法能力有了革命性突破，还将大量原本需要用户完成的训练任务预先完成。打个比方，这就像学校先把各种知识教给学生，让他有了基本的行业常识，而不是等到进入企业之后再从头识字，从而降低了企业的培训成本。

如今，大规模预训练模型已经成为全球主流AI厂商、研究机构的“必备功课”，训练参数与算力投入量也水涨船高。OpenAI在2020年发布的GPT-3已经达到了1750亿参数量、上万GPU的惊人训练规模。可以说，大规模预训练模型既要考验厂商的算法创新、调参与优化能力，又是对数据能力、并行计算能力、网络架构能力、开发工具和能力的全面大考。想要让AI在厂商一侧就变成工业化、标准化的“准完成品”，需要投入的技术实力与产业资源都远超大部分AI产品。

想要“镇”住AI工业化中出现的种种挑战，练就真正能解决问题的AI大模型，需要同时具备高效算法、澎湃算力，海量数据吞吐能力基础。

在2021WAIC开幕式上，华为轮值董事长胡厚崑在演讲中介绍了盘古大模型。他认为当前AI的普及应用的瓶颈首先不在技术上，技术已经有了相当的发展，也不在应用上，因为应用的需求都已经蓬勃而出了。它的瓶颈在于开发的效率上，现在的开发效率太低，AI应用的开发太慢，它严重阻碍了技术和需求的结合。

为了提高AI的开发效率，华为云联合伙伴推出了盘古系列预训练大模型，包括业界首个兼具生成与理解能力的中文语言（NLP）大模型和视觉（CV）大模型。

想要具体感知到华为云盘古大模型的能力，我们到WAIC的展馆中一探究竟。盘古大模型在现场展示了成语填空、阅读理解、快速分类三种能力。甚至连 “明明明明明白白白喜欢他，但他就是不说”这种奇葩句子，盘古大模型也能判断出“白白喜欢谁？”“谁喜欢明明？”等问题。

优质的大模型需要三个核心能力，即：可以吸收海量数据的超大型神经网络、强壮的网络结构、优秀的泛化能力。华为云盘古预训练大模型除此之外，还有哪些独特优势呢？

首先，盘古预训练大模型拥有领先的技术创新。

盘古NLP大模型首次使用Encoder-Decoder架构，兼顾NLP理解与生成的能力，且性能领先；在NLPCC生成任务上，Rouge score取得第一，比第二名提升60% 以上。该架构多任务学习的方法，能够让大模型训练更加稳定；同时基于提示的微调，能够在小样本学习上超越GPT系列。训练盘古NLP大模型使用了40TB的文本数据，包含了大量的通用知识，同时也沉淀了华为云的许多行业经验。盘古CV大模型在业界首次实现了模型的按需抽取，不同部署场景下抽取出的模型体积差异，动态范围可达三个数量级；提出的基于样本相似度的对比学习，凭借小样本学习能力在ImageNet上取得了业界领先的成绩。

其次，盘古预训练大模型拥有丰富的技术沉淀及应用实践。

盘古预训练大模型已经在多个行业、100多个场景成功验证，包括能源、零售、金融、工业、医疗、环境、物流等等。其中，在能源领域，盘古预训练大模型帮助行业客户实现设备能耗的智能控制，可以节约电力成本50%；在金融行业中的异常财务检测，让模型精度提升20%以上；在尘肺检测中，病例识别准确率提升22%等等。

盘古已经在近百个行业场景中进行了应用，未来，华为云盘古预训练大模型还将上线华为云AI资产共享社区（AI Gallery），将AI能力进一步开放出来。

既名“盘古”，便应该去开辟一些什么。翻过AI工业化的山丘，彼端每一家企业、每一位开发者的心中都应该有一个“盘古”。

智赢未来共创新价值，华为亮相2021世界人工智能大会

2021世界人工智能大会将于2021年7月8日至10日在上海举办,华为将以"智赢未来共创新价值"为主题,通过展台与多场论坛,重点呈现华为在AI领域的产品及解决方案.面向行业数字化 ...
华为入局，新药研发！

9月23日,据华为云公众号消息,华为全联接2021隆重开幕,华为高级副总裁.华为云CEO.消费者云服务总裁张平安发表"深耕数字化,一切皆服务"主题演讲,并重磅发布了华为云盘古药物分 ...
AI深度引领城市数字化转型

原标题:AI深度引领城市数字化转型随着人工智能(AI)技术快速发展,大数据.算法模型.AI芯片等软硬件信息技术成为传统行业向数智化转型的重要支撑,推动城市交通.金融.教育.制造等领域数字化转型. 7 ...
NLP：NLP领域没有最强，只有更强的模型——GPT-3的简介、安装、使用方法之详细攻略

NLP:NLP领域没有最强,只有更强的模型--GPT-3的简介.安装.使用方法之详细攻略导读:NLP领域的模型,没有最大,只有更大.博主这几天也仔仔细细看了这篇长达75页的论文,光署名作者都有二三十 ...
像人类一样认识世界，AI需要哪些底层思维？

作者 | 琰琰近几年,多模态已经成为自然语言处理(NLP)领域的热点研究方向之一.得益于深度学习的兴起,大数据+大模型的双轮模式推动人工智能实现了跨越式发展.但大量实验证明,仅依靠"炼大模 ...
盘点今年值得关注的人工智能产品-开课吧

人工智能从1956年作为一个概念提出以来,经过六十多年的发展,已经从一种超前的设想变为了一种触手可及的现实,赋能各大行业,在不同领域遍地开花,以各种看似细微的方式融入了我们现实生活的方方面面.人工智能 ...
执掌华为云余承东一口气发布盘古大模型等6个新品

2021.4月25日,华为常务董事.消费者业务CEO余承东自4月初接任华为云CEO后首次出现在以云计算为主题的官方活动上"HDC华为开发者大会",顺势带来了几个新品的发布.云厂商的 ...
华为云：深耕数字化，一切皆服务

9月23日,华为全联接2021于9月23日开幕.华为轮值董事长徐直军进行了"以持续创新加速数字化发展"的主题演讲,发布业界首个分布式云原生产品--华为云UCS,即 "无处 ...
BERT、GPT-3们有了新名字：Percy Liang、李飞飞等发布200多页综述，阐述大模型机遇...

设为"星标",重磅干货,第一时间送达转载自 | 机器之心在一篇 200 多页的论文中,Percy Liang.李飞飞等斯坦福研究者系统阐述了大规模预训练模型背后的机遇与风险.他 ...
余承东新身份首秀：华为云发布全球最大盘古大模型，2.2亿美元培育沃土……

导读全面云化已不可阻挡,云是ICT产业的未来,也是企业数字化转型的底座,开发者是产业发展的灵魂.华为将继续开放技术创新能力,携手开发者.伙伴共同加速行业全面云化和智能升级. 4月25日上午,华为 ...
开辟“鸿蒙”，又见“欧拉”！华为深耕数字化，打造全景式智能世界

2021 年 9 月 23-25 日,华为全联接大会以线上形式举行,业界思想领袖.商业精英.技术大咖.生态伙伴等皆汇聚于此,华为再次成为焦点. 为期 3 天的会议过程中,华为回顾云服务.人工智能技术的 ...
重磅！华为积蓄已久，出手介入新药研发和CXO领域！

据华为云公众号消息,9月23日,华为全联接2021隆重开幕,华为高级副总裁.华为云CEO.消费者云服务总裁张平安发表「深耕数字化,一切皆服务」主题演讲,并重磅发布了华为云盘古药物分子大模型. 华为高级 ...
2021年中深度热评：AI从量变到质变，转折点在哪里？

一.2021年上半年的AI,取得了哪些新的突破? 据统计,我国人工智能相关企业已经超过了5000家,2021年人工智能市场规模也将突破2000亿元,市场增速30%左右. 如今的AI,在普通老百姓眼中, ...
Adapter: 高效NLP迁移学习

今天轻松一点,看个简单高效的trick.也是咱们在昨天的DCCL: 推荐系统的端+云联动学习挖的坑. 目前,NLP中主流的方式是预训练+微调,当然,有大宗师级别的资源强者可以玩GPT-3这样子的大模型 ...
地表最强的GPT-3，是在推理，还是胡言乱语？

AI TIME欢迎每一位AI爱好者的加入! GPT-3发布以来,衍生了翻译.答题.创作小说.数据分析.数学推理.玩游戏.画图表.制作简历等诸多玩法.深度学习之父Geoffrey Hinton表示&qu ...

让AI抛弃“小作坊”，拥抱“工业化”：盘古大模型究竟是什么？

相关推荐