阿里万亿参数AI巨模型M6来了!它的“神...

阿里万亿参数AI巨模型M6来了!它的“神经元”达到人类10倍,不仅是中国科技公司首个万亿大模型,而且是首个真正进入商用的多模态通用大模型!

还有更关键的,M6创下一个世界纪录,将大模型所需算力压缩到极致。老僧了解到,通过一系列技术突破,达摩院和阿里云只用了480块GPU就训练出了M6,相比英伟达用3072块GPU训练万亿模型、谷歌用2048块TPU训练1.6万亿模型(1 TPU约等于2~3 GPU),M6省了超过八成算力,还将效率提升了近11倍。

那么问题来了,啥是M6?它到底能干啥?

M6是阿里达摩院研发的超大规模多模态预训练模型,主打多模态、多任务能力,目标是成为全球领先的具有通用性的人工智能大模型。

和生物一样,拥有更多“神经元”的大模型,理论上将更聪明。因此,大模型目前是AI领域全球竞争最激烈的研究方向,业界普遍认为大模型将成下一代人工智能基础设施。

今年3月,达摩院发布了中国首个千亿参数多模态大模型M6,引发海外关注。OpenAI前政策主管Jack Clark公开点赞:“这个模型的规模和设计都非常惊人。这看起来像是众多中国的AI研究组织逐渐发展壮大的一种表现。”

这次,M6升级至万亿,阿里研究人员发现,AI的认知和创造能力升级了!现在的M6擅长绘画、写作、问答,在文字生成图片领域尤其惊艳,它可以生成1024*1024分辨率宛如实物的高清图片,比此前海外公司OpenAI最高纪录提升4倍。

目前,M6已作为AI小助理在阿里新制造平台犀牛智造上岗,可实现快速设计、试穿效果模拟。M6还已应用在支付宝、淘宝等平台,参与跨模态搜索、文案撰写、图片设计等工作。

做深底层技术,实现技术应用,达摩院是认真的!

横图
(0)

相关推荐