阿里万亿参数AI巨模型M6来了！它的“神...

2024-05-10 14:50:02

阿里万亿参数AI巨模型M6来了！它的“神经元”达到人类10倍，不仅是中国科技公司首个万亿大模型，而且是首个真正进入商用的多模态通用大模型！

还有更关键的，M6创下一个世界纪录，将大模型所需算力压缩到极致。老僧了解到，通过一系列技术突破，达摩院和阿里云只用了480块GPU就训练出了M6，相比英伟达用3072块GPU训练万亿模型、谷歌用2048块TPU训练1.6万亿模型（1 TPU约等于2～3 GPU），M6省了超过八成算力，还将效率提升了近11倍。

那么问题来了，啥是M6？它到底能干啥？

M6是阿里达摩院研发的超大规模多模态预训练模型，主打多模态、多任务能力，目标是成为全球领先的具有通用性的人工智能大模型。

和生物一样，拥有更多“神经元”的大模型，理论上将更聪明。因此，大模型目前是AI领域全球竞争最激烈的研究方向，业界普遍认为大模型将成下一代人工智能基础设施。

今年3月，达摩院发布了中国首个千亿参数多模态大模型M6，引发海外关注。OpenAI前政策主管Jack Clark公开点赞：“这个模型的规模和设计都非常惊人。这看起来像是众多中国的AI研究组织逐渐发展壮大的一种表现。”

这次，M6升级至万亿，阿里研究人员发现，AI的认知和创造能力升级了！现在的M6擅长绘画、写作、问答，在文字生成图片领域尤其惊艳，它可以生成1024*1024分辨率宛如实物的高清图片，比此前海外公司OpenAI最高纪录提升4倍。

目前，M6已作为AI小助理在阿里新制造平台犀牛智造上岗，可实现快速设计、试穿效果模拟。M6还已应用在支付宝、淘宝等平台，参与跨模态搜索、文案撰写、图片设计等工作。

做深底层技术，实现技术应用，达摩院是认真的！

横图

阿里发布首款自研AI芯片含光800：号称全球最强，算力相当于10颗GPU

在今日的云栖大会上,阿里发布旗下首款自研AI芯片含光800,号称是目前全球最强AI芯片,性能和能效比均为第一.据介绍,含光为上古三大神剑之一,含而不露,光而不耀.算力上,阿里称1颗含光800的算力相当 ...
［首藏作品］（6648）图片、文字、语音都能理解这个AI平台是“全能”选手

图片.文字.语音都能理解这个AI平台是"全能"选手◎本报记者陆成宽"小初,请以天宫为主题作首诗吧?""天宫生殿开成,万花垂露照初.稠云不掩国志,飞 ...
最强AI算力哪里来？三个时代的阿里叠影

又是一年云栖时. 阿里的云栖大会,堪称科技众的年度狂欢之一.而今年似乎格外特殊,阿里云十岁生日,阿里巴巴集团20周年,似乎都让今年的云栖有点不同.而从技术从业者的角度来看,或许另一个不同更加引人注目: ...
2457亿参数！全球最大AI巨量模型「源1.0」发布，中国做出了自己的GPT-3

新智元报道编辑:好困 yaxin [新智元导读]古代文人,或一觞一咏,畅叙幽情,或风乎舞雩,咏而归.「吟诗作对」成为他们的标配.刚刚,全球最大人工智能巨量模型「源1.0」发布,能赋诗作词,比 ...
仅480块GPU搞出万亿参数大模型！★★★达摩院3个月打造，出手即商用

不要6000张GPU!不要2000张TPU! 只要480,万亿参数大模型"抱回家"! 还没完,更惊艳的在后边. 同为万亿"体量",能耗降低超八成,效率还能提升1 ...
像人类一样认识世界，AI需要哪些底层思维？

作者 | 琰琰近几年,多模态已经成为自然语言处理(NLP)领域的热点研究方向之一.得益于深度学习的兴起,大数据+大模型的双轮模式推动人工智能实现了跨越式发展.但大量实验证明,仅依靠"炼大模 ...
大模型时代的AI之变与开发之根

自2018年谷歌发布Bert以来,预训练大模型以强大的算法效果,席卷了NLP为代表的各大AI榜单与测试数据集.随着产学研各界的深入研究,大模型在AI产学研各界的地位得到不断加强.到2021年,我们可以 ...
在AI“必争之地”，全球最大规模人工智能巨量模型诞生

作者 | 张双虎当学界和业界均相信"大力出奇迹"的时候,就该大模型闪亮登场了. 9月28日,浪潮人工智能研究院发布全球最大人工智能巨量模型--源1.0. 这个几乎把近5年中文互联 ...
日均调用量超13亿次，阿里达摩院研发全球首个实时翻译直播

近几年来,直播电商到处开花,但绝大多数都是国内的中文直播.如果想买外国电商主播推荐的商品,语言不通怎么办? 这一难题已被阿里巴巴(下称 "阿里")攻克,阿里速卖通是面向全球海外消费 ...
她琴棋书画全能，还进入清华计算机系实验室，被赞智商太超群、能力过强悍

邦哥推荐:华智冰也许是未来社会虚拟人的一个缩影.通过持续学习和演化,最后成为一个有着丰富知识和与人类有很强交互能力的机器人. 来源|量子位(ID:QbitAI) 作者|金磊杨净最特殊,没有之一. ...
“未来技术”人工智能算力网络面世：多模态的最佳“伴行者”？

用文字描述"一个女人打着红色的雨伞在路上走",系统呈现出一张唯美的街拍: 有一张飞机起飞的照片,想配上一段适合的声音,上传图片后,一段发动机呼啸声的音频播放出来: 把淅淅沥沥的下雨 ...
Adapter: 高效NLP迁移学习

今天轻松一点,看个简单高效的trick.也是咱们在昨天的DCCL: 推荐系统的端+云联动学习挖的坑. 目前,NLP中主流的方式是预训练+微调,当然,有大宗师级别的资源强者可以玩GPT-3这样子的大模型 ...
人工智能“干掉”程序员后，又对艺术家下手了

人工智能领域缺钱,但这两个月来,他们不缺「好消息」. Google 母公司 Alphabet 旗下的 DeepMind,先推出了蛋白质结构预测 AI--AlphaFold 2,为困扰了生化学界 50 ...
地表最强的GPT-3，是在推理，还是胡言乱语？

AI TIME欢迎每一位AI爱好者的加入! GPT-3发布以来,衍生了翻译.答题.创作小说.数据分析.数学推理.玩游戏.画图表.制作简历等诸多玩法.深度学习之父Geoffrey Hinton表示&qu ...
BERT、GPT-3们有了新名字：Percy Liang、李飞飞等发布200多页综述，阐述大模型机遇...

设为"星标",重磅干货,第一时间送达转载自 | 机器之心在一篇 200 多页的论文中,Percy Liang.李飞飞等斯坦福研究者系统阐述了大规模预训练模型背后的机遇与风险.他 ...
历经6年 AI终于在“读图会意”上超越人类

前不久,在中文语言理解权威评测基准CLUE中,阿里巴巴的AI模型在新闻文本上超越了人类识别精确度.现在"读图会意"上,阿里巴巴达摩院在VQA上也超越了人类,这是榜单设立6年来的首次 ...
NLP：NLP领域没有最强，只有更强的模型——GPT-3的简介、安装、使用方法之详细攻略

NLP:NLP领域没有最强,只有更强的模型--GPT-3的简介.安装.使用方法之详细攻略导读:NLP领域的模型,没有最大,只有更大.博主这几天也仔仔细细看了这篇长达75页的论文,光署名作者都有二三十 ...
给我一点AI，我也能成钢！晋南钢铁联合阿里达摩院打造废钢定级平台！

编者按: 你知道吗?1吨废钢能炼出860公斤钢材,废钢利用节能环保,但中国废钢利用率远低于世界水平. 为了破解行业难题废钢定级,山西晋南钢铁集团联合阿里达摩院率先上线废钢AI定级系统. 导语废钢拉运 ...
阿里的“扫地僧”，2年“抄”了20万页古籍

阿里达摩院,一个正儿八经搞AI的地方. 但偏偏"扫地僧"们干起了文绉绉的工作: 研究古籍. 他们将流散海外的珍贵古籍善本以数字化的形式请回故土. 第一批达20万页. △宋百家诗存 ...

阿里万亿参数AI巨模型M6来了！它的“神...

相关推荐