重大突破！阿里达摩院创全球新纪录：AI“读图会意”首次超越人类

2024-06-15 22:48:36

从阿里云官方获悉，近日，国际权威机器视觉问答榜单VQA Leaderboard出现关键突破，阿里巴巴达摩院以81.26%的准确率创造了新纪录，让AI在“读图会意”上首次超越人类基准。

近10年来，AI技术保持高速发展。然而在视觉问答VQA(Visual Question Answering）这一涉及视觉-文本多模态理解的高阶认知任务上，AI始终未取得超越人类水平的突破。

自然语言技术与计算机视觉交融，是多模态领域重要的前沿研究方向。其中，VQA是AI领域难度最高的挑战之一，对研发通用AI具有重要意义。

VQA的任务是根据给定图片及自然语言问题，生成正确的自然语言回答。

例如下面这张图，图中玩具人的IP出自哪部电影？AI先提取了问题关键信息——玩具人；再根据常识做出回答——星球大战。

在首届VQA挑战赛上，AI的最高准确率仅能达到55%。今年8月，达摩院以81.26%的准确率创造VQA Leaderboard全球纪录，首次超越人类基准线80.83%。

这是VQA测试以来，AI第一次超过人类水平，是标志性的重大突破。

- THE END -

转载请注明出处：快科技

责任编辑：朝晖

赞 (0)

人工智能（AI）将取代心理医生？！

发布时间:2021-04-13 作者:拉康心理来源:Lacan心理(ID:Lacan-psy) 长久以来,精神疾病的诊断都基于一种古老而又主观的方法,医生主观判断和经验上的限制,导致其可能在诊断上出 ...
马云立功了！阿里达摩院为国争光，打破一项世界纪录

提到阿里巴巴,想必大家不会陌生.很难说是阿里成就了杭州,还是杭州成就了阿里,屡屡提到马云,无数年轻人心生敬仰,甚至将其视为"信仰".阿里旗下有众多业务,一般人以为阿里只是搞电商的, ...
谋略的关键就是“算”：算天、算地、算人、...

谋略的关键就是"算":算天.算地.算人.算己.算变.谁算得深.算得细.算得透.算得狠.算得远,谁就赢.<孙子兵法>说:"多算胜,少算不胜,何况无算乎?&quo ...
历经6年 AI终于在“读图会意”上超越人类

前不久,在中文语言理解权威评测基准CLUE中,阿里巴巴的AI模型在新闻文本上超越了人类识别精确度.现在"读图会意"上,阿里巴巴达摩院在VQA上也超越了人类,这是榜单设立6年来的首次 ...
达摩院，拿下40余项全球第一后，再次刷新世界纪录

马云巨资打造的达摩院,拿下40余项全球第一后,再次刷新世界纪录近日,阿里达摩院又刷新一项世界纪录!达摩院自研求解器MindOpt继今年8月份夺冠后,在日前国际权威测评中,又获线性规划:单纯形法第一. ...
【探秘达摩院之语音实验室】对AI说你好坏，它能懂你什么意思吗？

【探秘达摩院之语音实验室】对AI说你好坏，它能懂你什么意思吗？
中国古籍离家百年被AI找回过去，达摩院已...

过去,达摩院已经沉淀了完整的OCR技术能力,但主要用于解决现代场景中的文字识别需求,而古籍识别与现代场景的文字识别存在巨大差异,在现代场景下识别准确率超过99%的算法,应用到古籍识别上识别率不足40% ...
20秒测出新冠肺炎，准确率96%！这个黑科技手机上也有？

将「雷科技Lite」收藏为我的小程序,不再错过精彩内容新型冠状病毒肺炎肆虐至今已经给中国社会带来了巨大的损失,同时这个病毒"狡猾"的性质也让民众忧心忡忡,不知道如何防范.在目前的 ...
2021达摩院十大科技趋势.pdf

摘要: 科技服务社会需求.从2020年疫情爆发开始,数字科技就迅速成为人类与疫情抗争的重要力量,比如AI医疗影像辅助诊疗与提升药物研发的效率和精度,再到健康码与智慧城市都有效地帮助我们实现对疫情的精准 ...
阿里又偷梁换柱，还能不能脚踏实地做芯片了？

EEWORLD 电子资讯犀利解读技术干货每日更新昨日,据媒体报道,阿里达摩院研究员骄旸称,阿里巴巴达摩院正研发一款神经网络芯片--Ali-NPU. 按照设计,阿里巴巴的 Ali-NPU 性能, ...
钢铁厂来了“新员工”破解废钢定级行业难题

废钢利用节能环保,但中国废钢利用率远低于世界水平.记者今天获悉,山西晋南钢铁集团已在业内率先上线废钢AI定级系统,该系统由阿里巴巴达摩院合作研发,对废钢的定级准确率达95%,扣重准确率达90%,有望破 ...