计算机视觉近10年发展回顾与未来发展方向 2024-05-07 04:22:44 重磅干货,第一时间送达 在未来十年中,计算机视觉将取得长足发展。在本文中,我们将探讨2010~2020年间计算机视觉的发展趋势和取得的突破性成就,以及未来计算机视觉的发展目标。01. 计算机视觉简史在整个80年代,90年代和00年代,计算机视觉是一项非常困难的任务。甚至在实验室环境中的也很难得到较好的处理结果。在那个年代,用于训练视觉学习的机器学习系统是通过特征工程手动设计而成。那什么是特征工程?这意味着我们用“专家”的直觉进行了特殊的设计,这些办法对图像中的特定模式起作用,从而为学习计算机视觉创造许多有用的功能。多年来,我们积累了许多不同的办法,每种办法都有自己的缩写:HOG,SIFT,ORB甚至SURF。但是,不幸的现实是,解决现实世界中的问题需要花费大量的时间将这些技巧的融合在一起以达到较好的效果。我们可以用他们来检测道路上的分界线,但是无法用于识别和区分人脸等。建立通用系统仍然是遥不可及的梦想。02. 超越特征的工程在2010年初计算机视觉发生了巨大变化,当时我们看到了自计算机本身发明以来计算机视觉领域的最大革命。2012年,在ImageNet大规模视觉识别挑战赛上,一种名为AlexNet的计算机视觉算法比其竞争对手提高了10%。世界震惊了。关于它的最神奇的事情是:该模型没有使用手动设计的部分。相反,该模型依赖于称为神经网络的通用学习系统。AlexNet的突破在于使用GPU(图形处理单元)来更快地训练计算机视觉模型:AlexNet在两个消费级GPU上进行了6天的训练。为了进行比较,OpenAI于2020年发布的GPT3在355年的模拟等效时间里进行了培训,培训费用约为4,600,000美元。自从AlexNet以来,我们继续添加清晰明确的数据点:数据集越大,模型越大,并且训练的时间越长,我们的学习功能就越好。最近,在最近几年中,随着transformers的出现,我们看到了视觉算法的新突破。transformers是一种基于编码器和解码器的深度学习架构,这些编码器和解码器在自然语言(NLP)任务中已经流行了一段时间了。来自Facebook的AI研究小组的DETR论文引起了轰动,它们展示了如何使用transformers来获得视觉任务的最新性能。transformers比当前流行的计算机视觉算法(例如MaskRCNN)更易于实现,并且代表了朝着减少计算机视觉自动化的方向又迈出一步。我们花在开发和调整算法上的时间越少,就越可能完成日益复杂的任务。在未来的十年中,这些都将对计算机视觉产生巨大的影响,目前关于智能代理(IoT摄像头,Alexa和Google Home设备等)是在云上还是直接在设备本身上存在许多争议。03. 数据功能和用于计算机视觉的合成数据我们已经讨论了算法和硬件。现在,我们陷入了AI难题中最重要的部分:数据。历史趋势向我们展示了以下内容:一、算法变得越来越通用,二、人工设定数据的需求越来越小。其结果是计算机视觉的性能更多地取决于用于训练它的数据。这不足为奇,我们所有人都看到科技巨头聚集了大量的数据集。但是,获取庞大的数据集并不能解决所有的AI的问题。因为这些数据集,无论是从Internet上抓取还是在室内精心上演和捕获,都不是训练更通用的自主算法的最佳选择。这种“真实数据”所含有的误差不可避免地会渗入计算机视觉算法中。此外,真实数据不容易输入培训中:需要对其进行清理,标记,注释和修复。因此,我们发现已经要准备好迎接技术变革的新时代了,就像引入神经网络和transformers一样重要。数据是阻碍计算机视觉发展的最大障碍。我们认为,解决方案是数据合成。快速定义:合成数据是由计算机创建和生成的数据(例如视频游戏或电影中看到的CGI)。完全控制此虚拟世界意味着可以使用像素标签(请考虑元数据,例如哪些像素对应于图像中的脸部),甚至是在现实世界数据集中可能无法标记的标签。数据合成仍处于早期阶段。与2010年代非常相似,目前每个合成数据集都是使用人工直观设计的。但是,正如我们所说的那样,初创公司(包括我们!)正在构建系统,这将使我们能够生成由学习系统本身设计的无限量的合成数据流。自动化合成数据生成的出现将改变计算机视觉。从现在开始的十年后,计算机视觉算法将通过称为终身学习的过程不断改进。该模型将识别其弱点,为该弱点生成新的综合数据,然后对该数据集进行训练。最好的情况是:全部自动化实现,在云中某处成群的GPU上运行。这就是我们进入2020年代时可以期望的:它与数据有关,更具体地说,与数据合成有关。这将优化并实现更复杂的计算机视觉任务。下载1:OpenCV-Contrib扩展模块中文版教程 赞 (0) 相关推荐 改变科学的10种计算机工具,你用过哪个? 从Fortran到arXiv.org,从生物学的BLAST到人工智能的AlexNet,这些技术进步改变了科学,也改变了世界. 编译 | 乌鸦少年 2019年,事件视界望远镜(EHT)拍摄了人类第一张黑 ... 人工智能的三个必要条件 金融市场的量化密码系列文章(10) 人工智能的必要条件:深度学习模型,大数据,算力 作者:Michael Zhang 麦教授 2016年,AlphaGo下围棋战胜李世乭,大家都认为人工智能的时代到来了 ... 【图像分类】从数据集和经典网络开始 欢迎大家来到图像分类专栏,本篇简单介绍数据集和图像分类中的经典网络的进展. 作者 | 郭冰洋 编辑 言有三 1 简介 一场完美的交响乐演出,指挥家需要充分结合每位演奏者和乐器的特点,根据演奏曲目把控 ... ICCT:中国电动汽车发展回顾及未来展望 ICCT:中国电动汽车发展回顾及未来展望 我国汽车轻量化材料“十三五”时期发展回顾及未来展望 过去的十余年,特别是"十三五"以来,我国汽车轻量化材料开发及应用技术得到了快速发展.在高强度钢.铝合金.镁合金及非金属材料4大类轻量化材料方面,高强度钢应用基本达到国际同等水平,高 ... 智慧旅游是什么?智慧旅游发展现状及未来发展趋势分析 2020年4月3日 GuoMeng来源:互联网1247 81 繁体 你知道何为智慧旅游吗?智慧旅游是智慧地球及智慧城市的一部分.智慧旅游的核心内容是要能够解决旅游发展中出现的新问题,满足旅游发展中的新 ... (八)技术---干湿法隔膜发展瓶颈及未来发展方向 目前市场主要以湿法工艺制备的PE材质隔膜和干法工艺制备的PP材质的隔膜为主,但聚烯烃材料本身表面疏液性和低的表面能导致这类隔膜对电解液的浸润性较差,影响电池的循环寿命.且由于PE和PP的热变形温度和熔 ... 10个信号,决定未来楼市方向,一线城市或回暖,炒房者凉凉 判断未来楼市发展,一定要清楚当前房地产政策,回顾过去一年,房子是用来住的不是用来炒的这个定位得到了最严厉的落实.一切信号都预示着未来楼市的走向,房价真正趋于稳定,购房者也将塌下心来,该买则买,不急则缓 ... 我国AI的发展现状及未来发展趋势分析 如果从达特茅斯会议起算,AI已经走过65年历程,尤其是近些年深度学习兴起后,AI迎来了空前未有的繁荣.不过,最近两年中国AI热潮似乎有所回落,在理论突破和落地应用上都遇到了挑战,外界不乏批评质疑的声音 ... 大暴雨 降温近10℃!未来一周江苏天气太刺激! 这两天走在街上 大家都能感受到了阳光的炙烤 不少人已经穿上短袖 仿佛夏天已经真的到来了 尤其今天一早 太阳上线 气温像是坐上了火箭 下午3点 沿江以及长江以南的大部分地区 都已经达到了30℃以上 南京 ... 钛晨报:左晖因病去世,贝壳一度跌近10%;腾讯Q1营收1353.03亿,同比增长25%;奈雪的茶未来一两个月或完成IPO · 9小时前 马斯克称不会出售任何狗狗币:海底捞上市后首次股份奖励:1500余人将获1.59亿股:刘作虎官宣,前360手机总裁李开新加盟一加:谷歌宣布在纽约市开设首家实体零售店:消息称苹果无人驾驶汽车 ... 【回顾】创新思维决定企业未来发展之路 | 新桂商专业课第5期 5月19日晚,新桂商专业课第5期圆满结束.本次直播课特别邀请到了广西南宁奥理可赢企业管理咨询有限公司创始人黄尧,结合多年的企业管理经验和教学理论,以"广西企业成长过程中的创业变革之道&quo ...