人工智能的未来与目前的困难

2024-06-19 05:04:04

人工智能在当今世界越来越流行。许多行业都有人工智能的名字，人工智能已经成为几乎所有互联网技术公司的必备基因。就连很多制造企业都要谈人工智能，就像人类一夜之间就进入了人工智能时代一样。

但是很多企业只是对人工智能应用水平的开发，而不是对技术的研究，而企业应用的实施可以促进人工智能技术的发展。对于人工智能而言，计算机视觉一直是深度学习领域最热门的研究领域，应用最广泛的有人脸识别、图像检索识别、智能控制、生物特征识别（指纹、虹膜、人脸匹配）、智能驾驶等。而目前人工智能还是有许多的难题的，比如训练效率低下，需要大量的计算资源，大部分理论缺乏可解释性。

人工智能的训练效率低下

在传统数据中心完成的工作包括视频流、电子邮件和社交媒体的信息处理，这些都是大数据。而AI 是计算密集型的系统，因为它需要通过大量数据喂养，直到它学会理解它，即经过训练。

训练语言网络的一个常见方式是，是从各类百科和新闻媒体、自媒体等网站搜集数据提供大量文本，并过滤遮挡一些单词，并要求人工智能它们猜测被过滤和遮挡的单词。就比如一个例子是"今天，小明生病了，没有来上班"，把"生病"这个词遮盖掉，然后让机器去猜测可能的单词。最初，模型会弄错它们，但是，经过许多回合的训练调整后，连接权重开始迭代变化并拾取数据中的一些模式信息。这样整个人工智能的网络最终将变得准确。

与人们学习的方式相比，这种训练效率是很低的。我们现代人工智能使用人工神经网络，这是模拟人脑神经元的数学计算。每个神经元与其相邻神经元的连接强度是称为权重的网络参数。而要学习如何理解语言，则这些网络参数都是从随机的权重开始，并调整它们，直到输出在期望误差的合理范围内或大概率同意正确答案为止。

据统计称，一种“基于Transformer的双向编码器”的模型使用了33亿个英文书籍和维基百科文章中的单词。而且在训练中读取次数在40次以上。相比之下，一个平均学习说话的孩子在五岁前可能会听到4500万字，比这类模型要少3000多倍。可见人工智能的网络模型和训练样本决定着它的输出效果，更可怕的是这样的效率相比较人类而言无疑是非常低下的。

而目前的AI 模型比它们要大得多，并且每年都在变大。GPT-2是最近的一种语言模型，在其网络中具有15亿个权重。而升级版的GPT-3由于输出效果和精度高而引起了轰动，其参数权重为1750亿个，训练一次需要花费1000多万美元。

寻找合适的结构

语言模型的构建成本更高，因为这种训练过程在开发过程中多次发生。这是因为研究人员希望找到网络的最佳结构（神经元的数量、神经元之间的连接数、学习过程中参数变化的速度等参数）。这种类似的超参数调节他们尝试的组合越多，网络实现高精度输出的机会就越好。相比之下，我们人类的大脑不需要找到一种最佳结构，因为他们可能就是进化磨练后的最佳结构模型。

随着企业和学术界在人工智能领域的竞争，提高技术水平的压力也越来越大。即使机器翻译等高难度任务的准确率提高1%，也被认为意义重大，能带来良好的宣传效果和更好的产品。然而，为了得到1%的改进，研究人员可能会对模型进行成千上万次的训练，每次训练的结构不同，直到找到最好的。同时也带来了大量的设备能源浪费。

目前，人工智能模型是在图形处理器等专用硬件上进行训练的。与传统的CPU相比，它需要更多的功耗。这一切意味着，先进人工智能模型的发展将构成巨大的碳足迹。除非我们转向100%可再生能源，否则人工智能的进步可能与减少温室气体排放和减缓气候变化的目标相悖。开发的财务成本也变得如此之高，只有少数选定的实验室和机构企业能够负担得起，他们将成为制定开发哪种类型人工智能模型的标准实验室。

自GPT和BERT出现以来，NLP进入了“创造奇迹”的时代。在这个时代，大数据、大参数是构建好模型的基础，当然这也需要大量的计算资源。

未来

很明显人工智能未来将与普通人告别，大型企业和专业机构将去大规模训练和生成超大模型，个人将无力支付庞大的数据和计算资源所带来的高额代价。普通实践者应该都需要学习基本的人工智能概念和基本模型。以接续未来人工智能理论的不足。

预计到了2045年，人工智能将全面超越人类智能，世界将开启一个新的文明时代。虽然目前人工智能虽没有强大的学习能力，但从计算设备上，计算能力已经远超人类。而在部分领域人工智能也已经可以替代人类完成了。

艰难2020：人工智能的应用是否已停滞不前？

作者:Gary Grossman 译者:Sambodhi 策划:刘燕今年,每一个季度都是疯狂的一年,人工智能的发展同样如此.总的来说,这一年人工智能的发展喜忧参半,其中有显著的进展,也有对技术滥用的 ...
几经沉浮，人工智能(AI)前路何方？

人工智能将和电力一样具有颠覆性 . --吴恩达如同蒸汽时代的蒸汽机.电气时代的发电机.信息时 ...
无法访问GPT-3？强大的克隆版GPT-J带着60亿参数来了

编辑|核子可乐.钰莹去年 9 月,微软宣布与 OpenAI 达成独家授权协议,称该公司将使用 GPT-3 来"创建新的解决方案,利用先进自然语言生成的惊人能力".这一安排不会阻止 ...
深度学习与电力智能化的思考

摘要国网福建省电力有限公司检修分公司的研究人员黄旭超,在2018年第11期<电气技术>杂志上撰文,回顾了深度学习的发展历程,详细介绍了深度学习的主流基础网络--深度神经网络结构和特点,在 ...
“中文版GPT-3”来了：会算术、可续写红楼梦，用64张V100训练了3周

磐创AI分享来源 | 量子位(QbitAI) 编辑 | 晓查.发自.凹非寺今年,OpenAI推出的自然语言模型GPT-3引起了巨大的轰动. 这是迄今为止最大的NLP模型,包含1750亿参数 ...
在AI“必争之地”，全球最大规模人工智能巨量模型诞生

作者 | 张双虎当学界和业界均相信"大力出奇迹"的时候,就该大模型闪亮登场了. 9月28日,浪潮人工智能研究院发布全球最大人工智能巨量模型--源1.0. 这个几乎把近5年中文互联 ...
GPT-3：被捧上天的流量巨星，却有一个重大缺陷，很危险...

来源:nature 编辑:yaxin [新智元导读]去年当红的流量明星非GPT-3莫属,能答题.写文章,做翻译,还能生成代码,做数学推理,不断被人们吹捧.不过,过誉的背后也有人开始质疑,GPT-3真的 ...
赛尔译文 | 基础模型的机遇与风险（一）

原文:On the Opportunities and Risks of Foundation Models 链接:https://arxiv.org/pdf/2108.07258.pdf 译者:哈工 ...
陈根：1.6万亿参数语言模型，最大规模的人工智能语言模型

文/陈根开发人工智能的语言模型,一直是人工智能的重要细分领域.人工智能语言模型应用包括搜索引擎.文字生成.个性化的对话工具以及软件生成等. 2020年5月,OpenAI的一组研究人员发布了具有里程碑 ...
2457亿参数！全球最大AI巨量模型「源1.0」发布，中国做出了自己的GPT-3

新智元报道编辑:好困 yaxin [新智元导读]古代文人,或一觞一咏,畅叙幽情,或风乎舞雩,咏而归.「吟诗作对」成为他们的标配.刚刚,全球最大人工智能巨量模型「源1.0」发布,能赋诗作词,比 ...
Vokenization：一种比GPT-3更有常识的视觉语言模型

学习人工智能,最好的办法就是先考上大学,学好计算机和数学,其次就是生个孩子. 这可不是一个段子.有了孩子之后,你会能更好理解人工智能到底是如何发生的. 看着一个牙牙学语的小婴儿开始对这个世界发生好奇, ...
GPT-3记录被打破！谷歌推出1.6万亿参数的人工智能语言模型

古谚道:"熟读唐诗三百首,不会作诗也会吟." 这句话放在目前的人工智能语言模型中也非常适用. 此前,OpenAI 的研究人员开发出 "GPT-3",这是一个由 ...
NLP：NLP领域没有最强，只有更强的模型——GPT-3的简介、安装、使用方法之详细攻略

NLP:NLP领域没有最强,只有更强的模型--GPT-3的简介.安装.使用方法之详细攻略导读:NLP领域的模型,没有最大,只有更大.博主这几天也仔仔细细看了这篇长达75页的论文,光署名作者都有二三十 ...
GPT-2：OpenAI的NLP商业化野望

自然语言处理(NLP)技术正在生活的方方面面改变着我们的生活. 客厅的智能音箱在跟你每天的对话中飞速进步,甚至开始跟你"插科打诨"来适应你的爱好习惯. 电商客服总是能在第一时间回复 ...
人工智能“干掉”程序员后，又对艺术家下手了

人工智能领域缺钱,但这两个月来,他们不缺「好消息」. Google 母公司 Alphabet 旗下的 DeepMind,先推出了蛋白质结构预测 AI--AlphaFold 2,为困扰了生化学界 50 ...
写作神器还是魔鬼化身？万能语言模型GPT-3起底

「工程壮举」「人间奇迹」GPT-3,会让人类离没事做又近一步吗? 编译 | 心缘编辑 | 漠影 2020年6月,在训练约2000亿个单词.烧掉几千万美元后,史上最强大AI模型GPT-3一炮而红. ...

人工智能的未来与目前的困难

人工智能的训练效率低下

寻找合适的结构

未来

相关推荐