【AutoML】激活函数如何进行自动学习和配置

2024-04-26 04:59:28

大家好，欢迎来到专栏《AutoML》，在这个专栏中我们会讲述AutoML技术在深度学习中的应用。这一期讲述在激活函数设计中的应用。

作者&编辑 | 言有三

激活机制是一个网络非线性表达能力的来源，早期研究人员已经设计出了不少的激活函数，从sigmoid到relu系列，关于详细解读可以查看往期文章。

随着AutoML技术的发展，现在研究人员开始使用搜索技术来进行设计，本文简介相关技术发展。

1 从Relu到Swish

Google Brain是AutoML的先驱，从自动设计网络的NAS到自动数据增强的AutoAugment，因此很自然也最早做自动搜索最优的激活函数工作。

文[1]就在一系列一元函数和二元函数组成的搜索空间中，进行了比较细致的组合搜索实验。

结论是好用的激活函数都比较简单，不会超过两个基本函数的乘的组合。搜到了一些比Relu表现更好的函数，最好的是一个这样的函数：x · σ(βx)，被称为Swish，它在某个特定的参数下也和ReLU及其变种类似，看看图就知道了。

该方法做实验时的一元函数和二元函数的搜索空间已经覆盖我们能想到的一些简单的函数了。

后来研究者们[2]验证了Swish甚至在很多的NLP任务中都非常有效。

在Swish的基础上，后续的研究人员设计了EliSH，HardEliSH[3]，并针对不同的任务学习到了最好的激活函数。

2 Hybrid DNN

每一个网络层都使用同样的激活函数，这是最优的配置吗？显然不是。Hybrid DNN[4]的研究人员就研究了对不同的网络层进行不同激活函数机制的搜索问题，其流程如下：

从流程上来看，就是有一个激活函数库，然后每次从中选择配置到每一个网络层，使用验证集精度来进行最优配置搜索。

关于每一个网络层配置不同的策略，以后我们还会讲到不同的归一化层等配置，这也是一个小的研究方向吧。

参考文献

[1] Ramachandran P, Zoph B, Le Q V. Searching for activation functions[J]. arXiv preprint arXiv:1710.05941, 2017.

[2] Eger S, Youssef P, Gurevych I. Is it time to swish? comparing deep learning activation functions across NLP tasks[J]. arXiv preprint arXiv:1901.02671, 2019.

[3] Basirat M , Roth P M . The Quest for the Golden Activation Function[J]. 2018.

[4] Marchisio A, Hanif M A, Rehman S, et al. A Methodology for Automatic Selection of Activation Functions to Design Hybrid Deep Neural Networks[J]. arXiv preprint arXiv:1811.03980, 2018.

[5] Nwankpa C , Ijomah W , Gachagan A , et al. Activation Functions: Comparison of trends in Practice and Research for Deep Learning[J]. 2018.

总结

本次我们讨论的内容不涉及到一些学习参数的激活函数如Prelu，而是集中于全新的激活函数形式的探索以及逐层自适应的方案。研究点虽小，也有可以关注一下的。

下期预告：AutoML在归一化机制中的应用。

有三AI秋季划

有三AI秋季划已经正式启动报名，模型优化，人脸算法，图像质量共24个项目，助力提升深度学习计算机视觉算法和工程项目能力，介绍如下：

有三AI秋季划出炉，模型优化，人脸算法，图像质量等24个项目等你来拿

转载文章请后台联系

侵权必究

CVPR 2021 | 自适应激活函数ACON: 统一ReLU和Swish的新范式

论文地址:https://arxiv.org/pdf/2009.04759.pdf 论文代码:https://github.com/nmaac/acon 本文提出一种新的激活函数ACON (activ ...
【留言送书】轻量级骨架首选：MobileNetV3完全解析

2021年,文末留言送书精选留言中送出书籍一本! 前言相对重量级网络而言,轻量级网络的特点是参数少.计算量小.推理时间短.更适用于存储空间和功耗受限的场景,例如移动端嵌入式设备等边缘计算设备.因此轻 ...
谷歌大脑Quoc发布Primer，从操作原语搜索高效Transformer变体

新智元报道来源:arXiv 编辑:LRS [新智元导读]调参.改激活函数提高模型性能已经见怪不改了.最近Google Brain的首席Quoc发布了一个搜索框架,能够自动搜索高效率的Tran ...
Hi，我们是-MobileNet-家族！

作者简介 CW,广东深圳人,毕业于中山大学(SYSU)数据科学与计算机学院,毕业后就业于腾讯计算机系统有限公司技术工程与事业群(TEG)从事Devops工作,期间在AI LAB实习过,实操过道路交通元 ...
人工智能与信息安全：新的革命与挑战

人工智能,是一种借鉴生物感知系统和神经系统来开发相应模拟算法的计算机技术,其主要特点是可从数据中学习特征并进行自我迭代训练. 通常,人工智能算法往往需要大量的数据以及庞大的计算资源作为支撑.随着计算机 ...
计算机视觉中的自注意力

自从引入网络以来,深度学习中的注意力机制在机器翻译和社区中广受欢迎.然而,在计算机视觉中,卷积神经网络 (CNN) 仍然是常态,自注意力才刚刚开始慢慢渗透到研究的主体中,要么补充现有的架构,要么完全 ...
【AutoML】归一化(Normalization)方法如何进行自动学习和配置

大家好,欢迎来到专栏<AutoML>,在这个专栏中我们会讲述AutoML技术在深度学习中的应用.这一期讲述在归一化机制中的应用. 作者&编辑 | 言有三数据经过归一化和标准化后可 ...
梦境是夜间的治疗师《夜脑：在睡眠中自动学习的秘密》

梦境是夜间的治疗师《夜脑：在睡眠中自动学习的秘密》
夜脑：在睡眠中自动学习的秘密

开启大脑自动学习的模式;掌握人生倍速精进的方法. 我们通常认为人的大脑跟身体一样需要白天工作;晚上休息.但科学研究指出人的大脑其实是24小时连续运转;从不间断地进行思考和学习的. 心理学大师理查德·怀 ...
Linux学习17-gitlab配置邮箱postfix

前言 gitlab新增新用户有两种方式,第一种可以用户主动注册(自己设置密码):第二种也可以通过root管理员用户直接添加用户,发个邮件到用户的邮箱里,收到邮件后激活. 如果是第二种方式添加新用户的话 ...
jmeter压测学习18-JDBC配置连接mysql数据库

前言使用jmeter压测接口的时候,有时候需要批量造数据,需使用jmeter连数据库造对应的测试数据. 或者测试结束后,对测试的数据还原,删掉一些垃圾数据,都会用到连接数据库执行sql的操作. JD ...
夜脑：在睡眠中自动学习

每天一本书day113 夜脑:在睡眠中自动学习这本书稍微好于前两天读的书,但是这本书的相当篇幅就是在科普人在睡眠中的一些现象,以及告诉读者梦中可以学习.真正有用的是在最后一章教我们如何在睡眠中学习, ...
你要的后置厨卫B型房车来了，卫航依维柯8AT自动挡，配置一步到位

你要的后置厨卫B型房车来了，卫航依维柯8AT自动挡，配置一步到位
《夜脑》—开启大脑自动学习的模式，掌握人生倍速精进的方法。

《夜脑》—开启大脑自动学习的模式，掌握人生倍速精进的方法。
如何搭建Python开发环境(Anaconda其实是一个Python包管理器不仅可以自动帮你配置Python环境还能帮你安装好其他常用工具包)

(Anaconda其实是一个Python包管理器不仅可以自动帮你配置Python环境还能帮你安装好其他常用工具包) https://m.toutiao.com/is/JKe42qw/ 送大家一个小白版 ...

【AutoML】激活函数如何进行自动学习和配置

相关推荐