陈根:算法黑箱,不再黑箱

文/陈根

在人工智能深度学习输入的数据和其输出的答案之间,存在着人们无法洞悉的“隐层”,它被称为“黑箱”。这里的“黑箱”并不只意味着不能观察,还意味着即使计算机试图向我们解释,人们也无法理解。

事实上,早在1962年,美国的埃鲁尔在其《技术社会》一书中就指出,人们传统上认为的技术由人所发明就必然能够为人所控制的观点是肤浅的、不切实际的。技术的发展通常会脱离人类的控制,即使是技术人员和科学家,也不能够控制其所发明的技术。

进入人工智能时代,算法的飞速发展和自我进化已初步验证了埃鲁尔的预言,深度学习更是凸显了“算法黑箱现象带来的某种技术屏障。以至于无论是程序错误,还是算法歧视,在人工智能的深度学习中,都变得难以识别。

与此同时,在生命科学方面,理解细胞差异、为细胞分类,对生命科学具有重要意义,一系列基于基因转录数据和深度学习的分类方法正在兴起,然而,由于算法“黑箱”,以至于现有的方法可解释性往往不足。

近日,由北京师范大学、中科研基因所研究人员合作在Nature Machine Intelligence 期刊发表论文,其中,研究人员利用改进后的胶囊网络深度架构,应用于转录组分析和细胞分类,取得良好效果并具有较强的可解释性。

在研究人员提出的胶囊网络中,胶囊代表多个神经元组成的向量,作为基本的运算单位。每个向量(胶囊)代表特定对象的一种属性。所以,胶囊网络具有模块化的架构,适用于同样具有模块化特征的生物学数据。

最初版本的胶囊网络模型使用卷积神经网络作为特征提取器,用于图像分类任务。在此次研究中,研究人员则将其改造成为“单细胞胶囊网络”(scCapsNet ),以多个并联的神经网络替换原有卷积神经网络,作为特征提取器,用于单细胞表达谱的分类。

单细胞胶囊网络从多个层面弥补了传统机器学习透明度低及缺乏可解释性的问题。这对于决策黑盒子透明化具有重要意义。

(0)

相关推荐

  • 如果AI是孙悟空,谁来念“紧箍咒”?

    30秒快读 1 健康码.人脸识别通行,是疫情期间迅速铺开的大数据.人工智能应用. 2 在今年的世界人工智能大会上,来自全球的科学家.学者都在探讨数据和隐私该如何治理,之后,对于人工智能的监管是否会落地 ...

  • 报告 | 2021十大人工智能趋势

    AI与数字内容产业的深度耦合,将有望为行业释放更大的科技势能,构筑数字内容生成新范式. 6月5日,以"交叉.融合.相生.共赢"为主题的2021全球人工智能技术大会(GAITC 20 ...

  • “人工智能+” 理性正视挑战

    "人工智能+" 理性正视挑战 来源:光明网-<光明日报>2021-06-03 07:20 X 光明日报记者 杨舒 语音识别.文本识别.视频识别--数字经济时代,人工智能 ...

  • AI开发者大会:2020年7月3日09:10--09:30张钹《人工智能的发展现状与人才培养》

    AI开发者大会:2020年7月3日09:10--09:30张钹<人工智能的发展现状与人才培养> 2020年7月3日09:10--09:30张钹<人工智能的发展现状与人才培养> ...

  • DIG: Dive into Graphs 图深度学习工具包

    人工智能算法与Python大数据 致力于提供深度学习.机器学习.人工智能干货文章,为AI人员提供学习路线以及前沿资讯 23篇原创内容 公众号 点上方人工智能算法与Python大数据获取更多干货 在右上 ...

  • 谷歌让普通人读懂 AI

    作者 王焕超  腾讯研究院研究员   算法黑箱:从奥巴马"变"成白人说起 打码容易去码难,这条互联网定理似乎将成为历史. 2020年,美国杜克大学的研究者提出一种新型算法,名为PU ...

  • 13个AI模型超过《Nature》论文,西安交大团队夺冠!阿里达摩院AI预测厄尔尼诺大赛完美收官

    ! 雷锋网发布时间: 04-2216:39鲲鹏计划获奖作者,万象大会年度获奖创作者,优质创作者"一只蝴蝶在巴西微微振翅,是否会掀起美国德克萨斯州的龙卷风?"1963年,气象学家爱德 ...

  • 陈根:算法黑箱与数据正义

    文/陈根 在万物互联的背景下,以云计算为用,以个人数据为体,以机器学习为主的智能应用已经"润物细无声".从今日头条的个性化推送到蚂蚁金服的芝麻信用评分,从京东的"奶爸当家 ...

  • 陈根:北大博士送外卖背后,算法秩序浮现

    文/陈根 外卖骑手,再次引发全网关注.这一次,起因变成了发表在顶刊<社会学研究>上的一篇博士论文:北大博士后陈龙为做研究,加入了在中关村的一个外卖骑手团队,体验了 5 个半月的配送工作,写 ...

  • 陈根:走进癌症,算法测癌

    文/陈根 癌症的个性化,加之精准医学时代的到来,正对过去癌症临床指南造成了全新的.巨大的挑战. 事实上,一直以来,癌症作为一类复杂疾病,都是多种疾病的统称,包括肺癌.胃癌.肠道癌.皮肤癌等.这些癌症有 ...

  • 陈根:算法新进展——可“预测”癌症语言?

    文/陈根 当打开Netflix的时候,它会不会给你推荐一些剧,"恰好"是你感兴趣的:当在Facebook上聊天时,它会不会给你推荐一些朋友,"恰好"是你欣赏的: ...

  • 陈根:利用宇宙能源大势所趋,太空电站不再遥远

    文/陈根 近年来,随着地球传统能源面临枯竭,环保.节能.开发新能源等话题一直备受关注,各国各界也致力于环境.能源的可持续性发展. 太阳是地球乃至整个太阳系取之不尽的核心能源系统,地面太阳能作为新能源也 ...

  • 陈根:干细胞助力肌肉再生,年老不再“力”衰

    文/陈根 年老力衰是人类至今难以抗拒的自然规律.衰老的其中一大表现就是肌肉质量的丧失.骨骼肌占人体质量的40%.随着年龄的增长,骨骼肌会发生结构和功能变化,50岁之后人体每十年平均会损失15-30%的 ...

  • 陈根:研究发现关键致病蛋白,让肿瘤细胞不再“恶性”

    文/陈根 神经母细胞瘤是一种幼儿时期常见的恶性肿瘤,其常常发生在隐匿部位,并且没有特殊的临床表现,所以早期诊断极为困难.另外,神经母细胞瘤恶性程度非常高,患者生存率很低,3年仅为30%左右. 在患有神 ...

  • 陈根:从算法权利到算法权力,打破算法赋权失衡

    文/陈根 当前,大数据的快速发展正使算法融入并重塑人们的生活,算法作为机器可读的程序性指令,利用汇集人类行为的大规模数据集影响着人们方方面面的社会生活.比如,算法推荐新闻.推送广告.排名商品.安排专车 ...

  • 陈根:算法歧视,真的存在吗?

    文/陈根 人工智能的发展让人们逐也渐意识到算法所依赖的大数据并非中立.它们从真实社会中抽取,必然带有社会固有的不平等.排斥性和歧视的痕迹. 早在20世纪80年代,伦敦圣乔治医学院用计算机浏览招生简历, ...