关联图神经网络与结构因果模型

2024-05-09 16:37:01

仅做学术分享，如有侵权，联系删除

转载于：专知

图神经网络与因果推理是当下大家关注的焦点，GNN有强大的图结构建模表达能力，因果推理旨在探究因果关系结构，如何将两者联系起来是一个挑战性的问题？来自TU&DeepMind的研究人员将这两者做了研究，建立基于GNN的因果推理。

因果性可以用结构因果模型(SCM)来描述，该模型承载了有关兴趣变量及其机械关系的信息。对于大多数感兴趣的过程来说，底层的SCM将只是部分可见的，因此因果推理试图利用任何观察的信息。图神经网络(GNN)作为结构化输入的通用逼近器，为因果学习提供了一个可行的候选者，建议与SCM更紧密的集成。为此，我们提出了从第一原理出发的理论分析，在GNN和SCM之间建立了新的联系，同时提供了一般神经因果模型的扩展观点。然后我们建立了一个新的基于GNN的因果推理模型类，该模型类是因果效应识别的必要和充分条件。我们对模拟和标准基准的实证说明验证了我们的理论证明。

https://www.zhuanzhi.ai/paper/8c09c90940b1603f6d6dbce7335df3fc

引言

理解因果关系是人类认知的核心，因此对科学、工程、商业和法律具有很高的价值(Penn and Povinelli 2007)。发展心理学向我们展示了孩子们是如何像科学家一样进行探索的，都是通过问“如果……会怎么样?””和“为什么?这类问题((Gopnik 2012; Buchsbaum et al. 2012; Pearl and Mackenzie 2018)，而人工智能研究梦想将科学家的行为方式自动化(McCarthy 1998; McCarthy and Hayes 1981; Steinruecken et al. 2019)。深度学习带来了可优化的逼近普适性，这是指对于任何函数都存在一个接近任意精度的神经网络(Cybenko 1989;Hornik 1991)。这种能力已经在各种应用中获得了巨大的成功(Krizhevsky, Sutskever, and Hinton 2012;Mnih et al. 2013;Vaswani et al. 2017)。因此，将因果关系与深度学习相结合，对于即将达到人类智能水平的研究具有至关重要的意义。对所谓的神经-因果模型进行紧密整合的初步尝试(Xia et al. 2021;Pawlowski, Castro, and Glocker 2020)的存在，并显示出有望实现一个系统的梦想，该系统在其最令人印象深刻的应用中，可以执行与现代神经模块同样规模的有效性的因果推理。

虽然因果关系在过去十年中已经被彻底地正式化了(Pearl 2009;Peters, Janzing, and Scholkopf 2017)，“另一方面，深度学习在实际应用中取得了成功，理论突破仍然很少。”Bronstein等人(2017)率先提出了几何深度学习的概念，从几何观点出发并将其推广到现代架构的一类重要神经网络是图神经网络(GNN) (Velickovi ˇ c et al. 2017; Kipf and Welling 2016a; Gilmer ´ et al. 2017)。与其他专门的神经网络类似，GNN在药物发现(Stokes et al. 2020)和谷歌地图的ETA预测(DerrowPinion et al. 2021)等专门应用中取得了最先进的性能。这些特性，我们称之为归纳偏差，可以利用其他证明不可能的推论(Gondal et al. 2019)。

顾名思义，GNN在输入的结构上放置了一个归纳偏差，即，输入的维度是相关的，这样它们就形成了一个图结构。要回到因果关系，其核心是结构因果模型(SCM)，它被认为是负责数据生成的现实模型。SCM在其所建模的变量上暗示了一个图结构，而由于GNN研究的是图，对这两个模型之间的关系进行更仔细的检查似乎对神经因果人工智能的研究进展是合理的。我们没有从因果关系的原则中获得灵感来改进机器学习(Mitrovic等人，2020年)，而是展示了GNN如何用于执行因果计算，即因果关系如何在神经模型中出现。更准确地说，因果推理是指Pearl因果层次(PCH)模型(Bareinboim et al. 2020)。也就是说，我们以(部分)因果图和/或来自层次结构不同层次的数据的形式获得了关于SCM的部分知识。

总的来说，我们做出了一些关键贡献: (1) 我们从第一性原理推导出GNN和SCM之间的理论联系; (2)定义一个更细粒度的NCM; (3) 我们形式化了GNN的干预，并由此建立了一个新的神经因果模型类，利用自动编码器;(4) 在与现有工作相关的情况下，我们提供了关于这一新的模型类的可行性、表达性和可识别性的理论结果和证明。(5) 我们实证检验了我们的理论模型在识别和估计任务中的实际因果推理。

The GNN-SCM-NCM 联系

为了进一步扩展因果和机器学习之间的整合边界，我们对图神经网络(GNN)和结构因果模型(SCM)之间的关系进行了理论研究，从而也传递到神经因果模型(NCM)。虽然因果识别的所有已建立的结果已经证明，干预/操纵对于因果推理来说不是必要的，干预/操纵的概念仍然是因果关系的核心，正如Peter Holland和Don Rubin长期以来的座右铭“没有操纵就没有因果关系”(Holland 1986)所暗示的那样。干预的中心地位是我们选择将干预作为理论研究的起点的原因。因此，我们首先在GNN计算层中定义了一个干预过程，随后将揭示该过程的合理属性，类似于SCM上的干预。

基于GNN的因果推理

---------♥---------

AAAI 2021 |图模型相关工作——数据扩充；近似梯度下降；解决灾难性遗忘问题

点击上方蓝字关注我们本文介绍三篇AAAI2021最新的研究工作,下面的三篇论文均与模型的设计相关,具体的任务涉及节点分类和图分类. Data Augmentation for Graph Neur ...
中科院计算所沈华伟：图卷积神经网络的思想起源

智源社区 & AI科技评论作者 | 周寅张皓小到分子相互作用,物质结构,大至气候变化,星系模型,很多自然界和社会生活中的现象都能用图结构描述.而如何将神经网络应用到图网络中进行计算,在几年 ...
Bengio 智源大会重磅演讲：基于神经因果系统2实现鲁棒深度学习

导读:2021 年 6 月 1 日,Yoshua Bengio 在 2021 北京智源大会上发表了题为「Towards Robust Generalization in Machine Learnin ...
性能超越图神经网络，将标签传递和简单模型结合实现SOTA

图神经网络(GNNs)是图学习中一种主流的技术.然而,对于GNN为什么在实际使用中很成功以及它们是否是优异性能所必需的技术,了解相对较少. 本文展示了许多标准的传导节点网络的分类基准结果,作者通过将忽 ...
GPT-3和AlphaFold 2震撼2020，2021年AI最大看点在哪儿？

2020年并不缺重磅新闻,但人工智能依然够杀出重围,走进主流视野. 尤其是GPT-3,它展示了人工智能即将以全新的方式深入我们的日常生活. 这些进步赋予了未来很多可能,预测未来变得并不容易,但 ...
清华团队综述全面解读图神经网络理论方法与应用

撰文:吴婷婷近年来,由于图的强大表达能力,利用机器学习分析图的研究越来越受到关注.图(graph)作为一种数据结构,由节点(node)和边(edge)组成,如果赋予节点和边不同的含义,那么看似简单的 ...
清华唐杰教授综述全面解读网络表示学习（NRL）最新动态

撰文:吴婷婷在计算机技术飞速发展的今天,机器处理现实生活中复杂任务的能力也越来越强大.其中,从现实世界网络中挖掘有效.相关的信息在许多新兴应用中起着至关重要的作用.例如,在社交网络中,根据个人资料和 ...
综述 | 图神经网络加速结构

仅做学术分享,如有侵权,联系删除转载于 :专知摘要: 近年来,新兴的图神经网络因其强大的图学习和推理能力,得到学术界和工业界的广泛关注,被认为是推动人工智能领域迈入"认知智能" ...
叶进教授团队：面向植物病害识别的卷积神经网络精简结构Distilled-MobileNet模型（2021年第1期）

引用格式:邱文杰, 叶进, 胡亮青, 杨娟, 李其利, 莫贱友, 易万茂. 面向植物病害识别的卷积神经网络精简结构Distilled-MobileNet模型[J]. 智慧农业(中英文), 2021, ...
图神经网络加速结构综述

李涵, 严明玉, 吕征阳, 李文明, 叶笑春, 范东睿, 唐志敏. 图神经网络加速结构综述[J]. 计算机研究与发展, 2021, 58(6): 1204-1229. 近年来,新兴的图神经网络因其强大 ...
扩展图神经网络：暴力堆叠模型深度并不可取

节点之间的相互依赖关系使我们很难将损失函数分解为各个独立节点的影响. 在本文中,我们介绍了Twitter 研发的一种简单的图神经网络架构,该架构可以在大型图上有效工作. 1 图神经网络介绍图神经网络 ...
NeurIPS 2019 | 基于图自编码器的因果结构学习模型

❝ 论文标题 | A Graph Autoencoder Approach to Causal Structure Learning 论文来源 | NeurIPS (workshop) 2019 论文 ...
详解NLP中的预训练模型、图神经网络、模型压缩、知识图谱、信息抽取、序列模型、深度学习、语法分析、文...

NLP近几年非常火,且发展特别快.像BERT.GPT-3.图神经网络.知识图谱等技术应运而生. 我们正处在信息爆炸的时代.面对每天铺天盖地的网络资源和论文.很多时候我们面临的问题并不是缺资源,而是找准 ...
关于NLP相关技术全部在这里：预训练模型、图神经网络、模型压缩、知识图谱、信息抽取、序列模型、深度学...

大家都知道NLP近几年非常火,而且发展也特别快.那些耳熟的BERT.GPT-3.图神经网络.知识图谱等技术实际上也就是这几年发展起来的,特别像图神经网络在这两年间取得了飞速的发展.我们正处在信息爆炸的 ...
人工智能中图神经网络GNN是什么？

人工智能算法与Python大数据致力于提供深度学习.机器学习.人工智能干货文章,为AI人员提供学习路线以及前沿资讯 23篇原创内容公众号点上方人工智能算法与Python大数据获取更多干货在右上 ...

关联图神经网络与结构因果模型

相关推荐