需要多少试次才能获得显著的 ERP 效应? 这要看情况

在设计 ERP 研究时,研究人员必须选择包括多少个试次,平衡最大化统计效力的愿望和最小化记录实验时间的需要。最近的研究试图为各种 ERP 成分量化获得可靠测量所需的最低试次数量。然而,这些研究在很大程度上忽略了影响 ERP 研究中统计效力的其他变量,包括样本量和效应量。本研究的目的是确定试次次数、参与者人数和效应量是否以及如何相互作用以影响统计效力,从而为选择适当数量的试次提供更好的指导。我们使用蒙特卡罗方法来测量获得统计学显著结果的可能性,当测试(a)存在 ERP 效应,(b) ERP 效应中存在参与者被试内条件差异,和(c) ERP 效应中存在参与者组间差异。这些问题中的每一个都是在错误相关负波和单侧化准备电位的背景下进行检查的。我们发现,在许多情况下,将先前研究推荐的试次数增加一倍,统计效力就会增加一倍以上。因此,在确定一项研究应包括的试次数量时,研究人员必须考虑样本大小、预期效应量和噪声水平,而不是仅仅依靠关于获得“稳定的”ERP 波形所需的试次数量的一般性建议。本文发表在Psychophysiology杂志。(可添加微信号siyingyxf或18983979082获取原文及补充材料,另思影提供免费文献下载服务,如需要也可添加此微信号入群,原文也会在群里发布)。

1 引言
相对于脑电图中的其他信号,ERPs 较小,因此在单个试次中通常不可见。相反,ERPs 通过对特定类型事件的许多试次进行平均,从脑电图中分离出来。叠加平均增加了数据的信噪比。信噪比随着平均试次数量的平方根而提高(Luck,2014)。在其他条件相同的情况下,平均值中包含的试次越多,数据质量越好。然而,在实验中可以呈现的试次数量是有实际限制的。例如,如果实验时间太长,参与者可能会感到疲劳或烦躁,这会增加数据中的噪音水平,并对任务的表现产生负面影响。因此,有必要通过平衡数据质量与收集数据所花费的时间和资源之间的权衡,优化试次数量。
关于在一个特定的 ERP 实验中包括多少个试次通常是基于传统的或来自以前研究的证据。最近,一些研究试图提供具体的、数据驱动的指导方针,说明一个 ERP 实验应该包括多少个试次。这些研究考察了几个广泛使用的 ERP 成分,包括错误相关负波(ERN)、N100、 N200和 P300等等。这些研究的一般方法是从特定数量的试次中获取数据,并通过从原始数据集中的试次抽样来模拟较少数量的试次。这使得从可用的完整试次样本中获得稳定和可靠的ERP的最小试次数量成为可能。不同试次数的平均值之间的相似性已经通过多种方式进行量化,例如通过比较不同 ERPs 之间的相关性或测量平均值的内部可靠性。一些研究还集中在用于计算 ERP 的试次数量如何影响其心理测量特性,包括重测信度、内部一致性以及跨越不同年龄组的信度。这些研究的总体目标是确定获得可靠的特定 ERP 成分所需的最低试次数量。
对于较大 ERP 成分,这些研究通常得出的结论是,相对较少的试次数量是足够的。例如,一些研究已经得出结论,ERPs 可以通过10个或更少的 ERN 试次获得稳定的全脑平均的 ERPs。这个结论是基于 ERPs 的计算稳定性,一般定义为 ERPs 在相对较少的试次中的平均值和在更多的试次中的平均值之间的高度相关性。然而,基于 ERP 稳定性测试的具体建议可能不适合作为检测组间差异的指导方针。具体而言,需要更多的试次来获得适当的统计效力,以检测组间的显著差异。
这是一个重要的问题,因为确定 ERP 成分是否存在不是大多数 ERP 研究的目标。相反,大多数 ERP 研究的目的是确定 ERP 是否在个人,条件和/或组之间存在差异。这类研究通常比简单比较正确与错误试次(ERN)或罕见与频繁试次(P300)的差异要小得多。因此,一个关键的问题是试次的数量(以及样本大小和效应大小)如何影响检测统计上显著的条件间或组间效应的能力。但这一领域以前的大多数工作尚未对此进行审查。
人们可以从先前对试次数量的研究中得出的一个重要结论是,ERP 研究人员可以从相对较少的试次中收集数据,而不会对数据质量造成任何实际损害。例如,研究人员可能会读到“ P300振幅在所有条件下大约20个目标试次中稳定下来”或者“ ERN只需要6到8个试次就可以准确地量化”。研究者阅读这种说法可能会假设,即使可以合理地获得更多的试次,在 P300研究中获得超过20个试次或在 ERN 研究中获得6-8个试次也没有意义。然而,以前关于这个话题的大多数研究都没有直接检查试次数量对统计效力或评估这是否与样本大小和效应量存在交互作用。这些以前研究可能会导致我们低估获得显著结果所需的试次数量。因此,进行几乎没有机会产生显著效应的研究可能会浪费相当多的时间和资源。另一方面,如果在 P300实验中每个条件包含20个以上的试次,或者在 ERN 实验中每个条件包含6-8个以上的错误试次很少或没有价值,那么这将使得研究人员设计大量试次的研究是不可行的。因此,在确定给定研究的最佳试次数量时,确定实验背景的其他方面是否需要考虑是很重要的。
1.1 最新研究
因此,本研究的主要目标是探讨试次数量对统计效力的影响,以及这种影响如何与样本量和效应大小交互作用。如果获得具有统计学意义的结果所需的试次数量因这些其他因素的不同而有很大差异,那么这将破坏我们可以使用简单的指导方针来确定 ERP 的试次数量的想法,而这些指导方针可以广泛应用于各种不同类型的研究。这对于确定未来的 ERP 研究如何设计是一个至关重要的问题。
为了解决这个问题,我们系统地操纵了在决定统计效力方面发挥作用的三个关键因素:叠加平均的试次数量、样本量和效应量。我们研究了这些因素对获得统计学显著结果的可能性的影响: (a)当测试 ERP 效应的存在时(例如,错误试次和正确试次之间 ERN 幅度的差异) ; (b)当测试 ERP 效应中不同条件下的参与者内部差异时;当测试 ERP 效应的组间差异时。为了解决这些问题,我们使用蒙特卡罗方法来模拟实验,包括不同数量的试次,参与者的数量,效应量,这些是从一个大的数据集里抽样不同试次和参与者完成的。通过对每组给定的参数进行 1000 次的模拟,我们能够估计每个参数组合获得统计上显著结果的概率(即统计效力)。我们的目标不是简单地证明这些因素中的每一个都会影响统计效力,而是确定它们在决定效力方面是如何相互作用的。换句话说,我们研究了增加每名参与者试次次数的效果如何取决于样本量和效应量。这使得我们有可能确定,在不同的研究中,不再值得增加试次数的点是相对恒定的这一假设是否有效,或者换句话说,不同研究是否需要不同的试次数来达到相同的统计效力水平。
为了预览结果,我们发现统计效力随着每位参与者试次次数的增加而增加,甚至超过了实现“稳定”ERP 波形所需的点。例如,效应量小,被试少时,当我们在模拟 ERN 实验中将试次次数从 8 次增加到 16 次时,统计效力增加了一倍多。一般来说,增加试次次数在统计效力的低级和中级水平上最有帮助(这反过来又由效应量和参与者的数量决定)。然而,当试次数量相对较少时效力已经很高(因为效应量较大或参与者数量较多),增加试次数量对统计效力的增加相对较小(天花板效应)。
2 方法
2.1 ERP成分
我们专注于两个 ERP 成分,ERN 和LRP (lateralized readiness potential)。选择 ERN 是因为它是一个强有力的效应,最近已经成为几个可靠性研究的主题。选择 LRP 是因为它通常是一个较小的效应,需要相对较大数量试次来检测,从而允许更广泛范围的试次数和效应量进行审查。之所以选择这两种 ERP 效应,也是因为它们可以通过单个任务分离出来,允许我们使用来自单个实验的数据进行所有分析,从而消除了数据质量、噪音水平、参与者警觉性等方面的差异。数据集包括相对较大数量的参与者(N=40) ,使得有可能检查广泛的样本量。
ERN 通常在反应锁定波形中观察到,与正确试次相比,错误试次中的负电压更高。ERN的出现与错误的执行密切相关,并且在额中电极点处最大。错误试次和正确试次之间的幅度差异相对较大(通常为 5-15 μV) ,并且通常用相对较少的错误试次进行量化。
LRP 与选择和准备一个侧向的手动反应相关。它是一种在运动皮层上的电极部位观察到的负向偏转,并且在反应手的对侧电极部位比同侧电极部位更大。LRP 可以在刺激锁定或反应锁定的平均值中看到,它通常在反应发生前不久发作;在目前的研究中,我们将刺激锁定 LRP 波形作为反应锁定ERN 分析的对比。与反应准备相关的神经活动可以通过利用大脑中运动处理的对侧组织来分离。具体而言,通过从反应手对侧的电极位点记录的数据减去在反应手同侧的电极位点记录的数据来分离 LRP。这产生了与准备运动反应有关的活动。与 ERN 不同,LRP 是一个相对较小的成分(通常为 1-4 μV) ,通常使用平均每只反应手 50-100次试次来量化。
2.2 参加者
40 名年龄在 18 - 30 岁之间的大学生,颜色感知正常,无神经损伤或疾病史(25 名女性)。在这 40 名参与者中,8 名参与者被排除在 ERN 分析之外,因为他们的干净错误试次太少(< 16) ;剩下 32 名参与者中1 名参与者因为错误率超过 50% 而被排除在 LRP 分析之外,因此只剩下39 名参与者。该研究得到了加州大学戴维斯分校审查委员会的批准,并且参与者获得了金钱报酬。
2.3 刺激与任务
参与者完成了 Eriksen fanker任务的修改版本刺激显示示例如图 1a 所示。每个试次由一组五个箭头刺激组成,在浅灰色背景上以黑色呈现200毫秒。两侧的箭头要么指向相同的方向(一致性实验) ,要么指向相反的方向(不一致性实验)作为目标刺激,产生四组刺激:<<<<<, >>>>>, <<><<和>><>>。参与者完成了400个试次。
2.4 脑电图记录及处理
使用 Biosemi Active-Two 记录系统(Biosemi b.v.,荷兰阿姆斯特丹)记录连续脑电图。使用国际 10/20 系统。
在MATLAB中使用EEGLAB工具箱(Delorme & Makeig, 2004)和ERPLAB工具箱(Lopez-Calderon & Luck, 2014)进行信号处理和分析。脑电图被降采样到256 Hz,高通滤波器的截止频率为0.1 Hz(非因果Butterworth脉冲响应函数,半幅截止频率,12 dB/oct roll-off)。部分包含大肌肉伪影或极端电压偏移(由半自动ERPLAB算法识别)的脑电图被删除。然后对每个参与者进行独立成分分析(ICA),通过视觉检查波形和成分的头皮分布来确定并去除明显与眨眼相关的成分。ICA校正后的脑电数据分割如下。对于ERN,试次在反应开始前600毫秒开始,并在反应后400 ms继续进行;在反应开始前使用-400到-200 ms窗口进行基线校正。对于LRP,试次从刺激开始前200 ms开始,到刺激后800 ms;在刺激开始前200 ms进行基线校正。
图1 (a)修改后的Eriksen flanker 任务刺激显示示例。(b)电极记录montage

为了分离ERN,将正确的试次和错误试次分别平均,并产生差异波。LRP 是对侧减去同侧所得的差异波。LRP在 C3/4 电极上,以 300-500ms的平均振幅作为差异波测量振幅。

2.5 Monte Carlo分析
我们进行了三组模拟实验。对于每一个,Monte Carlo分析被用来模拟大量的实验,通过从我们的数据集中随机抽取试次和参与者的子集。模拟次数为1,000次。
3 结果
图3 ERN波形。

(a)在电极 Fz 处的错误和正确试次,反应锁定的全脑平均 ERP 波形。

(b)反应锁定全脑平均差异波(错误减去正确试次)。在绘图前采用低通滤波器。

(c)在电极 Fz 处的错误和正确试次,反应锁定的全脑平均 ERP波形,平均值的标准误差用阴影线表示。

(d)去除 ERP 信号但留下噪声的LRP。

3.1.1 ERN
图3a显示了正确和不正确试次的ERP波形,包括ERN分析中所有参与者的平均(N=32);错误-正确的差异波形如图3b所示。与较多ERN文献一致,错误响应比正确响应引起了更大的负偏转,在响应开始之前不久开始,并在响应后持续约100毫秒。配对t检验表明差异显著。错误平均振幅-正确平均振幅的差值为-8.02 μV (SEM = 0.93)。图3c显示平均值的平均标准误差。即,计算每个参与者在每个ERP波形的每个时间点的试次平均值的标准误差,然后在所有参与者中求平均值。
为更直观地显示噪声水平,采用正负平均法。即,在ERN分析中,每个参与者的所有无伪迹试次都被分成两组进行平均,一组为奇数试次的平均值,一组为偶数试次的平均值。然后从每个参与者的偶数错误试次的波形中减去奇数错误试次的平均波形。这有效地消除了ERP信号,但留下了噪声(图3d)。
3.1.2 LRP
图4a显示了LRP分析中所有参与者的对侧和同侧平均波形(N=39),对侧-同侧差异波形如图4b所示。与以往的LRP研究一致,反应手对侧电极位置的活动比反应手同侧电极位置的负电压偏转更大,这种效应在刺激发作后约300-500 ms出现。配对t检验表明差异显著。对侧平均减去同侧平均振幅差值为 -1.31μV (SEM=0.12)。图4c显示了平均值的平均标准误差,图4d显示了正负平均值作为可视化噪声的手段。
图4 LRP波形。
(a)刺激锁定的电极C3 /C4的ERP。
(b)对侧减去同侧的刺激锁定的差异波。
(c)刺激锁定的对侧和同侧电极C3 /C4,淡色的线表示标准误。
(d)删除了ERP的LRP,留下了噪音。
3.2 内部可靠性
为评估 ERN 和 LRP 作为试次数量和样本量函数的内部可靠性,计算了Cronbach’s alpha系数。即,对于每个参数的组合我们计算了每个参与者的Cronbach’s alpha系数,然后在所有 1000 个模拟实验中,对每个试次数量和样本大小的组合取平均值。结果见图 5。这些结果重复了以前的研究,并且获得了高内部可靠性(Cronbach’s alpha值为 0.7-0.9),8个试次足以用于 ERN,45个试次足以用于 LRP。然而,本研究的目的是确定是否通过增加超出这一水平的试次数量来提高统计效力,这一点将在以下各节中讨论。

图5 (a)在蒙特卡罗模拟中,电极Fz的 ERN 的内部可靠性作为试次数的函数,由 Cronbach’s alpha 测量。

(b)在蒙特卡罗模拟中, C3/4 的LRP的内部可靠性作为试次数和样本量的函数,由 Cronbach’s alpha 测量。两个面板都显示了我们在蒙特卡罗分析中测试的最大样本量 n=32。Cronbach’s α 值大于 0.9 表示内部可靠性良好(高内部可靠性在 0.7-0.9 之间,中等内部可靠性在 0.5-0.7 之间,低内部可靠性在 0.5 以下)。

3.3 获得统计学显著的 ERP 效应的概率
我们的第一组蒙特卡罗分析评估了检测出显著的 ERN 或 LRP (这是评估试次数量的“低门槛”)的可能性。随后的分析将集中在检测 ERP 和 LRP 幅度的组内或组间差异。我们模拟了不同数量的试次和参与者的数量。在我们的 ERN 分析中,我们模拟了6、8、10、12和14个无伪迹的试次,以及所有可用的错误试次(平均值:50.29; 范围: 16-87)。对于 LRP 分析,我们模拟了30、45、60、75和90个无伪迹试次,以及所有可用试次(范围:91-195)。对于每个数量的试次,我们模拟了12, 16, 20, 24, 28和32名参与者的实验。
3.3.1 ERN
图 6a 显示了获得显著的 ERN 的概率(即错误试次和正确试次之间的振幅非零差异)作为错误试次平均值中试次数的函数。正确的试次平均值包括所有可用的试次(因为正确试次的数量通常很大,所以对结果没有意义)。即使少量试次和被试也可以确定错误和正确试次的ERN幅度是否存在差异的统计效力也非常高。因此这些因素的变化对统计效力的影响很小(天花板效应)。然而,很少有研究的目的是简单地确定 ERN 在错误试次和正确试次之间是否存在差异,因此这些发现并不表明大多数实验可以使用最少数量的试次和参与者。
3.3.2 LRP
图 6b 显示了获得显著 LRP (活动对侧与同侧反应之间的差异)的可能性作为试次数量和样本大小的函数。与ERN 一样,对于这种简单的比较,统计功效存在天花板效应,因此改变试次数和参与者的数量几乎没有影响。
如果您对脑电,眼动,近红外等数据处理课程及服务,可浏览以下链接(可添加微信号siyingyxf或18983979082获取原文,另思影提供免费文献下载服务,如需要也可添加此微信号入群):
脑电及红外、眼动:
北京:

第二十八届脑电数据处理中级班(北京,6.20-25)

第十届眼动数据处理班(北京,6.27-7.2)
第十三届近红外脑功能数据处理班(北京,7.18-23)

第三十届脑电数据处理中级班(北京,8.5-10)

第四届脑电机器学习数据处理班(北京,8.11-16)
上海:
第三届脑电机器学习数据处理班(上海,6.25-30)

第十二届近红外脑功能数据处理班(上海,6.15-20)

第九届脑电信号数据处理提高班(上海,7.8-13)

第二十九届脑电数据处理中级班(上海,7.16-21)

第十七届脑电数据处理入门班(上海,8.1-6)

重庆:

第十五届脑电数据处理入门班(重庆,7.12-17)

第十四届近红外脑功能数据处理班(重庆,8.14-19)

数据处理业务介绍:

思影科技EEG/ERP数据处理业务
思影科技脑电机器学习数据处理业务

思影科技近红外脑功能数据处理服务

思影数据处理服务六:脑磁图(MEG)数据处理
思影科技眼动数据处理服务
招聘及产品:
招聘:脑影像数据处理工程师(上海,北京)
BIOSEMI脑电系统介绍
目镜式功能磁共振刺激系统介绍

3.4 在被试间实验中检测显著效应
接下来进行了模拟实验,每个参与者在两种条件下进行测试,以评估发现参与者内部条件差异的可能性。这些模拟类似于,例如,在低和高情绪唤起条件下,同样的参与者同时经历低和高情绪唤起条件下ERN振幅的差异。为了模拟一个已知的ERN大小的影响,随机将每个参与者的错误试次分成两组,每组8个错误(每组8个错误是可能的最大值,因为一些参与者只有16个无伪迹的错误试次)。为了在16个试次中模拟这种效应,使用bootstrap法。
在这些模拟中,假设所有参与者对实验操作的反应相等,并且所有的方差都是由于(a)有限数量的试次的平均,以及(b)与条件无关的 ERN 幅度个体差异的结果。在现实的实验中,个体对实验操纵的反应也会产生一些差异。然而,当试次数量很少时,大部分的变异可能来自于单试次 EEG 数据中的噪声,而这些噪声并没有被消除。
用1,2,3,4,5,6和 7μV 的 ERN 波幅在不同条件下的差异来模拟实验。对于每个模拟实验,两种情况下的错误试次在振幅上的差异就是这个数量,我们确定观察到的差异是否具有统计学意义(仅比较两种情况下的错误试次)。然后,随机选择了不同的试次和参与者,这个程序重复1000次,以便我们能够估计在给定数量的试次和参与者的条件之间获得显著差异的可能性。
对于 LRP,进行了一个类似的分析,将每个参与者的试次随机分成两组,每组 45 个试次或两组 90 个试次(取样替换) ,并计算每个对侧减去同侧差异以模拟两种不同的 LRP 条件。这些模拟类似于检查例如flanker任务中一致和不一致试次之间 LRP 幅度的差异的实验。电压从 C3/4 电极 300-500 ms 的平均振幅中减去,两个LRP条件之间的模拟差值分别为0.25,0.5,0.75,1.0,1.25,1.5和1.75μV。然后,进行统计学比较,以确定两个模拟条件之间的差异波幅是否显著不同。
在ERN和LRP分析中,评估了12名、16名、20名、24名、28名和32名参与者的样本量。因此,我们改变了试次的数量,参与者的数量以及不同条件下差异量的大小。

图6(a)在蒙特卡罗模拟中获得显著 ERN 的概率(ERP 在错误与正确试次之间的差异)作为试次次数和样本大小的函数。

(b)在蒙特卡罗模拟中获得显著的 LRP (对侧与同侧 ERP 波形之间的差异)作为试次次数和样本大小的函数的可能性

3.4.1 ERN
图 7 显示了在两个条件(即统计效力)之间获得ERN幅度的统计学显著性差异的概率,这种差异与试次的数量、参与者的数量和条件差异的大小有关。所有三个因素都互相影响获得显著结果的可能性。每个条件有16个试次,统计效力很高(大于0.8),只要实验效果至少是3μV,与参与者的数量无关。然而,在每个条件只有8个试次的情况下,检测3μV效应的能力随着参与者人数的增加而显著增加,只有当实验包括32个参与者时才达到0.8。对于一个通常的的20个参与者实验中,检测这个3μV效应的能力从8个错误试次的大约0.5上升到16个错误试次的大约1.0。同样,对于一个相对较大的32个参与者,检测稍微小一点的2μV效应的能力从大约0.4 (8个错误试次)上升到大于0.9(16个错误试次)。因此,在某些情况下,试次数量加倍可以将统计效力提高一倍以上。条件之间的差异很小(但非常合理),每个参与者只有8个错误试次,检测条件之间差异的效力很低,并且随着参与者人数从12人增加到32人而逐渐增加。这表明,每个参与者只有8个错误试次,需要非常大量的参与者来可靠地检测ERN幅度的小差异。然而,当实验包括每个参与者16个错误试次时,检测1μV效应的能力随着参与者人数的增加而稳步上升,这表明在实际参与者人数中可以达到合理的统计效力水平。因此,尽管8个试次足以获得高水平的内部可靠性(Cronbach’s alpha > 0.7),并且足以产生可接受的统计效力水平,用于检测ERN幅度的非常大的条件间差异,但将试次数目增加到16个,显著提高了检测ERN幅度中小尺寸差异的统计效力。更广泛地说,统计效力是由试次次数,参与者人数和条件间幅度差异的大小交互决定的。

图 7 在蒙特卡罗模拟条件差为 1-7μV 的实验中,获得两种条件之间 ERN 幅度的显著参与者内差异的概率,作为试次次数和样本大小的函数。请注意,对于这个分析,样本量绘制在 x 轴上。

3.4.2 LRP
图 8 显示了根据试次次数、参与者人数和模拟条件之间差异的大小,在两种条件之间获得 LRP 振幅统计学上显著差异的可能性。结果与图 7 所示的ERN 结果紧密平行,所有三个因素相互作用以确定统计效力。1.5-1.75 μV 的效应大约是 LRP 振幅的两倍,无论实验是否包括45或90个试次,即使只有12个参与者,检测效应的能力都接近上限。然而,在一定条件下(例如,当模拟实验涉及20名参与者,而实验条件的差异为0.5μV)。因此,增加试次次数超过实现较高内部可靠性所需的次数,会导致检测LRP振幅中小差异的统计效力大幅增加。

图8 在实验条件差为 0.25-1.75μV 的蒙特卡罗模拟中,两种条件之间 LRP 振幅在参与者内部取得显著差异的概率随试次次数和样本大小的变化而变化。请注意,对于这个分析,样本量绘制在 x 轴上。

3.5检测组间差异
为了评估在 ERN 和 LRP 中发现组间差异的可能性,进行了第三组蒙特卡罗分析。为了模拟 ERN 大小的参与者之间的差异,我们将样本随机分成每组16 名参与者。为了模拟每组 32 名参与者的更大样本量,我们使用 bootstrap 方法,将我们的样本随机分为两组,每组 32 名参与者,从 32 名有用的参与者中进行替换抽样。同样,这是一个经过充分验证的方法,提供了一个很好的近似抽样,而不需要从无限的参与者群体中进行替代。为了模拟两组间 X μV 的差异,我们模拟了组间差异幅度为1,2,3,4,5,6和7μV的实验。LRP 的类似模拟使用 0.25, 0.5, 0.75, 1.0, 1.25, 1.5和 1.75 μV 的差值,在每个参与者的平均对侧-负同侧差值上加上或减去适当的电压,然后将得到的差值提交统计学分析。对于ERN,我们用 6,8,10,12,14 个错误试次和所有可用的错误试次来模拟实验。对于LRP,我们模拟了30, 45, 60, 75, 90个试次和所有可用试次的实验。试次数量的变化与参与者数量的变化(每组16或32人)以及组间幅度差异的变化相结合。
3.5.1 ERN
图 9 显示了获得组间 ERN 幅度(统计效力)的统计学显著性差异的概率与无伪迹试次次数、参与者人数和组间差异的大小成函数关系。所有三个因素相互作用以确定统计效力。每组 16 名参与者,随着试次次数的增加,统计效力缓慢但稳定地增加。每组32人参与者的效力接近上限,组间的极大差异波幅6-7 μV,与试次数无关。组间差异若为中等,则统计效力缓慢但稳定随着试次数增加而增加,而对组间差异极小的情况而言,统计效力接近下限而与试次数无关。
图9 在蒙特卡罗模拟实验中获得两组之间 ERN 幅度显著差异的概率作为差异量的大小和样本大小的函数,组间差异为 1-7 μV。
3.5.2 LRP
图 10 显示了组间 LRP 幅度差异的统计效力,这种差异与试次次数、参与者人数和组间差异的大小有关。如图8 所示的参与者内部模拟所观察到的,在组间模拟中,这些因素之间存在实质性的相互作用。当组间差异很小或很大时,随着试次次数或参与者人数的增加,效力分别保持在最低限度或最高限度。然而,对于中等组间差异,随着试次或参与者的数量增加,效力大大增加。例如,当每组包含 32 名参与者时,随着试次数量的增加,检测 0.5μV 组间差异的能力显著增加。此外,当试次次数增加到 0.75 μV 或更高时,每组 32 名参与者的统计效力迅速饱和,而当试次次数增加到 0.5-1.25 μV 时,每组 16 名参与者的统计效力稳步增加。

图10 在 0.25-1.75 μV 的蒙特卡罗模拟实验中,两组间 LRP 振幅有显著差异的概率与差异的大小和样本大小成函数关系

4 结论
总的来说,这些分析表明了几个因素如何影响 ERP 研究中的统计效力,包括试次数量、样本大小和影响程度,以及这些因素之间的交互作用。这些结果提供了明确的证据,即对于研究需要多少试次的问题,没有单一的答案。
There is no single answer to the question of how many trials are needed in an ERP study.
虽然对于一个特定的 ERP 实验应包括多少个试次这个问题没有简单的答案,但本研究的确得出两个实际结论。
首先,除非效力接近地板或天花板,否则增加试次次数几乎总是会显著增加统计效力。在 ERN 实验的8 个试次或 LRP 实验的 45 个试次中,对于大多数实验设计用来探测的效应量,统计效力不会饱和。因此,如果这样做的成本很低,通常值得增加试次数量。
其次,在参与者内部设计中,通过增加试次次数可以增加效力的程度似乎大于组间设计。在参与者内部研究中,增加试次数量往往是值得的(假设这不会导致疲劳或其他可能降低数据质量的因素)。然而,在组间的研究中,增加试次的数量可能只有很小的影响,增加参与者的数量可能是增加效力的更有效的方法。例如,我们发现,在许多情况下,参与者内部模拟的试次数量翻倍,统计效力翻倍,但参与者数量翻倍的影响通常较小。相比之下,增加参与者的数量通常比在我们的组间模拟中增加试次的数量具有更大的影响。
还有一些额外的因素在本研究中没有检查,这些因素也可能影响给定研究的最佳试次数量和样本大小,包括数据质量、实验范式和参与者人口学信息。因此,尽管我们的模拟提供了对特定数量的试次、参与者数量和效应量所能达到的统计效力的估计,但我们提醒研究人员不要将这些特定值外推到其他在数据质量、范式和参与人群方面存在差异的研究中。
如需原文及补充材料请添加思影科技微信:siyingyxf18983979082获取,如对思影课程及服务感兴趣也可加此微信号咨询。另思影提供免费文献下载服务,如需要也可添加此微信号入群,原文也会在群里发布,如果我们的解读对您的研究有帮助,请给个转发支持以及右下角点击一下在看,是对思影科技莫大的支持,感谢!
微信扫码或者长按选择识别关注思影
非常感谢转发支持与推荐

欢迎浏览思影的数据处理业务及课程介绍。(请直接点击下文文字即可浏览思影科技所有的课程,欢迎添加微信号siyingyxf18983979082进行咨询,所有课程均开放报名,报名后我们会第一时间联系,并保留已报名学员名额):

脑电及红外、眼动:
北京:

第二十八届脑电数据处理中级班(北京,6.20-25)

第十届眼动数据处理班(北京,6.27-7.2)
第十三届近红外脑功能数据处理班(北京,7.18-23)

第三十届脑电数据处理中级班(北京,8.5-10)

第四届脑电机器学习数据处理班(北京,8.11-16)
上海:
第三届脑电机器学习数据处理班(上海,6.25-30)

第十二届近红外脑功能数据处理班(上海,6.15-20)

第九届脑电信号数据处理提高班(上海,7.8-13)

第二十九届脑电数据处理中级班(上海,7.16-21)

第十七届脑电数据处理入门班(上海,8.1-6)

重庆:

第十五届脑电数据处理入门班(重庆,7.12-17)

第十四届近红外脑功能数据处理班(重庆,8.14-19)

磁共振:
上海:

第十六届脑影像机器学习班(上海,7.23-28)

第十八届DTI数据处理班(上海,7.2-7)

第十届任务态功能磁共振数据处理班(上海,8.12-17)

第二十一届脑网络数据处理班(上海,8.20-25)

北京:

第十四届磁共振脑影像结构班(北京,7.10-15)

第四十四届磁共振脑影像基础班(北京,7.29-8.3)

第十九届DTI数据处理班(北京,8.19-24)

第一届任务态fMRI提高班(北京,8.25-30)

第十七届脑影像机器学习班(北京,9.3-8)

南京:

第四十三届磁共振脑影像基础班(南京,7.1-6)

第二十二届磁共振脑网络数据处理班(7.16-21)

第九届磁共振ASL数据处理班(南京,8.5-8)

数据处理业务介绍:

思影科技功能磁共振(fMRI)数据处理业务
思影科技弥散加权成像(DWI/dMRI)数据处理
思影科技脑结构磁共振成像数据处理业务(T1)
思影科技啮齿类动物(大小鼠)神经影像数据处理业务
思影数据处理业务三:ASL数据处理
思影科技脑影像机器学习数据处理业务介绍
思影科技EEG/ERP数据处理业务
思影科技脑电机器学习数据处理业务

思影科技近红外脑功能数据处理服务

思影数据处理服务六:脑磁图(MEG)数据处理
思影科技眼动数据处理服务
招聘及产品:
招聘:脑影像数据处理工程师(上海,北京)
BIOSEMI脑电系统介绍
目镜式功能磁共振刺激系统介绍
此处给个“在看”及“点赞”,让更多朋友关注思影
(0)

相关推荐