R语言中的神经网络预测时间序列：多层感知器（MLP）和极限学习机（ELM）数据分析报告

2024-05-06 08:30:01

原文链接：http://tecdat.cn/?p=23485

用于R语言的多层感知器（MLP）和极限学习机（ELM）进行时间序列预测。请注意，由于神经网络无法利用GPU处理，因此大型网络的训练速度往往很慢。与现有神经网络实现的不同之处在于，R可以自动设计具有合理预测性能的网络。这增加了神经网络的鲁棒性，但也有助于减少训练时间。

使用MLP进行预测

使用R软件包，您可以生成外推（单变量）预测，也可以包含解释变量。

单变量预测

最简单的形式，您只需输入要建模的时间序列。

fit1 <- MLPfit(Air)
print(fit1)

输出表明结果网络具有5个隐藏节点，对其进行了20次训练，并使用中位数运算组合了不同的预测。自动生成网络集合，其训练从不同的随机初始权重开始。此外，它提供了网络中包含的输入。

可以使用plot() 获得直观的摘要。

plot(fit1)

灰色的输入节点是自回归，而洋红色的则是确定性输入（在这种情况下为季节性）。如果包括任何其他回归变量，它们将以浅蓝色显示。

该 MLP() 函数接受几个参数来微调生成的网络。该 hd 参数定义了固定数量的隐藏节点。如果是单个数字，则神经元排列在单个隐藏节点中。如果是矢量，则将它们排列成多层。

fit( hd = c(10,5))

稍后我们将介绍如何自动选择节点数。根据我的经验（以及来自文献的证据），预测单个时间序列的常规神经网络无法从多个隐藏层中获得更好效果。预测问题通常并不那么复杂！

reps 定义了使用多少次训练重复。如果您想训练一个单一的网络，则可以使用 reps=1，有大量结果证据表明这样效果一般。默认值 reps=20 是训练速度和性能之间的折衷，但是您可以承受的重复次数越多越好。当重新训练网络时，它们不仅有助于模型的性能，而且还有助于结果的稳定性。

lags 允许您选择网络考虑的自回归滞后。如果未提供此参数，则网络使用lag 1到lag m，即序列的季节。

lags=1:24

keep=c(rep(TRUE,12), rep(FALSE,12)))

lags=1:24, sel.lag=FALSE

在第一种情况下，滞后（1,2,4,7,8,9,10,11,12,13,18,21,23,24）被保留。在第二种情况下，保留所有1-12，其余13-24被测试是否保留。

神经网络在建模趋势方面并不出色。因此，在对趋势进行建模之前将其消除是很有用的。这由参数处理 difforder。如果 difforder=0 不执行任何差分。对于 diff=1，执行一阶差分。同样，如果 difforder=12 执行12阶差分。如果时间序列是具有季节性周期12的季节性序列，则这是季节性差异。

您可以同时执行 difforder=c(1,12) 或执行任何其他差分。如果 difforder=NULL 然后代码自动决定。如果存在趋势，则使用一阶差分。该序列还经过季节性测试。如果存在，则使用Canova-Hansen检验来确定这是确定性的还是随机的。如果是后者，则还会添加季节性差分。

确定性季节性可以使用季节性虚拟变量更好地建模。

隐藏的节点数可以使用参数预设。默认情况下，这使用验证样本（时间序列的20％）进行测试，或 type="cv" 使用5倍交叉验证。

auto.type="valid",hd.max=8

鉴于训练神经网络非常耗时，因此你可以重用已经指定/经过训练的网络。在以下示例中，我们将重用 fit1 到新的时间序列。

fit(x, model=fit1)

保留了的模型参数 fit1。如果您只想使用参数，但要对网络进行训练，则可以使用参数 retrain=TRUE。

观察两个设置之间的样本内MSE的差异。

最后，您可以使用省略号将参数直接传递给用于训练网络的函数 ...。

要生成预测，我们使用函数forecast()，该函数需要训练的网络对象和预测范围 h。

print(frc)

plot(frc)

预测图以灰色提供了所有集合的预测。

使用回归预测

让我们假设我们要使用确定性趋势来预测时间序列。首先，我们构造输入，然后对序列建模。

z <- 1:(length()+24) # 我为预测增加了24个额外的观测值
z <- cbind(z) # 把它转换成一个列数
# 添加一个滞后0的回归因子，并强制它留在模型中
difforder=0) # 不要让mlp()来删除随机趋势

输出反映了包含回归变量。这在带有浅蓝色输入的网络图中反映出来。

plot(fit4)

为了包括更多的滞后，我们扩展了 xreg.lags：

difforder=0,xreg=z,xreg.lags=list(1:12)

观察到网络中未包含任何变量。我们使用 xreg.keep 来强制包含这些变量。

difforder=0,xreg=z,xreg.lags=list(1:12),xreg.keep=list(c(rep(TRUE,3),rep(FALSE,9)

显然，神经网络不喜欢确定性趋势！如果我们强制执行，它只会保留它。为此，我将尝试tsutils 包。

zz <- cbind(z, 0)
zz\[loc,2\] <- 1
fitxreg.lags=list(c(0:6),0),xreg.keep=list(rep(FALSE,7),TRUE)

显然，您可以包含任意数量的回归变量。

为了产生预测，我们使用 forecast() 函数，但现在使用 xreg 输入。方法是从网络训练期间使用的相同观察值开始输入回归变量，并根据需要扩展预测范围。您

frc.reg <- forecast(fit5,xreg=zz)

ELM的预测

使用极限学习机（EML）。默认情况下，ELM从一个非常大的隐藏层（100个节点）开始，并根据需要对其进行修剪。

print(fit6)

plot(fit6)

网络图有一些黑线和一些灰线。后者被修剪。装有20个网络（由参数控制 reps）。每个网络可能具有不同的最终连接。

par(mfrow=c(2,2))
for (i in 1:4){plot(fit6,i)}
par(mfrow=c(1,1))

修剪的方式由参数控制。默认选项是使用LASSO回归（类型=“套索LASSO”）。或者，可以使用“ ridge”进行岭回归，使用“ step”进行逐步OLS，使用“ lm”获得OLS解决方案而不进行修剪。

要进行预测，使用forecast() 。

forecast(fit6,h=12)

时间层次结构

实现时间层次结构mlp和`elm。`

par(mfrow=c(1,2))
plot(thiMLP)
plot(thiELM)
par(mfrow=c(1,1))

这应该使您可以进行神经网络的时间序列预测。

谷歌自锤Attention is all you need：纯注意力并没那么有用，Transform...

机器之心报道编辑:魔王基于注意力的架构为什么那么有效?近期谷歌等一项研究认为注意力并没有那么有用,它会导致秩崩溃,而网络中的另两个组件则发挥了重要作用:「跳过连接」有效缓解秩崩溃,「多层感知器」能 ...
【看文献046】【附代码】对外直接投资能否改善中国的资源错配

白俊红,刘宇英.对外直接投资能否改善中国的资源错配[J].中国工业经济,2018(01):60-78. 随着中国经济进入新常态,粗放式的发展越来越难以为继,要维持中国经济的继续增长必须转向提高资源配置 ...
Transformer是巧合还是必然？搜索推荐领域的新潮流

炼丹笔记干货作者:九羽,四品炼丹师 BERT等Transformer模型在自然语言处理领域大放异彩之后,将Transformer应用在各个领域变成了一种潮流,包括之前文章中介绍的 Image Tra ...
时间序列预处理 | 白噪声检验

TimeSeries 当当当,分享时间序列相关知识 4篇原创内容 Official Account 时间序列的平稳性检验完之后应该做什么呢? 若时间序列非平稳,使用差分等方法想办法将序列平稳化,平稳化 ...
PointNet：三维点云分割与分类的深度学习

本文是关于PointNet点云深度学习的翻译与理解,PointNet是一种直接处理点云的新型神经网络,它很好地体现了输入点云的序列不变性. 相关工作点云特征点云的大多数现有特征都是针对特定任务人工 ...
你了解渐进式DID平行趋势图的几种画法吗？

导读规则: 正文出现红色字体,对应Stata命令: 正文中出现蓝色字体,对应往期链接: do文件中:'//'符号代表作者注释内容,帮助理解:'**'代表分节,便于阅读关键词:coefplot t ...
xtgranger：面板格兰杰因果检验

作者: 曹琳君 (南开大学) 邮箱: linjuncao@yeah.net Source: Juodis, A., Karavias, Y., and Sarafidis, V., 2021. A h ...
java学习——94.序列求和

今天遇到了一个数学里的小问题,就想起来用Java解决一下. 计算: 分析:1也即是1/1,此序列就是分母从1开始,一直到n结束.分子都是1的n项分式之和. 即本序列需要3个变量: i用来表示分母,取值 ...
用R语言中的神经网络预测时间序列：多层感知器和极限学习机

原文链接:http://tecdat.cn/?p=16392 对于此示例,我将对R中的时间序列进行建模.我将最后24个观察值保留为测试集,并将使用其余的观察值来拟合神经网络.当前有两种类型的神经网络可 ...
R语言基于递归神经网络RNN的温度时间序列预测

原文链接:http://tecdat.cn/?p=20335 在本文中,我们将介绍三种提高循环神经网络性能和泛化能力的高级技术.我们演示有关温度预测问题的三个概念,我们使用建筑物屋顶上的传感器的时间数 ...
Prophet在R语言中进行时间序列数据预测

原文链接:http://tecdat.cn/?p=7327 您将学习如何使用Prophet(在R中)解决一个常见问题:预测公司明年的每日订单. 数据准备与探索 Prophet最拟合每日数据以及至少一年 ...
使用R语言随机波动模型SV处理时间序列中的随机波动率

原文链接:http://tecdat.cn/?p=12030 准备数据采样函数svsample需要其输入数据y是数值向量,而且没有任何缺失值(NA),如果提供其他任何内容,则会报错.在y包含零的情况 ...
R语言使用ARIMA模型预测股票收益时间序列

原文链接:http://tecdat.cn/?p=2831 "预测非常困难,特别是关于未来".丹麦物理学家尼尔斯·波尔(Neils Bohr) 很多人都会看到这句名言.预测是这篇博 ...
R语言多元Copula GARCH 模型时间序列预测

原文链接 http://tecdat.cn/?p=2623 和宏观经济数据不同,金融市场上多为高频数据,比如股票收益率序列.直观的来说 ,后者是比前者"波动"更多且随机波动的序列 ...
R语言中的时间序列分析模型：ARIMA-ARCH / GARCH模型分析股票价格

原文链接:http://tecdat.cn/?p=18860 简介时间序列分析是统计学中的一个主要分支,主要侧重于分析数据集以研究数据的特征并提取有意义的统计信息来预测序列的未来值.时序分析有两种方 ...
R语言用ARIMA模型预测巧克力的兴趣趋势时间序列

原文链接:http://tecdat.cn/?p=18850 在本文中我们对在Google趋势上的关键字" Chocolate "序列进行预测.序列如下 > report = ...
R语言中的偏最小二乘回归PLS-DA

原文链接:http://tecdat.cn/?p=8890 主成分回归(PCR)的方法本质上是使用第一个方法的普通最小二乘(OLS)拟合来自预测变量的主成分(PC).这带来许多优点: 预测变量的数量 ...