预测的神经网络方法

用于时间序列分析的大多数方法，如勃克斯-詹金斯（Box-Jenkins ）方法均假设各变量之间是一种线性关系，这种局限性使其在实际应用过程中很难准确地进行分析和预测。在过去的十多年中，一些学者注意到这种局限性并提出了一些非线性时间序列模型，如H. Tong和K. S. Lim提出的阈值自回归模型等，这些方法均属于模型驱动的方法，即首先辩识出各数据间的关系，然后再估计模型参数。近年来，神经网络模型作为一种非线性模型被用来研究预测问题，由于其自身的特性，神经网络模型属于数据驱的方法。目前，神经元网络模型已成功地应用于许多领域，诸如经济预测、财政分析、贷款抵押评估和矿产预测等许多经济领域。将神经元网络应用于预测领域，总的来说有两种方式：直接预测和非直接预测。

1）直接预测

这种方式是利用神经元网络的非线性特性去逼近一个时间序列或者一个时间序列的变型，通过神经元网络清晰的逻辑关系，利用过去时刻的值去表达未来时刻的值，即

~X (t +1) =θ(X (t ), X (t -1), , X (t -n ))

利用神经元网络来研究预测问题，一个很大困难就在于如何确定网络的结构，具体地讲，就是如何确定隐层的节点数。当隐层节点数太少时，预测的精度无法得到保证；太多时，网络在训练过程中又容易陷入局部极小点。因此，在不减少网络性能的前提下，选择一个最佳的网络结构成为网络设计的关键。不少学者在这方面进行了一些研究，提出了一些方法，从总体上看，这些方法可分为4类。

（1）特定方法

采用这种方法时，分析设计人员通常对所要处理的问题有比较清晰的概念，网络的结构由过去的经验主观地来决定。采用这种方法的一个理由是神经元网络具有较强的鲁棒性，即网络的性能通常不会受网络结构的影响。然而，尽管神经元网络模型在某种程度上对某些问题具有很好的鲁棒性，但网络的结构通常会对网络的性能造成影响，这也是这种方法的缺陷。

（2）动态方法

与特定方法不同，动态方法是在网络训练过程中根据系统误差动态地增加或减少网络隐层节点的数目，直到系统的误差不再改变为止。典型的这类方法有：S. E. Fahlman和C. Lebiere 等人提出的级联相关法；A. S. Weigend等人提出的权消去法；S. J. Hanson, L. Y. Pratt和Y . Chauvin等人提出的扩展权消去法。这里简要介绍一下权消去法。权消去法的思想是利用代价函数来确定网络的最佳结构，代价函数的形式为

2C =∑(targetk -prediction k ) +λ∑k i , j (ωij /ω0) 2(ωij /ω0) 2

式中，第二项可看作惩罚项；ωij 为权值；λ和ω0为任选参数；当网络达到最佳结构时，代价函数C 取得最小值。这种方法的优点是不需要测试不同的网络结构和参数，缺点是由于惩罚项的引入，可能会造成系统丢失一些有用信息。

（3）分布函数法

分布函数法是找到系统的一个分布函数并通过这个函数导出一个统计量以测量网络性能并最终确定网络结构。D. B. Fogel提出的方法就属于分布函数法。在人输入到最终节点是正态分布的假设下，Fogel 采用最终信息统计量（FIS ）来测量网络性能。为了选择隐层节点的最佳节点数，网络设计者需计算每一个可能网络的FIS ，其中具有最小FIS 值的网络为最佳网络。从这个过程可以看出，这类方法的一个缺陷就是计算量较大，为了选择最优网络结构，需要计算一大类网络的FIS 值。

（4）其他方法

除了上述提到的方法外，还有一些学者提出了一些确定网络结构的其他方法。J. Sietsma 和R. J. Dow提出了切去法，这种方法的思想是切去网络中具有最小权值的节点，然而由于网络的复杂性，那些具有小权值的节点有可能对网络的性能造成很大的影响，这也是这种方法在实际使用时效果不佳的原因；S. Y. Kung和J. N. Hwang提出了代烽投影法（AP ），其思想是检验训练数据集合的规律性并以此确定网络的结构；R. P. Brent采用决策树的方法来确定网络的结构；Y . R. Park等人则采用主成分分析法（PCA ）来优化网络结构。从以上可以看出，不少学者都在努力寻找确定网络最佳结构的方法，但从实际应用来看，真正取得成功的并不多。在实际应用中，使用最多的仍然是经验法和启发式方法，这种现状同样是由神经元网络的复杂性所造成的。

（5）应用情况

网络结构确定后，接下来的任务就是如何将神经元网络应用于时间序列分析中去。这方面同样有许多学者进行了研究，然而他们的结论却不尽相同。一些研究表明，神经元网络要优于传统的预测方法，而另一些研究却得出了此相反的结论。A. Lapedes和R. Farber 利用神经网络模型去预测两个无序的时间序列，结果表明神经网络模型能学习模仿这类非线性系统，且与传统方法相比，神经网络模型能得到很高的预测精度。A. Lapedes和R. Farber研究的局限性在于他们没有研究包含噪声的时间序列。R. R. Leighton和B. C. Conrath提出了一种自回归反传网络模型，他们的研究表明如果系统的输入是过去的时间序列，则他们的模型与标准的ARMA 差分议程有同样好的效果。Z. Tang等人用不同的数据将神经网络模型与Box-Jenkins 模型进行了比较，结果发现对于短期预测，Box-Jenkins 模型要优于神经网络模型，而对于长期预测，则是神经网络模型要优于Box-Jenkins 模型。还有许多学者也试图利用神经网络模型来进行预测问题的研究，并提出了不同的方法，大多数结果都表明神经网络模型至少与传统的预测方法具有相同的精度，有些甚至超过传统的预测方法。从以上看出，不同的研究结果之间似乎存在着矛盾。

笔者认为，造成这些矛盾的原因与不同的研究采用不同的网络结构有关，此外，数据序列的类型（静态或动态）以及网络结构和时间序列数据间的关系也会对最后的结果产生影响。因此，应针对某一具体问题来评价神经网络模型的好坏，而不能泛泛地将其与传统的预测方法进行比较。在应用方面，目前比较成功的例子是A. Khotanzad等人开发的ANNSTLF （人工神经元网络短期负荷预测器），目前在美国和加拿大有32个电力事业部门在使用ANNSTLF ，而且这个数目还在增加，可以说ANNSTLF 是目前在电力事业部门使用最广泛的神经网络模型。S. Cho等人将神经网络应用于钢铁企业中冷轧机的辊轴压力预测方面，使预测精度提高了305~50%。在经济领域，J. V. Hansen和R. D. Nelson则利用神经网络模型对美国犹他州的年财政状况进行了分析。

2）非直接预测

在非直接预测方面，神经元网络模型可以帮助人们进行组合预测和预测方法的选择。

（1）组合预测

第十一章对组合预测进行了讨论，其中参与组合的各个预测模型间是一种线性关系，然而，当单个预测方法来源于非线性模型或者每一预测方法所基于的条件期望是信息集合的非线性函数时，各预测方法的线性组合并不是最佳的。R. G. Donaldson 和M. Kamstra研究了用人工神经元网络来实现两个预测模型的非线性组合问题，具有如下形式：

F t =β0+∑βj f j , t +∑δi ψ(z t γi )

j =1i =1k p

ψ(z t γi ) =(1+exp[-(γ0, t +γ1, i z 1, t +γ2, z z 2, t )])-1 z j , t =(f j , t -) /S A

k ∈{0, 2}j =1, 2p ∈{0, 1, 2, 3}

式中，和S A 分别为数据样本的均值和偏差；γ，β，δ为待估计的参数。应用结果表明，这种非线性组合预测较线性组合预测更容易发现蕴含于数据样本中的潜在的非线性特性。将神经元网络用于组合预测的另一种方式是以参加组合的预测方法作为神经网络的输入，输出为组合预测结果。S. Cho等人利用这种方法对冷轧机的辊轴压力预测进行了研究，他们分别设计了预测的代用神经网络模型（S-NN ）和较正神经网络模型（C-NN ）。将S-NN ，C-NN 和传统的预测模型按上述方式进行组合，实验结果显示这种方法在提高预测精度的同时，预测模型的可靠性也可大为增加。

（2）预测方法的选择

将神经网络模型用于预测方法的选择主要是利用神经元网络的模式识别能力，这方面的研究相对较少一些。C. H. Chu和D. Widijaja做了这方面的一些工作，他们的方法中包括2类神经网络模型：第一类神经网络模型用于模式识别（DPR ），有6种被要求识别的模式：静态、静态加季节、线性趋势、线性趋势加季节、二

次趋势、二次趋势加季节；第二类神经网络模型用于预测方法的选择（FMS ），网络输入包括被识别出的模式、预测区间（长、中、短期）和预测的长度，输出为被选中的预测方法。这种方法的缺陷是被选的预测方法的种类较少，因而应用范围受到限制。

预测的神经网络方法

1）直接预测

~X (t +1) =θ(X (t ), X (t -1), , X (t -n ))

（1）特定方法

（2）动态方法

2C =∑(targetk -prediction k ) +λ∑k i , j (ωij /ω0) 2(ωij /ω0) 2

（3）分布函数法

（4）其他方法

（5）应用情况

2）非直接预测

在非直接预测方面，神经元网络模型可以帮助人们进行组合预测和预测方法的选择。

（1）组合预测

F t =β0+∑βj f j , t +∑δi ψ(z t γi )

j =1i =1k p

ψ(z t γi ) =(1+exp[-(γ0, t +γ1, i z 1, t +γ2, z z 2, t )])-1 z j , t =(f j , t -) /S A

k ∈{0, 2}j =1, 2p ∈{0, 1, 2, 3}

（2）预测方法的选择

预测的神经网络方法

相关文章