基于ELM和LSSVM的客流量預測模型
作者 張克申1 安俊峰1 孫二杰1 趙帥1 蘆瀟1 盧萌萌2 1.濟南軌道交通集團有限公司(山東 濟南 250000)2.山東勞動職業技術學院(山東 濟南 250000)
本文引用地址:http://www.j9360.com/article/201807/389582.htm張克申(1973),男,工程師,研究方向:自動化。
摘要:涉及一種基于滾動式地鐵人流量混合預測方法,采用的是雙預測算法,雙預測通道的模式;雙預測方法指的是預測用到了ELM神經網絡和LSSVM兩種算法混合組成。雙預測通道指的是采用兩個不同的滾動序列基數進行預測。最后根據不同方式確定權重大小,并且得到混合預測數據模型。
0 引言
地鐵中,客流量分析是一個很重要的領域,客流量的多少直接影響到安全,城市的經濟發展等重要因素。地鐵的客流量多少對乘客的出行有很大的警示作用。
AFC(自動售檢票)系統可以獲得很大的客流量信息,可以進行設置,獲得每分鐘、每小時、每天、每月、每季度、每年的數據信息,并且可以按照車站每類整理,形成龐大的數據信息,信息量的充足和龐大足夠支撐大家去進行分析和預測,并且因為數據量的充足和龐大,可以對感興趣數據進行分類整合,組成想要的數據信息進行研究。
收集大量的客流量數據后,以每半年或者每年為單位作為數據統計,有效地去預測未來五年或者未來十年,甚至未來二十年的數據,對于地鐵線路的規劃,市政建設的布局都有著指導性的作用。
并且現有的預測算法都是針對于已知的數據進行分析和預測,進而研究一種預測方法去預測未知數據是有必要的。目前存在的預測方法是用已知的數據做研究,即知道數輸入數據和輸出數據,進行研究和挖掘,但是往往未來的的輸入數據是未知的,那么帶來預測很大的不方便,但是預測有著很重要的作用。因此針對未知數據的預測是個有力的應用。
本文提出一種基于滾動式地鐵人流量混合預測方法,并且將數據傳遞給AFC系統,由AFC系統來完成相關的預警信號。
1 原理簡介
1.1 ELM神經網絡
ELM是一個神經網絡的形式,結構由輸入層、隱含層和輸出層構成,具有局部記憶模塊和局部反饋連接的前向形式的神經網絡。具有訓練速度快,誤差不大,不容易陷入到局部最優值的特點。
其中帶有m個隱含層節點的ELM的網絡結構式(1)所示:
其中pi、qi是學習參數,ni是連接第i個隱含層節點與輸出層之間的權重,表示的是當輸入是X的時候,第i個隱含層節點的輸出數值。
1.2 LSSVM介紹
LS-SVM和SVM有很重要的聯系和區別,下面有所比較。
(1)優化問題的構造
SVM目標函數采用了誤差因子的一次項,LS-SVM采用了誤差因子的二次項,同時約束條件的先定下,SVM采用不等式約束,LS-SVM采用等式約束形式。
(2)優化問題的求解
SVM求解QP問題中,變量維數和訓練樣本的個數是一樣的,而LS-SVM方法借助求解線性方程組達到了最終的決策函數,在某些方面上降低了求解難度,提高速度。
(3)解的稀疏性
SVM中,需要解決QP問題,目標條件是達到全局最優解,并且,大部分的Lagrange乘子均為0。在LS-SVM方法中,目標函數采取了誤差平方項,約束條件是等式,通過一定的處理方式,把SVM的QP問題轉化成線性問題,因此Lagrange乘子與誤差項成比例關系,但是LS-SVM方法通過對最終求解得到的Lagrange乘子進行排序,同樣的情形下,可以實現解的稀疏性。
2 具體實施過程
2.1 整體構架
本文主要涉及雙通道、雙預測模型,如圖1所示,主要包括以下步驟:
(1)從AFC(地鐵中的自動售票系統)獲得整理出人流量數據。
(2)雙通道預測的過程,具體操作如下:
(a)比如采樣頻率為1,組成序列為A,滾動序列 [A1,A2,A3,..An],預測第(n+1)個數據,然后用預測的結果A(n+1)與原來的序列[A1,A2,A3,..An]組成新的序列[A1,A2,A3,..An,A(n+1)],用新的序列預測第(n+2)個數據。以此類推,得到一個通道的預測數據,此種方式記成通道1。
(b)開始選擇的滾動序列基數是[A2,A3,……An]一共(n-1)個數據,預測第(n+1)個數據,然后用預測的結果A(n+1)與原來的序列[A2,A3,..An]組成新的序列[A2,A3,..An,A(n+1)],用新的序列預測第(n+2)個數據。以此類推,得到一個通道的預測數據,此種方式記成通道2。
值得一提的是,上述的(a)、(b)步驟中選擇的基數不一定是[A1,A2,A3,..An]、[A2,A3,..An]等這樣的數列,也可以采用別的[A2,A3,..An]、[A3,..An]等形式。
(3)進行決策獲得未來預測數據的過程,具體操作如下:
通過上述步驟(2)的(a)、(b)兩個步驟,我們可以得到針對通道1 通道2的兩個預測數據序列。在這里,通道1的預測數據記成[A(n+1),A(n+2)……A(n+m)],通道2的預測數據記成[Ab(n+1),Ab(n+2)……Ab(n+m)];與上述的兩個通道的序列求加權平均作為最后的預測結果,即(w1*[Ab(n+1),Ab(n+2)……Ab(n+m)]+ w2*[A(n+1),A(n+2)……A(n+m)]),其中w1和w2是ELM神經網絡和LSSVM的權重。
2.2 通道預測模型和確定
假設滾動序列 [A1,A2,A3,..An]預測第(n+1)個數據,用ELM得到的結果是AA(n+1),svm預測得到的是AB(n+1),取加權平均數作為第(n+1)個數據的預測結果,記A(n+1)=(AA(n+1)+ AB(n+1))/2),然后用預測的結果A(n+1)與原來的序列[A1,A2,A3,..An]組成新的序列[A1,A2,A3,..An,A(n+1)],用新的序列預測第n+2個數據;用ELM得到的結果是AA(n+2),LSSVM預測得到的是AB(n+2)。那么取加權平均數作為第(n+2)個數據的預測結果,記A(n+2)=(AA(n+2)+ AB(n+2))/2),以此類推。
假設滾動序列 [A2,A3,..An]預測第(n+1)個數據,用ELM得到的結果是AA(n+1),LSSVM預測得到的是AB(n+1),那么取加權平均數作為第(n+1)個數據的預測結果,記A(n+1)=(AA(n+1)+ AB(n+1))/2),然后用預測的結果A(n+1)與原來的序列[A2,A3,..An]組成新的序列[A2,A3,..An,A(n+1)],用新的序列預測第(n+2)個數據;用ELM得到的結果是AA(n+2),LSSVM預測得到的是AB(n+2),取加權平均數作為第(n+2)個數據的預測結果,記A(n+2)=(AA(n+2)+ AB(n+2))/2),以此類推。
通過上述兩個步驟,我們可以得到針對通道1 通道2得到的兩個預測數據序列,在這里通道1的預測數據記成[A(n+1),A(n+2)……A(n+m)];通道2的預測數據記成[Ab(n+1),Ab(n+2)……Ab(n+m)];與上述的兩個通道的序列求加權平均作為最后的預測結果,也就是(w1*[Ab(n+1),Ab(n+2)……Ab(n+m)]+ w2*[A(n+1),A(n+2)……A(n+m)])。其中,w1和w2是ELM神經網絡和LSSVM的權重,其中本文按照2.3的方法,得出的權重w1=0.49,w2=0.51。
2.3 關于權重的確立方法
(1)標準差法確定權重:
本文確定權重的步驟如下:
(1)選取i個數據做訓練,得到真實值和預測值,其中ELM的預測值看成E1,E2,…Ei,LSSVM的預測值看成l1,l2,…li,真實值為R1,R2,…Ri;
(2)按照公式(2),確定ELM和LSSVM的權重w1,w2;
(3)按照公式(4),確定ELM和LSSVM的權重w3,w4;
(4)計算混合模型的誤差平方和,按照公式(5):
(5)
其中按照w1,w2兩種權重得的混合模型的誤差平方和是f1,按照w3,w4兩個權重得到混合模型的誤差平方和是f2。
(5)比較上述步驟f1、f2,如果f1
2.4 預測結果
圖3、圖4、圖5是本文經過編程預測得到的數據結果,分別是通道1、通道2及最終決策的預測結果。
3 結論
采用本文方案與現有技術相比,具有以下的優點和積極效果:
(1)有AFC系統提供相應的客流量數據信息,然后有預測方案進行雙通道預測,預測得到的信息傳遞給AFC系統,并且如果客流量達到很大的高峰時候,進而進行相關的預警信息,由AFC系統提前告知乘客,或許有相關的擁擠預報,請乘客提前選擇交通方式。
(2)本文采用網絡的數據流量進行數據整合和挖掘,對于現有的數據進行整理,然后用這些數據進行對于未來未知的數據進行預測,是一個相當可觀的使用方法。
(3)應用本文方案可以對五年、十年乃至二十年的城市地鐵的人流量進行預測,提前做好規劃,對于地鐵設計和城市布置有著很重要的預測和導向作用。
本文所涉及的方法不是針對現在有的數據進行試驗,而是對未來不知道的數據進行預測和分析,同樣適用于相關的金融市場,比如股票未來的走勢預測、基金的預測、未來人類的壽命預測等具有很大的參考價值和實際意義。
參考文獻:
[1]Zhao Z, Chen Z, Chen Y, et al. A Class Incremental Extreme Learning Machine for Activity Recognition[J]. Cognitive Computation, 2014:1-9.
[2]Bueno-Crespo A, Garcia-Laencina P J, Sancho-Gomez J L. Neural architecture design based on extreme learning machine [J]. Neural Networks, 2013,48:1924 Sunday H, Silver D, Gagvani N, et al. Skeleton based shape matching and retrieval[C].Shape Modeling International, 2003,IEEE, 2003:130-139
[3]熊南,劉百芬.基于自適應粒子群優化LSSVM的網絡流量在線預測[J].計算機應用與軟件,2013,30(9):21-24.
[4]葉美盈,汪曉東,張浩然.基于在線最小二乘支持向量機回歸的混沌時間序列預測[J].物理學報,2005,54(6):2568-2573.
[5]張文金,許愛軍.混沌理論和LSSVM相結合的網絡流量預測[J].計算機工程與應用,2013,49(15):101-104.
[6]Huang G B,Siew C K. Extreme learning machine with randomly assigned RBF kernels[J]. International Journal of Information Technology,2005,11(1):16-24.
[7]李彬,李貽斌.基于ELM 學習算法的混沌時間序列預測[J],天津大學學報, 2011,44(8):701-704.
[8]李海波,鄭秀萍,柴天佑.浮選工藝指標KPCA-ELM 軟測量模型及應用[J].化工學報,2012,33(1):4-8.
[9]周傳世,劉永清.變權重組合預測模型的研究[J].預測,1995,(4),47-48.
[10]王志勇,陳昊鵬.基于組合神經網絡模型的函數逼近方法[J].計算機應用與軟件,2008(7),137-139.
本文來源于《電子產品世界》2018年第8期第64頁,歡迎您寫論文時引用,并注明出處。
評論