国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      基于馬爾科夫狀態(tài)轉移模型的狀態(tài)轉換預測方法及系統(tǒng)與流程

      文檔序號:11865066閱讀:1138來源:國知局
      基于馬爾科夫狀態(tài)轉移模型的狀態(tài)轉換預測方法及系統(tǒng)與流程
      本發(fā)明屬于數(shù)據(jù)挖掘
      技術領域
      ,具體涉及一種基于馬爾科夫狀態(tài)轉移模型的狀態(tài)轉換預測方法及系統(tǒng)。
      背景技術
      :隨著大數(shù)據(jù)時代的來臨,數(shù)據(jù)挖掘及其相關技術得到了越來越多的關注。數(shù)據(jù)挖掘相關技術獲得了長足的進步,各類數(shù)據(jù)挖掘技術的使用加強了人們分析、處理海量數(shù)據(jù)資源的能力。數(shù)據(jù)挖掘是指以某種方式分析數(shù)據(jù)源,從中發(fā)現(xiàn)一些潛在的有用的信息,從而可以找出數(shù)據(jù)中的聯(lián)系和規(guī)律,根據(jù)現(xiàn)有的數(shù)據(jù)指出以后的變化趨勢。數(shù)據(jù)挖掘的應用范圍也變得越來越廣,例如,電商企業(yè)通過對消費者一段時期內(nèi)的訪問和購物記錄數(shù)據(jù)分析,挖掘找出事物之間隱含的聯(lián)系,從而分析消費者可能的偏好,并確定能夠反映消費者的交易意向數(shù)據(jù),能為電商企業(yè)提供強大的決策支持;在金融領域,研究人員對不同的金融數(shù)據(jù)流進行挖掘和分析,預測未來的發(fā)展走勢。金融對象狀態(tài)預測指通過分析歷史信息以及當前狀態(tài)信息,對于對象未來時間可能出現(xiàn)的狀態(tài)進行預測。金融對象狀態(tài)決定了投資策略,順應狀態(tài)的投資策略才能最大化盈利并減小風險;當金融對象在不同狀態(tài)(例如趨勢市和震蕩市)時,投資策略必然是不同的。如果投資者能夠準確判斷市場風格并預測風格轉換,或者說,如果投資者準確判斷金融對象狀態(tài)并預測狀態(tài)轉換的方向,那么投資者就很容易在投資領域搶得先機、擴大收益。所以,金融對象狀態(tài)轉換預測能為投資者提供強大的決策支持,預測其狀態(tài)轉換方向對于投資者做出投資決策尤為重要。當前主流預測方法主要基于時間序列進行預測,從以往狀態(tài)序列中找到一定模式進而推測未來狀態(tài)。由于金融市場存在周期性變化,會發(fā)生市場風格轉換,并影響金融數(shù)據(jù)流,普通的自回歸分析方法要求時間序列平穩(wěn),而在市場風格轉換前后,金融數(shù)據(jù)流時間序列誤差的均值和方差都會變化,不能再用同一個模型進行擬合,需要針對金融數(shù)據(jù)流中對象所處的每個狀態(tài)單獨建模。常用的建模方法是馬爾科夫狀態(tài)轉移模型,它包含了各狀態(tài)下模型參數(shù)、狀態(tài)序列和狀態(tài)轉移矩陣,模型估計更為困難。對此,現(xiàn)有技術主要采用最大似然估計的思路進行參數(shù)估計,需要計算復雜的似然函數(shù),在模型階數(shù)較高時,計算復雜度非常高。此外,在真正得到一個較好的模型之前,市場中對象取多少個狀態(tài),自回歸方程取多少階數(shù),建立幾階馬爾科夫模型,這些都是未知的,需要不斷校驗和調(diào)整模型,一個高效且適應模型階數(shù)變化的解法能顯著提高效率。最后,金融市場風格轉換預測是一種中長期預測,核心在于預測出市場中各對象的狀態(tài),而從市場中獲取金融數(shù)據(jù)流的時間序列包含了大量無效的隨機信息,會影響模型參數(shù)的估計和對市場中各對象狀態(tài)的判斷,還可能導致大量的嘗試仍難以獲得一個滿意的模型。技術實現(xiàn)要素:針對目前存在的金融數(shù)據(jù)流的時間序列所包含的大量干擾信息影響了模型獲取和狀態(tài)判斷、最大似然估計計算復雜度高、以及模型調(diào)整難以實現(xiàn)等問題,本發(fā)明提供一種基于馬爾科夫狀態(tài)轉移模型的狀態(tài)轉換預測方法及系統(tǒng),通過該方法及系統(tǒng)能夠科學合理有效快速地對金融數(shù)據(jù)流進行數(shù)據(jù)挖掘和分析。為解決上述技術問題,本發(fā)明采用以下技術方案:一種基于馬爾科夫狀態(tài)轉移模型的狀態(tài)轉換預測方法,包括以下步驟:1)按時間粒度采樣,獲取若干個采樣時刻的待預測對象的值,構成待預測對象的初始時間序列數(shù)據(jù)流;2)根據(jù)預測周期對待預測對象的初始時間序列數(shù)據(jù)流進行濾波預處理,得到濾波后的時間序列數(shù)據(jù)流,包括:采用離散傅里葉變換將離散的初始時間序列信號數(shù)據(jù)流變換為頻域信號數(shù)據(jù)流;對所獲得的頻域信號進行低通濾波,所述低通濾波的帶寬范圍為2/T~4/T,T為預測周期;采用離散傅里葉反變換將濾波后的頻域信號重構到時域,得到濾波后的時間序列數(shù)據(jù)流;實際應用中,為了得到更好的濾波效果,可以對上述濾波后的時間序列數(shù)據(jù)流進行校驗,根據(jù)需求適當調(diào)整濾波帶寬,重新執(zhí)行步驟2);3)基于所述濾波后的時間序列數(shù)據(jù)流,對所述待預測對象建立自回歸馬爾科夫狀態(tài)轉移模型:yt=a0s+Σd=1padsyt-d+uts---(1)]]>其中,yt為濾波后第t個采樣時刻的待預測對象的值,yt-d為濾波后第t-d個采樣時刻的待預測對象的值;p是自回歸方程的階數(shù),表示前p個采樣時刻的待預測對象的值對當前的待預測對象的值有影響;s表示待預測對象所處的狀態(tài),s=1,…,m,即,待預測對象存在m個狀態(tài);是常數(shù)項;是自回歸項,表示第t-d個采樣時刻的待預測對象的值對當前第t個采樣時刻的待預測對象的值的影響;是隨機誤差項,服從均值為0且方差為的正態(tài)分布;對于不同的狀態(tài),有不同的取值,表示在不同狀態(tài)下符合不同的規(guī)律;4)求取所述自回歸馬爾科夫狀態(tài)轉移模型中各個變量的條件概率密度函數(shù):在給定的條件下,st的概率密度;在給定的條件下,的概率密度;在給定的條件下,的概率密度;(2)在給定的條件下,的概率密度;在給定的條件下,F(xiàn)ir的概率密度;其中,YN為所述濾波后的時間序列數(shù)據(jù)流,YN=(y1,y2,…,yt,…,yN),N為采樣個數(shù);θ為所有待估計的變量集合,θ=(a0,ad,σ2,s,F),ad為m×p的矩陣;s=(s1,s2,…,st,…,sN);F為狀態(tài)轉移概率矩陣,為m階方陣,其中,矩陣元素Fir代表當前狀態(tài)為i時,下一個狀態(tài)為r的概率ρ(r|i);表示去掉st后的條件集合,表示去掉a0后的條件集合,表示去掉后的條件集合,表示去掉σs2后的條件集合,表示去掉Fir后的條件集合;5)對于所述條件概率密度函數(shù)已知的模型,進行吉布斯采樣來調(diào)整模型并估計模型參數(shù),其步驟如下:5.1)給所有未知變量賦初始值θ(0),設采樣次數(shù)k'=1;5.2)對所有變量循環(huán)采樣,即,根據(jù)變量的條件概率密度函數(shù)進行隨機抽樣,將抽樣值作為新一次的采樣值,第k'次采樣值為:s1(k′)←[s1(k′)|YN,θ-s1(k′-1)]s2(k′)←[s2(k′)|YN,θ-s2(k′-1)]...Fir(k′)←[Fir(k′)|YN,θ-Fir(k′-1)]---(3)]]>5.3)設置k'=k'+1,跳回步驟5.2);5.4)重復步驟5.2)和5.3)進行多次采樣,從第λ次開始,取采樣次數(shù)k'=(λ+1,…,λ+ε)的時間序列數(shù)據(jù)流作為一個樣本,取該樣本的均值作為各變量的估計值,并檢驗擬合的相關系數(shù);其中,所述各變量的估計值包括各狀態(tài)下模型參數(shù)、狀態(tài)序列和狀態(tài)轉移矩陣的估計值;5.5)不斷調(diào)整模型的規(guī)模,直至檢驗到所擬合的相關系數(shù)大于0.9,此時,估計出各個采樣時刻待預測對象所處的狀態(tài)、各狀態(tài)下的模型參數(shù)和狀態(tài)轉移概率矩陣;6)由所述模型估計出的待預測對象當前狀態(tài)和轉移概率矩陣,預測所述待預測對象在下個采樣時刻最大概率出現(xiàn)的狀態(tài);7)根據(jù)步驟5)所得的s=1,…,m的不同狀態(tài)下模型參數(shù)和前p個采樣時刻待預測對象的值,計算得到m個模型預測值;將m個模型預測值分別與采集的下個采樣時刻待預測對象的值進行比較,計算所述下個采樣時刻的待預測對象處于各個狀態(tài)的概率,取概率最大的狀態(tài)作為下個采樣時刻的實際狀態(tài);8)根據(jù)所述的下個采樣時刻的實際狀態(tài)和狀態(tài)轉移概率矩陣,預測所述待預測對象在下下個采樣時刻最大概率出現(xiàn)的狀態(tài);9)重復步驟7)和8),不斷更新,實現(xiàn)對于每個采樣時刻的下個采樣時刻的狀態(tài)的預測。同時,本發(fā)明還提供了一種基于馬爾科夫狀態(tài)轉移模型的狀態(tài)轉換預測系統(tǒng),包括:1)采樣單元:用于按時間粒度采樣,獲取若干個采樣時刻的待預測對象的值,構成待預測對象的初始時間序列數(shù)據(jù)流;2)濾波單元:用于根據(jù)預測周期對待預測對象的初始時間序列數(shù)據(jù)流進行濾波預處理,并得到濾波后的時間序列數(shù)據(jù)流,包括:離散傅里葉變換模塊,用于采用離散傅里葉變換將離散的初始時間序列信號數(shù)據(jù)流變換為頻域信號數(shù)據(jù)流;低通濾波器,用于對所獲得的頻域信號進行低通濾波,所述低通濾波器的帶寬范圍為2/T~4/T,T為預測周期;以及信號重構模塊:用于采用離散傅里葉反變換將濾波后的頻域信號重構到時域,得到濾波后的時間序列數(shù)據(jù)流;3)建模單元:用于基于所述濾波后的時間序列數(shù)據(jù)流,對所述待預測對象建立自回歸馬爾科夫狀態(tài)轉移模型:yt=a0s+Σd=1padsyt-d+uts---(1)]]>其中,yt為濾波后第t個采樣時刻的待預測對象的值,yt-d為濾波后第t-d個采樣時刻的待預測對象的值;p是自回歸方程的階數(shù),表示前p個采樣時刻的待預測對象的值對當前的待預測對象的值有影響;s表示待預測對象所處的狀態(tài),s=1,…,m,即,待預測對象存在m個狀態(tài);是常數(shù)項;是自回歸項,表示第t-d個采樣時刻的待預測對象的值對當前第t個采樣時刻的待預測對象的值的影響;是隨機誤差項,服從均值為0且方差為的正態(tài)分布;對于不同的狀態(tài),有不同的取值,表示在不同狀態(tài)下符合不同的規(guī)律;4)條件概率密度函數(shù)計算單元:用于求取所述自回歸馬爾科夫狀態(tài)轉移模型中各個變量的以下條件概率密度函數(shù):在給定的條件下,st的概率密度;在給定的條件下,的概率密度;在給定的條件下,的概率密度;(2)在給定的條件下,的概率密度;在給定的條件下,F(xiàn)ir的概率密度;其中,YN為所述濾波后的時間序列數(shù)據(jù)流,YN=(y1,y2,…,yt,…,yN),N為采樣個數(shù);θ為所有待估計的變量集合,θ=(a0,ad,σ2,s,F),ad為m×p的矩陣;s=(s1,s2,…,st,…,sN);F為狀態(tài)轉移概率矩陣,為m階方陣,其中,矩陣元素Fir代表當前狀態(tài)為i時,下一個狀態(tài)為r的概率ρ(r|i);表示去掉st后的條件集合,表示去掉a0后的條件集合,表示去掉后的條件集合,表示去掉σs2后的條件集合,表示去掉Fir后的條件集合;5)吉布斯采樣單元:用于對所述條件概率密度函數(shù)已知的模型進行吉布斯采樣來調(diào)整模型并估計模型參數(shù),其包括:5.1)初始賦值模塊:用于給所有未知變量賦初始值θ(0),設采樣次數(shù)k'=1;5.2)循環(huán)采樣模塊:用于對所有變量循環(huán)采樣,即,根據(jù)變量的條件概率密度函數(shù)進行隨機抽樣,將抽樣值作為新一次的采樣值,第k'次采樣值為:s1(k′)←[s1(k′)|YN,θ-s1(k′-1)]s2(k′)←[s2(k′)|YN,θ-s2(k′-1)]...Fir(k′)←[Fir(k′)|YN,θ-Fir(k′-1)]---(3)]]>設置k'=k'+1,循環(huán)采樣;5.3)參數(shù)估計模塊:用于對采樣次數(shù)k'=(λ+1,…,λ+ε)的時間序列數(shù)據(jù)流所構成的一個樣本進行取均值處理,將該樣本的均值作為各變量的估計值,并檢驗擬合的相關系數(shù);其中,所述各變量的估計值包括各狀態(tài)下模型參數(shù)、狀態(tài)序列和狀態(tài)轉移矩陣的估計值;5.4)估計輸出模塊:當檢驗到所擬合的相關系數(shù)大于0.9時,將估計出的各個采樣時刻待預測對象所處的狀態(tài)、各狀態(tài)下的模型參數(shù)和狀態(tài)轉移概率矩陣輸出;6)預測模塊:用于由所述模型估計出的待預測對象當前狀態(tài)和轉移概率矩陣,預測所述待預測對象在下個采樣時刻最大概率出現(xiàn)的狀態(tài);以及用于通過以下過程預測所述待預測對象在下下個采樣時刻最大概率出現(xiàn)的狀態(tài):調(diào)用吉布斯采樣單元輸出的s=1,…,m的不同狀態(tài)下模型參數(shù)和采樣單元所獲取的前p個采樣時刻待預測對象的值,計算得到m個模型預測值;并將m個模型預測值分別與采集的下個采樣時刻待預測對象的值進行比較,計算所述下個采樣時刻的待預測對象處于各個狀態(tài)的概率,取概率最大的狀態(tài)作為下個采樣時刻的實際狀態(tài);根據(jù)所述的下個采樣時刻的實際狀態(tài)和狀態(tài)轉移概率矩陣,預測所述待預測對象在下下個采樣時刻最大概率出現(xiàn)的狀態(tài);并用于通過不斷更新實現(xiàn)對于每個采樣時刻的下個采樣時刻的狀態(tài)的預測。本發(fā)明中,在建立自回歸馬爾科夫狀態(tài)轉移模型之前,對采樣的時間序列進行濾波預處理,根據(jù)預測周期決定濾波器濾波范圍,能削弱隨機干擾,清除數(shù)據(jù)中大量無效信息,并使風格轉換的預測周期與數(shù)據(jù)本身的周期更加匹配,顯著有助于模型參數(shù)的獲取和金融市場中各對象狀態(tài)的判斷;并且,使用貝葉斯估計的思想估計模型參數(shù),求取各變量的概率密度函數(shù),將狀態(tài)序列估計和狀態(tài)轉移矩陣估計分開,通過吉布斯采樣仿真進行參數(shù)估計。這種模型解法不需要計算復雜的似然函數(shù),并且隨著模型階數(shù)的變化,只需對概率密度函數(shù)做相應調(diào)整,降低計算復雜度,易于實現(xiàn),能夠顯著提高模型調(diào)整和校驗的效率。通過該方法及系統(tǒng)能夠科學合理有效快速地對金融數(shù)據(jù)流進行數(shù)據(jù)挖掘和分析,從而完成對于下一狀態(tài)轉換的預測,進而預判金融市場中對象的走勢。與現(xiàn)有技術相比,本發(fā)明具有以下有益的技術效果:通過對采樣的時間序列進行濾波預處理,清除數(shù)據(jù)中大量無效信息,過濾掉隨機干擾,并使數(shù)據(jù)周期與狀態(tài)轉換預測周期更加匹配,顯著有助于模型參數(shù)的獲取和金融市場中各對象狀態(tài)的判斷;能夠跟蹤狀態(tài)轉換后參數(shù)的變化,用不同的狀態(tài)模型來表征市場中對象所處的多個狀態(tài),提高了擬合的精確度,克服了現(xiàn)有預測技術中存在的未考慮市場中對象多個狀態(tài)切換時特征參數(shù)的變化的缺點;將狀態(tài)序列估計和狀態(tài)轉移概率估計分兩步,通過馬爾科夫轉移概率矩陣表示可能變化的狀態(tài)方向,并通過吉布斯采樣仿真獲取模型參數(shù),降低了計算復雜度,提高模型獲取效率,減小響應延遲。附圖說明圖1為本發(fā)明基于馬爾科夫狀態(tài)轉移模型的狀態(tài)轉換預測方法的流程圖。圖2為本發(fā)明方法中吉布斯采樣流程圖。具體實施方式下面結合具體實施例,進一步闡述本發(fā)明。應理解,這些實施例僅用于說明本發(fā)明而不用于限制本發(fā)明的范圍。如圖1所示,本發(fā)明的一具體實施例中,一種基于馬爾科夫狀態(tài)轉移模型的狀態(tài)轉換預測方法,包括以下步驟:1)按時間粒度采樣,獲取N個采樣時刻t的待預測對象的值yt(0),構成待預測對象的初始時間序列數(shù)據(jù)流YN(0),即,YN(0)由N個初始采樣點構成,記為:YN(0)=(y1(0),y2(0),…,yt(0),…,yN(0));2)根據(jù)預測周期對待預測對象的初始時間序列數(shù)據(jù)流YN(0)進行濾波預處理,得到濾波后的時間序列數(shù)據(jù)流YN,記為:YN=(y1,y2,…,yt,…,yN);2.1)采用離散傅里葉變換將離散的初始時間序列信號數(shù)據(jù)流變換為頻域信號數(shù)據(jù)流;所述離散傅里葉變換(DFT)公式如下:X(k)=Σn=0N-1x(n)e-j2πknN,k=0,1,2,...,N-1]]>其中,x(n)為采樣點,即x(n)=y(tǒng)N(0);N為采樣點個數(shù),X(k)是頻域中的信號,其頻譜分辨率為2π/N,j是復數(shù)符號;所述快速傅里葉變換可以用FFT算法實現(xiàn),F(xiàn)FT算法通過把DFT矩陣分解為稀疏因子之積來提高計算速度,其中蝶型算法應用廣泛,現(xiàn)成的工具非常多,此處不再贅述;2.2)對所獲得的頻域信號進行低通濾波,以去除高頻信號和保留低頻信號,所述低通濾波的帶寬范圍為2/T~4/T,其中T為預測周期;在獲取的時間序列中,狀態(tài)變化趨勢是低頻信號,隨機噪聲干擾是高頻信號,所以濾波的作用是去除高頻信號干擾;低通濾波的帶寬根據(jù)預測周期決定:假設預測周期為T,采樣序列為等時間間隔采樣,一個周期內(nèi)采樣點數(shù)為NT=2n',采樣頻率記為f0=2n'/T,總采樣點數(shù)為N,傅里葉變換后,頻譜中共有N個頻率分量,頻譜中可用的最高頻率為fmax=f0/2,相鄰頻譜的頻率間隔為△f=f0/N,可見,想濾除更高頻的信號,每個周期內(nèi)的采樣點數(shù)需要越多;假設取定帶寬為2/T,將頻域中高頻分量的幅值置0,得到新的頻譜:X(k)=0k=N2n′-1,...,N/2,...,N/2+N2n′-1]]>2.3)采用離散傅里葉反變換將濾波后的頻域信號重構到時域,完成對時間序列的濾波預處理,得到濾波后的時間序列數(shù)據(jù)流YN;其中,所述離散傅里葉反變換(IDFT)公式如下:x(n)=1NΣn=0N-1X(k)ej2πknN,n=0,1,2,...,N-1]]>同樣,所述快速傅里葉反變換可以用IFFT算法來實現(xiàn);實際應用中,為了得到更好的濾波效果,可以對上述濾波后的時間序列數(shù)據(jù)流進行校驗,根據(jù)需求適當調(diào)整濾波帶寬,重新執(zhí)行步驟2.1)~2.3);3)基于所述濾波后的時間序列數(shù)據(jù)流YN,對所述待預測對象建立自回歸馬爾科夫狀態(tài)轉移模型:yt=a0s+Σd=1padsyt-d+uts---(1)]]>其中,yt為濾波后第t個采樣時刻的待預測對象的值,yt-d為濾波后第t-d個采樣時刻的待預測對象的值;p是自回歸方程的階數(shù),表示前p個采樣時刻的待預測對象的值對當前的待預測對象的值有影響;s表示待預測對象所處的狀態(tài),s=1,…,m,即,待預測對象存在m個狀態(tài);是常數(shù)項;是自回歸項,表示第t-d個采樣時刻的待預測對象的值對當前第t個采樣時刻的待預測對象的值的影響;是隨機誤差項,服從均值為0且方差為的正態(tài)分布;對于不同的狀態(tài),有不同的取值,表示在不同狀態(tài)下符合不同的規(guī)律;4)求取所述自回歸馬爾科夫狀態(tài)轉移模型中各個變量的條件概率密度函數(shù):令所有待估計的變量集合θ=(a0,ad,σ2,s,F),其中,a0表示各狀態(tài)中常數(shù)項集合ad表示各個狀態(tài)下的自回歸參數(shù),為m×p的矩陣;σ2表示在各狀態(tài)下的方差,為m維向量,s表示樣本中每個采樣時刻待預測對象所處的狀態(tài),s=(s1,s2,…,st,…,sN);F為狀態(tài)轉移概率矩陣,為m階方陣,其中,矩陣元素Fir代表當前狀態(tài)為i時,下一個狀態(tài)為r的概率ρ(r|i);表示去掉st后的條件集合(已知變量集合),表示去掉a0后的條件集合,表示去掉后的條件集合,表示去掉σs2后的條件集合,表示去掉Fir后的條件集合;分別以st、σs2、Fir為目標項,建立除目標項外所有變量都已知的條件概率密度,條件概率密度函數(shù)集合如下:[st|YN,θ-st][a0s|YN,θ-a0s][ads|YN,θ-ads][σs2|YN,θ-σs2][Fir|YN,θ-Fir]---(2)]]>5)對于所述條件概率密度函數(shù)已知的模型,進行吉布斯采樣來調(diào)整模型并估計模型參數(shù),其步驟如圖2所示:5.1)給所有未知變量賦初始值θ(0),設采樣次數(shù)k'=1;5.2)對所有變量循環(huán)采樣,即,根據(jù)變量的條件概率密度函數(shù)進行隨機抽樣,將抽樣值作為新一次的采樣值,第k'次采樣值為:s1(k′)←[s1(k′)|YN,θ-s1(k′-1)]s2(k′)←[s2(k′)|YN,θ-s2(k′-1)]...Fir(k′)←[Fir(k′)|YN,θ-Fir(k′-1)]---(3)]]>5.3)設置k'=k'+1,跳回步驟5.2);5.4)重復步驟5.2)和5.3)進行多次采樣,從第λ次開始,取采樣次數(shù)k'=(λ+1,…,λ+ε)的時間序列數(shù)據(jù)流作為一個樣本,取該樣本的均值作為各變量的估計值,并檢驗擬合的相關系數(shù);其中,所述各變量的估計值包括各狀態(tài)下模型參數(shù)、狀態(tài)序列和狀態(tài)轉移矩陣的估計值;例如,所述方差的估計值為:E(σs2)=1NΣk′=λ+1λ+ϵσs2(k′)---(4)]]>5.5)不斷調(diào)整模型的規(guī)模,直至檢驗到所擬合的相關系數(shù)大于0.9,此時,估計出各采樣點所處的狀態(tài)s、各狀態(tài)下的參數(shù)(a0,a,σ2)和狀態(tài)轉移概率矩陣F;6)由所述模型估計出的待預測對象當前狀態(tài)和轉移概率矩陣,預測所述待預測對象在下個采樣時刻最大概率出現(xiàn)的狀態(tài);7)根據(jù)步驟5)所得的s=1,…,m的不同狀態(tài)下模型參數(shù)和之前的p個采樣時刻待預測對象的值,計算得到m個模型預測值;將m個模型預測值分別與采集的下個采樣時刻待預測對象的值進行比較,計算所述下個采樣時刻的待預測對象處于各個狀態(tài)的概率,取概率最大的狀態(tài)作為下個采樣時刻的實際狀態(tài);8)根據(jù)下個采樣時刻的實際狀態(tài)和狀態(tài)轉移概率矩陣F,預測所述待預測對象在下下個采樣時刻最大概率出現(xiàn)的狀態(tài);9)重復步驟7)和8),不斷更新,實現(xiàn)對于每個采樣時刻的下個采樣時刻的狀態(tài)的預測??梢?,根據(jù)本發(fā)明方法,不但可以判斷當前待預測對象的市場風格,而且可以預測市場風格轉換方向,從而預測市場未來的行情和走勢,進而預測相應的市場期望,能夠為投資者的投資決策提供重要的支持:假設當前市場狀態(tài)為狀態(tài)i,F(xiàn)i為轉移概率矩陣的第i行,則下個時段市場處于狀態(tài)r的概率為Fir,相應的市場期望為:Ey=Σr=1myrFir---(5)]]>其中yr是市場處于狀態(tài)r下的取值。相應地,本發(fā)明的一具體實施例中,一種基于馬爾科夫狀態(tài)轉移模型的狀態(tài)轉換預測系統(tǒng),包括:1)采樣單元:用于按時間粒度采樣,獲取N個采樣時刻t的待預測對象的值yt(0),并構成待預測對象的初始時間序列數(shù)據(jù)流YN(0),即,YN(0)由N個初始采樣點構成,記為:YN(0)=(y1(0),y2(0),…,yt(0),…,yN(0));2)濾波單元:用于根據(jù)預測周期對待預測對象的初始時間序列數(shù)據(jù)流YN(0)進行濾波預處理,并得到濾波后的時間序列數(shù)據(jù)流YN,記YN=(y1,y2,…,yt,…,yN);其中,包括:2.1)離散傅里葉變換模塊,用于采用離散傅里葉變換將離散的初始時間序列信號數(shù)據(jù)流變換為頻域信號數(shù)據(jù)流;所述離散傅里葉變換(DFT)公式如下:X(k)=Σn=0N-1x(n)e-j2πknN,k=0,1,2,...,N-1]]>其中,x(n)為采樣點,即x(n)=y(tǒng)N(0);N為采樣點個數(shù),X(k)是頻域中的信號,其頻譜分辨率為2π/N,j是復數(shù)符號;所述快速傅里葉變換可以用FFT算法實現(xiàn),F(xiàn)FT算法通過把DFT矩陣分解為稀疏因子之積來提高計算速度,其中蝶型算法應用廣泛,現(xiàn)成的工具非常多,此處不再贅述;2.2)低通濾波器,用于對所獲得的頻域信號進行低通濾波,以去除高頻信號和保留低頻信號,所述低通濾波器的帶寬范圍為2/T~4/T,其中T為預測周期:在獲取的時間序列中,狀態(tài)變化趨勢是低頻信號,隨機噪聲干擾是高頻信號,所以濾波的作用是去除高頻信號干擾;低通濾波的帶寬根據(jù)預測周期決定:假設預測周期為T,采樣序列為等時間間隔采樣,一個周期內(nèi)采樣點數(shù)為NT=2n',采樣頻率記為NT=2n',總采樣點數(shù)為N,傅里葉變換后,頻譜中共有N個頻率分量,頻譜中可用的最高頻率為fmax=f0/2,相鄰頻譜的頻率間隔為△f=f0/N,可見,想濾除更高頻的信號,每個周期內(nèi)的采樣點數(shù)需要越多;假設取定帶寬為2/T,將頻域中高頻分量的幅值置0,得到新的頻譜:X(k)=0k=N2n′-1,...,N/2,...,N/2+N2n′-1]]>2.3)信號重構模塊:用于采用離散傅里葉反變換將濾波后的頻域信號重構到時域,以完成對時間序列的濾波預處理,并得到濾波后的時間序列數(shù)據(jù)流YN;其中,所述離散傅里葉反變換(IDFT)公式如下:x(n)=1NΣk=0N-1X(k)ej2πknN,n=0,1,2,...,N-1]]>同樣,所述快速傅里葉反變換可以用IFFT算法來實現(xiàn);3)建模單元:用于基于所述濾波后的時間序列數(shù)據(jù)流YN,對所述待預測對象建立自回歸馬爾科夫狀態(tài)轉移模型:yt=a0s+Σd=1padsyt-d+uts---(1)]]>其中,yt為濾波后第t個采樣時刻的待預測對象的值,yt-d為濾波后第t-d個采樣時刻的待預測對象的值;p是自回歸方程的階數(shù),表示前p個采樣時刻的待預測對象的值對當前的待預測對象的值有影響;s表示待預測對象所處的狀態(tài),s=1,…,m,即,待預測對象存在m個狀態(tài);是常數(shù)項;是自回歸項,表示第t-d個采樣時刻的待預測對象的值對當前第t個采樣時刻的待預測對象的值的影響;是隨機誤差項,服從均值為0且方差為的正態(tài)分布;對于不同的狀態(tài),,有不同的取值,表示在不同狀態(tài)下符合不同的規(guī)律;4)條件概率密度函數(shù)計算單元:用于求取所述自回歸馬爾科夫狀態(tài)轉移模型中各個變量的條件概率密度函數(shù):令所有待估計的變量集合θ=(a0,ad,σ2,s,F),其中,a0表示各狀態(tài)中常數(shù)項集合ad表示各個狀態(tài)下的自回歸參數(shù),為m×p的矩陣;σ2表示在各狀態(tài)下的方差,為m維向量,s表示樣本中每個采樣時刻待預測對象所處的狀態(tài),s=(s1,s2,…,st,…,sN);F為狀態(tài)轉移概率矩陣,為m階方陣,其中,矩陣元素Fir代表當前狀態(tài)為i時,下一個狀態(tài)為r的概率ρ(r|i);表示去掉st后的條件集合(已知變量集合),表示去掉a0后的條件集合,表示去掉后的條件集合,表示去掉σs2后的條件集合,表示去掉Fir后的條件集合;分別以st、σs2、Fir為目標項,建立除目標項外所有變量都已知的條件概率密度,條件概率密度函數(shù)集合如下:[st|YN,θ-st][a0s|YN,θ-a0s][ads|YN,θ-ads][σs2|YN,θ-σs2][Fir|YN,θ-Fir]---(2)]]>5)吉布斯采樣單元:用于對于所述條件概率密度函數(shù)已知的模型,進行吉布斯采樣來調(diào)整模型并估計模型參數(shù),其包括:5.1)初始賦值模塊:用于給所有未知變量賦初始值θ(0),設采樣次數(shù)k'=1;5.2)循環(huán)采樣模塊:用于對所有變量循環(huán)采樣,即,根據(jù)變量的條件概率密度函數(shù)進行隨機抽樣,將抽樣值作為新一次的采樣值,第k'次采樣值為:s1(k′)←[s1(k′)|YN,θ-s1(k′-1)]s2(k′)←[s2(k′)|YN,θ-s2(k′-1)]...Fir(k′)←[Fir(k′)|YN,θ-Fir(k′-1)]---(3)]]>設置k'=k'+1,循環(huán)采樣;5.3)參數(shù)估計模塊:用于對采樣次數(shù)k'=(λ+1,…,λ+ε)的時間序列數(shù)據(jù)流所構成的一個樣本進行取均值處理,將該樣本的均值作為各變量的估計值,并檢驗擬合的相關系數(shù);其中,所述各變量的估計值包括各狀態(tài)下模型參數(shù)、狀態(tài)序列和狀態(tài)轉移矩陣的估計值,例如,所述方差的估計值為:E(σs2)=1NΣk′=λ+1λ+ϵσs2(k′)---(4)]]>5.4)估計輸出模塊:當檢驗到所擬合的相關系數(shù)大于0.9時,將估計出各采樣點所處的狀態(tài)s、各狀態(tài)下的參數(shù)(a0,a,σ2)和狀態(tài)轉移概率矩陣F輸出;6)預測模塊:由所述模型估計出的待預測對象當前狀態(tài)和轉移概率矩陣,預測所述待預測對象在下個采樣時刻最大概率出現(xiàn)的狀態(tài);以及用于通過以下過程預測所述待預測對象在下下個采樣時刻最大概率出現(xiàn)的狀態(tài):調(diào)用吉布斯采樣單元輸出的s=1,…,m的不同狀態(tài)下模型參數(shù)和采樣單元所獲取的之前的p個采樣時刻待預測對象的值,計算得到m個模型預測值;并將m個模型預測值分別與采集的下個采樣時刻待預測對象的值進行比較,計算所述下個采樣時刻的待預測對象處于各個狀態(tài)的概率,取概率最大的狀態(tài)作為下個采樣時刻的實際狀態(tài);根據(jù)所述的下個采樣時刻的實際狀態(tài)和狀態(tài)轉移概率矩陣,預測所述待預測對象在下下個采樣時刻最大概率出現(xiàn)的狀態(tài);并用于通過不斷更新實現(xiàn)對于每個采樣時刻的下個采樣時刻的狀態(tài)的預測。關于上述實施例中,各變量條件概率密度函數(shù)的推導,可參考:McCullochRE,TsayRS.StatisticalanalysisofeconomictimeseriesviaMarkovswitchingmodels[J].Journaloftimeseriesanalysis,1994,15(5):523-539。為了便于理解,在此略作說明:由于變量有相似的意義,相當于y0=1的系數(shù),將它們合寫為列向量對部分向量取先驗分布(φs服從正態(tài)分布,為了避免混淆,以下用代表φs~G(φ0s,As,0-1),s=1,2,...,m]]>σs2~ψsηsχψs2,s=1,2,...,m]]>這些先驗分布相互獨立,超參數(shù)是已知常量,可自由選取,不影響最終結果。①其中的表達式如下:對狀態(tài)s=i,設樣本中共有qi個點處于狀態(tài)i,將這些點按采樣時間排序,取p+1維行向量Yt,p=(1,yt-1,yt-2,…,yt-p)',其中包含常數(shù)1和p個滯后項;取t=iτ,s=i,推導得出:Ai,0,*=σi-2(Στ=1qiYiτ,p′Yiτ,p)+Ai,0]]>φ0,*i=(Στ=1qiYiτ,p′Yiτ,pσi2+Ai,0)-1(Στ=1qiYiτ,pyiτσi2+Ai,0φ0s)]]>②是逆卡方分布:與①中類似,對狀態(tài)s=i,取出處于狀態(tài)i的采樣點,可得到表達式:Di2=Στ=1qi(yiτ-Yiτ,p′φi)2]]>③st服從一個離散分布,需要計算第t個采樣點處的條件概率,st是t時刻的狀態(tài),其概率為:ρ(st|y,θ-st)∝ρ(y|·)ρ(st|F,st-1,st+1)]]>其中:ρ(st|F,st-1,st+1)=Fst-1,stFst,st+1]]>ρ(y|·)∝1(2π)1σstexp(-ξt22σst2)]]>其中,ξt是殘差項,④當狀態(tài)數(shù)為2時,轉移概率的聯(lián)合分布為貝塔分布,可求得概率密度函數(shù)。當狀態(tài)數(shù)大于2時,聯(lián)合概率密度函數(shù)不易表達。通用的方法是用統(tǒng)計頻率來代替概率:根據(jù)已知的狀態(tài)序列,計算狀態(tài)轉移次數(shù)(從狀態(tài)i轉換到狀態(tài)r的次數(shù))vir,其中,i,r=1,2,3,…,m。則狀態(tài)轉移概率為Fir=vir/(N-1),轉移總次數(shù)為N-1次。為了更好理解以上方法,在此將以一個簡單的p階2狀態(tài)自回歸馬爾科夫狀態(tài)轉移模型為示例,對于應用基于濾波后的濾波后的時間序列數(shù)據(jù)流YN對所述待預測對象所建立的自回歸馬爾科夫狀態(tài)轉移模型(如下式(1)所示)進行狀態(tài)轉換預測作以下說明:yt=a0s+Σd=1padsyt-d+uts---(1)]]>即,對于式(1)所示的自回歸馬爾科夫狀態(tài)轉移模型,其中代表待預測對象所處的狀態(tài)s=1,2,即,存在2個狀態(tài)。此時,所有待估計的變量集合θ=(s,a0,a,σ2,F)中,s=(s1,s2,…,st,…,sN),狀態(tài)轉移概率矩陣F為2階方陣,F(xiàn)12=P(2|1)=c,F21=P(1|2)=h,F(xiàn)11=P(1|1)=1-c,F(xiàn)22=P(2|2)=1-h;分別以st、σs2、Fir為目標項,建立除目標項外所有變量都已知的條件概率密度,條件概率密度函數(shù)集合如下:[st|YN,θ-st][a0s|YN,θ-a0s][ads|YN,θ-ads][σs2|YN,θ-σs2][Fir|YN,θ-Fir]---(2)]]>定義[A|B]為在B條件下A發(fā)生的概率,[A,B]表示A,B同時發(fā)生的概率;由式(1)可知,每個樣本點(對應于每個采樣時刻待預測對象的值)的概率滿足標準正態(tài)分布(為了避免混淆,以下用代表):yt-a0s-Σd=1padsyt-d~G(0,σs2)---(7)]]>據(jù)此,可得到各個變量的條件概率密度函數(shù):①表示在給定的條件下,st的概率密度;由貝葉斯理論推導可知:[st|YN,θ-st][YN,θ-st]=[yt+1,...,yN|Yt,θ][Yt,θ]⇓[st|YN,θ-st][yt+1,...,yN|YN,θ-st][Yt,θ-st]=[yt+1,..,yN|Yt,θ][st|Yt,θ-st][Yt,θ-st]---(8)]]>最終求得:[st|YN,θ-st]=[st|Yt,θ-st][yt+1,...,yN|Yt,θ][yt+1,...,yN|Yt,θ-st]---(9)]]>對變量進行吉布斯采樣時,密度函數(shù)中與待估變量無關的公共項不影響采樣結果,因此推導過程中可略去與st無關的項并且馬爾科夫狀態(tài)轉移模型中,當前狀態(tài)值只與前后兩個狀態(tài)值相關,與其他參數(shù)無關??梢缘玫剑?lsqb;st|Yt,θ-st]=[st|st-1][st+1|st][yt+1,...,yN|Yt,θ]=Πz=t+1N[yz|Yz-1,θ]---(10)]]>代入公式(9)中,[st|YN,θ-st]∝[st|st-1][st+1|st]Πz=tN[yz|Yz-1,θ]---(11)]]>根據(jù)公式(7),[st|st-1]和[st+1|st]是狀態(tài)轉移概率;上式中除了st外都是已知量,可分別求出st取兩個狀態(tài)的概率,進行隨機抽樣。②表示在給定的條件下的概率密度;表示在給定的條件下的概率密度;如前所述,記為而取t=iτ,s=i,推導得出的表達式如而下:Ai,0,*=σi-2(Στ=1qiYiτ,p′Yiτ,p)+Ai,0]]>φ0,*i=(Στ=1qiYiτ,p′Yiτ,pσi2+Ai,0)-1(Στ=1qiYiτ,pyiτσi2+Ai,0φ0s)]]>其中,qi為樣本中所有處于狀態(tài)i的采樣點的個數(shù),將這些點按采樣時間排序,p+1維行向量Yt,p=(1,yt-1,yt-2,…,yt-p)',其中包含常數(shù)1和p個滯后項;分別取i為兩個狀態(tài)時,可求出相應的φs的概率密度函數(shù)。③表示在給定的條件下的概率密度;如前所述,是逆卡方分布:與②中類似,對狀態(tài)s=i,取出處于狀態(tài)i的采樣點,可得到表達式:Di2=Στ=1qi(yiτ-Yiτ,p′φi)2]]>同時,設As,0=I3,ψs=2,ηs=0.8,分別取i為兩個狀態(tài)時,可求出相應的的概率密度函數(shù)。④表示在給定的條件下Fir的概率密度;Fir是只與s相關的變量,獨立于其他變量,一旦s已知,可得總的似然函數(shù):L(c,h)=cv00hv11(1-c)v01(1-h)v10---(15)]]>引人先驗分布uir是超參數(shù)。vir表示序列從狀態(tài)i轉換到狀態(tài)r的次數(shù);則概率密度函數(shù)可以寫為獨立的貝塔分布:[c|s]~beta(v12+u12,v11+u11)[h|s]~beta(v21+u21,v22+u22)---(16)]]>基于上述變量的全條件概率密度函數(shù),可進行吉布斯采樣仿真,采樣次數(shù)足夠多(超過λ次)以后,取一段采樣序列k'=(λ+1,…,λ+ε),比如100個樣本(ε=100),以這100個樣本的均值作為變量的估計值,并檢驗擬合的相關系數(shù);不斷調(diào)整模型的規(guī)模,直到所擬合的相關系數(shù)大于0.9,估計出此時模型的狀態(tài)參數(shù):各采樣點的狀態(tài)s、各狀態(tài)下的模型參數(shù)(a0,a,b,σ2)和轉移概率矩陣F;由所述模型估計出的待預測對象當前狀態(tài)和轉移概率矩陣,預測所述待預測對象在下個采樣時刻最大概率出現(xiàn)的狀態(tài);根據(jù)s=1,…,m的不同狀態(tài)下模型參數(shù)和前p個采樣時刻待預測對象的值,計算得到m個模型預測值;將m個模型預測值分別與采集的下個采樣時刻待預測對象的值進行比較,計算所述下個采樣時刻的待預測對象處于各個狀態(tài)的概率,取概率最大的狀態(tài)作為下個采樣時刻的實際狀態(tài);根據(jù)下個采樣時刻的實際狀態(tài)和狀態(tài)轉移概率矩陣F,預測所述待預測對象在下下個采樣時刻最大概率出現(xiàn)的狀態(tài);重復上述預測步驟,不斷更新,實現(xiàn)對于每個采樣時刻的下個采樣時刻的狀態(tài)的預測??梢?,根據(jù)本發(fā)明方法,不但可以判斷當前待預測對象的市場風格,而且可以預測市場風格轉換方向,從而預測市場未來的行情和走勢,進而預測相應的市場期望,例如,預測分級基金折溢價趨勢,能夠為投資者的投資決策提供重要的支持:假設當前市場狀態(tài)為狀態(tài)i,F(xiàn)i為轉移概率矩陣的第i行,則下個時段市場處于狀態(tài)r的概率為Fir,相應的市場期望為:Ey=Σr=1myrFir---(5)]]>其中yr是市場處于狀態(tài)r下的取值。本領域的技術人員應理解,上述描述中所示的本發(fā)明的實施例只作為舉例用于說明本發(fā)明,而不應視為限定本發(fā)明的范圍。由此可見,本發(fā)明的目的已經(jīng)完整并有效的予以實現(xiàn)。本發(fā)明的功能及結構原理已在實施例中予以展示和說明,在不背離所述原理的情況下,實施方式可作任意修改。所以,本發(fā)明包括了基于權利要求精神及權利要求范圍的所有變形實施方式。當前第1頁1 2 3 
      當前第1頁1 2 3 
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1