UnixTM,LinuxTM,F(xiàn)reeBSDTM等等。
[0050] 在一個(gè)實(shí)施例中,具體的,該資源的請(qǐng)求量預(yù)測(cè)方法如圖2所示,包括:
[0051] 步驟210,獲取資源所對(duì)應(yīng)的歷史請(qǐng)求量時(shí)間序列,在歷史請(qǐng)求量時(shí)間序列中提取 設(shè)定時(shí)間長(zhǎng)度的最近歷史請(qǐng)求量。
[0052] 資源可以是互聯(lián)網(wǎng)絡(luò)中發(fā)布的任意資源,包括應(yīng)用資源、媒體資源、虛擬物品資源 等。例如,具體可為第三方應(yīng)用、電影、電視劇、綜藝節(jié)目等,與之相對(duì)應(yīng)的,該請(qǐng)求量可以是 下載量、播放量等。
[0053] 資源發(fā)布之后每日所統(tǒng)計(jì)得到的請(qǐng)求量便構(gòu)成了該資源所對(duì)應(yīng)的歷史請(qǐng)求量時(shí) 間序列,各資源中,隨著發(fā)布時(shí)間的不同,其歷史請(qǐng)求量時(shí)間序列的時(shí)間長(zhǎng)度也各不相同。 發(fā)布較長(zhǎng)的資源,歷史請(qǐng)求量時(shí)間序列的時(shí)間長(zhǎng)度相對(duì)一些新發(fā)布的資源要長(zhǎng)一些,對(duì)于 新發(fā)布的資源,其歷史請(qǐng)求量時(shí)間序列相對(duì)較短。
[0054] 任意一資源,都將在其所對(duì)應(yīng)的歷史請(qǐng)求量時(shí)間序列中提取設(shè)定時(shí)間長(zhǎng)度的最近 歷史請(qǐng)求量。其中,該設(shè)定時(shí)間長(zhǎng)度用于對(duì)未來(lái)請(qǐng)求量的預(yù)測(cè)中輸入數(shù)據(jù)的選取進(jìn)行控制, 設(shè)定時(shí)間長(zhǎng)度的具體數(shù)值與輸出的未來(lái)請(qǐng)求量的時(shí)間長(zhǎng)度相對(duì)應(yīng)。例如,設(shè)定時(shí)間長(zhǎng)度可 以是最近七日,由此所輸出的未來(lái)請(qǐng)求量將是預(yù)測(cè)所得到的未來(lái)七日的資源請(qǐng)求量。
[0055] 針對(duì)發(fā)布的資源,以當(dāng)前時(shí)間為截點(diǎn)在歷史請(qǐng)求量時(shí)間序列中提取與設(shè)定時(shí)間長(zhǎng) 度相符的最近歷史請(qǐng)求量,以作為此請(qǐng)求量預(yù)測(cè)的輸入數(shù)據(jù)。
[0056] 步驟230,根據(jù)最近歷史請(qǐng)求量進(jìn)行參數(shù)估計(jì)得到狀態(tài)變量和模型參數(shù),由狀態(tài)變 量和模型參數(shù)構(gòu)建狀態(tài)空間模型。
[0057] 狀態(tài)空間模型包括了多個(gè)未知參數(shù),如狀態(tài)變量和模型參數(shù),因此,需要根據(jù)最近 歷史請(qǐng)求量進(jìn)行參數(shù)估計(jì),以便于構(gòu)建與資源的請(qǐng)求情況相符的狀態(tài)空間模型,進(jìn)而保證 后續(xù)預(yù)測(cè)的準(zhǔn)確性。
[0058] 構(gòu)建所得到的狀態(tài)空間模型是以最近歷史請(qǐng)求量作為歷史數(shù)據(jù)進(jìn)行建模所得到 的,其將輸出反映了最近歷史請(qǐng)求量動(dòng)態(tài)變化的預(yù)測(cè)值,即資源的未來(lái)請(qǐng)求量。其中,進(jìn)行 參數(shù)估計(jì)而得到的狀態(tài)變量將用于描述動(dòng)態(tài)特征。
[0059]步驟250,通過(guò)構(gòu)建的狀態(tài)空間模型預(yù)測(cè)資源的未來(lái)請(qǐng)求量。
[0060] 由于狀態(tài)空間模型是以資源的最近歷史請(qǐng)求量為基礎(chǔ)而構(gòu)建的,由構(gòu)建的狀態(tài)空 間模型輸出得到資源的未來(lái)請(qǐng)求量,例如,在通過(guò)一資源的最近七日請(qǐng)求量進(jìn)行參數(shù)估計(jì) 而構(gòu)建的狀態(tài)空間模型中輸出該資源未來(lái)七日的請(qǐng)求量的預(yù)測(cè)結(jié)果。
[0061] 通過(guò)如上所述的過(guò)程,實(shí)現(xiàn)了對(duì)發(fā)布的資源所進(jìn)行的請(qǐng)求量的預(yù)測(cè),并且是在歷 史請(qǐng)求量時(shí)間序列和狀態(tài)空間模型的配合下實(shí)現(xiàn)的,使得所預(yù)測(cè)得到的未來(lái)請(qǐng)求量是在歷 史請(qǐng)求量時(shí)間序列的基礎(chǔ)上符合動(dòng)態(tài)發(fā)展的變化的,因此有效地保障了預(yù)測(cè)的準(zhǔn)確性,為 資源發(fā)布中的后續(xù)處理提供準(zhǔn)確指引。
[0062] 在一個(gè)實(shí)施例中,步驟230之前,如上所述的方法還包括:
[0063] 對(duì)歷史請(qǐng)求量時(shí)間序列進(jìn)行類型識(shí)別,該類型為平穩(wěn)型或非平穩(wěn)型。
[0064] 資源的發(fā)布中,所對(duì)應(yīng)的請(qǐng)求量具備隨機(jī)性,某些資源的每日請(qǐng)求量相對(duì)較為平 穩(wěn),而某些資源的每日請(qǐng)求量常常會(huì)出現(xiàn)突發(fā)的增長(zhǎng)或者突發(fā)的下降,因此,需要對(duì)歷史請(qǐng) 求量時(shí)間序列進(jìn)行類型識(shí)別,以進(jìn)一步保證后續(xù)預(yù)測(cè)的準(zhǔn)確性。
[0065] 歷史請(qǐng)求量時(shí)間序列所對(duì)應(yīng)的類型包括平穩(wěn)型和非平穩(wěn)型,其中,平穩(wěn)型的歷史 請(qǐng)求量時(shí)間序列中記錄的每日歷史請(qǐng)求量在數(shù)值上是平穩(wěn)的,且變化較為平緩;非平穩(wěn)型 的歷史請(qǐng)求量時(shí)間序列中記錄的每日歷史請(qǐng)求量在數(shù)值上存在著較大變化。
[0066] 若識(shí)別得到資源所對(duì)應(yīng)的歷史請(qǐng)求量時(shí)間序列為平穩(wěn)型,則根據(jù)由此歷史請(qǐng)求量 時(shí)間序列提取的最近歷史請(qǐng)求量進(jìn)行參數(shù)估計(jì)和狀態(tài)空間模型構(gòu)建即可進(jìn)行準(zhǔn)確預(yù)測(cè)。
[0067] 若識(shí)別得到資源所對(duì)應(yīng)的歷史請(qǐng)求量時(shí)間序列為非平穩(wěn)型,換而言之,方歷史請(qǐng) 求量時(shí)間序列中的變化非常大,相應(yīng)的,該資源后續(xù)所對(duì)應(yīng)的請(qǐng)求量變化非常大的可能性 很高,因此,將額外地引入已知的解釋變量時(shí)間序列,以此作為輔助進(jìn)行參數(shù)估計(jì)和狀態(tài)空 間模型的構(gòu)建,進(jìn)而保障預(yù)測(cè)的準(zhǔn)確性。
[0068] 歷史請(qǐng)求量時(shí)間序列的識(shí)別可通過(guò)計(jì)算歷史請(qǐng)求量時(shí)間序列的自相關(guān)函數(shù)來(lái)實(shí) 現(xiàn),也可以通過(guò)Dickey-Fuller檢驗(yàn)變量的算法來(lái)實(shí)現(xiàn),還可以通過(guò)波動(dòng)率的運(yùn)算實(shí)現(xiàn)
[0069] 進(jìn)一步的,在優(yōu)選的實(shí)施例中,如圖3所示,上述對(duì)歷史請(qǐng)求量時(shí)間序列進(jìn)行類型 識(shí)別的步驟包括:
[0070] 步驟301,運(yùn)算歷史請(qǐng)求量時(shí)間序列的波動(dòng)率。
[0071] 波動(dòng)率用于衡量歷史請(qǐng)求量時(shí)間序列中歷史請(qǐng)求量的波動(dòng)程度。在此波動(dòng)率的運(yùn) 算中,將首先運(yùn)算歷史請(qǐng)求量時(shí)間序列中兩個(gè)歷史請(qǐng)求量之間的百分比收益率,即Yt = (Xt+1-Xt)/Xt,其中,Yt為歷史請(qǐng)求量之間的百分比,Xt+d日期為t+1的歷史請(qǐng)求量,X t為日 期為t的歷史請(qǐng)求量,由此得到歷史請(qǐng)求量時(shí)間序列所對(duì)應(yīng)的百分比收益率序列。
[0072] 然后對(duì)百分比收益率序列進(jìn)行標(biāo)準(zhǔn)差的運(yùn)算,得到歷史請(qǐng)求時(shí)間序列的波動(dòng)率。
[0073] 步驟303,根據(jù)波動(dòng)率和設(shè)定的閾值得到歷史請(qǐng)求量時(shí)間序列的類型為平穩(wěn)型或 非平穩(wěn)型的類型識(shí)別結(jié)果。
[0074] 預(yù)先進(jìn)行閾值的設(shè)定,以根據(jù)運(yùn)算得到的波動(dòng)率和設(shè)定的閾值來(lái)判定歷史請(qǐng)求量 時(shí)間序列是平穩(wěn)型還是非平穩(wěn)型,進(jìn)而得到相應(yīng)的類型識(shí)別結(jié)果。
[0075] 具體的,根據(jù)波動(dòng)率判斷設(shè)定的閾值是否小于設(shè)定的閾值,若為是,則得到歷史請(qǐng) 求量時(shí)間序列的類型為非平穩(wěn)型的類型識(shí)別結(jié)果,若為否,則得到歷史請(qǐng)求量時(shí)間序列的 類型為平穩(wěn)型的類型識(shí)別結(jié)果。
[0076]其中,閾值所對(duì)應(yīng)的具體數(shù)值將是發(fā)布的所有資源中控制平穩(wěn)型和非平穩(wěn)型的占 比來(lái)進(jìn)行設(shè)定的。
[0077]例如,發(fā)布的所有資源可以是第三方應(yīng)用,請(qǐng)求量為第三方應(yīng)用的下載量,與之相 對(duì)應(yīng)的,針對(duì)每一第三方應(yīng)用所對(duì)應(yīng)的歷史請(qǐng)求量時(shí)間序列所運(yùn)算得到的波動(dòng)率以及一定 范圍的波動(dòng)率所對(duì)應(yīng)的第三方應(yīng)用數(shù)量及占比如下表所示:
[0078]
[0079] 表 1
[0080] 由此表,可根據(jù)平穩(wěn)型的歷史請(qǐng)求量時(shí)間序列和非平穩(wěn)型的歷史請(qǐng)求量時(shí)間序列 之間第三方應(yīng)用占比的控制需要來(lái)設(shè)定閾值。例如,控制請(qǐng)求量為1 〇至100的所有第三方應(yīng) 用中歷史請(qǐng)求量時(shí)間序列為平穩(wěn)型的占比為61%,請(qǐng)求量為100至1000的所有第三方應(yīng)用 中歷史請(qǐng)求量時(shí)間序列為平穩(wěn)型的占比為78%,則所對(duì)應(yīng)的閾值為0.5。
[0081] 以此類推,根據(jù)發(fā)布的所有資源中平穩(wěn)型的歷史請(qǐng)求量時(shí)間序列和非平穩(wěn)型的歷 史請(qǐng)求時(shí)時(shí)間序列之間資源占比來(lái)進(jìn)行閾值的設(shè)定,以使得進(jìn)行的類型識(shí)別與當(dāng)前的資源 發(fā)布狀況相適應(yīng)。
[0082] 通過(guò)此過(guò)程所進(jìn)行的歷史請(qǐng)求量時(shí)間序列的類型識(shí)別較為簡(jiǎn)單,便于實(shí)現(xiàn)。
[0083] 在一個(gè)實(shí)施例中,歷史請(qǐng)求量時(shí)間序列的類型為非平穩(wěn)型,在上述對(duì)歷史請(qǐng)求時(shí) 間序列進(jìn)行類型識(shí)別的步驟之后,如圖4所示,該方法還包括如下步驟:
[0084] 步驟410,在搜索數(shù)據(jù)和/或社交數(shù)據(jù)中為狀態(tài)空間模型的構(gòu)建挖掘相關(guān)的解釋變 量時(shí)間序列。
[0085] 搜索數(shù)據(jù)是與搜索相關(guān),且基于海量數(shù)據(jù)所統(tǒng)計(jì)得到的數(shù)據(jù)指標(biāo);社交數(shù)據(jù)則是 社交應(yīng)用中基于海量數(shù)據(jù)所統(tǒng)計(jì)得到的數(shù)據(jù)指標(biāo);例如,搜索數(shù)據(jù)可以是關(guān)鍵詞以及關(guān)鍵 詞對(duì)應(yīng)的搜索熱度,社交數(shù)據(jù)可以是某一虛擬社交網(wǎng)絡(luò)中的關(guān)鍵詞以及對(duì)應(yīng)的搜索熱度。 因此,搜索數(shù)據(jù)和社交數(shù)據(jù)中包括了大量的文本信息以及對(duì)每一文本信息進(jìn)行統(tǒng)計(jì)所得到 的數(shù)據(jù)指標(biāo),在優(yōu)選的實(shí)施例中,該數(shù)據(jù)指標(biāo)為熱度時(shí)間序列,即文本信息的每日熱度所形 成的熱度時(shí)間序列。
[0086] 具體的,根據(jù)狀態(tài)空間模型的構(gòu)建需要,在搜索數(shù)據(jù)和/或社交數(shù)據(jù)中包含的文本 信息中為狀態(tài)空間模型進(jìn)行相關(guān)關(guān)鍵詞的挖掘,進(jìn)而以此關(guān)鍵詞作為狀態(tài)空間模型中的解 釋變量,由此所對(duì)應(yīng)的熱度時(shí)間序列即為解釋變量時(shí)間序列。
[0087] 在搜索數(shù)據(jù)和/或社交數(shù)據(jù)中,通過(guò)進(jìn)行信息過(guò)濾、文本分類和數(shù)據(jù)歸一化來(lái)匹配 得到與狀態(tài)空間模型的構(gòu)建相關(guān)的關(guān)鍵詞。
[0088] 在搜索數(shù)