一種信息處理方法和服務(wù)器的制造方法
【技術(shù)領(lǐng)域】
[0001 ]本發(fā)明涉及信息處理技術(shù),具體涉及一種信息處理方法和服務(wù)器。
【背景技術(shù)】
[0002]本申請發(fā)明人在實(shí)現(xiàn)本申請實(shí)施例技術(shù)方案的過程中,至少發(fā)現(xiàn)相關(guān)技術(shù)中存在如下技術(shù)問題:
[0003]在現(xiàn)有的多媒體信息推送系統(tǒng)中,通常會預(yù)先抽取某些特征數(shù)據(jù)進(jìn)一步估算出相應(yīng)多媒體信息的特定參數(shù),以便基于所述特定參數(shù)的考量選擇效益最大化的推送策略。其中,所述多媒體信息比如主動推送的廣告內(nèi)容;所述特定參數(shù)比如點(diǎn)擊率預(yù)估(PCTR)、或轉(zhuǎn)化率預(yù)估(pCVR)等等。
[0004]現(xiàn)有技術(shù)存在的問題是:在特征數(shù)據(jù)抽取過程中,由于無法從海量的源數(shù)據(jù)中準(zhǔn)確抽取所需的特征數(shù)據(jù),存在抽取的特征數(shù)據(jù)冗余的情況,從而導(dǎo)致抽取效率低。然而,對于上述問題,相關(guān)技術(shù)中并未存在有效的解決方案。
【發(fā)明內(nèi)容】
[0005]為解決現(xiàn)有存在的技術(shù)問題,本發(fā)明實(shí)施例提供一種信息處理方法和服務(wù)器,能夠提高特征數(shù)據(jù)的抽取速率。
[0006]為達(dá)到上述目的,本發(fā)明實(shí)施例的技術(shù)方案是這樣實(shí)現(xiàn)的:
[0007]本發(fā)明實(shí)施例提供了一種服務(wù)器,所述服務(wù)器包括:特征生成器、特征池和特征處理器;其中,
[0008]所述特征生成器,用于獲得源數(shù)據(jù),識別所述源數(shù)據(jù)獲得滿足預(yù)設(shè)類別的特征數(shù)據(jù),將所述特征數(shù)據(jù)解析為單原子特征數(shù)據(jù),將所述單原子特征數(shù)據(jù)發(fā)送至所述特征池;
[0009]所述特征池,用于存儲所述單原子特征數(shù)據(jù);
[0010]所述特征處理器,用于從所述特征池中讀取所述單原子特征數(shù)據(jù),針對所述單原子特征數(shù)據(jù)按照預(yù)設(shè)處理規(guī)則進(jìn)行處理,以基于處理結(jié)果確定預(yù)估參數(shù)。
[0011 ]上述方案中,所述特征生成器,用于獲得在線來源數(shù)據(jù),所述在線來源數(shù)據(jù)包括:客戶端傳輸?shù)奶卣鲾?shù)據(jù)和離線特征數(shù)據(jù);分別識別所述客戶端傳輸?shù)奶卣鲾?shù)據(jù)和所述離線特征數(shù)據(jù),獲得滿足預(yù)設(shè)類別的第一特征數(shù)據(jù)和第二特征數(shù)據(jù);分別將所述第一特征數(shù)據(jù)解析為第一單原子特征數(shù)據(jù),將所述第二特征數(shù)據(jù)解析為第二單原子特征數(shù)據(jù);將所述第一單原子特征數(shù)據(jù)和所述第二單原子特征數(shù)據(jù)發(fā)送至所述特征池。
[0012]上述方案中,所述特征生成器,用于獲得離線來源數(shù)據(jù),所述離線來源數(shù)據(jù)包括歷史日志數(shù)據(jù);識別所述歷史日志數(shù)據(jù)獲得滿足預(yù)設(shè)類別的第三特征數(shù)據(jù);將所述第三特征數(shù)據(jù)解析為第三單原子特征數(shù)據(jù),將所述第三單原子數(shù)據(jù)發(fā)送至所述特征池。
[0013]上述方案中,所述特征處理器,用于從所述特征池中讀取所述單原子特征數(shù)據(jù),按照預(yù)設(shè)處理規(guī)則處理所述單原子特征數(shù)據(jù),獲得處理結(jié)果,將所述處理結(jié)果發(fā)送至預(yù)估模塊進(jìn)行預(yù)估參數(shù)的處理操作;
[0014]其中,所述預(yù)設(shè)處理規(guī)則包括:
[0015]直接將所述單原子特征數(shù)據(jù)作為處理結(jié)果;
[0016]和/或,將所述單原子特征數(shù)據(jù)按預(yù)設(shè)運(yùn)算規(guī)則進(jìn)行運(yùn)算處理。
[0017]上述方案中,所述預(yù)設(shè)運(yùn)算規(guī)則包括以下至少之一:交集處理、并集處理、差集處理。
[0018]本發(fā)明實(shí)施例還提供了一種信息處理方法,所述方法包括:
[0019]獲得源數(shù)據(jù),識別所述源數(shù)據(jù)獲得滿足預(yù)設(shè)類別的特征數(shù)據(jù),將所述特征數(shù)據(jù)解析為單原子特征數(shù)據(jù),將所述單原子特征數(shù)據(jù)存儲至特征池;
[0020]從所述特征池中讀取所述單原子特征數(shù)據(jù),對所述單原子特征數(shù)據(jù)按照預(yù)設(shè)處理規(guī)則進(jìn)行處理,以基于處理結(jié)果確定預(yù)估參數(shù)。
[0021]上述方案中,所述獲得源數(shù)據(jù),識別所述源數(shù)據(jù)獲得滿足預(yù)設(shè)類別的特征數(shù)據(jù),將所述特征數(shù)據(jù)解析為單原子特征數(shù)據(jù),將所述單原子特征數(shù)據(jù)存儲至特征池,包括:
[0022]獲得在線來源數(shù)據(jù),所述在線來源數(shù)據(jù)包括:客戶端傳輸?shù)奶卣鲾?shù)據(jù)和離線特征數(shù)據(jù);
[0023]識別出所述客戶端傳輸?shù)奶卣鲾?shù)據(jù)中滿足預(yù)設(shè)類別的第一特征數(shù)據(jù),以及識別出所述離線特征數(shù)據(jù)中滿足預(yù)設(shè)類別的第二特征數(shù)據(jù);
[0024]分別將所述第一特征數(shù)據(jù)解析為第一單原子特征數(shù)據(jù),以及將所述第二特征數(shù)據(jù)解析為第二單原子特征數(shù)據(jù);
[0025]將所述第一單原子特征數(shù)據(jù)和所述第二單原子特征數(shù)據(jù)存儲至所述特征池。
[0026]上述方案中,所述獲得源數(shù)據(jù),識別所述源數(shù)據(jù)獲得滿足預(yù)設(shè)類別的特征數(shù)據(jù),將所述特征數(shù)據(jù)解析為單原子特征數(shù)據(jù),將所述單原子特征數(shù)據(jù)存儲至特征池,包括:
[0027]所述特征生成器獲得離線來源數(shù)據(jù),所述離線來源數(shù)據(jù)包括歷史日志數(shù)據(jù);
[0028]識別所述歷史日志數(shù)據(jù)獲得滿足預(yù)設(shè)類別的第三特征數(shù)據(jù),將所述第三特征數(shù)據(jù)解析為第三單原子特征數(shù)據(jù),將所述第三單原子數(shù)據(jù)存儲至所述特征池。
[0029]上述方案中,所述針對所述單原子特征數(shù)據(jù)按照預(yù)設(shè)處理規(guī)則進(jìn)行處理,以基于處理結(jié)果確定預(yù)估參數(shù),包括:
[0030]按照預(yù)設(shè)處理規(guī)則處理所述單原子特征數(shù)據(jù),獲得處理結(jié)果,將所述處理結(jié)果發(fā)送至預(yù)估模塊進(jìn)行預(yù)估參數(shù)的處理操作;
[0031 ]其中,所述預(yù)設(shè)處理規(guī)則包括:
[0032]直接將所述單原子特征數(shù)據(jù)作為處理結(jié)果;
[0033]和/或,將所述單原子特征數(shù)據(jù)按預(yù)設(shè)運(yùn)算規(guī)則進(jìn)行運(yùn)算處理。
[0034]上述方案中,所述預(yù)設(shè)運(yùn)算規(guī)則包括以下至少之一:交集處理、并集處理、差集處理。
[0035]本發(fā)明實(shí)施例提供的信息處理方法和服務(wù)器,所述服務(wù)器包括:特征生成器、特征池和特征處理器;其中,所述特征生成器,用于獲得源數(shù)據(jù),識別所述源數(shù)據(jù)獲得滿足預(yù)設(shè)類別的特征數(shù)據(jù),將所述特征數(shù)據(jù)解析為單原子特征數(shù)據(jù),將所述單原子特征數(shù)據(jù)發(fā)送至所述特征池;所述特征池,用于存儲所述單原子特征數(shù)據(jù);所述特征處理器,用于從所述特征池中讀取所述單原子特征數(shù)據(jù),針對所述單原子特征數(shù)據(jù)按照預(yù)設(shè)處理規(guī)則進(jìn)行處理,以基于處理結(jié)果確定預(yù)估參數(shù)。采用本發(fā)明實(shí)施例的技術(shù)方案,通過服務(wù)器中包含的特征生成器、特征池和特征處理器的抽取架構(gòu),在海量的源數(shù)據(jù)中,抽取并存儲預(yù)估參數(shù)相關(guān)的特征數(shù)據(jù),大大提高了特征數(shù)據(jù)的抽取效率,為后續(xù)的特定參數(shù)的估算提供了便利。
【附圖說明】
[0036]圖1為本發(fā)明實(shí)施例的服務(wù)器的組成結(jié)構(gòu)示意圖;
[0037]圖2為本發(fā)明實(shí)施例的服務(wù)器的一種應(yīng)用示意圖;
[0038]圖3為本發(fā)明實(shí)施例的服務(wù)器的另一種應(yīng)用示意圖;
[0039]圖4為本發(fā)明實(shí)施例的信息處理方法的流程示意圖;
[0040]圖5為本發(fā)明實(shí)施例的信息處理方法的另一種流程示意圖;
[0041 ]圖6為本發(fā)明實(shí)施例的信息處理方法的又一種流程示意圖。
【具體實(shí)施方式】
[0042]下面結(jié)合附圖及具體實(shí)施例對本發(fā)明作進(jìn)一步詳細(xì)的說明。
[0043]實(shí)施例一
[0044]本發(fā)明實(shí)施例提供了一種服務(wù)器。圖1為本發(fā)明實(shí)施例的服務(wù)器的組成結(jié)構(gòu)示意圖;如圖1所示,所述服務(wù)器包括:特征生成器11、特征池12和特征處理器13;其中,
[0045]所述特征生成器11,用于獲得源數(shù)據(jù),識別所述源數(shù)據(jù)獲得滿足預(yù)設(shè)類別的特征數(shù)據(jù),將所述特征數(shù)據(jù)解析為單原子特征數(shù)據(jù),將所述單原子特征數(shù)據(jù)發(fā)送至所述特征池12;
[0046]所述特征池12,用于存儲所述單原子特征數(shù)據(jù);
[0047]所述特征處理器13,用于從所述特征池12中讀取所述單原子特征數(shù)據(jù),針對所述單原子特征數(shù)據(jù)按照預(yù)設(shè)處理規(guī)則進(jìn)行處理,以基于處理結(jié)果確定預(yù)估參數(shù)。
[0048]本發(fā)明實(shí)施例的服務(wù)器主要用于特定參數(shù)的估算時,對所需要的特征數(shù)據(jù)進(jìn)行抽取。
[0049]具體的,所述特征生成器11獲得的源數(shù)據(jù)包括:用戶相關(guān)數(shù)據(jù)、終端設(shè)備相關(guān)數(shù)據(jù)、多媒體信息展示頁面的相關(guān)數(shù)據(jù)、多媒體信息的相關(guān)數(shù)據(jù)以及所述多媒體信息的離線數(shù)據(jù)等等;其中,所述用戶相關(guān)數(shù)據(jù)例如用戶的性別、年齡等等;所述終端設(shè)備(例如手機(jī))相關(guān)數(shù)據(jù)例如終端設(shè)備型號、終端設(shè)備的聯(lián)網(wǎng)類型等等;所述多媒體信息展示頁面的相關(guān)數(shù)據(jù)例如展示位、展示頁面信息(如關(guān)鍵字、分類、主題等)等;所述多媒體信息的相關(guān)數(shù)據(jù)例如多媒體信息的屬性信息(如多媒體信息的標(biāo)識碼(ID)、多媒體信息的類型等等);所述多媒體信息的離線數(shù)據(jù)為計算獲得的數(shù)據(jù),例如所述多媒體信息在預(yù)設(shè)時間范圍內(nèi)(例如一天之內(nèi))的平均點(diǎn)擊率、平均轉(zhuǎn)換率等等。其中,所述特征生成器11可從歷史日志中獲得所述源數(shù)據(jù),也可以實(shí)時在線獲得用戶相關(guān)數(shù)據(jù)以及調(diào)用離線詞表,具體的實(shí)施方式可分別參見實(shí)施例二和實(shí)施例三所示,這里不再詳細(xì)描述。
[0050]本實(shí)施例中,所述特征生成器11中預(yù)先配置至少一個特征類別(即所述預(yù)設(shè)類別);所述特征生成器