用于多個(gè)數(shù)據(jù)源的數(shù)據(jù)整合處理方法和裝置制造方法
【專利摘要】本發(fā)明公開了一種用于多個(gè)數(shù)據(jù)源的數(shù)據(jù)整合處理方法和裝置。該用于多個(gè)數(shù)據(jù)源的數(shù)據(jù)整合處理方法包括:獲取來自多個(gè)不同數(shù)據(jù)源的數(shù)據(jù);將多個(gè)不同數(shù)據(jù)源的數(shù)據(jù)拆分為第一類型的數(shù)據(jù)和第二類型的數(shù)據(jù);以及對(duì)第一類型的數(shù)據(jù)和第二類型的數(shù)據(jù)進(jìn)行數(shù)據(jù)整合處理。通過本發(fā)明,解決了相關(guān)技術(shù)中不能對(duì)不同來源的數(shù)據(jù)進(jìn)行統(tǒng)一整合的問題,進(jìn)而達(dá)到了統(tǒng)一整合不同來源的數(shù)據(jù)的效果。
【專利說明】用于多個(gè)數(shù)據(jù)源的數(shù)據(jù)整合處理方法和裝置
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及數(shù)據(jù)處理領(lǐng)域,具體而言,涉及一種用于多個(gè)數(shù)據(jù)源的數(shù)據(jù)整合處理方法和裝置。
【背景技術(shù)】
[0002]在互聯(lián)網(wǎng)廣告領(lǐng)域,轉(zhuǎn)化數(shù)據(jù)是指廣告商投放廣告之后,由于用戶的注冊(cè)、登陸、瀏覽、點(diǎn)擊以及下訂單等行為產(chǎn)生的數(shù)據(jù)。轉(zhuǎn)化數(shù)據(jù)可以來自多個(gè)平臺(tái),例如,轉(zhuǎn)化數(shù)據(jù)可以來自第三方代理商、廣告投放平臺(tái)、網(wǎng)站本身監(jiān)控等不同的數(shù)據(jù)源。這些不同的數(shù)據(jù)源,以不同的方式、格式和渠道等為數(shù)據(jù)管理系統(tǒng)等導(dǎo)入系統(tǒng)提供轉(zhuǎn)化數(shù)據(jù)以進(jìn)行整合。
[0003]為了整合來自不同的數(shù)據(jù)源的轉(zhuǎn)化數(shù)據(jù),在相關(guān)技術(shù)中采用以下方案:首先針對(duì)來自不同的數(shù)據(jù)源的轉(zhuǎn)化數(shù)據(jù)根據(jù)預(yù)定格式進(jìn)行定制開發(fā),然后再將定制開發(fā)后的數(shù)據(jù)進(jìn)行整合處理。這種方案雖然能對(duì)轉(zhuǎn)化數(shù)據(jù)進(jìn)行整合處理,但是,由于轉(zhuǎn)化數(shù)據(jù)來自不同的數(shù)據(jù)源,它們各自的數(shù)據(jù)格式和數(shù)據(jù)類型多種多樣,而且不同時(shí)期的同一轉(zhuǎn)化數(shù)據(jù)可能也不一樣,這就需要對(duì)每一種轉(zhuǎn)化數(shù)據(jù)進(jìn)行不同的定制開發(fā),因此該種方案存在如下缺點(diǎn):
[0004]a)針對(duì)每種類型的轉(zhuǎn)化數(shù)據(jù)都需要進(jìn)行不同的定制開發(fā),因此開發(fā)成本較高。
[0005]b)客戶以及轉(zhuǎn)化數(shù)據(jù)的數(shù)據(jù)源均多種多樣,這樣,定制開發(fā)的版本就會(huì)很多,從而維護(hù)的轉(zhuǎn)化數(shù)據(jù)類型越來越多,進(jìn)而維護(hù)各種版本的成本也會(huì)提高。
[0006]針對(duì)相關(guān)技術(shù)中不能對(duì)不同來源的數(shù)據(jù)進(jìn)行統(tǒng)一整合的問題,目前尚未提出有效的解決方案。
【發(fā)明內(nèi)容】
[0007]本發(fā)明的主要目的在于提供一種用于多個(gè)數(shù)據(jù)源的數(shù)據(jù)整合處理方法和裝置,以解決相關(guān)技術(shù)中不能對(duì)不同來源的數(shù)據(jù)進(jìn)行統(tǒng)一整合問題。
[0008]為了實(shí)現(xiàn)上述目的,根據(jù)本發(fā)明的一個(gè)方面,提供了一種用于多個(gè)數(shù)據(jù)源的數(shù)據(jù)整合處理方法。該用于多個(gè)數(shù)據(jù)源的數(shù)據(jù)整合處理方法包括:獲取來自多個(gè)不同數(shù)據(jù)源的數(shù)據(jù);將多個(gè)不同數(shù)據(jù)源的數(shù)據(jù)拆分為第一類型的數(shù)據(jù)和第二類型的數(shù)據(jù);以及對(duì)第一類型的數(shù)據(jù)和第二類型的數(shù)據(jù)進(jìn)行數(shù)據(jù)整合處理。
[0009]進(jìn)一步地,在將多個(gè)不同數(shù)據(jù)源的數(shù)據(jù)拆分為第一類型的數(shù)據(jù)和第二類型的數(shù)據(jù)之前,該數(shù)據(jù)整合處理方法還包括:判斷多個(gè)不同數(shù)據(jù)源的數(shù)據(jù)是否有標(biāo)識(shí);如果判斷出多個(gè)不同數(shù)據(jù)源的數(shù)據(jù)有標(biāo)識(shí),則對(duì)每一條數(shù)據(jù)都加入已有的標(biāo)識(shí);以及如果判斷出多個(gè)不同數(shù)據(jù)源的數(shù)據(jù)沒有標(biāo)識(shí),則對(duì)每一條數(shù)據(jù)都加入唯一標(biāo)識(shí)。
[0010]進(jìn)一步地,按照以下方式對(duì)每一條數(shù)據(jù)加入標(biāo)識(shí):將需要加入標(biāo)識(shí)的數(shù)據(jù)拆分為關(guān)鍵字部分和點(diǎn)擊部分;以及將關(guān)鍵字部分和點(diǎn)擊部分分別加上標(biāo)識(shí)。
[0011]進(jìn)一步地,在將多個(gè)不同數(shù)據(jù)源的數(shù)據(jù)拆分為第一類型的數(shù)據(jù)和第二類型的數(shù)據(jù)之后,數(shù)據(jù)整合處理方法還包括:查找預(yù)先設(shè)置的第一數(shù)據(jù)表和第二數(shù)據(jù)表;將第一類型的數(shù)據(jù)存儲(chǔ)至第一數(shù)據(jù)表中;以及將第二類型的數(shù)據(jù)存儲(chǔ)至第二數(shù)據(jù)表中。[0012]進(jìn)一步地,將多個(gè)不同數(shù)據(jù)源的數(shù)據(jù)拆分為第一類型的數(shù)據(jù)和第二類型的數(shù)據(jù)包括:將多個(gè)不同數(shù)據(jù)源的數(shù)據(jù)拆分為物料數(shù)據(jù)和轉(zhuǎn)化數(shù)據(jù)。
[0013]為了實(shí)現(xiàn)上述目的,根據(jù)本發(fā)明的另一方面,提供了一種用于多個(gè)數(shù)據(jù)源的數(shù)據(jù)整合處理裝置。該用于多個(gè)數(shù)據(jù)源的數(shù)據(jù)整合處理裝置包括:獲取單元,用于獲取來自多個(gè)不同數(shù)據(jù)源的數(shù)據(jù);拆分單元,用于將多個(gè)不同數(shù)據(jù)源的數(shù)據(jù)拆分為第一類型的數(shù)據(jù)和第二類型的數(shù)據(jù);以及整合單元,用于對(duì)第一類型的數(shù)據(jù)和第二類型的數(shù)據(jù)進(jìn)行數(shù)據(jù)整合處理。
[0014]進(jìn)一步地,還包括:判斷單元,用于在將多個(gè)不同數(shù)據(jù)源的數(shù)據(jù)拆分為第一類型的數(shù)據(jù)和第二類型的數(shù)據(jù)之前,判斷多個(gè)不同數(shù)據(jù)源的數(shù)據(jù)是否有標(biāo)識(shí);第一加入單元,用于如果判斷出多個(gè)不同數(shù)據(jù)源的數(shù)據(jù)有標(biāo)識(shí),則對(duì)每一條數(shù)據(jù)都加入已有的標(biāo)識(shí);以及第二加入單元,用于如果判斷出多個(gè)不同數(shù)據(jù)源的數(shù)據(jù)沒有標(biāo)識(shí),則對(duì)每一條數(shù)據(jù)都加入唯一標(biāo)識(shí)。
[0015]進(jìn)一步地,第一加入單元包括:拆分模塊,用于將需要加入標(biāo)識(shí)的數(shù)據(jù)拆分為關(guān)鍵字部分和點(diǎn)擊部分;以及加入模塊,用于將關(guān)鍵字部分和點(diǎn)擊部分分別加上標(biāo)識(shí)。
[0016]進(jìn)一步地,在將多個(gè)不同數(shù)據(jù)源的數(shù)據(jù)拆分為第一類型的數(shù)據(jù)和第二類型的數(shù)據(jù)之后,還包括:查找單元,用于查找預(yù)先設(shè)置的第一數(shù)據(jù)表和第二數(shù)據(jù)表;第一存儲(chǔ)單元,用于將第一類型的數(shù)據(jù)存儲(chǔ)至第一數(shù)據(jù)表中;以及第二存儲(chǔ)單元,用于將第二類型的數(shù)據(jù)存儲(chǔ)至第二數(shù)據(jù)表中。
[0017]進(jìn)一步地,拆分單元還用于將多個(gè)不同數(shù)據(jù)源的數(shù)據(jù)拆分為物料數(shù)據(jù)和轉(zhuǎn)化數(shù)據(jù)。
[0018]通過本發(fā)明,采用獲取來自多個(gè)不同數(shù)據(jù)源的數(shù)據(jù);將多個(gè)不同數(shù)據(jù)源的數(shù)據(jù)拆分為第一類型的數(shù)據(jù)和第二類型的數(shù)據(jù);以及對(duì)第一類型的數(shù)據(jù)和第二類型的數(shù)據(jù)進(jìn)行數(shù)據(jù)整合處理,解決了相關(guān)技術(shù)中不能對(duì)不同來源的數(shù)據(jù)進(jìn)行統(tǒng)一整合的問題,進(jìn)而達(dá)到了統(tǒng)一整合不同來源的數(shù)據(jù)的效果。
【專利附圖】
【附圖說明】
[0019]構(gòu)成本申請(qǐng)的一部分的附圖用來提供對(duì)本發(fā)明的進(jìn)一步理解,本發(fā)明的示意性實(shí)施例及其說明用于解釋本發(fā)明,并不構(gòu)成對(duì)本發(fā)明的不當(dāng)限定。在附圖中:
[0020]圖1是根據(jù)本發(fā)明第一實(shí)施例的用于多個(gè)數(shù)據(jù)源的數(shù)據(jù)整合處理方法的流程圖;
[0021]圖2是根據(jù)本發(fā)明第二實(shí)施例的用于多個(gè)數(shù)據(jù)源的數(shù)據(jù)整合處理方法的流程圖;
[0022]圖3是根據(jù)本發(fā)明第一實(shí)施例的用于多個(gè)數(shù)據(jù)源的數(shù)據(jù)整合處理裝置的示意圖;以及
[0023]圖4是根據(jù)本發(fā)明第二實(shí)施例的用于多個(gè)數(shù)據(jù)源的數(shù)據(jù)整合處理裝置的示意圖。【具體實(shí)施方式】
[0024]需要說明的是,在不沖突的情況下,本申請(qǐng)中的實(shí)施例及實(shí)施例中的特征可以相互組合。下面將參考附圖并結(jié)合實(shí)施例來詳細(xì)說明本發(fā)明。
[0025]為了使本領(lǐng)域的技術(shù)人員更好的理解本發(fā)明方案,下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分的實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,在本領(lǐng)域普通技術(shù)人員沒有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都應(yīng)當(dāng)屬于本發(fā)明的保護(hù)范圍。
[0026]需要說明的是,本發(fā)明的說明書和權(quán)利要求書及上述附圖中的術(shù)語(yǔ)“第一”、“第二”等是用于區(qū)別類似的對(duì)象,而不必用于描述特定的順序或先后次序。應(yīng)該理解這樣使用的數(shù)據(jù)在適當(dāng)情況下可以互換,以便這里描述的本發(fā)明的實(shí)施例能夠以除了在這里圖示或描述的那些以外的順序?qū)嵤?。此外,術(shù)語(yǔ)“包括”和“具有”以及他們的任何變形,意圖在于覆蓋不排他的包含。
[0027]根據(jù)本發(fā)明的實(shí)施例,提供了一種用于多個(gè)數(shù)據(jù)源的數(shù)據(jù)整合處理方法,該用于多個(gè)數(shù)據(jù)源的數(shù)據(jù)整合處理方法用于對(duì)不同來源的數(shù)據(jù)進(jìn)行統(tǒng)一整合。該用于數(shù)據(jù)的數(shù)據(jù)整合處理方法可以運(yùn)行在計(jì)算機(jī)處理設(shè)備上。
[0028]圖1是根據(jù)本發(fā)明第一實(shí)施例的用于多個(gè)數(shù)據(jù)源的數(shù)據(jù)整合處理方法的流程圖。
[0029]如圖1所示,該用于多個(gè)數(shù)據(jù)源的數(shù)據(jù)整合處理方法包括如下的步驟SlOl至步驟S103:
[0030]步驟S101,獲取來自多個(gè)不同數(shù)據(jù)源的數(shù)據(jù)。
[0031]在互聯(lián)網(wǎng)廣告領(lǐng)域,來自多個(gè)不同數(shù)據(jù)源的數(shù)據(jù)包括轉(zhuǎn)化數(shù)據(jù)和物料數(shù)據(jù)。轉(zhuǎn)化數(shù)據(jù)是指廣告商投放廣告之后,由于用戶的注冊(cè)、登陸、瀏覽、點(diǎn)擊以及下訂單等行為產(chǎn)生的數(shù)據(jù),轉(zhuǎn)化數(shù)據(jù)與相應(yīng)的廣告實(shí)體相對(duì)應(yīng),這里的廣告實(shí)體即為物料,并且一個(gè)廣告實(shí)體可以對(duì)應(yīng)多個(gè)轉(zhuǎn)化數(shù)據(jù),該轉(zhuǎn)化數(shù)據(jù)可以通過物料收集系統(tǒng)進(jìn)行收集。該轉(zhuǎn)化數(shù)據(jù)可以包括兩種格式的數(shù)據(jù),即可以拆分格式的數(shù)據(jù)和不可以拆分格式的數(shù)據(jù)。其中,可以拆分格式的數(shù)據(jù)是由第一類型的數(shù)據(jù)和第二類型的數(shù)據(jù)組成的。第一類型的數(shù)據(jù)采用字符串的方式進(jìn)行存儲(chǔ),并且第一類型的數(shù)據(jù)可以是轉(zhuǎn)化數(shù)據(jù)對(duì)應(yīng)的廣告實(shí)體的唯一標(biāo)識(shí),即上述字符串可以作為該轉(zhuǎn)化數(shù)據(jù)對(duì)應(yīng)的廣告實(shí)體的關(guān)鍵字。第二類型的數(shù)據(jù)采用鍵值對(duì)的方式進(jìn)行存儲(chǔ),該鍵值對(duì)可以是數(shù)據(jù)類型和數(shù)據(jù)值對(duì),例如,浮點(diǎn)型數(shù)據(jù)和浮點(diǎn)型數(shù)據(jù)的值對(duì)、整形數(shù)據(jù)和整形數(shù)據(jù)的值對(duì)等。不可以拆分格式的數(shù)據(jù)不包含第一類型的數(shù)據(jù),只包含第二類型的數(shù)據(jù),即,不可以拆分格式的數(shù)據(jù)沒有作為該轉(zhuǎn)化數(shù)據(jù)的唯一標(biāo)識(shí)的字符串。
[0032]數(shù)據(jù)源(Data Source)是提供某種所需要數(shù)據(jù)的器件或原始媒體。顧名思義,數(shù)據(jù)源為數(shù)據(jù)的來源。在數(shù)據(jù)源中存儲(chǔ)了所有建立數(shù)據(jù)庫(kù)連接的信息,就象通過指定文件名稱可以在文件系統(tǒng)中找到文件一樣,通過提供正確的數(shù)據(jù)源名稱,可以找到相應(yīng)的數(shù)據(jù)庫(kù)連接。
[0033]在本發(fā)明實(shí)施例中,獲取來自多個(gè)不同數(shù)據(jù)源的數(shù)據(jù)為獲取多條數(shù)據(jù),可以通過多個(gè)數(shù)據(jù)庫(kù)表獲取多個(gè)不同數(shù)據(jù)源的數(shù)據(jù),需要說明的是,多個(gè)不同數(shù)據(jù)源的數(shù)據(jù)可以為描述同一互聯(lián)網(wǎng)實(shí)體的數(shù)據(jù),例如,針對(duì)某件衣服的互聯(lián)網(wǎng)廣告,可以獲取來自廣告商提供的數(shù)據(jù)、用戶自己收集的數(shù)據(jù)和網(wǎng)站監(jiān)控的數(shù)據(jù)等,而上述數(shù)據(jù)均為描述該件衣服的相關(guān)信息(如,衣服的名稱、訂單數(shù)量、單價(jià)和總價(jià)等)的數(shù)據(jù)。
[0034]步驟S102,將多個(gè)不同數(shù)據(jù)源的數(shù)據(jù)拆分為第一類型的數(shù)據(jù)和第二類型的數(shù)據(jù)。
[0035]在本發(fā)明實(shí)施例中,可以檢測(cè)多個(gè)不同數(shù)據(jù)源的數(shù)據(jù)的組成部分,當(dāng)檢測(cè)出數(shù)據(jù)的字符除部分時(shí),則將該字符串部分拆分為第一類型的數(shù)據(jù),剩下的數(shù)據(jù)部分作為第二數(shù)據(jù)類型。
[0036]具體地,可以將多個(gè)不同數(shù)據(jù)源的數(shù)據(jù)拆分為物料數(shù)據(jù)和轉(zhuǎn)化數(shù)據(jù)。其中,物料數(shù)據(jù)為描述物料的關(guān)鍵字字符串,轉(zhuǎn)化數(shù)據(jù)為用戶對(duì)物料進(jìn)行操作時(shí)產(chǎn)生的交互數(shù)據(jù)。
[0037]在本發(fā)明實(shí)施例中,可以將數(shù)據(jù)拆分成的第一類型的數(shù)據(jù)存儲(chǔ)在第一數(shù)據(jù)表中,并且可以將轉(zhuǎn)化數(shù)據(jù)拆分成的第二類型的數(shù)據(jù)存儲(chǔ)在第二數(shù)據(jù)表中,其中,第一數(shù)據(jù)表和第二數(shù)據(jù)表可以是同一個(gè)應(yīng)用系統(tǒng)的兩個(gè)列表,并且第一數(shù)據(jù)表和第二數(shù)據(jù)表分別用于存儲(chǔ)字符串格式的數(shù)據(jù)和鍵值對(duì)格式的數(shù)據(jù)。具體地,在步驟S102將多個(gè)不同數(shù)據(jù)源的轉(zhuǎn)化數(shù)據(jù)拆分為第一類型的數(shù)據(jù)和第二類型的數(shù)據(jù)之后,該用于多個(gè)數(shù)據(jù)源的數(shù)據(jù)整合處理方法還包括:
[0038]步驟1,查找預(yù)先設(shè)置的第一數(shù)據(jù)表和第二數(shù)據(jù)表。
[0039]例如,在本發(fā)明實(shí)施例中,查找預(yù)先設(shè)置的第一數(shù)據(jù)表和第二數(shù)據(jù)表可以是分別查找預(yù)先設(shè)置在物料管理系統(tǒng)中的物料(entrance)列表和轉(zhuǎn)化(conversion)列表,其中,物料列表可以用于存儲(chǔ)物料數(shù)據(jù),轉(zhuǎn)化列表可以用于存儲(chǔ)轉(zhuǎn)化數(shù)據(jù)。物料數(shù)據(jù)可以包括廣告推廣計(jì)劃、單元、關(guān)鍵詞、廣告來源、廣告媒介、搜索引擎、訪問時(shí)間和標(biāo)識(shí)等類型的數(shù)據(jù),其中,物料數(shù)據(jù)的部分類型可以為空。轉(zhuǎn)化數(shù)據(jù)可以以鍵值對(duì)的形式存儲(chǔ)數(shù)據(jù),并且轉(zhuǎn)化數(shù)據(jù)可以包含若干可以為空的擴(kuò)展屬性,例如,轉(zhuǎn)化數(shù)據(jù)可以包括擴(kuò)展標(biāo)識(shí)的屬性等。
[0040]步驟2,將第一類型的數(shù)據(jù)存儲(chǔ)至第一數(shù)據(jù)表中。
[0041]在本發(fā)明實(shí)施例中,可以按照預(yù)設(shè)順序?qū)⒌谝活愋偷臄?shù)據(jù)存儲(chǔ)至第一數(shù)據(jù)表中,也可以隨機(jī)將第一類型的數(shù)據(jù)存儲(chǔ)至第一數(shù)據(jù)表中。
[0042]步驟3,將第二類型的數(shù)據(jù)存儲(chǔ)至第二數(shù)據(jù)表中。
[0043]在本發(fā)明實(shí)施例中,可以按照預(yù)設(shè)順序?qū)⒌诙愋偷臄?shù)據(jù)存儲(chǔ)至第二數(shù)據(jù)表中,也可以隨機(jī)將第二類型的數(shù)據(jù)存儲(chǔ)至第二數(shù)據(jù)表中。
[0044]步驟S103,對(duì)第一類型的數(shù)據(jù)和第二類型的數(shù)據(jù)進(jìn)行數(shù)據(jù)整合處理。
[0045]在本發(fā)明實(shí)施例中,在步驟S103之后,可以將轉(zhuǎn)化數(shù)據(jù)和物料數(shù)據(jù)進(jìn)行匹配,并根據(jù)物料管理系統(tǒng)的具體配置,先刪除用戶不關(guān)注的轉(zhuǎn)化數(shù)據(jù)部分和無效的轉(zhuǎn)化數(shù)據(jù)部分(例如,用戶只關(guān)注某個(gè)廣告中下訂單的轉(zhuǎn)化數(shù)據(jù)時(shí),就可以將僅僅由于瀏覽而產(chǎn)生的轉(zhuǎn)化數(shù)據(jù)刪除。),再將剩余的轉(zhuǎn)化數(shù)據(jù)和物料數(shù)據(jù)進(jìn)行歸因處理,最后將其導(dǎo)入物料管理系統(tǒng)的目標(biāo)表中展示給用戶。
[0046]通過本發(fā)明,采用獲取來自多個(gè)不同數(shù)據(jù)源的轉(zhuǎn)化數(shù)據(jù);將多個(gè)不同數(shù)據(jù)源的轉(zhuǎn)化數(shù)據(jù)拆分為第一類型的數(shù)據(jù)和第二類型的數(shù)據(jù);以及對(duì)第一類型的數(shù)據(jù)和第二類型的數(shù)據(jù)進(jìn)行數(shù)據(jù)整合處理,解決了相關(guān)技術(shù)中不能對(duì)不同來源的轉(zhuǎn)化數(shù)據(jù)進(jìn)行統(tǒng)一整合的問題,進(jìn)而達(dá)到了統(tǒng)一整合不同來源的轉(zhuǎn)化數(shù)據(jù)的效果。
[0047]圖2是根據(jù)本發(fā)明第二實(shí)施例的用于多個(gè)數(shù)據(jù)源的數(shù)據(jù)整合處理方法的流程圖。
[0048]如圖2所示,該用于多個(gè)數(shù)據(jù)源的數(shù)據(jù)整合處理方法包括如下的步驟S201至步驟S205,該實(shí)施例可以作為圖1所示實(shí)施例的優(yōu)選實(shí)施方式。
[0049]步驟S201,判斷多個(gè)不同數(shù)據(jù)源的數(shù)據(jù)是否有標(biāo)識(shí)。
[0050]在本發(fā)明實(shí)施例中,在將多個(gè)不同數(shù)據(jù)源的轉(zhuǎn)化數(shù)據(jù)拆分為第一類型的數(shù)據(jù)和第二類型的數(shù)據(jù)之前,即在圖1所示的步驟SlOl之前,可以判斷多個(gè)不同數(shù)據(jù)源的數(shù)據(jù)是否有標(biāo)識(shí)。具體地,可以檢測(cè)多個(gè)不同數(shù)據(jù)源的數(shù)據(jù)是否具有字符串?dāng)?shù)據(jù),當(dāng)檢測(cè)上述數(shù)據(jù)具有字符串?dāng)?shù)據(jù)時(shí),判斷出多個(gè)不同數(shù)據(jù)源的數(shù)據(jù)有標(biāo)識(shí),其中,該標(biāo)識(shí)即為上述檢測(cè)出的字符串,否則當(dāng)檢測(cè)上述數(shù)據(jù)不具有字符串?dāng)?shù)據(jù)時(shí),判斷出多個(gè)不同數(shù)據(jù)源的數(shù)據(jù)沒有標(biāo)識(shí)。需要說明的是,在本發(fā)明實(shí)施例中,只有具有標(biāo)識(shí)的多個(gè)不同數(shù)據(jù)源的數(shù)據(jù)采可以進(jìn)行拆分處理,即,可以將多個(gè)不同數(shù)據(jù)源的數(shù)據(jù)拆分成物料數(shù)據(jù)和轉(zhuǎn)化數(shù)據(jù),并且拆分之后物料數(shù)據(jù)和轉(zhuǎn)化數(shù)據(jù)都可以用該多個(gè)不同數(shù)據(jù)源的數(shù)據(jù)的標(biāo)識(shí)進(jìn)行標(biāo)識(shí)。在本發(fā)明實(shí)施例中,對(duì)沒有標(biāo)識(shí)的多個(gè)不同數(shù)據(jù)源的數(shù)據(jù)不能進(jìn)行直接拆分,但是可以先為該沒有標(biāo)識(shí)的多個(gè)不同數(shù)據(jù)源的數(shù)據(jù)隨機(jī)生成一個(gè)字符串作為其標(biāo)識(shí),該標(biāo)識(shí)即為物料數(shù)據(jù),然后再將上述多個(gè)不同數(shù)據(jù)源的數(shù)據(jù)進(jìn)拆分為物料數(shù)據(jù)和轉(zhuǎn)化數(shù)據(jù),并且將拆分得到的物料數(shù)據(jù)和轉(zhuǎn)化數(shù)據(jù)用該標(biāo)識(shí)進(jìn)行唯一標(biāo)記。需要說明的是,來自多個(gè)不同數(shù)據(jù)源的不同數(shù)據(jù)對(duì)應(yīng)的標(biāo)識(shí)不同,即每個(gè)該數(shù)據(jù)的標(biāo)識(shí)是唯一的。
[0051]步驟S202A,如果判斷出多個(gè)不同數(shù)據(jù)源的數(shù)據(jù)有標(biāo)識(shí),則對(duì)每一條數(shù)據(jù)都加入已有的標(biāo)識(shí)。
[0052]在本發(fā)明實(shí)施例中,如果判斷出多個(gè)不同數(shù)據(jù)源的數(shù)據(jù)有標(biāo)識(shí),則對(duì)每一條數(shù)據(jù)都加入已有的標(biāo)識(shí)是指對(duì)每一條數(shù)據(jù)拆分后的第一類型的數(shù)據(jù)和第二類型的數(shù)據(jù)分別加上已有的標(biāo)識(shí),例如,可以對(duì)每一條數(shù)據(jù)拆分后的物料數(shù)據(jù)和轉(zhuǎn)化數(shù)據(jù)分別在物料列表和轉(zhuǎn)化列表中的相應(yīng)具有擴(kuò)展屬性的位置加上已有的標(biāo)識(shí)。
[0053]在本發(fā)明實(shí)施例中,可以按照以下方式對(duì)每一條數(shù)據(jù)加入標(biāo)識(shí):
[0054]步驟1,將需要加入標(biāo)識(shí)的數(shù)據(jù)拆分為關(guān)鍵詞部分和點(diǎn)擊部分。
[0055]例如,以會(huì)話的點(diǎn)擊數(shù)據(jù)為例,其中,會(huì)話具有標(biāo)識(shí)sessionkey,可以將該會(huì)話數(shù)據(jù)拆分為該會(huì)話的關(guān)鍵詞部分和點(diǎn)擊部分,并且關(guān)鍵詞部分和點(diǎn)擊部分可以分別作為物料數(shù)據(jù)和轉(zhuǎn)化數(shù)據(jù)存儲(chǔ)在物料列表和轉(zhuǎn)化列表中。
[0056]步驟2,將關(guān)鍵詞部分和點(diǎn)擊部分分別加上標(biāo)識(shí)。
[0057]例如,根據(jù)上述步驟I中的例子,可以分別在物料列表和轉(zhuǎn)化列表中存儲(chǔ)關(guān)鍵詞部分和點(diǎn)擊部分的相應(yīng)擴(kuò)展屬性的位置加上標(biāo)識(shí)sessionkey。
[0058]步驟S202B,如果判斷出多個(gè)不同數(shù)據(jù)源的數(shù)據(jù)沒有標(biāo)識(shí),則對(duì)每一條數(shù)據(jù)都加入唯一標(biāo)識(shí)。
[0059]在本發(fā)明實(shí)施例中,如果判斷出多個(gè)不同數(shù)據(jù)源的數(shù)據(jù)沒有標(biāo)識(shí),則對(duì)每一條數(shù)據(jù)都加入唯一標(biāo)識(shí)是指對(duì)加入唯一標(biāo)識(shí)的每一條數(shù)據(jù)拆分后的第一類型的數(shù)據(jù)和第二類型的數(shù)據(jù)分別加上唯一標(biāo)識(shí),例如,可以對(duì)每一條加入唯一標(biāo)識(shí)的數(shù)據(jù)拆分后的物料數(shù)據(jù)和轉(zhuǎn)化數(shù)據(jù)分別在物料列表和轉(zhuǎn)化列表中的相應(yīng)具有擴(kuò)展屬性的位置加上唯一的標(biāo)識(shí)。
[0060]步驟S203至步驟S205,分別同圖1所示實(shí)施例的步驟SlOl至步驟S103,在此不再贅述。
[0061]根據(jù)本發(fā)明的實(shí)施例,提供了一種用于多個(gè)數(shù)據(jù)源的數(shù)據(jù)整合處理裝置,該用于多個(gè)數(shù)據(jù)源的數(shù)據(jù)整合處理裝置用于對(duì)不同來源的數(shù)據(jù)進(jìn)行統(tǒng)一整合。需要說明的是,本發(fā)明實(shí)施例的用于多個(gè)數(shù)據(jù)源的數(shù)據(jù)整合處理裝置也可以用于執(zhí)行本發(fā)明實(shí)施例的用于多個(gè)數(shù)據(jù)源的數(shù)據(jù)整合處理方法,本發(fā)明實(shí)施例所提供的用于多個(gè)數(shù)據(jù)源的數(shù)據(jù)整合處理方法可以通過本發(fā)明實(shí)施例的用于多個(gè)數(shù)據(jù)源的數(shù)據(jù)整合處理裝置來執(zhí)行。
[0062]圖3是根據(jù)本發(fā)明第一實(shí)施例的用于多個(gè)數(shù)據(jù)源的數(shù)據(jù)整合處理裝置的示意圖。
[0063]如圖3所示,該裝置包括:獲取單元10、拆分單元20和整合單元30。
[0064]獲取單元10用于獲取來自多個(gè)不同數(shù)據(jù)源的數(shù)據(jù)。在互聯(lián)網(wǎng)廣告領(lǐng)域,來自多個(gè)不同數(shù)據(jù)源的數(shù)據(jù)包括轉(zhuǎn)化數(shù)據(jù)和物料數(shù)據(jù)。轉(zhuǎn)化數(shù)據(jù)是指廣告商投放廣告之后,由于用戶的注冊(cè)、登陸、瀏覽、點(diǎn)擊以及下訂單等行為產(chǎn)生的數(shù)據(jù),轉(zhuǎn)化數(shù)據(jù)與相應(yīng)的廣告實(shí)體相對(duì)應(yīng),這里的廣告實(shí)體即為物料,并且一個(gè)廣告實(shí)體可以對(duì)應(yīng)多個(gè)轉(zhuǎn)化數(shù)據(jù),該轉(zhuǎn)化數(shù)據(jù)可以通過物料收集系統(tǒng)進(jìn)行收集。該轉(zhuǎn)化數(shù)據(jù)可以包括兩種格式的數(shù)據(jù),即可以拆分格式的數(shù)據(jù)和不可以拆分格式的數(shù)據(jù)。其中,可以拆分格式的數(shù)據(jù)是由第一類型的數(shù)據(jù)和第二類型的數(shù)據(jù)組成的。第一類型的數(shù)據(jù)采用字符串的方式進(jìn)行存儲(chǔ),并且第一類型的數(shù)據(jù)可以是轉(zhuǎn)化數(shù)據(jù)對(duì)應(yīng)的廣告實(shí)體的唯一標(biāo)識(shí),即上述字符串可以作為該轉(zhuǎn)化數(shù)據(jù)對(duì)應(yīng)的廣告實(shí)體的關(guān)鍵字。第二類型的數(shù)據(jù)采用鍵值對(duì)的方式進(jìn)行存儲(chǔ),該鍵值對(duì)可以是數(shù)據(jù)類型和數(shù)據(jù)值對(duì),例如,浮點(diǎn)型數(shù)據(jù)和浮點(diǎn)型數(shù)據(jù)的值對(duì)、整形數(shù)據(jù)和整形數(shù)據(jù)的值對(duì)等。不可以拆分格式的數(shù)據(jù)不包含第一類型的數(shù)據(jù),只包含第二類型的數(shù)據(jù),即,不可以拆分格式的數(shù)據(jù)沒有作為該轉(zhuǎn)化數(shù)據(jù)的唯一標(biāo)識(shí)的字符串。
[0065]數(shù)據(jù)源(Data Source)是提供某種所需要數(shù)據(jù)的器件或原始媒體。顧名思義,數(shù)據(jù)源為數(shù)據(jù)的來源。在數(shù)據(jù)源中存儲(chǔ)了所有建立數(shù)據(jù)庫(kù)連接的信息,就象通過指定文件名稱可以在文件系統(tǒng)中找到文件一樣,通過提供正確的數(shù)據(jù)源名稱,可以找到相應(yīng)的數(shù)據(jù)庫(kù)連接。
[0066]在本發(fā)明實(shí)施例中,獲取單元10獲取來自多個(gè)不同數(shù)據(jù)源的數(shù)據(jù)為獲取多條數(shù)據(jù),獲取單元10可以通過多個(gè)數(shù)據(jù)庫(kù)表獲取多個(gè)不同數(shù)據(jù)源的數(shù)據(jù),需要說明的是,多個(gè)不同數(shù)據(jù)源的數(shù)據(jù)可以為描述同一互聯(lián)網(wǎng)實(shí)體的數(shù)據(jù),例如,針對(duì)某件衣服的互聯(lián)網(wǎng)廣告,獲取單元10可以獲取來自廣告商提供的數(shù)據(jù)、用戶自己收集的數(shù)據(jù)和網(wǎng)站監(jiān)控的數(shù)據(jù)等,而上述數(shù)據(jù)均為描述該件衣服的相關(guān)信息(如,衣服的名稱、訂單數(shù)量、單價(jià)和總價(jià)等)的數(shù)據(jù)。
[0067]拆分單元20用于將多個(gè)不同數(shù)據(jù)源的數(shù)據(jù)拆分為第一類型的數(shù)據(jù)和第二類型的數(shù)據(jù)。
[0068]在本發(fā)明實(shí)施例中,可以檢測(cè)多個(gè)不同數(shù)據(jù)源的數(shù)據(jù)的組成部分,當(dāng)檢測(cè)出數(shù)據(jù)的字符除部分時(shí),則拆分單元20將該字符串部分拆分為第一類型的數(shù)據(jù),剩下的數(shù)據(jù)部分作為第二數(shù)據(jù)類型。
[0069]具體地,拆分單元20可以將多個(gè)不同數(shù)據(jù)源的數(shù)據(jù)拆分為物料數(shù)據(jù)和轉(zhuǎn)化數(shù)據(jù)。其中,物料數(shù)據(jù)為描述物料的關(guān)鍵字字符串,轉(zhuǎn)化數(shù)據(jù)為用戶對(duì)物料進(jìn)行操作時(shí)產(chǎn)生的交互數(shù)據(jù)。
[0070]在本發(fā)明實(shí)施例中,拆分單元20可以將數(shù)據(jù)拆分成的第一類型的數(shù)據(jù)存儲(chǔ)在第一數(shù)據(jù)表中,并且可以將轉(zhuǎn)化數(shù)據(jù)拆分成的第二類型的數(shù)據(jù)存儲(chǔ)在第二數(shù)據(jù)表中,其中,第一數(shù)據(jù)表和第二數(shù)據(jù)表可以是同一個(gè)應(yīng)用系統(tǒng)的兩個(gè)列表,并且第一數(shù)據(jù)表和第二數(shù)據(jù)表分別用于存儲(chǔ)字符串格式的數(shù)據(jù)和鍵值對(duì)格式的數(shù)據(jù)。具體地,在將多個(gè)不同數(shù)據(jù)源的轉(zhuǎn)化數(shù)據(jù)拆分為第一類型的數(shù)據(jù)和第二類型的數(shù)據(jù)之后,該用于多個(gè)數(shù)據(jù)源的數(shù)據(jù)整合處理裝置還包括:查找單元、第一存儲(chǔ)單元和第二存儲(chǔ)單元。
[0071]查找單元用于查找預(yù)先設(shè)置的第一數(shù)據(jù)表和第二數(shù)據(jù)表。
[0072]例如,在本發(fā)明實(shí)施例中,查找預(yù)先設(shè)置的第一數(shù)據(jù)表和第二數(shù)據(jù)表可以是分別查找預(yù)先設(shè)置在物料管理系統(tǒng)中的物料(entrance)列表和轉(zhuǎn)化(conversion)列表,其中,物料列表可以用于存儲(chǔ)物料數(shù)據(jù),轉(zhuǎn)化列表可以用于存儲(chǔ)轉(zhuǎn)化數(shù)據(jù)。物料數(shù)據(jù)可以包括廣告推廣計(jì)劃、單元、關(guān)鍵詞、廣告來源、廣告媒介、搜索引擎、訪問時(shí)間和標(biāo)識(shí)等類型的數(shù)據(jù),其中,物料數(shù)據(jù)的部分類型可以為空。轉(zhuǎn)化數(shù)據(jù)可以以鍵值對(duì)的形式存儲(chǔ)數(shù)據(jù),并且轉(zhuǎn)化數(shù)據(jù)可以包含若干可以為空的擴(kuò)展屬性,例如,轉(zhuǎn)化數(shù)據(jù)可以包括擴(kuò)展標(biāo)識(shí)的屬性等。
[0073]第一存儲(chǔ)單元用于將第一類型的數(shù)據(jù)存儲(chǔ)至第一數(shù)據(jù)表中。
[0074]在本發(fā)明實(shí)施例中,第一存儲(chǔ)單元可以按照預(yù)設(shè)順序?qū)⒌谝活愋偷臄?shù)據(jù)存儲(chǔ)至第一數(shù)據(jù)表中,也第一存儲(chǔ)單元可以隨機(jī)將第一類型的數(shù)據(jù)存儲(chǔ)至第一數(shù)據(jù)表中。
[0075]第二存儲(chǔ)單元用于將第二類型的數(shù)據(jù)存儲(chǔ)至第二數(shù)據(jù)表中。
[0076]在本發(fā)明實(shí)施例中,第二存儲(chǔ)單元可以按照預(yù)設(shè)順序?qū)⒌诙愋偷臄?shù)據(jù)存儲(chǔ)至第二數(shù)據(jù)表中,也第二存儲(chǔ)單元可以隨機(jī)將第二類型的數(shù)據(jù)存儲(chǔ)至第二數(shù)據(jù)表中。
[0077]整合單元30用于對(duì)第一類型的數(shù)據(jù)和第二類型的數(shù)據(jù)進(jìn)行數(shù)據(jù)整合處理。
[0078]在本發(fā)明實(shí)施例中,整合單元30可以將轉(zhuǎn)化數(shù)據(jù)和物料數(shù)據(jù)進(jìn)行匹配,并根據(jù)物料管理系統(tǒng)的具體配置,先刪除用戶不關(guān)注的轉(zhuǎn)化數(shù)據(jù)部分和無效的轉(zhuǎn)化數(shù)據(jù)部分(例如,用戶只關(guān)注某個(gè)廣告中下訂單的轉(zhuǎn)化數(shù)據(jù)時(shí),就可以將僅僅由于瀏覽而產(chǎn)生的轉(zhuǎn)化數(shù)據(jù)刪除。),再將剩余的轉(zhuǎn)化數(shù)據(jù)和物料數(shù)據(jù)進(jìn)行歸因處理,最后將其導(dǎo)入物料管理系統(tǒng)的目標(biāo)表中展示給用戶。
[0079]通過本發(fā)明,解決了相關(guān)技術(shù)中不能對(duì)不同來源的轉(zhuǎn)化數(shù)據(jù)進(jìn)行統(tǒng)一整合的問題,進(jìn)而達(dá)到了統(tǒng)一整合不同來源的轉(zhuǎn)化數(shù)據(jù)的效果。
[0080]圖4是根據(jù)本發(fā)明第二實(shí)施例的用于多個(gè)數(shù)據(jù)源的數(shù)據(jù)整合處理裝置的示意圖。
[0081]如圖4所示,該實(shí)施例可以作為圖3所示實(shí)施例的優(yōu)選實(shí)施方式,該用于網(wǎng)頁(yè)頁(yè)面點(diǎn)擊展現(xiàn)的數(shù)據(jù)處理裝置除了包括:獲取單元10、拆分單元20和整合單元30之外,還包括:判斷單元40、第一加入單元50和第二加入單元60。
[0082]獲取單元10、拆分單元20和整合單元30的作用與圖5所示實(shí)施例中的相同,在此不再贅述。
[0083]判斷單元40用于判斷多個(gè)不同數(shù)據(jù)源的數(shù)據(jù)是否有標(biāo)識(shí)。
[0084]在本發(fā)明實(shí)施例中,在將多個(gè)不同數(shù)據(jù)源的轉(zhuǎn)化數(shù)據(jù)拆分為第一類型的數(shù)據(jù)和第二類型的數(shù)據(jù)之前,判斷單元40可以判斷多個(gè)不同數(shù)據(jù)源的數(shù)據(jù)是否有標(biāo)識(shí)。具體地,判斷單元40可以檢測(cè)多個(gè)不同數(shù)據(jù)源的數(shù)據(jù)是否具有字符串?dāng)?shù)據(jù),當(dāng)檢測(cè)上述數(shù)據(jù)具有字符串?dāng)?shù)據(jù)時(shí),判斷出多個(gè)不同數(shù)據(jù)源的數(shù)據(jù)有標(biāo)識(shí),其中,該標(biāo)識(shí)即為上述檢測(cè)出的字符串,否則當(dāng)檢測(cè)上述數(shù)據(jù)不具有字符串?dāng)?shù)據(jù)時(shí),判斷出多個(gè)不同數(shù)據(jù)源的數(shù)據(jù)沒有標(biāo)識(shí)。需要說明的是,在本發(fā)明實(shí)施例中,只有具有標(biāo)識(shí)的多個(gè)不同數(shù)據(jù)源的數(shù)據(jù)采可以進(jìn)行拆分處理,即,可以將多個(gè)不同數(shù)據(jù)源的數(shù)據(jù)拆分成物料數(shù)據(jù)和轉(zhuǎn)化數(shù)據(jù),并且拆分之后物料數(shù)據(jù)和轉(zhuǎn)化數(shù)據(jù)都可以用該多個(gè)不同數(shù)據(jù)源的數(shù)據(jù)的標(biāo)識(shí)進(jìn)行標(biāo)識(shí)。在本發(fā)明實(shí)施例中,對(duì)沒有標(biāo)識(shí)的多個(gè)不同數(shù)據(jù)源的數(shù)據(jù)不能進(jìn)行直接拆分,但是可以先為該沒有標(biāo)識(shí)的多個(gè)不同數(shù)據(jù)源的數(shù)據(jù)隨機(jī)生成一個(gè)字符串作為其標(biāo)識(shí),該標(biāo)識(shí)即為物料數(shù)據(jù),然后再將上述多個(gè)不同數(shù)據(jù)源的數(shù)據(jù)進(jìn)拆分為物料數(shù)據(jù)和轉(zhuǎn)化數(shù)據(jù),并且將拆分得到的物料數(shù)據(jù)和轉(zhuǎn)化數(shù)據(jù)用該標(biāo)識(shí)進(jìn)行唯一標(biāo)記。需要說明的是,來自多個(gè)不同數(shù)據(jù)源的不同數(shù)據(jù)對(duì)應(yīng)的標(biāo)識(shí)不同,即每個(gè)該數(shù)據(jù)的標(biāo)識(shí)是唯一的。
[0085]第一加入單元50用于如果判斷出多個(gè)不同數(shù)據(jù)源的數(shù)據(jù)有標(biāo)識(shí),則對(duì)每一條數(shù)據(jù)都加入已有的標(biāo)識(shí)。
[0086]在本發(fā)明實(shí)施例中,如果判斷出多個(gè)不同數(shù)據(jù)源的數(shù)據(jù)有標(biāo)識(shí),則第一加入單元50對(duì)每一條數(shù)據(jù)都加入已有的標(biāo)識(shí)是指對(duì)每一條數(shù)據(jù)拆分后的第一類型的數(shù)據(jù)和第二類型的數(shù)據(jù)分別加上已有的標(biāo)識(shí),例如,第一加入單元50可以對(duì)每一條數(shù)據(jù)拆分后的物料數(shù)據(jù)和轉(zhuǎn)化數(shù)據(jù)分別在物料列表和轉(zhuǎn)化列表中的相應(yīng)具有擴(kuò)展屬性的位置加上已有的標(biāo)識(shí)。
[0087]在本發(fā)明實(shí)施例中,第一加入單元50可以包括拆分模塊和加入模塊。
[0088]拆分模塊用于將需要加入標(biāo)識(shí)的數(shù)據(jù)拆分為關(guān)鍵詞部分和點(diǎn)擊部分。
[0089]例如,以會(huì)話的點(diǎn)擊數(shù)據(jù)為例,其中,會(huì)話具有標(biāo)識(shí)sessionkey,拆分模塊可以將該會(huì)話數(shù)據(jù)拆分為該會(huì)話的關(guān)鍵詞部分和點(diǎn)擊部分,并且關(guān)鍵詞部分和點(diǎn)擊部分可以分別作為物料數(shù)據(jù)和轉(zhuǎn)化數(shù)據(jù)存儲(chǔ)在物料列表和轉(zhuǎn)化列表中。
[0090]加入模塊用于將關(guān)鍵詞部分和點(diǎn)擊部分分別加上標(biāo)識(shí)。
[0091]例如,根據(jù)上述例子,加入模塊可以分別在物料列表和轉(zhuǎn)化列表中存儲(chǔ)關(guān)鍵詞部分和點(diǎn)擊部分的相應(yīng)擴(kuò)展屬性的位置加上標(biāo)識(shí)sessionkey。
[0092]第二加入單元60用于如果判斷出多個(gè)不同數(shù)據(jù)源的數(shù)據(jù)沒有標(biāo)識(shí),則對(duì)每一條數(shù)據(jù)都加入唯一標(biāo)識(shí)。
[0093]在本發(fā)明實(shí)施例中,如果判斷出多個(gè)不同數(shù)據(jù)源的數(shù)據(jù)沒有標(biāo)識(shí),則第二加入單元60對(duì)每一條數(shù)據(jù)都加入唯一標(biāo)識(shí)是指對(duì)加入唯一標(biāo)識(shí)的每一條數(shù)據(jù)拆分后的第一類型的數(shù)據(jù)和第二類型的數(shù)據(jù)分別加上唯一標(biāo)識(shí),例如,第二加入單元60可以對(duì)每一條加入唯一標(biāo)識(shí)的數(shù)據(jù)拆分后的物料數(shù)據(jù)和轉(zhuǎn)化數(shù)據(jù)分別在物料列表和轉(zhuǎn)化列表中的相應(yīng)具有擴(kuò)展屬性的位置加上唯一的標(biāo)識(shí)。
[0094]從以上的描述中,可以看出,本發(fā)明實(shí)現(xiàn)了將不同數(shù)據(jù)源拆分成可以識(shí)別的轉(zhuǎn)化數(shù)據(jù)和物料數(shù)據(jù)的目的,進(jìn)而達(dá)到了統(tǒng)一整合不同來源的數(shù)據(jù)的效果。
[0095]需要說明的是,在附圖的流程圖示出的步驟可以在諸如一組計(jì)算機(jī)可執(zhí)行指令的計(jì)算機(jī)系統(tǒng)中執(zhí)行,并且,雖然在流程圖中示出了邏輯順序,但是在某些情況下,可以以不同于此處的順序執(zhí)行所示出或描述的步驟。
[0096]顯然,本領(lǐng)域的技術(shù)人員應(yīng)該明白,上述的本發(fā)明的各模塊或各步驟可以用通用的計(jì)算裝置來實(shí)現(xiàn),它們可以集中在單個(gè)的計(jì)算裝置上,或者分布在多個(gè)計(jì)算裝置所組成的網(wǎng)絡(luò)上,可選地,它們可以用計(jì)算裝置可執(zhí)行的程序代碼來實(shí)現(xiàn),從而,可以將它們存儲(chǔ)在存儲(chǔ)裝置中由計(jì)算裝置來執(zhí)行,或者將它們分別制作成各個(gè)集成電路模塊,或者將它們中的多個(gè)模塊或步驟制作成單個(gè)集成電路模塊來實(shí)現(xiàn)。這樣,本發(fā)明不限制于任何特定的硬件和軟件結(jié)合。
[0097]以上所述僅為本發(fā)明的優(yōu)選實(shí)施例而已,并不用于限制本發(fā)明,對(duì)于本領(lǐng)域的技術(shù)人員來說,本發(fā)明可以有各種更改和變化。凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
【權(quán)利要求】
1.一種用于多個(gè)數(shù)據(jù)源的數(shù)據(jù)整合處理方法,其特征在于,包括:獲取來自多個(gè)不同數(shù)據(jù)源的數(shù)據(jù);將所述多個(gè)不同數(shù)據(jù)源的數(shù)據(jù)拆分為第一類型的數(shù)據(jù)和第二類型的數(shù)據(jù);以及對(duì)所述第一類型的數(shù)據(jù)和所述第二類型的數(shù)據(jù)進(jìn)行數(shù)據(jù)整合處理。
2.根據(jù)權(quán)利要求1所述的數(shù)據(jù)整合處理方法,其特征在于,在將所述多個(gè)不同數(shù)據(jù)源的數(shù)據(jù)拆分為第一類型的數(shù)據(jù)和第二類型的數(shù)據(jù)之前,所述數(shù)據(jù)整合處理方法還包括:判斷所述多個(gè)不同數(shù)據(jù)源的數(shù)據(jù)是否有標(biāo)識(shí);如果判斷出所述多個(gè)不同數(shù)據(jù)源的數(shù)據(jù)有標(biāo)識(shí),則對(duì)每一條數(shù)據(jù)都加入已有的標(biāo)識(shí);以及如果判斷出所述多個(gè)不同數(shù)據(jù)源的數(shù)據(jù)沒有標(biāo)識(shí),則對(duì)每一條數(shù)據(jù)都加入唯一標(biāo)識(shí)。
3.根據(jù)權(quán)利要求2所述的數(shù)據(jù)整合處理方法,其特征在于,按照以下方式對(duì)每一條數(shù)據(jù)加入標(biāo)識(shí):將需要加入標(biāo)識(shí)的數(shù)據(jù)拆分為關(guān)鍵字部分和點(diǎn)擊部分;以及將所述關(guān)鍵字部分和所述點(diǎn)擊部分分別加上標(biāo)識(shí)。
4.根據(jù)權(quán)利要求1所述的數(shù)據(jù)整合處理方法,其特征在于,在將所述多個(gè)不同數(shù)據(jù)源的數(shù)據(jù)拆分為第一類型的數(shù)據(jù)和第二類型的數(shù)據(jù)之后,所述數(shù)據(jù)整合處理方法還包括:查找預(yù)先設(shè)置的第一數(shù)據(jù)表和第二數(shù)據(jù)表;將所述第一類型的數(shù)據(jù)存儲(chǔ)至所述第一數(shù)據(jù)表中;以及將所述第二類型的數(shù)據(jù)存儲(chǔ)至所述第二數(shù)據(jù)表中。
5.根據(jù)權(quán)利要求1所述的數(shù)據(jù)整合處理方法,其特征在于,將所述多個(gè)不同數(shù)據(jù)源的數(shù)據(jù)拆分為第一類型的數(shù)據(jù)和第二類型的數(shù)據(jù)包括:將所述多個(gè)不同數(shù)據(jù)源的數(shù)據(jù)拆分為物料數(shù)據(jù)和轉(zhuǎn)化數(shù)據(jù)。
6.一種用于多個(gè)數(shù)據(jù)源的數(shù)據(jù)整合處理裝置,其特征在于,包括:獲取單元,用于獲取來自多個(gè)不同數(shù)據(jù)源的數(shù)據(jù);拆分單元,用于將所述多個(gè)不同數(shù)據(jù)源的數(shù)據(jù)拆分為第一類型的數(shù)據(jù)和第二類型的數(shù)據(jù);以及整合單元,用于對(duì)所述第一類型的數(shù)據(jù)和所述第二類型的數(shù)據(jù)進(jìn)行數(shù)據(jù)整合處理。
7.根據(jù)權(quán)利要求6所述的數(shù)據(jù)整合處理裝置,其特征在于,還包括:判斷單元,用于在將所述多個(gè)不同數(shù)據(jù)源的數(shù)據(jù)拆分為第一類型的數(shù)據(jù)和第二類型的數(shù)據(jù)之前,判斷所述多個(gè)不同數(shù)據(jù)源的數(shù)據(jù)是否有標(biāo)識(shí);第一加入單元,用于如果判斷出所述多個(gè)不同數(shù)據(jù)源的數(shù)據(jù)有標(biāo)識(shí),則對(duì)每一條數(shù)據(jù)都加入已有的標(biāo)識(shí);以及第二加入單元,用于如果判斷出所述多個(gè)不同數(shù)據(jù)源的數(shù)據(jù)沒有標(biāo)識(shí),則對(duì)每一條數(shù)據(jù)都加入唯一標(biāo)識(shí)。
8.根據(jù)權(quán)利要求7所述的數(shù)據(jù)整合處理裝置,其特征在于,所述第一加入單元包括:拆分模塊,用于將需要加入標(biāo)識(shí)的數(shù)據(jù)拆分為關(guān)鍵字部分和點(diǎn)擊部分;以及加入模塊,用于將所述關(guān)鍵字部分和所述點(diǎn)擊部分分別加上標(biāo)識(shí)。
9.根據(jù)權(quán)利要求6所述的數(shù)據(jù)整合處理裝置,其特征在于,在將所述多個(gè)不同數(shù)據(jù)源的數(shù)據(jù)拆分為第一類型的數(shù)據(jù)和第二類型的數(shù)據(jù)之后,還包括:查找單元,用于查找預(yù)先設(shè)置的第一數(shù)據(jù)表和第二數(shù)據(jù)表;第一存儲(chǔ)單元,用于將所述第一類型的數(shù)據(jù)存儲(chǔ)至所述第一數(shù)據(jù)表中;以及第二存儲(chǔ)單元,用于將所述第二類型的數(shù)據(jù)存儲(chǔ)至所述第二數(shù)據(jù)表中。
10.根據(jù)權(quán)利要求6所述的數(shù)據(jù)整合處理裝置,其特征在于,所述拆分單元還用于將所述多個(gè)不同數(shù)據(jù)源的數(shù)據(jù) 拆分為物料數(shù)據(jù)和轉(zhuǎn)化數(shù)據(jù)。
【文檔編號(hào)】G06F17/30GK103605715SQ201310566735
【公開日】2014年2月26日 申請(qǐng)日期:2013年11月14日 優(yōu)先權(quán)日:2013年11月14日
【發(fā)明者】陳改靜, 楊基彬, 蔡波 申請(qǐng)人:北京國(guó)雙科技有限公司