數(shù)據(jù)挖掘系統(tǒng)及數(shù)據(jù)挖掘方法【專利摘要】本發(fā)明涉及數(shù)據(jù)挖掘系統(tǒng)及數(shù)據(jù)挖掘方法,其中數(shù)據(jù)挖掘系統(tǒng)包括:數(shù)據(jù)源整合模塊、存儲(chǔ)模塊、挖掘模塊以及輸出模塊;數(shù)據(jù)源整合模塊用于對(duì)用戶提交給搜索引擎的查詢?cè)~與預(yù)先存儲(chǔ)的購買詞進(jìn)行相關(guān)性匹配,以形成查詢?cè)~和購買詞之間關(guān)聯(lián)關(guān)系對(duì)應(yīng)的至少一種數(shù)據(jù)源;存儲(chǔ)模塊利用各數(shù)據(jù)源的查詢?cè)~、購買詞之間的關(guān)聯(lián)關(guān)系,在查詢?cè)~、購買詞之間建立圖的存儲(chǔ)結(jié)構(gòu);挖掘模塊基于圖的存儲(chǔ)結(jié)構(gòu)構(gòu)建網(wǎng)絡(luò)拓?fù)潢P(guān)系圖,并作基于圖的數(shù)據(jù)挖掘;輸出模塊根據(jù)用戶輸入的不同應(yīng)用需求,將數(shù)據(jù)挖掘的結(jié)果進(jìn)行輸出以使用戶對(duì)所述輸出結(jié)果進(jìn)行選擇,從而觸發(fā)輸出信息的展示。本發(fā)明能夠從多視圖、多粒度對(duì)業(yè)務(wù)數(shù)據(jù)進(jìn)行分析?!緦@f明】數(shù)據(jù)挖掘系統(tǒng)及數(shù)據(jù)挖掘方法【
技術(shù)領(lǐng)域:
】[0001]本發(fā)明涉及互聯(lián)網(wǎng)挖掘【
技術(shù)領(lǐng)域:
】,特別涉及數(shù)據(jù)挖掘系統(tǒng)及數(shù)據(jù)挖掘方法。【
背景技術(shù):
】[0002]隨著互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展,各大廠商在網(wǎng)絡(luò)上投放的信息數(shù)量也越來越多,因此,有必要對(duì)數(shù)據(jù)的挖掘技術(shù)進(jìn)行研究以使客戶能從大量的網(wǎng)絡(luò)信息中找到所需要的信息。目前,各大網(wǎng)絡(luò)運(yùn)營商對(duì)數(shù)據(jù)挖掘技術(shù)研究的方法大致分為以下幾種:一種方法是通過半自動(dòng)化的方式建立網(wǎng)頁分類體系,并引入數(shù)據(jù)分類和查詢?cè)~/購買詞(query/bidterm)分類等屬性特征,結(jié)合網(wǎng)頁搜索結(jié)果進(jìn)行相關(guān)性反饋,從而找到所需要的信息。另一種方法是采用基于字面的文字匹配。再一種方法是采用基于語義的概率潛在語義分析(probabilisticlatentsemanticanalysis,PLSA)相關(guān)性模型方式而找到所需要的信息。[0003]但是,上述現(xiàn)有的數(shù)據(jù)挖掘方法均未涉及數(shù)據(jù)源樣本的拓?fù)浣Y(jié)構(gòu),難以從系統(tǒng)整體結(jié)構(gòu)和動(dòng)態(tài)演化的角度發(fā)現(xiàn)多視圖、多粒度的整體結(jié)構(gòu)知識(shí),容易遺漏信息業(yè)務(wù)中潛在的數(shù)據(jù)特征,從而給客戶提供的信息的挖掘結(jié)果不全面?!?br/>發(fā)明內(nèi)容】[0004]因此,本發(fā)明提供數(shù)據(jù)挖掘系統(tǒng)及數(shù)據(jù)挖掘方法,以克服現(xiàn)有互聯(lián)網(wǎng)挖掘技術(shù)存在的問題。[0005]具體地,本發(fā)明實(shí)施例提出的一種數(shù)據(jù)挖掘系統(tǒng),包括:數(shù)據(jù)源整合模塊、存儲(chǔ)模塊、挖掘模塊以及存儲(chǔ)器;數(shù)據(jù)源整合模塊用于對(duì)用戶提交給搜索引擎的查詢?cè)~與預(yù)先存儲(chǔ)的購買詞進(jìn)行相關(guān)性匹配,以形成查詢?cè)~和購買詞之間關(guān)聯(lián)關(guān)系對(duì)應(yīng)的至少一種數(shù)據(jù)源;存儲(chǔ)模塊利用各數(shù)據(jù)源的查詢?cè)~、購買詞之間的關(guān)聯(lián)關(guān)系,在查詢?cè)~、購買詞之間建立圖的存儲(chǔ)結(jié)構(gòu);挖掘模塊基于圖的存儲(chǔ)結(jié)構(gòu)構(gòu)建網(wǎng)絡(luò)拓?fù)潢P(guān)系圖,并作基于圖的數(shù)據(jù)挖掘;輸出模塊,根據(jù)用戶輸入的不同應(yīng)用需求,將數(shù)據(jù)挖掘的結(jié)果進(jìn)行輸出以使用戶對(duì)輸出結(jié)果進(jìn)行選擇,從而觸發(fā)輸出信息的展示。[0006]在本發(fā)明實(shí)施例中,上述數(shù)據(jù)源例如包括q2b、q2q以及b2b。上述數(shù)據(jù)挖掘系統(tǒng)例如還進(jìn)一步包括:存儲(chǔ)模塊,將數(shù)據(jù)源中的查詢?cè)~、購買詞及其核心成分抽象成節(jié)點(diǎn),節(jié)點(diǎn)之間的關(guān)聯(lián)關(guān)系抽象成邊,節(jié)點(diǎn)和邊附加屬性并且可擴(kuò)展,從而在查詢?cè)~、購買詞之間建立圖的存儲(chǔ)結(jié)構(gòu)。上述挖掘模塊例如使用復(fù)雜網(wǎng)絡(luò)的知識(shí)對(duì)圖進(jìn)行挖掘。上述數(shù)據(jù)挖掘系統(tǒng)例如還進(jìn)一步包括:存儲(chǔ)器,用于存儲(chǔ)購買詞、查詢?cè)~、數(shù)據(jù)源、圖的存儲(chǔ)結(jié)構(gòu)和挖掘模塊數(shù)據(jù)挖掘的結(jié)果。上述數(shù)據(jù)挖掘系統(tǒng)例如還進(jìn)一步包括:反饋模塊,用于將用戶選擇的輸出結(jié)果反饋給數(shù)據(jù)源整合模塊以使數(shù)據(jù)源整合模塊根據(jù)反饋模塊的反饋形成新的至少一種數(shù)據(jù)源。[0007]另外,本發(fā)明實(shí)施例提出的一種數(shù)據(jù)挖掘方法,其包括:對(duì)用戶提交給搜索引擎的查詢?cè)~與預(yù)先存儲(chǔ)的購買詞進(jìn)行相關(guān)性匹配,以形成查詢?cè)~和購買詞之間關(guān)聯(lián)關(guān)系對(duì)應(yīng)的至少一種數(shù)據(jù)源;利用各數(shù)據(jù)源查詢?cè)~、購買詞之間的關(guān)聯(lián)關(guān)系,在查詢?cè)~、購買詞之間建立圖的存儲(chǔ)結(jié)構(gòu);基于圖的存儲(chǔ)結(jié)構(gòu)構(gòu)建網(wǎng)絡(luò)拓?fù)潢P(guān)系圖,并作基于圖的數(shù)據(jù)挖掘;以及根據(jù)用戶輸入的不同應(yīng)用需求將數(shù)據(jù)挖掘的結(jié)果進(jìn)行輸出以使用戶對(duì)輸出結(jié)果進(jìn)行選擇,從而觸發(fā)輸出信息的展示。[0008]在本發(fā)明實(shí)施例中,上述數(shù)據(jù)挖掘方法在執(zhí)行基于所述圖的存儲(chǔ)結(jié)構(gòu)構(gòu)建網(wǎng)絡(luò)拓?fù)潢P(guān)系圖的步驟中例如進(jìn)一步包括步驟:使用復(fù)雜網(wǎng)絡(luò)的知識(shí)對(duì)所述圖進(jìn)行數(shù)據(jù)挖掘。上述數(shù)據(jù)挖掘方法在執(zhí)行根據(jù)用戶輸入的不同應(yīng)用需求,將數(shù)據(jù)挖掘的結(jié)果進(jìn)行輸出的步驟中例如進(jìn)一步包括步驟:將用戶選擇的輸出結(jié)果進(jìn)行反饋,并返回執(zhí)行對(duì)用戶提交給搜索引擎的查詢?cè)~與購買詞進(jìn)行相關(guān)性匹配的步驟。上述數(shù)據(jù)挖掘方法在執(zhí)行利用各數(shù)據(jù)源查詢?cè)~、購買詞之間的關(guān)聯(lián)關(guān)系的步驟中例如進(jìn)一步包括步驟:將數(shù)據(jù)源中的查詢?cè)~、購買詞及其核心成分抽象成節(jié)點(diǎn),節(jié)點(diǎn)之間的關(guān)聯(lián)關(guān)系抽象成邊,節(jié)點(diǎn)和邊附加屬性并且可擴(kuò)展從而在查詢?cè)~、購買詞之間建立圖的存儲(chǔ)結(jié)構(gòu)。[0009]由上述實(shí)施例可知,本發(fā)明通過整合不同種類的數(shù)據(jù)源,并通過分布式的數(shù)據(jù)庫設(shè)計(jì)對(duì)圖的關(guān)聯(lián)關(guān)系(短串間關(guān)系)進(jìn)行存儲(chǔ),再通過應(yīng)用圖論知識(shí)、復(fù)雜網(wǎng)絡(luò)知識(shí)刻畫由數(shù)據(jù)源構(gòu)成的圖,對(duì)其進(jìn)行數(shù)據(jù)分析、并作基于圖的數(shù)據(jù)挖掘,從而使得本發(fā)明從多視圖、多粒度對(duì)業(yè)務(wù)數(shù)據(jù)進(jìn)行了分析,并且能夠支持海量數(shù)據(jù)集、還提供了可復(fù)用的擴(kuò)展服務(wù)。[0010]上述說明僅是本發(fā)明技術(shù)方案的概述,為了能夠更清楚了解本發(fā)明的技術(shù)手段,而可依照說明書的內(nèi)容予以實(shí)施,并且為了讓本發(fā)明的上述和其他目的、特征和優(yōu)點(diǎn)能夠更明顯易懂,以下特舉較佳實(shí)施例,并配合附圖,詳細(xì)說明如下?!緦@綀D】【附圖說明】[0011]圖1是本發(fā)明實(shí)施例提出的數(shù)據(jù)挖掘系統(tǒng)的主要架構(gòu)框圖;[0012]圖2是圖1的數(shù)據(jù)挖掘系統(tǒng)對(duì)查詢?cè)~進(jìn)行糾錯(cuò)提示的示意圖;[0013]圖3是圖1的數(shù)據(jù)挖掘系統(tǒng)對(duì)查詢?cè)~進(jìn)行輔助提示的示意圖;[0014]圖4是圖1的數(shù)據(jù)挖掘系統(tǒng)對(duì)查詢?cè)~進(jìn)行相關(guān)搜索提示的示意圖;[0015]圖5是圖1的數(shù)據(jù)挖掘系統(tǒng)的廣告信息的組織結(jié)構(gòu)的示意圖;[0016]圖6是圖1的數(shù)據(jù)挖掘系統(tǒng)的局部子圖結(jié)構(gòu)的示意圖;[0017]圖7是本發(fā)明實(shí)施例提出的數(shù)據(jù)挖掘方法的步驟流程圖。【具體實(shí)施方式】[0018]為更進(jìn)一步闡述本發(fā)明為達(dá)成預(yù)定發(fā)明目的所采取的技術(shù)手段及功效,以下結(jié)合附圖及較佳實(shí)施例,對(duì)依據(jù)本發(fā)明提出的數(shù)據(jù)挖掘系統(tǒng)及數(shù)據(jù)挖掘方法其【具體實(shí)施方式】、結(jié)構(gòu)、特征及功效,詳細(xì)說明如后。[0019]有關(guān)本發(fā)明的前述及其他技術(shù)內(nèi)容、特點(diǎn)及功效,在以下配合參考圖式的較佳實(shí)施例詳細(xì)說明中將可清楚的呈現(xiàn)。通過【具體實(shí)施方式】的說明,當(dāng)可對(duì)本發(fā)明為達(dá)成預(yù)定目的所采取的技術(shù)手段及功效得以更加深入且具體的了解,然而所附圖式僅是提供參考與說明之用,并非用來對(duì)本發(fā)明加以限制。[0020]圖1是本發(fā)明實(shí)施例提出的數(shù)據(jù)挖掘系統(tǒng)的主要架構(gòu)框圖。圖2是圖1的數(shù)據(jù)挖掘系統(tǒng)對(duì)查詢?cè)~進(jìn)行糾錯(cuò)提示的示意圖。圖3是圖1的數(shù)據(jù)挖掘系統(tǒng)對(duì)查詢?cè)~進(jìn)行輔助提示的示意圖。圖4是圖1的數(shù)據(jù)挖掘系統(tǒng)對(duì)查詢?cè)~進(jìn)行相關(guān)搜索提示的示意圖。圖5是圖I的數(shù)據(jù)挖掘系統(tǒng)的廣告信息的組織結(jié)構(gòu)的示意圖。圖6是圖1的數(shù)據(jù)挖掘系統(tǒng)的局部子圖結(jié)構(gòu)的示意圖。請(qǐng)一并參閱圖1至圖6,數(shù)據(jù)挖掘系統(tǒng)包括:數(shù)據(jù)源整合模塊100、存儲(chǔ)模塊102、挖掘模塊106以及輸出模塊108。[0021]此外,數(shù)據(jù)挖掘系統(tǒng)還可以包括存儲(chǔ)器104以及反饋模塊110,以整合更多的功倉泛。[0022]更具體地,數(shù)據(jù)源整合模塊100,用于對(duì)用戶提交給搜索引擎的查詢?cè)~與預(yù)先存儲(chǔ)的購買詞進(jìn)行相關(guān)性匹配,以形成查詢?cè)~和購買詞之間至少一種關(guān)聯(lián)關(guān)系對(duì)應(yīng)的至少一種數(shù)據(jù)源。[0023]其中,用戶可通過搜索引擎輸入查詢?cè)~以查找用戶所需要的信息,例如廣告信息。數(shù)據(jù)源整合模塊100整合的數(shù)據(jù)源例如主要包括q2b、q2q以及b2b三種。[0024]q2b數(shù)據(jù)源的形成方式如下:數(shù)據(jù)源整合模塊100對(duì)用戶提交給搜索引擎的查詢?cè)~進(jìn)行分析,并將查詢?cè)~與買主購買且即時(shí)生效的關(guān)鍵詞(即購買詞)進(jìn)行相關(guān)性匹配。其中,在查詢?cè)~與購買詞進(jìn)行匹配的過程中,數(shù)據(jù)源整合模塊100可通過在線、離線的方法,采用查詢?cè)~與購買詞兩者之間的語義相關(guān)性方法對(duì)查詢?cè)~進(jìn)行各種智能匹配,以使查詢?cè)~關(guān)聯(lián)到更多的購買詞(bidterm),從而形成查詢?cè)~與購買詞之間關(guān)聯(lián)關(guān)系的數(shù)據(jù)源,這種數(shù)據(jù)源可稱為q2b(即query到bidterm的擴(kuò)展)。[0025]q2q數(shù)據(jù)源的形成方式如下:數(shù)據(jù)源整合模塊100對(duì)用戶提交給搜索引擎的查詢?cè)~所表現(xiàn)出的特征進(jìn)行相應(yīng)擴(kuò)展,常用的擴(kuò)展方法有:(I)糾錯(cuò)提示,例如如圖2所示當(dāng)用戶通過查詢區(qū)200輸入查詢?cè)~為“王物”時(shí)則在提示區(qū)202提示用戶是否要查詢“王五”;(2)查詢?cè)~的上下文修改,例如查詢?cè)~為“北京鮮花快遞”時(shí),則將查詢?cè)~擴(kuò)展為“鮮花快遞北京”等,(3)輔助提示,例如圖3對(duì)查詢?cè)~搜索時(shí)會(huì)有輔助提示,當(dāng)用戶通過查詢區(qū)300輸入“iphone4S”時(shí),則在提示區(qū)302會(huì)有相關(guān)的輔助提示;(4)相關(guān)搜索提示,例如如圖4所示通過查詢區(qū)400對(duì)查詢?cè)~搜索時(shí)在提示區(qū)402列有相關(guān)搜索。上述查詢?cè)~間的關(guān)聯(lián)關(guān)系均為查詢?cè)~的擴(kuò)展變化,將這種查詢?cè)~之間的關(guān)聯(lián)關(guān)系的數(shù)據(jù)源稱為q2q(qUery到query的擴(kuò)展)。[0026]b2b數(shù)據(jù)源的形成方式如下:由于在存儲(chǔ)器104中存儲(chǔ)了買主和代理商所購買的購買詞,購買詞一般保存在存儲(chǔ)器104的數(shù)據(jù)庫中,例如圖5所示為一種常見的數(shù)據(jù)庫中存儲(chǔ)的廣告信息的組織結(jié)構(gòu),圖5中,廣告購買詞500依附于廣告組501,每個(gè)廣告主(Advertiser)502可以購買多個(gè)購買詞,每個(gè)購買詞500也可以被不同的廣告主502購買??梢?,廣告信息的這種組織結(jié)構(gòu)決定了各購買詞500之間有一定的關(guān)聯(lián)關(guān)系。數(shù)據(jù)源整合模塊100根據(jù)廣告信息組織結(jié)構(gòu)中購買詞500之間的關(guān)系、購買詞500之間的字面相似情況,語義相關(guān)情況,由搜索結(jié)果、用戶點(diǎn)擊行為等關(guān)聯(lián)起來的情況等,從而形成購買詞與購買詞之間關(guān)聯(lián)關(guān)系和等價(jià)關(guān)系的數(shù)據(jù)源,這種數(shù)據(jù)源可稱為b2b(bidterm到bidterm的擴(kuò)展)。[0027]存儲(chǔ)模塊102,利用各數(shù)據(jù)源的節(jié)點(diǎn)與節(jié)點(diǎn)(節(jié)點(diǎn)即查詢?cè)~、購買詞)之間的關(guān)聯(lián)關(guān)系(即圖的短串關(guān)系),在查詢?cè)~、購買詞之間建立圖的存儲(chǔ)結(jié)構(gòu),并將圖的存儲(chǔ)結(jié)構(gòu)發(fā)送到存儲(chǔ)器104中進(jìn)行存儲(chǔ)。[0028]其中,由于各個(gè)數(shù)據(jù)源均是描述數(shù)據(jù)業(yè)務(wù)中實(shí)體間的關(guān)聯(lián)關(guān)系,它們并不是相互獨(dú)立的集合,而是彼此聯(lián)系的,因此可使用圖(graph)的數(shù)據(jù)結(jié)構(gòu)對(duì)上述數(shù)據(jù)源進(jìn)行抽象表達(dá)和存儲(chǔ)設(shè)計(jì)。存儲(chǔ)模塊102例如可以采用如下方式設(shè)計(jì)圖的存儲(chǔ)結(jié)構(gòu):可以將數(shù)據(jù)源中的查詢?cè)~、購買詞及其核心成分(例如查詢?cè)~、購買詞的重要詞組等)抽象成節(jié)點(diǎn),節(jié)點(diǎn)之間的關(guān)聯(lián)關(guān)系抽象成邊,節(jié)點(diǎn)和邊附加屬性并且可擴(kuò)展,例如圖中的節(jié)點(diǎn)可能種類不同,并且根據(jù)不同的應(yīng)用可以表達(dá)成二部圖(bipartitegraph)或其他模型。節(jié)點(diǎn)的屬性例如可以是所屬數(shù)據(jù)源的類型、對(duì)應(yīng)的字符串文本、行業(yè)分類、語義主題、數(shù)據(jù)的點(diǎn)擊、展示等信息。邊的屬性可以是有向邊、帶權(quán)邊(例如節(jié)點(diǎn)之間的文本、語義、成分、分類等相關(guān)性得分)。如表1所不為一種關(guān)系表結(jié)構(gòu)(bigtable):[0029]表1關(guān)系表結(jié)構(gòu)(bigtable)【權(quán)利要求】1.一種數(shù)據(jù)挖掘系統(tǒng),其特征在于,所述數(shù)據(jù)挖掘系統(tǒng)包括:數(shù)據(jù)源整合模塊,用于對(duì)用戶提交給搜索引擎的查詢?cè)~與預(yù)先存儲(chǔ)的購買詞進(jìn)行相關(guān)性匹配,以形成所述查詢?cè)~和所述購買詞之間關(guān)聯(lián)關(guān)系對(duì)應(yīng)的至少一種數(shù)據(jù)源;存儲(chǔ)模塊,利用所述各數(shù)據(jù)源的查詢?cè)~、購買詞之間的關(guān)聯(lián)關(guān)系,在所述查詢?cè)~、所述購買詞之間建立圖的存儲(chǔ)結(jié)構(gòu);挖掘模塊,基于所述圖的存儲(chǔ)結(jié)構(gòu)構(gòu)建網(wǎng)絡(luò)拓?fù)潢P(guān)系圖,并作基于所述圖的數(shù)據(jù)挖掘;以及輸出模塊,根據(jù)用戶輸入的不同應(yīng)用需求,將數(shù)據(jù)挖掘的結(jié)果進(jìn)行輸出以使用戶對(duì)所述輸出結(jié)果進(jìn)行選擇,從而觸發(fā)輸出信息的展示。2.如權(quán)利要求1所述的數(shù)據(jù)挖掘系統(tǒng),其特征在于,所述數(shù)據(jù)源包括q2b、q2q以及b2b03.如權(quán)利要求1所述的數(shù)據(jù)挖掘系統(tǒng),其特征在于,還包括:存儲(chǔ)模塊,將數(shù)據(jù)源中的所述查詢?cè)~、所述購買詞及其核心成分抽象成節(jié)點(diǎn),所述節(jié)點(diǎn)之間的關(guān)聯(lián)關(guān)系抽象成邊,所述節(jié)點(diǎn)和所述邊附加屬性并且可擴(kuò)展,從而在所述查詢?cè)~、所述購買詞之間建立所述圖的存儲(chǔ)結(jié)構(gòu)。4.如權(quán)利要求1所述的數(shù)據(jù)挖掘系統(tǒng),其特征在于,所述挖掘模塊使用復(fù)雜網(wǎng)絡(luò)的知識(shí)對(duì)所述圖進(jìn)行數(shù)據(jù)挖掘。5.如權(quán)利要求1所述的數(shù)據(jù)挖掘系統(tǒng),其特征在于,還包括:存儲(chǔ)器,用于存儲(chǔ)所述購買詞、所述查詢?cè)~、所述數(shù)據(jù)源、所述圖的存儲(chǔ)結(jié)構(gòu)和所述挖掘模塊數(shù)據(jù)挖掘的結(jié)果。6.如權(quán)利要求1所述的數(shù)據(jù)挖掘系統(tǒng),其特征在于,還包括:反饋模塊,用于將用戶選擇的輸出結(jié)果反饋給所述數(shù)據(jù)源整合模塊以使所述數(shù)據(jù)源整合模塊根據(jù)所述反饋模塊的反饋形成至少一種新的數(shù)據(jù)源。7.一種數(shù)據(jù)挖掘方法,其特征在于,所述數(shù)據(jù)挖掘方法包括:對(duì)用戶提交給搜索引擎的查詢?cè)~與預(yù)先存儲(chǔ)的購買詞進(jìn)行相關(guān)性匹配,以形成所述查詢?cè)~和所述購買詞之間關(guān)聯(lián)關(guān)系對(duì)應(yīng)的至少一種數(shù)據(jù)源;利用各數(shù)據(jù)源查詢?cè)~、購買詞之間的關(guān)聯(lián)關(guān)系,在所述查詢?cè)~、所述購買詞之間建立圖的存儲(chǔ)結(jié)構(gòu);基于所述圖的存儲(chǔ)結(jié)構(gòu)構(gòu)建網(wǎng)絡(luò)拓?fù)潢P(guān)系圖,并作基于所述圖的數(shù)據(jù)挖掘;以及根據(jù)用戶輸入的不同應(yīng)用需求將數(shù)據(jù)挖掘的結(jié)果進(jìn)行輸出以使用戶對(duì)輸出結(jié)果進(jìn)行選擇,從而觸發(fā)輸出信息的展示。8.如權(quán)利要求7所述的數(shù)據(jù)挖掘方法,其特征在于,在執(zhí)行基于所述圖的存儲(chǔ)結(jié)構(gòu)構(gòu)建網(wǎng)絡(luò)拓?fù)潢P(guān)系圖的步驟中,進(jìn)一步包括步驟:使用復(fù)雜網(wǎng)絡(luò)的知識(shí)對(duì)所述圖進(jìn)行數(shù)據(jù)挖掘。9.如權(quán)利要求7所述的數(shù)據(jù)挖掘方法,其特征在于,在執(zhí)行根據(jù)用戶輸入的不同應(yīng)用需求,將數(shù)據(jù)挖掘的結(jié)果進(jìn)行輸出的步驟中,進(jìn)一步包括步驟:將用戶選擇的輸出結(jié)果進(jìn)行反饋,并返回執(zhí)行對(duì)用戶提交給搜索引擎的查詢?cè)~與購買詞進(jìn)行相關(guān)性匹配的步驟。10.如權(quán)利要求7所述的數(shù)據(jù)挖掘方法,其特征在于,在執(zhí)行利用各數(shù)據(jù)源查詢?cè)~、購買詞之間的關(guān)聯(lián)關(guān)系的步驟中,進(jìn)一步包括步驟:將數(shù)據(jù)源中的所述查詢?cè)~、所述購買詞及其核心成分抽象成節(jié)點(diǎn),所述節(jié)點(diǎn)之間的關(guān)聯(lián)關(guān)系抽象成邊,所述節(jié)點(diǎn)和所述邊附加屬性并且可擴(kuò)展,從而在所述查詢?cè)~、所述購買詞之間建立所述圖的存儲(chǔ)結(jié)構(gòu)。【文檔編號(hào)】G06F17/30GK103699550SQ201210369692【公開日】2014年4月2日申請(qǐng)日期:2012年9月27日優(yōu)先權(quán)日:2012年9月27日【發(fā)明者】赫南,姚伶伶,王迪,蘇麒勻,孫國政申請(qǐng)人:騰訊科技(深圳)有限公司