網(wǎng)絡購物的綜合搜索引擎方法及其系統(tǒng)的制作方法
【技術領域】
[0001]本發(fā)明涉及搜索技術領域,尤其涉及一種網(wǎng)絡購物的綜合搜索引擎方法及其系統(tǒng)。
【背景技術】
[0002]在信息時代,搜索引擎已經(jīng)成為我們生活中必不可缺少的一部分,人們通過它在海量的信息海洋中實現(xiàn)快速定位信息、快速獲取信息、快速解決問題的目的。搜索引擎包括通用搜索引擎和垂直搜索引擎。
[0003]通用搜索引擎的技術是利用機器人技術通過網(wǎng)頁抓取程序隨著網(wǎng)頁中的超鏈接,連續(xù)的抓取網(wǎng)頁,然后根據(jù)搜索引擎表倒排表,即由索引項查找相應的URL。索引表也要記錄索引項在文檔中出現(xiàn)的位置,以便檢索器計算索引項之間的相鄰或接近的關系,并以特定的數(shù)據(jù)結構存儲在硬盤上,最后供用戶使用。該技術能夠快速返回大量的信息給用戶,但當我們在海量的網(wǎng)路數(shù)據(jù)查詢我們特定的信息時,我們會發(fā)現(xiàn)這些搜索引擎返回給我們的大量信息并不是我們所需要的,而我們真正所需要的信息并非總是在第一時間以及醒目的位置出現(xiàn),可見,在信息搜索方面上,通用引擎并不是滿足我們的電子購物需求。
[0004]垂直搜索引擎是針對一個領域或者一個行業(yè)的信息檢索,它的特點是查找準確度高,使用戶能夠快速定位、準確的獲取自己所要的信息。尤其是在電子電子購物平臺上,若在淘寶網(wǎng)、京東商城網(wǎng)、這些電子電子購物平臺含有大量的圖片、商品種類、評價等信息,因此一個有效的垂直搜索引擎可以有助于用戶的快捷購物。它所采用的技術仍是基于通用引擎的,只能在固定的一個網(wǎng)站能進行檢索,雖然能夠提供在該網(wǎng)站能的眾多商家信息,但其無法檢索其他電子購物平臺的商品的關鍵信息,也就是說無法實現(xiàn)跨網(wǎng)站搜索。例如,顧客在淘寶搜索一款手機,返回的信息是在淘寶網(wǎng)上的信息,無法獲得京東商城上的同一款手機的商品的關鍵信息,即無法提供顧客全面又能對比的信息,無法實現(xiàn)貨比三家式的對比購物。
【發(fā)明內(nèi)容】
[0005]針對上述技術中存在的不足之處,本發(fā)明提供一種網(wǎng)絡購物的綜合搜索引擎方法及其系統(tǒng),用戶可在第四方購物平臺上全面的了解到想要購買的商品的綜合排名,提供用戶全面又能對比的信息,實現(xiàn)貨比三家式的對比購物。
[0006]為實現(xiàn)上述目的,本發(fā)明提供一種網(wǎng)絡購物的綜合搜索引擎方法,包括以下步驟:
步驟1,用戶輸入需要查詢的商品的關鍵信息;
步驟2,接收商品的關鍵信息的搜索請求并發(fā)送至搜索引擎;
步驟3,爬取該商品在不同電子購物平臺上的至少三項類目排名并存儲至第四方電商平臺;
步驟4,第四方電商平臺對類目排名進行整合得到綜合排名名次后,將綜合排名在前的作為優(yōu)選賣家;
步驟5,用戶根據(jù)得到的優(yōu)選賣家信息直接在第四方電商平臺或返回對應的電子購物平臺進行購物交易。
[0007]其中,所述類目排名至少包括價格排名、銷量排名和好評排名三項。
[0008]其中,所述步驟3的具體步驟為:
步驟31,利用Heritrix爬蟲技術獲取包含該商品的不同電子購物平臺的網(wǎng)頁;
步驟32,把爬取出來的商品的類目排名關聯(lián)信息存儲到第四方電商平臺;
步驟33,在第四方電商平臺建立索引,并初步對商品的價格、銷量和好評類目進行單獨排名。
[0009]其中,所述步驟4的具體步驟為:給予銷量、好評排名為先的類目以較高優(yōu)先級,給予價格為先的類目以較低優(yōu)先級;對價格、銷量和好評的三個類目整合得到優(yōu)化的綜合排名在前100名的賣家展示在第四方電商平臺上并自動成為該第四方電商平臺的優(yōu)選賣家。
[0010]其中,所述索引建立的具體步驟為:首先,構建類目名稱的信息詞庫,需要遍歷所有不同電子購物平臺上的商品,寫入制定的商品詞庫文件中,完成詞庫的提??;其次,存儲不同電子購物平臺上的商品,實現(xiàn)商品在第四方電商平臺上進行存儲關聯(lián),作為用戶查詢的原始數(shù)據(jù);最后,建立Lucene索引。
[0011]其中,所述步驟31的具體步驟為利用Heritrix爬蟲技術獲得該商品的不同電子購物平臺的網(wǎng)頁,作為垂直搜索引擎檢索的原始數(shù)據(jù),爬取過程中以電子購物平臺為單位,因此在試下檢索一個網(wǎng)站,其他網(wǎng)站按照同等技術依次爬取,最后在第四方電商平臺上進行存儲整合。
[0012]其中,所述步驟32的具體步驟為把爬取出來的網(wǎng)頁解析成文本文件,把解析后的商品的海量信息中的類目排名信息存儲到第四方電商平臺。
[0013]其中,所述類目排名還包括信用排名、售后服務排名、營銷時間排名或退貨率排名中的一項或多項組合。
[0014]其中,所述商品的關鍵信息必須包括名稱,還可以包括規(guī)格型號、商品品牌、商品所屬分類中的一種或多種的組合。
[0015]為實現(xiàn)上述目的,本發(fā)明還提供一種網(wǎng)絡購物的綜合搜索引擎系統(tǒng),包括瀏覽器,用于輸入需要查詢的商品的關鍵信息;
搜索模塊,搜索模塊用于接收搜索請求并發(fā)送給至搜索引擎;
網(wǎng)頁爬取模塊,根據(jù)搜索引擎上的搜索請求爬取不同電子購物平臺上的該商品的海量信息;
網(wǎng)頁解析模塊,將商品的海量信息解析成文本文件,并提取該商品在不同電子購物平臺上的至少三項類目排名;
第四方電商平臺,用于存儲該商品在不同電子購物平臺上的至少三項類目排名,且第四方電商平臺對類目排名進行整合得到綜合排名名次后,將綜合排名在前的作為優(yōu)選賣家;用戶根據(jù)得到的優(yōu)選賣家信息直接在第四方電商平臺或返回對應的電子購物平臺進行購物交易。
[0016]本發(fā)明的有益效果是:與現(xiàn)有技術相比,本發(fā)明提供的網(wǎng)絡購物的綜合搜索引擎方法及其系統(tǒng),若是用戶需要購買某種商品,對該商品進行查詢搜索,搜索引擎會爬取該商品在不同購物平臺上的海量信息,然后再將所需要的關聯(lián)信息即至少三項類目排名并存儲至第四方電商平臺;再由第四方電商平臺對該商品的類目排名進行綜合排名;最后綜合排名在前的賣家可自動成為該第四方電商平臺的優(yōu)選賣家,用戶既可根據(jù)賣家綜合排名信息,直接在本電商平臺進行購物交易交易,也可返回原電子購物平臺進行購物交易交易。本發(fā)明的第四方電商平臺將搜索引擎平臺和電商平臺系統(tǒng)合理的融合,使得用戶可在第四方購物平臺上全面的了解到想要購買的商品的多個網(wǎng)站多個商家的綜合排名,提供用戶全面又能對比的信息,實現(xiàn)貨比三家式的對比購物后,達到了最佳的電子購物交易效果。
【附圖說明】
[0017]圖1為本發(fā)明的網(wǎng)絡購物的綜合搜索引擎方法的流程圖;
圖2為本發(fā)明的網(wǎng)絡購物的綜合搜索引擎方法中的一個具體實施例;
圖3為本發(fā)明的網(wǎng)絡購物的綜合搜索引擎系統(tǒng)的方框圖。
[0018]主要元件符號說明如下:
10、瀏覽器11、搜索模塊
12、網(wǎng)頁爬取模塊13、網(wǎng)頁解析模塊
14、第四方電商平臺。
【具體實施方式】
[0019]為了更清楚地表述本發(fā)明,下面結合附圖對本發(fā)明作進一步地描述。
[0020]請參閱圖1,本發(fā)明的網(wǎng)絡購物的綜合搜索引擎方法,包括以下步驟:
步驟Si,用戶輸入需要查詢的商品的關鍵信息;該關鍵信息必須包括名稱,還可以包括規(guī)格型號、商品品牌、商品所屬分類中的一種或多種的組合。當然,還可以是有關商品的其他信息,如生產(chǎn)日期、內(nèi)存量等等。
[0021]步驟S2,接收商品的關鍵信息的搜索請求并發(fā)送至搜索引擎;
步驟S3,爬取該商品在不同電子購物平臺上的至少三項類目排名并存儲至第四方電商平臺;類目排名至少包括價格排名、銷量排名和好評排名三項;該步驟的具體步驟如下:第一步,利用Heritrix爬蟲技術獲取包含該商品的不同電子購物平臺的網(wǎng)頁,如淘寶、京東、天貓等各個電子購物平臺;第二步,把爬取出來的商品的類目排名關聯(lián)信息存儲到第四方電商平臺;第三步,在第四方電商平臺建立索引,并初步對商品的價格、銷量和好評類目進行單獨排名。
[0022]步驟S4,第四方電商平臺對類目排名進行整合得到綜合排名名次后,將綜合排名在前的作為優(yōu)選賣家;該步驟的具體步驟為:給予銷量、好評排名為先的類目以較高優(yōu)先級,給予價格為先的類目以較低優(yōu)先級;對價格、銷量和好評的三個類目整合得到優(yōu)化的綜合排名在前100名的賣家展示在第四方電商平臺上并自動成為該第四方電商平臺的優(yōu)選賣家。
[0023]步驟S5,用戶根據(jù)得到的優(yōu)選賣家信息直接在第四方電商平臺或返回對應的電子購物平臺進行購物交易。由于該第四方電商平臺整合了多個網(wǎng)站中的多家賣家信息,可對該商品的多個類目排名進行整合排名,得到一個綜合的排名,客戶可根據(jù)最終綜合排名的先后選擇最優(yōu)的商品進行購物交易。
[0024]相較于現(xiàn)有技術的情況,本發(fā)明提供的網(wǎng)絡購物的綜合搜索引擎方法,若是用戶需要購買某種商品,對該商品進行查詢搜索,搜索引擎會爬取該商品在不同購物平臺上的海量信息,然后再將所需要的關聯(lián)信息即至少三項類目排名并存儲至第四方電商平臺;再由第四方電商平臺對該商品的類目排名進行綜合排名;最后綜合排名在前的賣家可自動成為該第四方電商平臺的優(yōu)選賣家,用戶既可根據(jù)賣家綜合排名信息,直接在本電商平臺進行購物交易交易,也可返回原電子購物平臺進行購物交易交易。本發(fā)明的第四方電商平臺將搜索引擎平臺和電商平臺系統(tǒng)合理的融合,使得用戶可在第四方購物平臺上全面的了解到想要購買的商品的多個網(wǎng)站多個商家的綜合排名,提供用戶全面又能對比的信息,實現(xiàn)貨比三家式的對比購物后,達到了最佳的電子購物交易效果。
[0025]在本實施例中,索引建立的具體步驟為:首先,構建類目名稱的信息詞庫,需要遍歷所有不同電子購物平臺上的商品,寫入制定的商品詞庫文件中,完成詞庫的提??;其次,存儲不同電子購物平臺上的商品,實現(xiàn)商品在第四方電商平臺上進行存儲關聯(lián),作為用戶查詢的原始數(shù)據(jù);最后,建立Lucene索引。用戶可在第四方電商平臺上采用索引的方式對商品的類目進行排名。