勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
[0043]圖1為根據(jù)本發(fā)明實施例的一種旅游信息處理與方案提供方法的流程圖;
[0044]圖2為根據(jù)本發(fā)明實施例的一種旅游信息處理與方案提供方法中,采用神經(jīng)網(wǎng)絡(luò)訓(xùn)練標(biāo)簽詞向量的一個實施例;
[0045]圖3為根據(jù)本發(fā)明實施例的一種旅游信息處理與方案提供方法的系統(tǒng)的結(jié)構(gòu)圖;
[0046]圖4為根據(jù)本發(fā)明實施例的一種旅游信息處理與方案提供方法中,用戶通過手機(jī)APP與系統(tǒng)交互的流程圖;
[0047]圖5為根據(jù)本發(fā)明實施例的一種旅游信息處理與方案提供方法中,用戶需求為旅游體驗最大化時返回的旅游線路推薦圖;
[0048]圖6為根據(jù)本發(fā)明實施例的一種旅游信息處理與方案提供方法中,用戶需求為旅游體驗-時間比最大化時返回的旅游線路推薦圖。
【具體實施方式】
[0049]為使本發(fā)明的目的、技術(shù)方案和優(yōu)點更加清楚明白,下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進(jìn)一步進(jìn)行清楚、完整、詳細(xì)地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員所獲得的所有其他實施例,都屬于本發(fā)明保護(hù)的范圍。
[0050]根據(jù)本發(fā)明的一個實施例,提供了一種旅游信息處理與方案提供方法,
[0051]如圖1所示,根據(jù)本發(fā)明的實施例提供的旅游信息處理與方案提供方法包括:
[0052]步驟SlOl,獲取旅游景點相關(guān)信息;
[0053]步驟S103,對旅游景點相關(guān)信息進(jìn)行結(jié)構(gòu)化處理獲得景點有效信息,并將結(jié)構(gòu)化的景點有效信息存儲于數(shù)據(jù)庫中;
[0054]步驟S105,對景點有效信息進(jìn)行分布式標(biāo)簽分類,將所有景點劃入多個風(fēng)景區(qū),并將景點劃分信息存儲于數(shù)據(jù)庫中;
[0055]步驟S107,獲取用戶需求,并根據(jù)用戶需求與數(shù)據(jù)庫中的景點有效信息與景點劃分信息生成推薦路游線路;
[0056]步驟S109,將推薦路游線路反饋給用戶。
[0057]在一個實施例中,該方法數(shù)據(jù)采集階段、知識庫建模階段、景點分類階段、景點聚類階段、數(shù)據(jù)存儲階段。在數(shù)據(jù)采集階段中,我們采集Internet上和旅游相關(guān)的數(shù)據(jù),例如名稱、所屬城市、省份、景點類別,景點描述、門票、適合游玩時間、景點面積、國家評級、景區(qū)出入口經(jīng)瑋度信息、景點圖片等等;在知識庫建模階段,通過采集到的數(shù)據(jù)在服務(wù)器上建立關(guān)于旅游的知識庫;在景點分類階段,通過景點的國家評價等級對景點的級別進(jìn)行分類;在景點聚類階段,以國家著名景點為中心,對周圍的景點進(jìn)行聚類,將城市的景點劃分為不同的片區(qū);在數(shù)據(jù)存儲階段,加劃分好的片區(qū)和景點數(shù)據(jù)存儲在后臺的服務(wù)器上。完成上述步驟后,用戶輸入條件,進(jìn)行線路推薦。
[0058]其中,獲取旅游景點相關(guān)信息包括:
[0059]連接至因特網(wǎng),獲取與景點有關(guān)的標(biāo)簽;
[0060]根據(jù)標(biāo)簽進(jìn)行檢索,并訪問被檢索到的網(wǎng)站或網(wǎng)頁;
[0061]從被檢索到的網(wǎng)站或網(wǎng)頁開始使用網(wǎng)絡(luò)爬蟲采集與旅游景點相關(guān)的文本和數(shù)據(jù)
?目息O
[0062]在一個實施例中,采用標(biāo)準(zhǔn)的瀏覽器-服務(wù)器(B/S)架構(gòu)體系,客戶端無需部署,直接通過瀏覽器就可以進(jìn)行數(shù)據(jù)庫管理。采用MVC設(shè)計模式,實現(xiàn)系統(tǒng)良好的層次化、模塊化分工。將數(shù)據(jù)庫的標(biāo)準(zhǔn)操作API從容器層剝離出來,獨立構(gòu)成一個服務(wù)體系。這樣做使得數(shù)據(jù)庫管理系統(tǒng)與其他使用到數(shù)據(jù)庫的程序能共享同一套API,最大限度的保證代碼重用性和代碼一致性。授權(quán)的任何程序都能以遠(yuǎn)程調(diào)用的方式,輕松讀寫數(shù)據(jù)庫。采用分布式數(shù)據(jù)庫作為后臺數(shù)據(jù)支撐平臺,確保數(shù)據(jù)庫的規(guī)??梢运綌U(kuò)展。
[0063]其中,對旅游景點相關(guān)信息進(jìn)行結(jié)構(gòu)化處理獲得景點有效信息包括:
[0064]從旅游景點相關(guān)信息中提取出陳述數(shù)據(jù),每個陳述數(shù)據(jù)中均包括S(Subject),P(Predicate) ,O(Object),C(Context)四種要素的資源標(biāo)識字符串;
[0065]選定陳述數(shù)據(jù)中的基本數(shù)據(jù)類型要素對應(yīng)的資源標(biāo)識字符串,并為每個基本數(shù)據(jù)類型要素分配一個與之唯一對應(yīng)的負(fù)整數(shù)數(shù)字標(biāo)識;
[0066]選定陳述數(shù)據(jù)中的概念指向類型要素對應(yīng)的資源標(biāo)識字符串,并為每個基本數(shù)據(jù)類型要素分配一個與之唯一對應(yīng)的正整數(shù)數(shù)字標(biāo)識;
[0067]將陳述數(shù)據(jù)中的S、P、0、C四種要素以負(fù)整數(shù)數(shù)字標(biāo)識與正整數(shù)數(shù)字標(biāo)識的形式表不,獲得景點有效?目息。
[0068]并且,將結(jié)構(gòu)化的景點有效信息存儲于數(shù)據(jù)庫中,為將陳述數(shù)據(jù)中的S、P、0、C四種要素以負(fù)整數(shù)數(shù)字標(biāo)識與正整數(shù)數(shù)字標(biāo)識的形式、負(fù)整數(shù)數(shù)字標(biāo)識與基本數(shù)據(jù)類型要素的資源標(biāo)識字符串的映射表、以及正整數(shù)數(shù)字標(biāo)識與概念指向類型要素的映射表存儲于數(shù)據(jù)庫中。
[0069]在數(shù)據(jù)庫標(biāo)準(zhǔn)API層中,我們提出了一種四元組數(shù)據(jù)的數(shù)據(jù)模式:認(rèn)為四元組是所有概念數(shù)據(jù)的基本形態(tài),由S(Subject) ,P(Predicate) ,O(Object) ,C(Context)四要素構(gòu)成。一個四元組就是一個陳述(Statement)。概念數(shù)據(jù)就是由大量陳述所構(gòu)成的集合。通過陳述來構(gòu)建概念知識,達(dá)到清晰化表述概念的目的。
[0070 ]傳統(tǒng)的概念描述方法,是由四個URI構(gòu)成的,URI是用來標(biāo)識資源(Re sour c e)的唯一字符串,這個串一般都比較長,在存儲、排序、查詢時都非常浪費資源。在實際應(yīng)用中,陳述的數(shù)量非常龐大,對陳述各維度的查詢極其頻繁。本文通過一種方法將所有的URI都統(tǒng)一轉(zhuǎn)為4字節(jié)的整型,來代替原有的標(biāo)識資源,將空間耗費基本上壓縮一個數(shù)量級,提高了查詢的效率。
[0071]正統(tǒng)的URI分兩類,一類為基本數(shù)據(jù)類型的URI。這種URI用來表示字符串、數(shù)值、日期等基本數(shù)據(jù)類型,這種URI是將數(shù)據(jù)轉(zhuǎn)成字符串后,再加上類型后綴組成。如:〃l〃~~xs:1nteger,l是數(shù)據(jù),~~XS:1nteger是其類型后綴。對于這種URI,我們用負(fù)整數(shù)為其分配一個唯一ID,然后用映射表實現(xiàn)ID到URI的雙向映射。另一類的URI是指向概念的,它是由一個組織前綴加上組織內(nèi)部對這個概念的唯一標(biāo)識組成。這個唯一標(biāo)識本來就是系統(tǒng)自動來分配的,只要能保證唯一性,什么樣的值都可以。所以,對這類URI,我們采用系統(tǒng)自動分配一個正整數(shù)作為其內(nèi)部ID。我們直接將這個ID與這個概念對應(yīng)起來,繞過了URI,也不需要ID到URI的映射表。通過特定規(guī)則,我們可以導(dǎo)出任意形態(tài)的URI,與標(biāo)準(zhǔn)接軌,但在內(nèi)部,我們采用這種高度壓縮的方式來表示,能極大節(jié)省系統(tǒng)的資源開銷。通過上述兩種方式,我們就實現(xiàn)了陳述(四元組)的內(nèi)部“標(biāo)準(zhǔn)化”。
[0072]在知識庫的構(gòu)建中,我們采用分布式的Mongo數(shù)據(jù)庫。它用C++編寫,性能優(yōu)越,部署簡單,既可以單機(jī)使用,又具有極強的水平擴(kuò)展能力。通過復(fù)制功能,還能保證數(shù)據(jù)庫服務(wù)的高可用性,單個節(jié)點的損害不會破壞數(shù)據(jù)完整性。另外,它的備份、還原功能也做得很好,符合我們知識庫平臺的需求。
[0073]概念標(biāo)簽包...