括自然景觀與人文景觀,其中,自然景觀標(biāo)簽包括以下至少之一的子標(biāo)簽:山、水、島、洲、湖、海、礁、森林、沙漠、草原、田園;人文景觀標(biāo)簽包括以下至少之一的子標(biāo)簽:寺廟、道觀、教堂、游樂場(chǎng)、購(gòu)物街、展覽館、紀(jì)念館、古鎮(zhèn)、石窟、古寨、宮殿、園林、花園、植物園、閣樓、水電站、動(dòng)物園;自然景觀與人文景觀的子標(biāo)簽還可以進(jìn)一步包括新的子標(biāo)簽。
[0074]其中,對(duì)景點(diǎn)有效信息進(jìn)行分布式標(biāo)簽分類包括:
[0075]從景點(diǎn)有效信息中提取出以數(shù)字標(biāo)識(shí)形式儲(chǔ)存的部分陳述數(shù)據(jù)中,提取出各景點(diǎn)的標(biāo)簽與標(biāo)簽權(quán)重;
[0076]根據(jù)各景點(diǎn)的標(biāo)簽與標(biāo)簽權(quán)重構(gòu)建神經(jīng)網(wǎng)絡(luò);
[0077]使用隨機(jī)梯度下降法對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行優(yōu)化,獲得的標(biāo)簽分類結(jié)果是各景點(diǎn)標(biāo)簽的m維詞向量。
[0078]并且,標(biāo)簽包括η個(gè)概念標(biāo)簽、w個(gè)位置標(biāo)簽與一個(gè)級(jí)別標(biāo)簽Lj,根據(jù)各景點(diǎn)的標(biāo)簽與標(biāo)簽權(quán)重構(gòu)建神經(jīng)網(wǎng)絡(luò)包括:
[0079]將所有η個(gè)概念標(biāo)簽首尾相接形成n*m維向量X,將w個(gè)位置標(biāo)簽首尾相接形成w*m維向量y,并根據(jù)x、y與級(jí)別標(biāo)簽Lj構(gòu)建第一層神經(jīng)網(wǎng)絡(luò);
[0080]分別對(duì)x、y進(jìn)行不同的線性變換、加入不同的偏置項(xiàng)后,使用激活函數(shù)激活獲得Tx、Ty,并根據(jù)Tx、Ty構(gòu)建第二層神經(jīng)網(wǎng)絡(luò);
[0081]將Tx、Ty與Lj首尾相接,分別進(jìn)行線性變換,并加入偏置項(xiàng),構(gòu)建第三層神經(jīng)網(wǎng)絡(luò);
[0082]將第三層神經(jīng)網(wǎng)絡(luò)的計(jì)算結(jié)果使用激活函數(shù)處理后在W個(gè)景點(diǎn)節(jié)點(diǎn)上輸出歸一化概率Y,W個(gè)景點(diǎn)節(jié)點(diǎn)構(gòu)成最后一層神經(jīng)網(wǎng)絡(luò)。
[0083]圖3示出的是詞向量的神經(jīng)網(wǎng)絡(luò)的一個(gè)實(shí)施例。如圖3所示,Li,…,Ln-1,Ln是景點(diǎn)的η個(gè)概念標(biāo)簽;3個(gè)位置標(biāo)簽Ls,Lq,Lx分別表示景點(diǎn)所屬的省份(直轄市),地區(qū)以及縣(縣級(jí)市);k表示景點(diǎn)的級(jí)別。現(xiàn)在需要根據(jù)這已知的不同標(biāo)簽類型預(yù)測(cè)景點(diǎn)。C(I)表示標(biāo)簽I所對(duì)應(yīng)的詞向量,整個(gè)模型中使用同一個(gè)詞向量庫(kù),數(shù)據(jù)存儲(chǔ)在矩陣中,矩陣的大小為(|V| Xm)中。其中I V I表示詞表的大小,m表示詞向量的維度。詞表中包括景點(diǎn)的標(biāo)簽類型,所屬省份(直轄市),地區(qū),以及縣(縣級(jí)市)。
[0084]神經(jīng)網(wǎng)絡(luò)中第一層(由下往上數(shù),下同)是將景點(diǎn)的η個(gè)屬性標(biāo)簽進(jìn)行首尾相接拼起來(lái),形成一個(gè)n*m維的向量,并表示為X ο再講景點(diǎn)的w個(gè)位置屬性進(jìn)行首尾拼接起來(lái),形成一個(gè)w*m維的向量,并表示為y。
[0085]神經(jīng)網(wǎng)絡(luò)中的第二層中,分別對(duì)X和y進(jìn)行不同線性變換Hx與Hy,再加上不同偏置項(xiàng)dx與dy,最后使用激活函數(shù)F進(jìn)行激活,得到Tx和Ty。
[0086]神經(jīng)網(wǎng)絡(luò)中的第三層中對(duì)Tx,Ty以及Lj進(jìn)行首尾拼接,并分別進(jìn)行線性變換Ux、Uy、Hj,再加上偏置項(xiàng)dj。
[0087]網(wǎng)絡(luò)的最后一層一共有W個(gè)節(jié)點(diǎn),W為景點(diǎn)的個(gè)數(shù),每個(gè)節(jié)點(diǎn)yi表示景點(diǎn)為i的未歸一化log概率。最后使用sof tmax激活函數(shù)將輸出值Y歸一化成概率。最終Y的計(jì)算公式為:
[0088]Y = b+ffxX+ffyy+UsF (UxF (dx+Hxx) +UyF (dy+Hyy) +dj+HjLj)
[0089]在構(gòu)建好深度神經(jīng)網(wǎng)絡(luò)之后,我們隨機(jī)梯度下降法對(duì)模型進(jìn)行優(yōu)化。
[0090]對(duì)景點(diǎn)進(jìn)行多標(biāo)簽標(biāo)注,標(biāo)注的屬性可以是所屬省市、開放時(shí)間,淡旺季的劃分、類型、所屬景區(qū)、是否為核心景點(diǎn)等信息。
[0091]同時(shí),將所有景點(diǎn)劃入多個(gè)風(fēng)景區(qū)包括:
[0092]根據(jù)位置標(biāo)簽將所有景點(diǎn)分為多個(gè)區(qū)域;
[0093]在每個(gè)區(qū)域中指定著名景點(diǎn),基于著名景點(diǎn)進(jìn)行合并與聚類,將區(qū)域中的所有景點(diǎn)劃分為多個(gè)風(fēng)景區(qū)。
[0094]并且,在每個(gè)區(qū)域中指定著名景點(diǎn),基于著名景點(diǎn)進(jìn)行合并與聚類,將區(qū)域中的所有景點(diǎn)劃分為多個(gè)風(fēng)景區(qū)包括:
[0095]指定k個(gè)著名景點(diǎn);
[0096]以每個(gè)著名景點(diǎn)各自為一風(fēng)景區(qū)中心,根據(jù)距離與標(biāo)簽相似度判定條件將非著名景點(diǎn)劃入k個(gè)著名景點(diǎn)為中心的風(fēng)景區(qū)中,獲得k個(gè)風(fēng)景區(qū)與風(fēng)景區(qū)內(nèi)的相似度;
[0097]對(duì)未劃入k個(gè)風(fēng)景區(qū)的非著名景點(diǎn)進(jìn)行增量式聚類,獲得η個(gè)可行的聚類結(jié)果,將區(qū)域中的所有景點(diǎn)劃分為k+n個(gè)風(fēng)景區(qū)、每個(gè)風(fēng)景區(qū)內(nèi)景點(diǎn)的相似度與風(fēng)景區(qū)間的相似度。
[0098]在一個(gè)實(shí)施例中,用戶輸入總體游玩時(shí)間、每天游玩時(shí)間、早晨出發(fā)時(shí)間、晚上返回時(shí)間(是否包含返程時(shí)間)、午休時(shí)間、景點(diǎn)類型、酒店級(jí)別等信息,分布式協(xié)同過濾算法根據(jù)以上信息生成推薦旅游線路。部分條件太強(qiáng)導(dǎo)致無(wú)法生成滿足條件的旅游線路時(shí),忽略某些次要條件并重新進(jìn)行推薦。在進(jìn)行線路規(guī)劃的過程中,首先在風(fēng)景區(qū)之間進(jìn)行線路規(guī)劃,再對(duì)風(fēng)景區(qū)內(nèi)部進(jìn)行線路規(guī)劃。對(duì)已有的著名景區(qū)(游玩時(shí)間超過一天的),根據(jù)不同的線路進(jìn)行內(nèi)部分類,規(guī)劃具體的旅游線路。合理規(guī)劃時(shí)間問題,在時(shí)間冗余的情況下為用戶推薦有價(jià)值游玩的地點(diǎn)。
[0099]在一個(gè)實(shí)施例中,用戶通過手機(jī)APP與系統(tǒng)進(jìn)行交互,如圖4所示。首先,APP示出一個(gè)初始化界面,用戶在上方進(jìn)行地理位置、時(shí)間、用戶個(gè)性化喜好等篩選。數(shù)據(jù)庫(kù)根據(jù)用戶喜好進(jìn)行旅游線路推薦,根據(jù)旅游線路經(jīng)過的地點(diǎn)推薦周邊的餐飲和酒店服務(wù),并返回整個(gè)路徑的規(guī)劃過程以及推薦的酒店餐飲信息。用戶根據(jù)自己的情況進(jìn)行參考與選擇,用戶可點(diǎn)開線路上的每個(gè)景點(diǎn)觀看景點(diǎn)的關(guān)鍵路徑規(guī)劃。
[0100]例如,用戶從國(guó)防科大出發(fā)游覽長(zhǎng)沙的風(fēng)景:當(dāng)用戶選擇喜好偏向?yàn)闊o(wú)時(shí)間限制、希望獲得最完整的旅游體驗(yàn)時(shí),返回的線路會(huì)嘗試遍歷風(fēng)景區(qū)內(nèi)的所有景點(diǎn),如圖5所示;當(dāng)用戶選擇喜好偏向?yàn)樵跁r(shí)間受限時(shí),返回的線路會(huì)在時(shí)間允許的范圍內(nèi)僅游覽多個(gè)風(fēng)景區(qū)中的著名景點(diǎn),具有最高的時(shí)間性價(jià)比,如圖6所示。
[0101]在旅游路線的規(guī)劃中,系統(tǒng)根據(jù)用戶提交的請(qǐng)求,考慮了用戶偏好、景區(qū)特征以及所處位置等信息,提出針對(duì)旅游路線規(guī)劃的改進(jìn)蟻群偶遇算法,提高螞蟻一次周游的質(zhì)量,縮短系統(tǒng)運(yùn)算時(shí)間,改進(jìn)路徑規(guī)劃問題中的路線求法,利用實(shí)時(shí)的環(huán)境信息實(shí)現(xiàn)路徑的動(dòng)態(tài)規(guī)劃,實(shí)現(xiàn)旅游景區(qū)的負(fù)載均衡以及旅游路線的實(shí)時(shí)調(diào)整,在最短的時(shí)間內(nèi)給出一個(gè)最優(yōu)的路線規(guī)劃,實(shí)現(xiàn)了路徑的智能規(guī)劃和實(shí)時(shí)調(diào)整。
[0102]根據(jù)本發(fā)明的另一個(gè)方面,提供了一種旅游信息處理與方案提供系統(tǒng),使用了前述的旅游信息處理與方案提供方法,系統(tǒng)結(jié)構(gòu)圖如圖2所示。
[0103]景點(diǎn)相關(guān)數(shù)據(jù)采集模塊采用自主開發(fā)的分布式爬蟲,可以在多個(gè)網(wǎng)站、論壇以及交友網(wǎng)站中爬取和景點(diǎn)相關(guān)的數(shù)據(jù)。
[0104]數(shù)據(jù)庫(kù)構(gòu)建模塊對(duì)爬取到的文本數(shù)據(jù)進(jìn)行結(jié)構(gòu)化處理,提取其中的可用信息,例如景點(diǎn)名稱、景點(diǎn)所屬省份、景點(diǎn)開放時(shí)間等等,結(jié)構(gòu)化處理的過程采用機(jī)器處理和人工處理相結(jié)合,將處理結(jié)束后的結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)在數(shù)據(jù)庫(kù)中。
[0105]景點(diǎn)分類模塊將存儲(chǔ)在數(shù)據(jù)庫(kù)中的數(shù)據(jù)采用自主開發(fā)的分布式多標(biāo)簽分類技術(shù),對(duì)景點(diǎn)進(jìn)行劃分,將劃分的結(jié)果存儲(chǔ)在數(shù)據(jù)庫(kù)中。
[0106]動(dòng)態(tài)規(guī)劃模塊在旅游線路推薦的過程中采用多層次動(dòng)態(tài)規(guī)劃的算法,根據(jù)用戶需求獲取最佳的旅游推薦線路。
[0107]結(jié)果展