本公開涉及電子商務(wù)領(lǐng)域,尤其涉及一種用于物品推薦的問題確定方法和裝置。
背景技術(shù):
目前客戶的個性化的定制已經(jīng)成為一個技術(shù)熱點,常見的例如為用戶推薦用戶感興趣的物品。為了使推薦的物品符合用戶的期望,通常需要在進行推薦之前充分了解用戶的喜好,而通過問卷調(diào)查來獲取用戶喜好是一個比較有效的途徑。問卷調(diào)查是讓用戶回答一些預(yù)先設(shè)置好的問題的一種調(diào)查方式,通過這種方式可以基于用戶對每個問題作答的答案,來獲取用戶的喜好,從而可以根據(jù)用戶的喜好來進行推薦。這些問題可以稱之為引導(dǎo)問題。在現(xiàn)有技術(shù)中,通常會利用決策樹算法對引導(dǎo)問題進行確定,而由此得到的上一個和下一個問題,只是考慮了如何選擇區(qū)分度最好的物品來獲取用戶興趣的最大信息量,而并未考慮上下層問題的相關(guān)性,通常用戶在回答完上一個問題后,下一個引導(dǎo)問題會和上一個問題間有很大的跳躍性,用戶體驗差,導(dǎo)致很多用戶放棄引導(dǎo)問題的回答。
技術(shù)實現(xiàn)要素:
本公開提供一種用于物品推薦的問題確定方法和裝置,用以解決生成引導(dǎo)問題時上下級問題之間關(guān)聯(lián)性低導(dǎo)致的問題之間有較大跳躍性的問題。
根據(jù)本公開實施例的第一方面,提供一種用于物品推薦的問題確定方法,所述方法包括:
根據(jù)上一引導(dǎo)問題的答案,利用預(yù)先建立的決策樹確定所述上一引導(dǎo)問題的答案所指示的物品,所述決策樹是根據(jù)物品總集合中物品的評分數(shù)據(jù)以及語義特征之間的關(guān)系建立的;
根據(jù)所述上一引導(dǎo)問題的答案所指示的物品獲取當(dāng)前的引導(dǎo)問題。
可選的,所述決策樹的建立方法包括:
獲取所述物品總集合中物品的評分數(shù)據(jù),所述評分數(shù)據(jù)包括物品總集合中每個物品的評分;
根據(jù)所述物品總集合中物品的評分數(shù)據(jù)確定所述決策樹的根節(jié)點,并將所述根節(jié)點作為上層節(jié)點;
提取所述上層節(jié)點的語義特征以及N個物品集合中的每個物品的語義特征,所述N個物品集合是根據(jù)所述物品總集合中每個物品的評分數(shù)據(jù)確定的,每個物品集合中包括一個或多個物品;
根據(jù)所述上層節(jié)點的語義特征以及所述N個物品集合中的每個物品的語義特征,確定所述N個物品集合中的每個物品集合對應(yīng)的下層節(jié)點,得到所述N個物品集合所對應(yīng)的N個下層節(jié)點;
將所述N個下層節(jié)點分別作為所述上層節(jié)點;
重復(fù)進行所述提取所述上層節(jié)點的語義特征以及N個物品集合中的每個物品的語義特征的步驟至所述將所述N個下層節(jié)點分別作為所述上層節(jié)點的步驟,直至確定第M層的節(jié)點,其中M為所述決策樹的總層數(shù);
根據(jù)第一層至所述第M層的節(jié)點,建立所述決策樹。
可選的,所述根據(jù)所述物品總集合中物品的評分數(shù)據(jù)確定所述決策樹的根節(jié)點,并將所述根節(jié)點作為上層節(jié)點,包括:
根據(jù)所述物品總集合中的每個物品的評分,對所述物品總集合中每個物品的評分進行分類;
計算所述物品總集合中的每個物品的每類評分的評分方差;
根據(jù)所述物品總集合中的每個物品的所有分類的評分方差,得到所述物品總集合中的每個物品的評分方差之和;
獲取所述物品總集合中的評分方差之和的最小值所對應(yīng)的物品,作為所述決策樹的根節(jié)點。
可選的,所述根據(jù)所述上層節(jié)點的語義特征以及所述N個物品集合中的每個物品的語義特征,確定所述N個物品集合中的每個物品集合對應(yīng)的下層節(jié)點,得到所述N個物品集合所對應(yīng)的N個下層節(jié)點,包括:
獲取所述上層節(jié)點的語義特征以及所述N個物品集合中的每個物品的語義特征;
確定所述上層節(jié)點的語義特征分別與所述N個物品集合中的每個物品的語義特征的語義相關(guān)度;
根據(jù)所述上層節(jié)點的語義特征與所述N個物品集合中的每個物品的語義特征的語義相關(guān)度,獲取所述N個物品集合中的每個物品的區(qū)分度誤差值;
根據(jù)所述N個物品集合中的每個物品的區(qū)分度誤差值,獲取每個物品集合中區(qū)分度誤差值的最小值所對應(yīng)的物品;
確定所述每個物品集合中的區(qū)分度誤差值的最小值所對應(yīng)的物品為所述每個物品集合對應(yīng)的下層節(jié)點。
可選的,所述根據(jù)所述上層節(jié)點的語義特征與所述N個物品集合中的每個物品的語義特征的語義相關(guān)度,獲取所述N個物品集合中的每個物品的區(qū)分度誤差值,包括:通過利用區(qū)分度誤差值公式,根據(jù)所述N個物品集合中的每個物品的評分方差確定所述N個物品集合中的每個物品的區(qū)分度誤差值,所述區(qū)分度誤差值公式包括:
Errt(i)=e2(t)–Wi*dis[TF(i,j)]
其中,i表示第一物品集合的第i個物品,j表示所述上層節(jié)點,所述第一物品集合為所述N個物品集合中的任一集合,Errt(i)表示所述第一物品集合的第i個物品的區(qū)分度誤差值,e2(t)表示所述第一物品集合的第i個物品的評分方差,TF(i,j)表示所述上層節(jié)點的語義特征以及所述第一物品集合的第i個物品的語義特征,dis[TF(i,j)]表示所述上層節(jié)點的語義特征與所述第一物品集合的第i個物品的語義特征的語義相關(guān)度,Wi表示語義相關(guān)度的歸一化權(quán)重值。
可選的,所述上層節(jié)點的語義特征與所述第一物品集合的第i個物品的語義特征的語義相關(guān)度的歸一化權(quán)重值是根據(jù)所述第一物品集合的第i個物品的所有語義特征確定的。
可選的,所述方法還包括:
接收所述當(dāng)前的引導(dǎo)問題的答案;
根據(jù)所述當(dāng)前的引導(dǎo)問題的答案生成推薦信息。
可選的,其特征在于,所述根據(jù)所述當(dāng)前的引導(dǎo)問題的答案生成推薦信息,還包括:
當(dāng)所述當(dāng)前的引導(dǎo)問題的答案為肯定回答時,選擇與所述當(dāng)前的引導(dǎo)問題所對應(yīng)的節(jié)點類似的物品生成所述推薦信息;或者
當(dāng)所述當(dāng)前的引導(dǎo)問題的答案為否定回答或者不確定時,采用協(xié)同過濾算法獲取所述推薦信息。
可選的,所述方法還包括:
根據(jù)所述當(dāng)前的引導(dǎo)問題的答案,以及所述當(dāng)前的引導(dǎo)問題之前已回答的一個或多個引導(dǎo)問題的答案,確定用戶的興趣圖譜,所述興趣圖譜用于調(diào)整所述推薦信息中的物品順序。
根據(jù)本公開實施例的第二方面,提供一種用于物品推薦的問題確定裝置,所述裝置包括:
物品確定模塊,用于根據(jù)上一引導(dǎo)問題的答案,利用預(yù)先建立的決策樹確定所述上一引導(dǎo)問題的答案所指示的物品,所述決策樹是根據(jù)物品總集合中物品的評分數(shù)據(jù)以及語義特征之間的關(guān)系建立的;
引導(dǎo)問題獲取模塊,用于根據(jù)所述上一引導(dǎo)問題的答案所指示的物品獲取當(dāng)前的引導(dǎo)問題。
可選的,所述決策樹的建立裝置包括:
評分獲取模塊,用于獲取所述物品總集合中物品的評分數(shù)據(jù),所述評分數(shù)據(jù)包括物品總集合中每個物品的評分;
根節(jié)點確定模塊,用于根據(jù)所述物品總集合中物品的評分數(shù)據(jù)確定所述決策樹的根節(jié)點,并將所述根節(jié)點作為上層節(jié)點;
語義特征提取模塊,用于提取所述上層節(jié)點的語義特征以及N個物品集合中的每個物品的語義特征,所述N個物品集合是根據(jù)所述物品總集合中每個物品的評分數(shù)據(jù)確定的,每個物品集合中包括一個或多個物品;
下層節(jié)點確定模塊,用于根據(jù)所述上層節(jié)點的語義特征以及所述N個物品集合中的每個物品的語義特征,確定所述N個物品集合中的每個物品集合對應(yīng)的下層節(jié)點,得到所述N個物品集合所對應(yīng)的N個下層節(jié)點;
迭代模塊,用于將所述N個下層節(jié)點分別作為所述上層節(jié)點;
循環(huán)模塊,用于重復(fù)進行所述提取所述上層節(jié)點的語義特征以及N個物品集合中的每個物品的語義特征的步驟至所述將所述N個下層節(jié)點分別作為所述上層節(jié)點的步驟,直至確定第M層的節(jié)點,其中M為所述決策樹的總層數(shù);
決策樹建立模塊,用于根據(jù)第一層至所述第M層的節(jié)點,建立所述決策樹。
可選的,所述根節(jié)點確定模塊,包括:
分類子模塊,用于根據(jù)所述物品總集合中的每個物品的評分,對所述物品總集合中每個物品的評分進行分類;
第一計算子模塊,用于計算所述物品總集合中的每個物品的每類評分的評分方差;
第二計算子模塊,用于根據(jù)所述物品總集合中的每個物品的所有分類的評分方差,得到所述物品總集合中的每個物品的評分方差之和;
根節(jié)點確定子模塊,用于獲取所述物品總集合中的評分方差之和的最小值所對應(yīng)的物品,作為所述決策樹的根節(jié)點。
可選的,所述下層節(jié)點確定模塊,包括:
語義特征獲取子模塊,用于獲取所述上層節(jié)點的語義特征以及所述N個物品集合中的每個物品的語義特征;
語義相關(guān)度確定子模塊,用于確定所述上層節(jié)點的語義特征分別與所述N個物品集合中的每個物品的語義特征的語義相關(guān)度;
區(qū)分度誤差值確定子模塊,用于根據(jù)所述上層節(jié)點的語義特征與所述N個物品集合中的每個物品的語義特征的語義相關(guān)度,獲取所述N個物品集合中的每個物品的區(qū)分度誤差值;
最小值獲取子模塊,用于根據(jù)所述N個物品集合中的每個物品的區(qū)分度誤差值,獲取每個物品集合中區(qū)分度誤差值的最小值所對應(yīng)的物品;
下層節(jié)點確定子模塊,用于確定所述每個物品集合中的區(qū)分度誤差值的最小值所對應(yīng)的物品為所述每個物品集合對應(yīng)的下層節(jié)點。
可選的,所述區(qū)分度誤差值確定子模塊包括:通過利用區(qū)分度誤差值公式,根據(jù)所述N個物品集合中的每個物品的評分方差確定所述N個物品集合中的每個物品的區(qū)分度誤差值,所述區(qū)分度誤差值公式包括:
Errt(i)=e2(t)–Wi*dis[TF(i,j)]
其中,i表示第一物品集合的第i個物品,j表示所述上層節(jié)點,所述第一物品集合為所述N個物品集合中的任一集合,Errt(i)表示所述第一物品集合的第i個物品的區(qū)分度誤差值,e2(t)表示所述第一物品集合的第i個物品的評分方差,TF(i,j)表示所述上層節(jié)點的語義特征以及所述第一物品集合的第i個物品的語義特征,dis[TF(i,j)]表示所述上層節(jié)點的語義特征與所述第一物品集合的第i個物品的語義特征的語義相關(guān)度,Wi表示語義相關(guān)度的歸一化權(quán)重值。
可選的,所述上層節(jié)點的語義特征與所述第一物品集合的第i個物品的語義特征的語義相關(guān)度的歸一化權(quán)重值是根據(jù)所述第一物品集合的第i個物品的所有語義特征確定的。
可選的,所述裝置還包括:
第一接收模塊,用于接收所述當(dāng)前的引導(dǎo)問題的答案;
第一推薦模塊,用于根據(jù)所述當(dāng)前的引導(dǎo)問題的答案生成推薦信息。
可選的,所述第一推薦模塊,還用于:
當(dāng)所述當(dāng)前的引導(dǎo)問題的答案為肯定回答時,選擇與所述當(dāng)前的引導(dǎo)問題所對應(yīng)的節(jié)點類似的物品生成所述推薦信息;或者
當(dāng)所述當(dāng)前的引導(dǎo)問題的答案為否定回答或者不確定時,采用協(xié)同過濾算法獲取所述推薦信息。
可選的,所述裝置還包括優(yōu)化模塊,所述優(yōu)化模塊:
用于根據(jù)所述當(dāng)前的引導(dǎo)問題的答案,以及所述當(dāng)前的引導(dǎo)問題之前已回答的一個或多個引導(dǎo)問題的答案,確定用戶的興趣圖譜,所述興趣圖譜用于調(diào)整所述推薦信息中的物品順序。
本公開的實施例提供的技術(shù)方案可以包括以下有益效果:
通過根據(jù)上一引導(dǎo)問題的答案,利用預(yù)先建立的決策樹確定所述上一引導(dǎo)問題的答案所指示的物品;再根據(jù)所述上一引導(dǎo)問題的答案所指示的物品獲取當(dāng)前的引導(dǎo)問題。因此,本公開所提供的用于物品推薦的問題確定方法,能夠解決生成引導(dǎo)問題時上下級問題之間關(guān)聯(lián)性低導(dǎo)致的問題之間有較大跳躍性的問題,能夠提高引導(dǎo)問題之間的關(guān)聯(lián)性,提高答題用戶的用戶體驗。
本公開的其他特征和優(yōu)點將在隨后的具體實施方式部分予以詳細說明。應(yīng)當(dāng)理解的是,以上的一般描述和后文的細節(jié)描述僅是示例性和解釋性的,并不能限制本公開。
附圖說明
附圖是用來提供對本公開的進一步理解,并且構(gòu)成說明書的一部分,與下面的具體實施方式一起用于解釋本公開,但并不構(gòu)成對本公開的限制。在附圖中:
圖1是根據(jù)一示例性實施例示出的一種用于物品推薦的問題確定方法的流程圖;
圖2是根據(jù)一示例性實施例示出的一種用于確定引導(dǎo)問題的決策樹的建立方法的流程圖;
圖3是根據(jù)圖2所示實施例示出的一種下層節(jié)點確定方法的流程圖;
圖4是根據(jù)一示例性實施例示出的另一種用于物品推薦的問題確定方法的流程圖;
圖5是根據(jù)一示例性實施例示出的一種用于物品推薦的問題確定裝置的框圖;
圖6是根據(jù)圖5所示實施例示出的一種決策樹的建立裝置的框圖;
圖7是根據(jù)圖6所示實施例示出的一種根節(jié)點確定模塊的框圖;
圖8是根據(jù)圖6所示實施例示出的一種下層節(jié)點確定模塊的框圖;
圖9是根據(jù)一示例性實施例示出的又一種用于物品推薦的問題確定裝置的框圖;
圖10是根據(jù)一示例性實施例示出的又一種用于物品推薦的問題確定裝置的框圖。
具體實施方式
以下結(jié)合附圖對本公開的具體實施方式進行詳細說明。應(yīng)當(dāng)理解的是,此處所描述的具體實施方式僅用于說明和解釋本公開,并不用于限制本公開。
圖1是根據(jù)一示例性實施例示出的一種用于物品推薦的問題確定方法的流程圖,如圖1所示,該用于物品推薦的問題確定方法可以包括以下步驟:
在步驟110中,根據(jù)上一引導(dǎo)問題的答案,利用預(yù)先建立的決策樹確定上一引導(dǎo)問題的答案所指示的物品,該決策樹是根據(jù)物品總集合中物品的評分數(shù)據(jù)以及語義特征之間的關(guān)系建立的。
其中,決策樹的建立是后續(xù)進行下一引導(dǎo)問題的獲取,以及物品推薦的依據(jù),通過決策樹的確立,克服了基于問題引導(dǎo)的推薦過程中可能會存在的冷啟動問題,避免了由于沒有數(shù)據(jù)依據(jù),而無法實現(xiàn)對新用戶的進行推薦的技術(shù)缺陷?,F(xiàn)在通過使用下面實施例介紹本公開的決策樹建立的方式,本公開是利用物品之間的語義特征的關(guān)聯(lián)性來確定該決策樹中作為每個節(jié)點的物品,因此建立了一個上下層節(jié)點之間具有語義關(guān)聯(lián)性的決策樹,因此決策樹中的上下層節(jié)點之間不存在較大跳躍性,能夠提高引導(dǎo)問題之間的關(guān)聯(lián)性,以提高答題用戶的用戶體驗。
另外,在本公開中各個實施例中的物品可以理解為一個名稱,或者是包括一個名稱以及與這個名稱對應(yīng)的屬性信息的一個信息集合,其中該名稱用于代指其對應(yīng)的實際物品,該實際物品可以是實體物品,例如各種產(chǎn)品,也可以是虛擬物品,例如一部電影、一首歌等,或者也可以是某個人或動物,或者該名稱也可以用于代指實際中的一類物品。
在步驟120中,根據(jù)上一引導(dǎo)問題的答案所指示的物品獲取當(dāng)前的引導(dǎo)問題。
示例地,在步驟110中所述的決策樹是引導(dǎo)問題確定的基礎(chǔ),在獲取上一引導(dǎo)問題的答案后,根據(jù)該答案可以通過決策樹確定該答案指向的層以及在該層中對應(yīng)的節(jié)點,從而作為該節(jié)點的物品就是上一引導(dǎo)問題的答案所指示的物品,從而能夠根據(jù)該物品確定當(dāng)前的引導(dǎo)問題(示例地,可以根據(jù)預(yù)先設(shè)置的引導(dǎo)問題與物品的關(guān)系,確定該物品對應(yīng)的引導(dǎo)問題)。
例如,假設(shè)上一引導(dǎo)問題為“您喜歡青春類電影嗎?”,且接收到的上一引導(dǎo)問題的答案為喜歡,則根據(jù)該答案確定在決策樹的當(dāng)前層對應(yīng)的節(jié)點為電影《小時代》,則獲取的當(dāng)前的引導(dǎo)問題可以是以電影《小時代》為基礎(chǔ)擴展的引導(dǎo)問題,例如:“您喜歡《小時代》這部電影么?”又或者“你覺得《小時代》好看么?”等等,具體的問題可以基于這部電影預(yù)先設(shè)置。可見,這樣基于上述的決策樹,由于上下層節(jié)點之間具有語義關(guān)聯(lián)性,因此得到當(dāng)前的引導(dǎo)問題與上一引導(dǎo)問題之間也具有關(guān)聯(lián)性,同理,當(dāng)前的引導(dǎo)問題與下一引導(dǎo)問題之間也具有關(guān)聯(lián)性,從而能夠提高答題用戶的體驗,為用戶帶來參與引導(dǎo)問題回答的興趣。
綜上所述,本公開實施例所提供的用于物品推薦的問題確定方法通過根據(jù)上一引導(dǎo)問題的答案,利用預(yù)先建立的決策樹確定該上一引導(dǎo)問題的答案所指示的物品;再根據(jù)上一引導(dǎo)問題的答案所指示的物品獲取當(dāng)前的引導(dǎo)問題。因此,本公開所提供的用于物品推薦的問題確定方法,能夠解決生成引導(dǎo)問題時上下級問題之間關(guān)聯(lián)性低導(dǎo)致的問題之間有較大跳躍性的問題,能夠提高引導(dǎo)問題之間的關(guān)聯(lián)性,提高答題用戶的用戶體驗。
圖2是根據(jù)一示例性實施例示出的一種用于確定引導(dǎo)問題的決策樹的建立方法的流程圖,如圖2所示,步驟110中所述的決策樹的建立方法可以包括以下步驟:
在步驟111中,獲取物品總集合中物品的評分數(shù)據(jù),該評分數(shù)據(jù)包括物品總集合中每個物品的評分。
在步驟112中,根據(jù)物品總集合中物品的評分數(shù)據(jù)確定決策樹的根節(jié)點,并將該根節(jié)點作為上層節(jié)點。
示例地,物品總集合可以理解為用于建立決策樹的物品樣本的集合,該物品總集合中物品的選取可以基于一些熱門物品或者是用戶的常用物品,或者是其他類型的物品,具體的可以根據(jù)實際需要來選取。物品總集合中物品的評分數(shù)據(jù)包括該物品總集合中的每個物品的評分,該物品總集合中的每個物品的評分可以是預(yù)先由用戶打分得到的。
根據(jù)物品總集合中物品的評分數(shù)據(jù)確定決策樹的根節(jié)點可以包括:首先根據(jù)物品總集合中的每個物品的評分,對物品總集合中每個物品的評分進行分類,該分類可以是一種模糊化的大類分類,比如,以物品為電影為例,用戶的評分可以分為三大類:“喜歡”、“不喜歡”、“不知道”,分類可以按如下的規(guī)則:評分在7-10分的(滿分為10分)為“喜歡”,評分在3-6分的為“不喜歡”,剩下的為“不知道”;之后計算物品總集合中的每個物品的每類評分的評分方差,并對于每個分類的類別下所有評分計算平均值,并計算該類別下的評分方差,例如用e2(tl)表示“喜歡”這個分類下的評分方差,用e2(th)表示“不喜歡”這個分類下的評分方差,用e2(tu)表示“不知道”這個分類下的評分方差,之后根據(jù)物品總集合中的每個物品的每個分類的評分方差,得到物品總集合中的每個物品的評分方差之和,最后獲取物品總集合中的評分方差之和的最小值所對應(yīng)的物品,作為決策樹的根節(jié)點。例如,在計算得到了對于一部電影的評分分別在“喜歡”,“不喜歡”,“不知道”的三個分類的評分方差后,將三個分類的評分方差相加,即Errt(i)=e2(tl)+e2(th)+e2(tu),即可得到該電影的評分方差之和Errt(i),從而比較所有物品的評分方差之和,將該Errt(i)的最小值所對應(yīng)的第i個物品作為所要建立的決策樹的根節(jié)點,獲取了決策樹的根節(jié)點之后,可以以此根節(jié)點作為上層節(jié)點,擴展下層節(jié)點,以完成決策樹的完整建立,即進行步驟113。
在步驟113中,提取上層節(jié)點的語義特征以及N個物品集合中的每個物品的語義特征,該N個物品集合是根據(jù)物品總集合中每個物品的評分確定的,每個物品集合中包括一個或多個物品。
示例地,在確定了上層節(jié)點后,決策樹需擴展的下層節(jié)點不再是單一的,即除了根節(jié)點以外,之后的每層的葉子節(jié)點可以有多個,因此在篩選該上層節(jié)點對應(yīng)的下層節(jié)點的時候,用于確定下層節(jié)點的物品集合也可以是多個。示例的,通過步驟101中所述的評分數(shù)據(jù),可以確定多個物品集合。示例的,可以利用步驟112中獲得的每個物品的每個分類的評分方差,通過設(shè)置閾值的方法,獲取多個具有較小評分方差值的物品集合,例如獲取了具有較小評分方差值的N個物品集合,然后對這N個物品集合進行步驟114,以便篩選出每個物品集合中作為下層節(jié)點的物品。
其中,如前文所述,本公開中的物品可以理解為一個名稱,或者是包括一個名稱以及與這個名稱對應(yīng)的屬性信息的一個信息集合,其中該名稱用于表示其所代指的實際物品,該實際物品可以是實體物品,例如各種產(chǎn)品,也可以是虛擬物品,例如一部電影、一首歌等,或者也可以是某個人或動物,或者該名稱也可以表示其所代指的實際中的一類物品。因此,確定了上述的N個物品集合后,可以根據(jù)每個集合中每個物品的名稱對應(yīng)的屬性信息來提取該物品的語義特征;或者,如果物品為名稱,不包括對應(yīng)的屬性信息,則可以根據(jù)該名稱來查找其對應(yīng)的屬性信息(可以從預(yù)先建立的數(shù)據(jù)庫中查找,或者可以通過互聯(lián)網(wǎng)查找),從而可以提取該物品的語義特征。
在步驟114中,根據(jù)上層節(jié)點的語義特征以及N個物品集合中的每個物品的語義特征,確定N個物品集合中的每個物品集合對應(yīng)的下層節(jié)點,得到N個物品集合所對應(yīng)的N個下層節(jié)點。
在步驟115中,將N個下層節(jié)點分別作為上層節(jié)點。
示例地,通過上一步驟中的利用語義特征的方法,確定了一個物品集合所對應(yīng)的下層節(jié)點,由于步驟113中所確定的下層節(jié)點的物品集合一共有N個,因此需對這N個物品集合中的每個物品集合依次地以步驟114中的方法進行對應(yīng)下層節(jié)點的選擇,使得在N個物品集合中的每個物品集合中都選出一個可以作為下層節(jié)點的物品,得到對應(yīng)的N個下層節(jié)點,以完成該決策樹的在當(dāng)前這一層的節(jié)點構(gòu)建。之后用迭代的方式,將當(dāng)前這一層作為新的上層,即將當(dāng)前這一層的N個下層節(jié)點作為下一層的上層節(jié)點,并再次進行步驟113至115,并且以此類推,該決策樹的后續(xù)的每一層中的葉子節(jié)點都采用上述的方法確定,以便繼續(xù)進行該決策樹的后續(xù)的葉子節(jié)點擴展,直至確定第M層的節(jié)點,其中M為決策樹的總層數(shù),從而就能夠得到該決策樹所需要的所有節(jié)點,可見該決策樹是以根節(jié)點為基礎(chǔ),通過上下層節(jié)點間的語義特征作為相關(guān)性,逐步擴展成帶有多個分叉和子節(jié)點的M層的決策樹。
在步驟116中,根據(jù)第一層至第M層的節(jié)點,建立決策樹。
綜上所述,從步驟112確定的根節(jié)點開始,之后的步驟113至步驟115在根節(jié)點的基礎(chǔ)上基于物品的語音特征對決策樹的其他層節(jié)點進行了逐層擴展,直到獲取到?jīng)Q策樹所需的所有節(jié)點后,使得該決策樹每層節(jié)點與其上下層節(jié)點間均具在語義上相互關(guān)聯(lián),因此利用該決策樹確定的引導(dǎo)問題與其上一個引導(dǎo)問題或下一個引導(dǎo)問題之間具有關(guān)聯(lián)性,從而能夠提高答題用戶的答題體驗。
圖3是根據(jù)圖2所示實施例示出的一種下層節(jié)點確定方法的流程圖,如圖3所示,上述的步驟114所述的根據(jù)上層節(jié)點的語義特征以及N個物品集合中的每個物品的語義特征,確定N個物品集合中的每個物品集合對應(yīng)的下層節(jié)點,得到N個物品集合所對應(yīng)的N個下層節(jié)點可以包括以下步驟:
在步驟1141中,獲取上層節(jié)點的語義特征以及N個物品集合中的每個物品的語義特征。
示例地,以物品為電影為例,電影的語義特征可以主要包括四類:導(dǎo)演,演員,類型和名稱,以物品為電影《小時代》舉例,對于電影《小時代》的語義特征提取為:導(dǎo)演為郭敬明,演員有陳學(xué)冬,楊冪等,類型屬于青春類,名稱是小時代,按照這樣的方式對N個物品集合中的每個物品進行語義特征提取,用于下面的判斷。
在步驟1142中,確定上層節(jié)點的語義特征分別與N個物品集合中的每個物品的語義特征的語義相關(guān)度。
示例地,根據(jù)步驟1141中確定的上層節(jié)點的語義特征以及N個物品集合中的所有物品的語義特征,獲取其語義特征之間的語義相關(guān)度,示例的,可以定義語義特征為TF(i,j),用于確定其語義相關(guān)度,定義語義相關(guān)度為dis[TF(i,j)]。之后可以結(jié)合每個物品集合中的每個物品的評分,再進行步驟1143的判斷,以獲取每個物品集合中的每個物品的區(qū)分度誤差值。
在步驟1143中,根據(jù)上層節(jié)點的語義特征與N個物品集合中的每個物品的語義特征的語義相關(guān)度,獲取N個物品集合中的每個物品的區(qū)分度誤差值。
示例地,可以通過利用以下區(qū)分度誤差值公式,根據(jù)N個物品集合中的每個物品的評分方差確定N個物品集合中的每個物品的區(qū)分度誤差值,該區(qū)分度誤差值公式包括:
Errt(i)=e2(t)–Wi*dis[TF(i,j)]
其中,i表示第一物品集合的第i個物品,j表示上層節(jié)點,第一物品集合為N個物品集合中的任一集合,Errt(i)表示第一物品集合的第i個物品的區(qū)分度誤差值,e2(t)表示第一物品集合的第i個物品的評分方差,TF(i,j)表示上層節(jié)點的語義特征以及第一物品集合的第i個物品的語義特征,dis[TF(i,j)]所述上層節(jié)點的語義特征與第一物品集合的第i個物品的語義特征的語義相關(guān)度,Wi表示語義相關(guān)度的歸一化權(quán)重值。
在葉子節(jié)點的確認過程中,與確定根節(jié)點的方式不同的是,此時會考慮到上下層節(jié)點間的語義相關(guān)度,因此以第一物品集合為例,首先對第一物品集合中的物品的評分依次進行分類,并對每個分類下的評分進行方差計算,獲取第一物品集合中的每個物品在所有類別的方差值之和,其具體方法與步驟112所述的方法相同,此處不再贅述。第一物品集合的第i個物品的區(qū)分度誤差值是第一物品集合的第i個物品的評分方差之和減去上層節(jié)點的語義特征與第一物品集合的第i個物品的語義特征的語義相關(guān)度與語義相關(guān)度的歸一化權(quán)重值之積。也就是說,在歸一化權(quán)重值不變的情況下,上下層節(jié)點間語義特征之間的語義相關(guān)度越高,會導(dǎo)致其乘積越大,因此減法后的區(qū)分度誤差值會更小;反之,則區(qū)分度誤差值會更大,表明上下層的語義相關(guān)度更低。
此外,上述公式中的上層節(jié)點的語義特征與第一物品集合的第i個物品的語義特征的語義相關(guān)度的歸一化權(quán)重值可以是根據(jù)該第一物品集合的第i個物品的所有語義特征確定。例如,物品的類別選擇電影,并選擇電影的名稱、類型、導(dǎo)演以及主演數(shù)據(jù)作為語義特征進行提取,可以設(shè)置以上四個語義特征在語義相關(guān)度中所占的權(quán)重一樣,也可以根據(jù)實際情況進行語義相關(guān)度的歸一化權(quán)重值的調(diào)整,對于電影來說,用戶通常所關(guān)心的主要是導(dǎo)演和主演,而電影的片名和類別則不是主要關(guān)心的因素,因此可以提高導(dǎo)演和主演在語義相關(guān)度中所占的權(quán)重,即調(diào)整語義相關(guān)度的歸一化權(quán)重值。例如,可以將導(dǎo)演的權(quán)重調(diào)整到原本權(quán)重的4倍,而將演員的權(quán)重調(diào)整都原本權(quán)重的2倍,在此調(diào)整的基礎(chǔ)上,獲得一個更加貼合實際需求的語義相關(guān)度的歸一化權(quán)重值,進而再進行上述公式的計算,使得語義相關(guān)度的值更加符合用戶的實際情況,其區(qū)分度誤差值將更加具有參考價值和實際針對性。因此,可針對不同的推薦的物品,依據(jù)該物品所屬類別的特性靈活地進行所占權(quán)重的調(diào)整,進而提高推薦的物品符合用戶興趣的可能性,例如在餐飲類別的引導(dǎo)問題時,可以將口味和價位作為權(quán)重較高的語義特征,而環(huán)境和位置的權(quán)重則次之,實現(xiàn)更為符合實際情況的引導(dǎo)問題。
在步驟1144中,根據(jù)N個物品集合中的每個物品的區(qū)分度誤差值,獲取每個物品集合中區(qū)分度誤差值的最小值所對應(yīng)的物品。
在步驟1145中,確定每個物品集合中的區(qū)分度誤差值的最小值所對應(yīng)的物品為每個物品集合對應(yīng)的下層節(jié)點。即可以理解為將每個物品集合中的區(qū)分度誤差值的最小值所對應(yīng)的物品確定為該物品集合中作為該上層節(jié)點的下層節(jié)點的物品。
圖4是根據(jù)一示例性實施例示出的另一種用于物品推薦的問題確定方法的流程圖,如圖4所示,在圖1所示方法的基礎(chǔ)上還包括以下步驟:
在步驟130中,接收當(dāng)前的引導(dǎo)問題的答案。
示例地,在步驟120中所確定的引導(dǎo)問題為“您喜歡《小時代》這部電影么?”,向用戶發(fā)出這樣的引導(dǎo)問題之后,等待用戶針對該問題作出回答在獲取到用戶的答案后,可以根據(jù)該答案進行步驟140所述的判斷。
在步驟140中,根據(jù)當(dāng)前的引導(dǎo)問題的答案生成推薦信息。
示例地,在引導(dǎo)問題“您喜歡小時代這部電影么?”,用戶對于該引導(dǎo)問題有三個可以選答案:“喜歡”,“不喜歡”以及“不知道”,再根據(jù)之前所建立的決策樹來確定不同答案在該決策樹所指向的物品,從而對該物品進行推薦,例如對于回答“喜歡”的用戶,則推薦的是電影《致青春》,而回答“不喜歡”的用戶的推薦為電影《中國合伙人》,而剩下的并未直接回答喜好的用戶,可推薦的電影是《讓子彈飛》。通過上述的方法不難看出,對于喜歡電影小時代的用戶來講,青春系列的電影應(yīng)該符合其喜好,因此推薦為致青春,而不喜歡小時代的用戶說明,所感興趣的類別可能屬于較為成熟的電影內(nèi)容,中國合伙人是其適合的物品。另外,可以理解的是物品的推薦和下一引導(dǎo)問題的獲取都是依據(jù)當(dāng)前的引導(dǎo)問題的答案,即在根據(jù)用戶的答案確定了某一物品時,既可以將該物品推薦給用戶,也可以提出基于該物品生成的下一引導(dǎo)問題。例如,對于回答“不喜歡”的用戶推薦電影《中國合伙人》,并生成下一引導(dǎo)問題為:“您喜歡中國合伙人這部電影么?”。
示例地,在獲取當(dāng)前的引導(dǎo)問題的答案后,根據(jù)所述當(dāng)前的引導(dǎo)問題的答案生成推薦信息還可以包括:
當(dāng)當(dāng)前的引導(dǎo)問題的答案為肯定回答時,選擇與當(dāng)前的引導(dǎo)問題所對應(yīng)的節(jié)點(即生成當(dāng)前的引導(dǎo)問題所基于的那個物品)類似的物品生成推薦信息。其中,當(dāng)用戶對于當(dāng)前的引導(dǎo)問題的回答為肯定回答,則說明用戶可能喜歡或者感興趣,從而可以根據(jù)該物品的語義特征,找出與該物品最為相似的物品進行推薦。
或者當(dāng)當(dāng)前的引導(dǎo)問題的答案為否定回答或者不確定時,采用協(xié)同過濾算法獲取所述推薦信息。不同于之前的肯定回答,當(dāng)用戶對于引導(dǎo)問題的回答的答案為否定或者不能夠清楚的直接辨別用戶的喜好時,可以采取協(xié)同過濾算法,找出與該用戶具有相同喜好的其他用戶所選擇的物品進行推薦,該協(xié)同過濾算法是通過不同用戶間的相似度,選取類似喜好的物品進行推薦的方法。
其中,根據(jù)當(dāng)前的引導(dǎo)問題的答案生成推薦信息可以理解為每獲取一個引導(dǎo)問題的答案就根據(jù)該引導(dǎo)問題的答案生成推薦信息,或者也可以根據(jù)當(dāng)前的引導(dǎo)問題的答案,以及當(dāng)前的引導(dǎo)問題之前已回答的一個或多個引導(dǎo)問題的答案生成推薦信息。也就是說,該用于物品推薦的問題確定方法不再是用戶必須回答完所有設(shè)計的引導(dǎo)問題后才會生成推薦信息的,而是可以在任一個引導(dǎo)問題之后都會有對應(yīng)的推薦信息,從而避免了用戶需要回答很多引導(dǎo)問題之后才能獲得推薦信息的所導(dǎo)致的用戶容易放棄答題的問題,每個問題都有相應(yīng)的推薦信息可以很大程度的擴大推薦的范圍和內(nèi)容,提高用戶的體驗滿意度。
進一步的,用戶在回答了多個問題后,還可以根據(jù)當(dāng)前的引導(dǎo)問題的答案,以及當(dāng)前的引導(dǎo)問題之前已回答的一個或多個引導(dǎo)問題的答案,確定該用戶的興趣圖譜,該興趣圖譜可以用于調(diào)整推薦信息中的物品順序。其中,推薦的物品,可以兩個以上,因此為用戶提供推薦的物品時,可以利用采集到的多個引導(dǎo)問題的答案,建立針對單個用戶的興趣圖譜,更好的優(yōu)化推薦信息的物品順序,使得最符合用戶喜好的物品排在其他推薦物品之前,以實現(xiàn)更加貼合用戶喜好的推薦,增加用戶滿意度。
綜上所述,本公開實施例所提供的用于物品推薦的問題確定方法,通過根據(jù)上一引導(dǎo)問題的答案,利用預(yù)先建立的決策樹確定所述上一引導(dǎo)問題的答案所指示的物品,而該決策樹是根據(jù)物品總集合中物品的評分數(shù)據(jù)以及語義特征之間的關(guān)系建立的;再根據(jù)上一引導(dǎo)問題的答案所指示的物品獲取當(dāng)前的引導(dǎo)問題。因此,本公開所提供的用于物品推薦的問題確定方法,能夠解決生成引導(dǎo)問題時上下級問題之間關(guān)聯(lián)性低導(dǎo)致的問題之間有較大跳躍性的問題,能夠提高引導(dǎo)問題之間的關(guān)聯(lián)性,提高答題用戶的用戶體驗。并且還可以根據(jù)引導(dǎo)問題的答案為用戶推薦符合用戶喜好的物品。
圖5是根據(jù)一示例性實施例示出的一種用于物品推薦的問題確定裝置的框圖,該裝置500可以用于執(zhí)行圖1-圖4任一所述的方法。參見圖5,該裝置500包括:
物品確定模塊5010,用于根據(jù)上一引導(dǎo)問題的答案,利用預(yù)先建立的決策樹確定上一引導(dǎo)問題的答案所指示的物品,該決策樹是根據(jù)物品總集合中物品的評分數(shù)據(jù)以及語義特征之間的關(guān)系建立的;
引導(dǎo)問題獲取模塊5020,用于根據(jù)上一引導(dǎo)問題的答案所指示的物品獲取當(dāng)前的引導(dǎo)問題。
可選的,圖6是根據(jù)一示例性實施例示出的另一種用于物品推薦的問題確定裝置的框圖,參見圖6,該裝置500,還包括:
評分獲取模塊5030,用于獲取物品總集合中物品的評分數(shù)據(jù),該評分數(shù)據(jù)包括物品總集合中每個物品的評分;
根節(jié)點確定模塊5040,用于根據(jù)物品總集合中物品的評分數(shù)據(jù)確定該決策樹的根節(jié)點,并將根節(jié)點作為上層節(jié)點;
語義特征提取模塊5050,用于提取上層節(jié)點的語義特征以及N個物品集合中的每個物品的語義特征,N個物品集合是根據(jù)物品總集合中每個物品的評分數(shù)據(jù)確定的,每個物品集合中包括一個或多個物品;
下層節(jié)點確定模塊5060,用于根據(jù)上層節(jié)點的語義特征以及N個物品集合中的每個物品的語義特征,確定N個物品集合中的每個物品集合對應(yīng)的下層節(jié)點,得到N個物品集合所對應(yīng)的N個下層節(jié)點;
循環(huán)模塊5070,用于將N個下層節(jié)點分別作為上層節(jié)點;
循環(huán)模塊5070,還用于重復(fù)進行提取上層節(jié)點的語義特征以及N個物品集合中的每個物品的語義特征的步驟至將N個下層節(jié)點分別作為上層節(jié)點的步驟,直至確定第M層的節(jié)點,其中M為決策樹的總層數(shù);
決策樹建立模塊5080,用于根據(jù)第一層至第M層的節(jié)點,建立決策樹。
可選的,圖7是根據(jù)圖6所示實施例示出的一種根節(jié)點確定模塊的框圖,參見圖7,該根節(jié)點確定模塊5040,包括:
分類子模塊5041,用于根據(jù)物品總集合中的每個物品的評分,對物品總集合中每個物品的評分進行分類;
方差計算子模塊5042,用于計算物品總集合中的每個物品的每類評分的評分方差;
方差和計算子模塊5043,用于根據(jù)物品總集合中的每個物品的所有分類的評分方差,得到物品總集合中的每個物品的評分方差之和;
根節(jié)點確定子模塊5044,用于獲取物品總集合中的評分方差之和的最小值所對應(yīng)的物品,作為決策樹的根節(jié)點。
可選的,圖8是根據(jù)圖6所示實施例示出的一種下層節(jié)點確定模塊的框圖,參見圖8,該下層節(jié)點確定模塊5060,包括:
語義特征獲取子模塊5061,用于獲取上層節(jié)點的語義特征以及N個物品集合中的每個物品的語義特征;
語義相關(guān)度確定子模塊5062,用于確定上層節(jié)點的語義特征分別與N個物品集合中的每個物品的語義特征的語義相關(guān)度;
區(qū)分度誤差值確定子模塊5063,用于根據(jù)上層節(jié)點的語義特征與N個物品集合中的每個物品的語義特征的語義相關(guān)度,獲取N個物品集合中的每個物品的區(qū)分度誤差值;
物品確定子模塊5064,用于根據(jù)N個物品集合中的每個物品的區(qū)分度誤差值,獲取每個物品集合中區(qū)分度誤差值的最小值所對應(yīng)的物品;
下層節(jié)點確定子模塊5065,用于確定每個物品集合中的區(qū)分度誤差值的最小值所對應(yīng)的物品為每個物品集合對應(yīng)的下層節(jié)點。
可選的,圖8該裝置中的區(qū)分度誤差值確定子模塊5063用于:通過利用區(qū)分度誤差值公式,根據(jù)N個物品集合中的每個物品的評分方差確定N個物品集合中的每個物品的區(qū)分度誤差值,區(qū)分度誤差值公式包括:
Errt(i)=e2(t)–Wi*dis[TF(i,j)]
其中,i表示第一物品集合的第i個物品,j表示上層節(jié)點,第一物品集合為N個物品集合中的任一集合,Errt(i)表示第一物品集合的第i個物品的區(qū)分度誤差值,e2(t)表示第一物品集合的第i個物品的評分方差,TF(i,j)表示上層節(jié)點的語義特征以及第一物品集合的第i個物品的語義特征,dis[TF(i,j)]表示上層節(jié)點的語義特征與第一物品集合的第i個物品的語義特征的語義相關(guān)度,Wi表示語義相關(guān)度的歸一化權(quán)重值。
可選的,上層節(jié)點的語義特征與第一物品集合的第i個物品的語義特征的語義相關(guān)度的歸一化權(quán)重值是根據(jù)第一物品集合的第i個物品的所有語義特征確定的。
可選的,圖9是根據(jù)一示例性實施例示出的又一種用于物品推薦的問題確定裝置的框圖,參見圖9,該裝置500還包括:
答案接收模塊5090,用于接收當(dāng)前的引導(dǎo)問題的答案;
推薦模塊5100,用于根據(jù)當(dāng)前的引導(dǎo)問題的答案生成推薦信息。
可選的,推薦模塊5100,還用于:
當(dāng)當(dāng)前的引導(dǎo)問題的答案為肯定回答時,選擇與當(dāng)前的引導(dǎo)問題所對應(yīng)的節(jié)點類似的物品生成推薦信息;或者
當(dāng)當(dāng)前的引導(dǎo)問題的答案為否定回答或者不確定時,采用協(xié)同過濾算法獲取推薦信息。
可選的,圖10是根據(jù)一示例性實施例示出的又一種用于物品推薦的問題確定裝置的框圖,參見圖10,該定裝置還包括:
確定模塊5110,用于根據(jù)當(dāng)前的引導(dǎo)問題的答案,以及當(dāng)前的引導(dǎo)問題之前已回答的一個或多個引導(dǎo)問題的答案,確定用戶的興趣圖譜,興趣圖譜用于調(diào)整推薦信息中的物品順序。
綜上所述,本公開實施例所提供的用于物品推薦的問題確定裝置,通過根據(jù)上一引導(dǎo)問題的答案,利用預(yù)先建立的決策樹確定所述上一引導(dǎo)問題的答案所指示的物品,而該決策樹是根據(jù)物品總集合中物品的評分數(shù)據(jù)以及語義特征之間的關(guān)系建立的;再根據(jù)上一引導(dǎo)問題的答案所指示的物品獲取當(dāng)前的引導(dǎo)問題。因此,本公開所提供的用于物品推薦的問題確定方法,能夠解決生成引導(dǎo)問題時上下級問題之間關(guān)聯(lián)性低導(dǎo)致的問題之間有較大跳躍性的問題,能夠提高引導(dǎo)問題之間的關(guān)聯(lián)性,提高答題用戶的用戶體驗。并且還可以根據(jù)引導(dǎo)問題的答案為用戶推薦符合用戶喜好的物品。
以上結(jié)合附圖詳細描述了本公開的優(yōu)選實施方式,但是,本公開并不限于上述實施方式中的具體細節(jié),在本公開的技術(shù)構(gòu)思范圍內(nèi),可以對本公開的技術(shù)方案進行多種簡單變型,這些簡單變型均屬于本公開的保護范圍。
另外需要說明的是,在上述具體實施方式中所描述的各個具體技術(shù)特征,在不矛盾的情況下,可以通過任何合適的方式進行組合。為了避免不必要的重復(fù),本公開對各種可能的組合方式不再另行說明。
此外,本公開的各種不同的實施方式之間也可以進行任意組合,只要其不違背本公開的思想,其同樣應(yīng)當(dāng)視為本公開所公開的內(nèi)容。