本發(fā)明涉及互聯(lián)網(wǎng)技術(shù),尤其涉及一種排序模型的訓(xùn)練方法及裝置。
背景技術(shù):
處理引擎是指根據(jù)一定的策略、運(yùn)用特定的計(jì)算機(jī)程序從互聯(lián)網(wǎng)上搜集信息,在對信息進(jìn)行組織和處理后,為用戶提供搜索服務(wù),將用戶搜索相關(guān)的信息展示給用戶的系統(tǒng)。據(jù)國家統(tǒng)計(jì)局的報(bào)道,中國網(wǎng)民人數(shù)已經(jīng)超過了4億,這個(gè)數(shù)據(jù)意味著中國已經(jīng)超過美國成為世界上第一大網(wǎng)民國,且中國的網(wǎng)站總數(shù)量已經(jīng)超過了200萬。因此,如何利用搜索服務(wù)最大限度滿足用戶需求,對于互聯(lián)網(wǎng)企業(yè)而言,始終是一個(gè)重要的課題。
搜索結(jié)果排序,是處理引擎的核心問題,現(xiàn)有排序算法新增特征之后需要重新訓(xùn)練構(gòu)建新的頁面排序模型,但模型重訓(xùn)往往會(huì)帶來較大的性能差異,使得新特征的貢獻(xiàn)淹沒在模型重訓(xùn)所帶來的更大的性能差異中,很難分析該特征的貢獻(xiàn),從而導(dǎo)致了特征調(diào)研的可靠性的降低。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的多個(gè)方面提供一種排序模型的訓(xùn)練方法及裝置,用以提高特征調(diào)研的可靠性。
本發(fā)明的一方面,提供一種排序模型的訓(xùn)練方法,包括:
獲取訓(xùn)練樣本數(shù)據(jù),所述訓(xùn)練樣本數(shù)據(jù)包括至少一個(gè)搜索關(guān)鍵詞所對應(yīng)的正例樣本頁面的特征數(shù)據(jù)和負(fù)例樣本頁面的特征數(shù)據(jù);
獲取神經(jīng)網(wǎng)絡(luò)的損失函數(shù),所述損失函數(shù)中包含約束項(xiàng);所述所述約束項(xiàng)用于對加入新特征數(shù)據(jù)之前的所述神經(jīng)網(wǎng)絡(luò)與其在加入新特征數(shù)據(jù)之后的所述神經(jīng)網(wǎng)絡(luò)中所對應(yīng)的權(quán)重參數(shù)之間的差值進(jìn)行二范數(shù)約束;
根據(jù)所述損失函數(shù)、所述正例樣本頁面的特征數(shù)據(jù)和所述負(fù)例樣本頁面的特征數(shù)據(jù),構(gòu)建頁面排序模型。
如上所述的方面和任一可能的實(shí)現(xiàn)方式,進(jìn)一步提供一種實(shí)現(xiàn)方式,所述損失函數(shù)中還包含第一調(diào)整因子和第二調(diào)整因子;所述第一調(diào)整因子用于調(diào)整所述正例樣本頁面的排序分?jǐn)?shù)趨向于大于指定閾值;所述第二調(diào)整因子用于調(diào)整所述負(fù)例樣本頁面的排序分?jǐn)?shù)趨向于小于指定閾值。
如上所述的方面和任一可能的實(shí)現(xiàn)方式,進(jìn)一步提供一種實(shí)現(xiàn)方式,所述第一調(diào)整因子,包括:
第一最大值與預(yù)先設(shè)置的第一常數(shù)的乘積;其中,所述第一最大值為所述指定閾值與第i組正例樣本頁面的排序分?jǐn)?shù)的相反數(shù)中的最大值;i為大于或等于1且小于或等于n的整數(shù),n為神經(jīng)網(wǎng)絡(luò)的層數(shù)。
如上所述的方面和任一可能的實(shí)現(xiàn)方式,進(jìn)一步提供一種實(shí)現(xiàn)方式,所述第二調(diào)整因子,包括:
第二最大值與預(yù)先設(shè)置的第二常數(shù)的乘積;其中,所述第二最大值為所述指定閾值與第i組負(fù)例樣本頁面的排序分?jǐn)?shù)中的最大值;i為大于或等于1且小于或等于n的整數(shù),n為神經(jīng)網(wǎng)絡(luò)的層數(shù)。
如上所述的方面和任一可能的實(shí)現(xiàn)方式,進(jìn)一步提供一種實(shí)現(xiàn)方式,所述根據(jù)所述損失函數(shù)、所述正例樣本頁面的特征數(shù)據(jù)和所述負(fù)例樣本頁面的特征數(shù)據(jù),構(gòu)建頁面排序模型,包括:
根據(jù)所述正例樣本頁面的特征數(shù)據(jù)和所述正例樣本頁面的特征調(diào)整權(quán)重,以及所述負(fù)例樣本頁面的特征數(shù)據(jù)和所述負(fù)例樣本頁面的特征調(diào)整權(quán)重,獲得所述正例樣本頁面的調(diào)整特征數(shù)據(jù)和所述負(fù)例樣本頁面的調(diào)整特征數(shù)據(jù);
根據(jù)所述損失函數(shù)、所述正例樣本頁面的調(diào)整特征數(shù)據(jù)和所述負(fù)例樣本頁面的調(diào)整特征數(shù)據(jù),構(gòu)建所述頁面排序模型。
本發(fā)明的另一方面,提供一種排序模型的訓(xùn)練裝置,包括:
數(shù)據(jù)獲取單元,用于獲取訓(xùn)練樣本數(shù)據(jù),所述訓(xùn)練樣本數(shù)據(jù)包括至少一個(gè)搜索關(guān)鍵詞所對應(yīng)的正例樣本頁面的特征數(shù)據(jù)和負(fù)例樣本頁面的特征數(shù)據(jù);
函數(shù)獲取單元,用于獲取神經(jīng)網(wǎng)絡(luò)的損失函數(shù),所述損失函數(shù)中包含約束項(xiàng);所述約束項(xiàng)用于對加入新特征數(shù)據(jù)之前的所述神經(jīng)網(wǎng)絡(luò)與其在加入新特征數(shù)據(jù)之后的所述神經(jīng)網(wǎng)絡(luò)中所對應(yīng)的權(quán)重參數(shù)之間的差值進(jìn)行二范數(shù)約束;
模型構(gòu)建單元,用于根據(jù)所述損失函數(shù)、所述正例樣本頁面的特征數(shù)據(jù)和所述負(fù)例樣本頁面的特征數(shù)據(jù),構(gòu)建頁面排序模型。
如上所述的方面和任一可能的實(shí)現(xiàn)方式,進(jìn)一步提供一種實(shí)現(xiàn)方式,所述損失函數(shù)中還包含第一調(diào)整因子和第二調(diào)整因子;所述第一調(diào)整因子用于調(diào)整所述正例樣本頁面的排序分?jǐn)?shù)趨向于大于指定閾值;所述第二調(diào)整因子用于調(diào)整所述負(fù)例樣本頁面的排序分?jǐn)?shù)趨向于小于指定閾值。
如上所述的方面和任一可能的實(shí)現(xiàn)方式,進(jìn)一步提供一種實(shí)現(xiàn)方式,所述第一調(diào)整因子,包括:
第一最大值與預(yù)先設(shè)置的第一常數(shù)的乘積;其中,所述第一最大值為所述指定閾值與第i組正例樣本頁面的排序分?jǐn)?shù)的相反數(shù)中的最大值;i為大于或等于1且小于或等于n的整數(shù),n為神經(jīng)網(wǎng)絡(luò)的層數(shù)。
如上所述的方面和任一可能的實(shí)現(xiàn)方式,進(jìn)一步提供一種實(shí)現(xiàn)方式,所述第二調(diào)整因子,包括:
第二最大值與預(yù)先設(shè)置的第二常數(shù)的乘積;其中,所述第二最大值為所述指定閾值與第i組負(fù)例樣本頁面的排序分?jǐn)?shù)中的最大值;i為大于或等于1且小于或等于n的整數(shù),n為神經(jīng)網(wǎng)絡(luò)的層數(shù)。
如上所述的方面和任一可能的實(shí)現(xiàn)方式,進(jìn)一步提供一種實(shí)現(xiàn)方式,所述模型構(gòu)建單元,具體用于
根據(jù)所述正例樣本頁面的特征數(shù)據(jù)和所述正例樣本頁面的特征調(diào)整權(quán)重,以及所述負(fù)例樣本頁面的特征數(shù)據(jù)和所述負(fù)例樣本頁面的特征調(diào)整權(quán)重,獲得所述正例樣本頁面的調(diào)整特征數(shù)據(jù)和所述負(fù)例樣本頁面的調(diào)整特征數(shù)據(jù);以及
根據(jù)所述損失函數(shù)、所述正例樣本頁面的調(diào)整特征數(shù)據(jù)和所述負(fù)例樣本頁面的調(diào)整特征數(shù)據(jù),構(gòu)建所述頁面排序模型。
由上述技術(shù)方案可知,本發(fā)明實(shí)施例通過獲取訓(xùn)練樣本數(shù)據(jù),所述訓(xùn)練樣本數(shù)據(jù)包括至少一個(gè)搜索關(guān)鍵詞所對應(yīng)的正例樣本頁面的特征數(shù)據(jù)和負(fù)例樣本頁面的特征數(shù)據(jù),以及獲取神經(jīng)網(wǎng)絡(luò)的損失函數(shù),所述損失函數(shù)中包含約束項(xiàng);所述約束項(xiàng)用于對加入新特征數(shù)據(jù)之前的所述神經(jīng)網(wǎng)絡(luò)即舊神經(jīng)網(wǎng)絡(luò)與其在加入新特征數(shù)據(jù)之后的所述神經(jīng)網(wǎng)絡(luò)即新神經(jīng)網(wǎng)絡(luò)中所對應(yīng)的權(quán)重參數(shù)之間的差值進(jìn)行二范數(shù)約束,使得能夠根據(jù)所述損失函數(shù)、所述正例樣本頁面的特征數(shù)據(jù)和所述負(fù)例樣本頁面的特征數(shù)據(jù),構(gòu)建頁面排序模型,由于采用對舊神經(jīng)網(wǎng)絡(luò)與其在新神經(jīng)網(wǎng)絡(luò)中所對應(yīng)的權(quán)重參數(shù)之間的差值進(jìn)行二范數(shù)約束的約束項(xiàng),使得這個(gè)差值會(huì)比較小,這樣,舊神經(jīng)網(wǎng)絡(luò)與其在新神經(jīng)網(wǎng)絡(luò)中所對應(yīng)的權(quán)重參數(shù)趨于一致,能夠避免現(xiàn)有技術(shù)中由于模型重訓(xùn)而導(dǎo)致的性能差異較大的技術(shù)問題,從而提高了特征調(diào)研的可靠性。
另外,采用本發(fā)明所提供的技術(shù)方案,通過采用調(diào)整所述正例樣本頁面的排序分?jǐn)?shù)趨向于大于指定閾值,且調(diào)整所述負(fù)例樣本頁面的排序分?jǐn)?shù)趨向于小于指定閾值的調(diào)整因子,使得基于Pairwise的排序算法中不同搜索關(guān)鍵詞所對應(yīng)的頁面的排序分?jǐn)?shù)具有可比性,從而提高了頁面的排序分?jǐn)?shù)的可應(yīng)用性。
【附圖說明】
為了更清楚地說明本發(fā)明實(shí)施例中的技術(shù)方案,下面將對實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作一簡單地介紹,顯而易見地,下面描述中的附圖是本發(fā)明的一些實(shí)施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1為本發(fā)明一實(shí)施例提供的排序模型的訓(xùn)練方法的流程示意圖;
圖2為本發(fā)明另一實(shí)施例提供的排序模型的訓(xùn)練裝置的結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
為使本發(fā)明實(shí)施例的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例。基于本發(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動(dòng)前提下所獲得的全部其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
需要說明的是,本發(fā)明實(shí)施例中所涉及的終端可以包括但不限于手機(jī)、個(gè)人數(shù)字助理(Personal Digital Assistant,PDA)、無線手持設(shè)備、平板電腦(Tablet Computer)、個(gè)人電腦(Personal Computer,PC)、MP3播放器、MP4播放器、可穿戴設(shè)備(例如,智能眼鏡、智能手表、智能手環(huán)等)等。
另外,本文中術(shù)語“和/或”,僅僅是一種描述關(guān)聯(lián)對象的關(guān)聯(lián)關(guān)系,表示可以存在三種關(guān)系,例如,A和/或B,可以表示:單獨(dú)存在A,同時(shí)存在A和B,單獨(dú)存在B這三種情況。另外,本文中字符“/”,一般表示前后關(guān)聯(lián)對象是一種“或”的關(guān)系。
圖1為本發(fā)明一實(shí)施例提供的排序模型的訓(xùn)練方法的流程示意圖,如圖1所示。
101、獲取訓(xùn)練樣本數(shù)據(jù),所述訓(xùn)練樣本數(shù)據(jù)包括至少一個(gè)搜索關(guān)鍵詞所對應(yīng)的正例樣本頁面的特征數(shù)據(jù)和負(fù)例樣本頁面的特征數(shù)據(jù)。
102、獲取神經(jīng)網(wǎng)絡(luò)的損失函數(shù),所述損失函數(shù)中包含約束項(xiàng);所述約束項(xiàng)用于對加入新特征數(shù)據(jù)之前的所述神經(jīng)網(wǎng)絡(luò)與其在加入新特征數(shù)據(jù)之后的所述神經(jīng)網(wǎng)絡(luò)中所對應(yīng)的權(quán)重參數(shù)之間的差值進(jìn)行二范數(shù)約束。
103、根據(jù)所述損失函數(shù)、所述正例樣本頁面的特征數(shù)據(jù)和所述負(fù)例樣本頁面的特征數(shù)據(jù),構(gòu)建頁面排序模型。
可以理解的是,101與102沒有固定的執(zhí)行順序,可以先執(zhí)行101,再執(zhí)行102,或者還可以先執(zhí)行102,再執(zhí)行101,或者還可以同時(shí)執(zhí)行101和102,本實(shí)施例對此不進(jìn)行特別限定。
需要說明的是,101~103的執(zhí)行主體的部分或全部可以為位于本地終端的應(yīng)用,或者還可以為設(shè)置在位于本地終端的應(yīng)用中的插件或軟件開發(fā)工具包(Software Development Kit,SDK)等功能單元,或者還可以為位于網(wǎng)絡(luò)側(cè)服務(wù)器中的處理引擎,或者還可以為位于網(wǎng)絡(luò)側(cè)的分布式系統(tǒng),本實(shí)施例對此不進(jìn)行特別限定。
可以理解的是,所述應(yīng)用可以是安裝在終端上的本地程序(nativeApp),或者還可以是終端上的瀏覽器的一個(gè)網(wǎng)頁程序(webApp),本實(shí)施例對此不進(jìn)行特別限定。
這樣,通過獲取訓(xùn)練樣本數(shù)據(jù),所述訓(xùn)練樣本數(shù)據(jù)包括至少一個(gè)搜索關(guān)鍵詞所對應(yīng)的正例樣本頁面的特征數(shù)據(jù)和負(fù)例樣本頁面的特征數(shù)據(jù),以及獲取神經(jīng)網(wǎng)絡(luò)的損失函數(shù),所述損失函數(shù)中包含約束項(xiàng);所述約束項(xiàng)用于對加入新特征數(shù)據(jù)之前的所述神經(jīng)網(wǎng)絡(luò)即舊神經(jīng)網(wǎng)絡(luò)與其在加入新特征數(shù)據(jù)之后的所述神經(jīng)網(wǎng)絡(luò)即新神經(jīng)網(wǎng)絡(luò)中所對應(yīng)的權(quán)重參數(shù)之間的差值進(jìn)行二范數(shù)約束,使得能夠根據(jù)所述損失函數(shù)、所述正例樣本頁面的特征數(shù)據(jù)和所述負(fù)例樣本頁面的特征數(shù)據(jù),構(gòu)建頁面排序模型,由于采用對舊神經(jīng)網(wǎng)絡(luò)與其在新神經(jīng)網(wǎng)絡(luò)中所對應(yīng)的權(quán)重參數(shù)之間的差值進(jìn)行二范數(shù)約束的約束項(xiàng),使得這個(gè)差值會(huì)比較小,這樣,舊神經(jīng)網(wǎng)絡(luò)與其在新神經(jīng)網(wǎng)絡(luò)中所對應(yīng)的權(quán)重參數(shù)趨于一致,能夠避免現(xiàn)有技術(shù)中由于模型重訓(xùn)而導(dǎo)致的性能差異較大的技術(shù)問題,從而提高了特征調(diào)研的可靠性。
通常,搜索引擎在獲取到用戶所提供的輸入關(guān)鍵詞之后,可以采用現(xiàn)有的搜索方法,獲得與所述搜索關(guān)鍵詞,對應(yīng)的若干個(gè)頁面,進(jìn)而根據(jù)這些頁面生成包含頁面摘要等內(nèi)容的搜索結(jié)果,并將搜索結(jié)果提供給用戶。詳細(xì)描述可以參見現(xiàn)有技術(shù)中的相關(guān)內(nèi)容,此處不在贅述。
可以理解的是,本發(fā)明所涉及的頁面,也可以稱為Web頁面或網(wǎng)頁,可以是基于超文本標(biāo)記語言(HyperText Markup Language,HTML)編寫的網(wǎng)頁(Web Page),即HTML頁面,或者還可以是基于HTML和Java語言編寫的網(wǎng)頁,即Java服務(wù)器頁面(Java Server Page,JSP),或者還可以為其他語言編寫的網(wǎng)頁,本實(shí)施例對此不進(jìn)行特別限定。頁面可以包括由一個(gè)或者多個(gè)頁面標(biāo)簽例如,超文本標(biāo)記語言(HyperText Markup Language,HTML)標(biāo)簽、JSP標(biāo)簽等,定義的一個(gè)顯示區(qū)塊,稱為頁面元素,例如,文字、圖片、超鏈接、按鈕、編輯框、下拉框等。
在完成一次搜索之后,可以將該搜索相關(guān)的數(shù)據(jù)記錄下來,形成用戶歷史行為數(shù)據(jù)?;谒涗浀挠脩魵v史行為數(shù)據(jù),則可以獲得同一個(gè)搜索關(guān)鍵詞(query)所對應(yīng)的正例樣本頁面和負(fù)例樣本頁面,并將同一個(gè)搜索關(guān)鍵詞所對應(yīng)的正例樣本頁面與負(fù)例樣本頁面兩兩組合,組成配對樣本<<Q,T,1><Q,T,0>>(Q表示query,T表示樣本數(shù)據(jù),0表示負(fù)例,1表示正例),以作為訓(xùn)練樣本數(shù)據(jù)。進(jìn)而,則可以利用所述訓(xùn)練樣本數(shù)據(jù),執(zhí)行101~103,構(gòu)建神經(jīng)網(wǎng)絡(luò)即頁面排序模型。其中,所述神經(jīng)網(wǎng)絡(luò)可以包括但不限于深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Network,DNN),本實(shí)施例對此不進(jìn)行特別限定。
所謂的正例樣本頁面,是指點(diǎn)擊過的頁面;所謂的負(fù)例樣本頁面,是指未點(diǎn)擊過的頁面。對于同一個(gè)query,一個(gè)正例樣本和一個(gè)負(fù)例樣本就組成了一個(gè)訓(xùn)練用的數(shù)據(jù)樣本即訓(xùn)練樣本數(shù)據(jù)。這里的點(diǎn)擊過的頁面與未點(diǎn)擊過的頁面,具體可以是指在搜索引擎的點(diǎn)擊日志當(dāng)中所記錄的,當(dāng)某個(gè)用戶搜索了一個(gè)query之后,選擇了其中的某個(gè)搜索結(jié)果進(jìn)行進(jìn)一步瀏覽,則可以稱該搜索結(jié)果所對應(yīng)的頁面為點(diǎn)擊過的頁面,稱未選擇的其他搜索結(jié)果所對應(yīng)的頁面為未點(diǎn)擊的頁面。
通常而言,損失函數(shù)可以由損失項(xiàng)(loss term)和正則項(xiàng)(regularization term)組成。本發(fā)明中,所采用的損失項(xiàng)可以交叉熵?fù)p失函數(shù),或者還可以為Hinge loss損失函數(shù),本實(shí)施例對此不進(jìn)行特別限定。本發(fā)明中所采用的損失函數(shù)還進(jìn)一步包含一個(gè)約束項(xiàng),對舊神經(jīng)網(wǎng)絡(luò)與其在新神經(jīng)網(wǎng)絡(luò)中所對應(yīng)的權(quán)重參數(shù)之間的差值進(jìn)行二范數(shù)約束的約束項(xiàng)。可選地,在本實(shí)施例的一個(gè)可能的實(shí)現(xiàn)方式中,在102中,所獲取的神經(jīng)網(wǎng)絡(luò)的損失函數(shù)中所包含的約束項(xiàng)r(W)可以為其中,表示加入新特征數(shù)據(jù)之后的所述神經(jīng)網(wǎng)絡(luò)即新神經(jīng)網(wǎng)絡(luò)第j層的權(quán)重參數(shù),j為大于或等于1且小于或等于n的整數(shù);表示加入新特征數(shù)據(jù)之前的所述神經(jīng)網(wǎng)絡(luò)即舊神經(jīng)網(wǎng)絡(luò)的權(quán)重參數(shù);c表示預(yù)先設(shè)置的一個(gè)常數(shù)。由于采用對舊神經(jīng)網(wǎng)絡(luò)與其在新神經(jīng)網(wǎng)絡(luò)中所對應(yīng)的權(quán)重參數(shù)之間的差值進(jìn)行二范數(shù)約束的約束項(xiàng),使得這個(gè)差值會(huì)比較小,這樣,舊神經(jīng)網(wǎng)絡(luò)與其在新神經(jīng)網(wǎng)絡(luò)中所對應(yīng)的權(quán)重參數(shù)趨于一致,能夠避免現(xiàn)有技術(shù)中由于模型重訓(xùn)而導(dǎo)致的性能差異較大的技術(shù)問題,從而提高了特征調(diào)研的可靠性。在保證舊神經(jīng)網(wǎng)絡(luò)與其在新神經(jīng)網(wǎng)絡(luò)中所對應(yīng)的權(quán)重參數(shù)趨于一致的情況之下,能夠最大限度地發(fā)揮新特征數(shù)據(jù)地效用。
可選地,在本實(shí)施例的一個(gè)可能的實(shí)現(xiàn)方式中,在102中,所獲取的神經(jīng)網(wǎng)絡(luò)的損失函數(shù)中還可以進(jìn)一步包含第一調(diào)整因子和第二調(diào)整因子,對損失函數(shù)中的損失項(xiàng)進(jìn)行調(diào)整優(yōu)化。其中,所述第一調(diào)整因子用于調(diào)整所述正例樣本頁面的排序分?jǐn)?shù)趨向于大于指定閾值;所述第二調(diào)整因子用于調(diào)整所述負(fù)例樣本頁面的排序分?jǐn)?shù)趨向于小于指定閾值。
具體來說,所述第一調(diào)整因子,可以為第一最大值與預(yù)先設(shè)置的第一常數(shù)的乘積;其中,所述第一最大值為所述指定閾值與第i組正例樣本頁面的排序分?jǐn)?shù)的相反數(shù)中的最大值;i為大于或等于1且小于或等于n的整數(shù),n為神經(jīng)網(wǎng)絡(luò)的層數(shù),即:
其中,α表示預(yù)先設(shè)置的第一常數(shù);θ表示所述指定閾值;表示第i組正例樣本頁面的特征數(shù)據(jù),i為大于或等于1且小于或等于n的整數(shù),n為神經(jīng)網(wǎng)絡(luò)的層數(shù);表示第i組正例樣本頁面的排序分?jǐn)?shù)。這樣,則可以調(diào)整所述正例樣本頁面的排序分?jǐn)?shù)趨向于大于指定閾值。
所述第二調(diào)整因子,可以為第二最大值與預(yù)先設(shè)置的第二常數(shù)的乘積;其中,所述第二最大值為所述指定閾值與第i組負(fù)例樣本頁面的排序分?jǐn)?shù)中的最大值;i為大于或等于1且小于或等于n的整數(shù),n為神經(jīng)網(wǎng)絡(luò)的層數(shù),即:
其中,β表示預(yù)先設(shè)置的第二常數(shù);θ表示所述指定閾值;表示第i組負(fù)例樣本頁面的特征數(shù)據(jù),i為大于或等于1且小于或等于n的整數(shù),n為神經(jīng)網(wǎng)絡(luò)的層數(shù);表示第i組負(fù)例樣本頁面的排序分?jǐn)?shù)。這樣,則可以調(diào)整所述負(fù)例樣本頁面的排序分?jǐn)?shù)趨向于小于指定閾值。
可選地,在本實(shí)施例的一個(gè)可能的實(shí)現(xiàn)方式中,在103中,具體可以根據(jù)所述正例樣本頁面的特征數(shù)據(jù)和所述正例樣本頁面的特征調(diào)整權(quán)重,以及所述負(fù)例樣本頁面的特征數(shù)據(jù)和所述負(fù)例樣本頁面的特征調(diào)整權(quán)重,獲得所述正例樣本頁面的調(diào)整特征數(shù)據(jù)和所述負(fù)例樣本頁面的調(diào)整特征數(shù)據(jù),進(jìn)而,則可以根據(jù)所述損失函數(shù)、所述正例樣本頁面的調(diào)整特征數(shù)據(jù)和所述負(fù)例樣本頁面的調(diào)整特征數(shù)據(jù),構(gòu)建一個(gè)神經(jīng)網(wǎng)絡(luò),以作為頁面排序模型。
一般來說,多個(gè)特征輸入的用于頁面排序的神經(jīng)網(wǎng)絡(luò)(即RankNet網(wǎng)絡(luò))的網(wǎng)絡(luò)結(jié)構(gòu)為即輸入特征逐層經(jīng)過矩陣向量乘積和非線性變換的作用后輸出。但是,由于全部輸入特征都直接接入神經(jīng)網(wǎng)絡(luò),并不能顯示地控制特征效果,從而會(huì)限制某些特征的效果。例如,涉及輸入特征所依賴的數(shù)據(jù)與頁面排序模型訓(xùn)練所用的數(shù)據(jù)不匹配的情況下,輸入特征往往只有較小的權(quán)重占比,其貢獻(xiàn)的效果也會(huì)被削弱。為了特征權(quán)重調(diào)整的便捷性,可以讓輸入特征輸入神經(jīng)網(wǎng)絡(luò)之前乘以一個(gè)正對角陣,即每個(gè)特征數(shù)據(jù)乘以一個(gè)大于0的權(quán)重參數(shù)即特征調(diào)整權(quán)重。這樣,通過設(shè)置正對角陣對應(yīng)元素的值,就能夠?yàn)槊恳粋€(gè)輸入特征增加一個(gè)權(quán)重先驗(yàn),在保持其他輸入特征的權(quán)重先驗(yàn)取值不變的情況下,提升某一個(gè)輸入特征的權(quán)重先驗(yàn)取值將會(huì)提升該輸入特征最終的權(quán)重占比。
本實(shí)施例中,通過獲取訓(xùn)練樣本數(shù)據(jù),所述訓(xùn)練樣本數(shù)據(jù)包括至少一個(gè)搜索關(guān)鍵詞所對應(yīng)的正例樣本頁面的特征數(shù)據(jù)和負(fù)例樣本頁面的特征數(shù)據(jù),以及獲取神經(jīng)網(wǎng)絡(luò)的損失函數(shù),所述損失函數(shù)中包含約束項(xiàng);所述約束項(xiàng)用于對加入新特征數(shù)據(jù)之前的所述神經(jīng)網(wǎng)絡(luò)即舊神經(jīng)網(wǎng)絡(luò)與其在加入新特征數(shù)據(jù)之后的所述神經(jīng)網(wǎng)絡(luò)即新神經(jīng)網(wǎng)絡(luò)中所對應(yīng)的權(quán)重參數(shù)之間的差值進(jìn)行二范數(shù)約束,使得能夠根據(jù)所述損失函數(shù)、所述正例樣本頁面的特征數(shù)據(jù)和所述負(fù)例樣本頁面的特征數(shù)據(jù),構(gòu)建頁面排序模型,由于采用對舊神經(jīng)網(wǎng)絡(luò)與其在新神經(jīng)網(wǎng)絡(luò)中所對應(yīng)的權(quán)重參數(shù)之間的差值進(jìn)行二范數(shù)約束的約束項(xiàng),使得這個(gè)差值會(huì)比較小,這樣,舊神經(jīng)網(wǎng)絡(luò)與其在新神經(jīng)網(wǎng)絡(luò)中所對應(yīng)的權(quán)重參數(shù)趨于一致,能夠避免現(xiàn)有技術(shù)中由于模型重訓(xùn)而導(dǎo)致的性能差異較大的技術(shù)問題,從而提高了特征調(diào)研的可靠性。
另外,采用本發(fā)明所提供的技術(shù)方案,通過采用調(diào)整所述正例樣本頁面的排序分?jǐn)?shù)趨向于大于指定閾值,且調(diào)整所述負(fù)例樣本頁面的排序分?jǐn)?shù)趨向于小于指定閾值的調(diào)整因子,使得基于Pairwise的排序算法中不同搜索關(guān)鍵詞所對應(yīng)的頁面的排序分?jǐn)?shù)具有可比性,從而提高了頁面的排序分?jǐn)?shù)的可應(yīng)用性。
需要說明的是,對于前述的各方法實(shí)施例,為了簡單描述,故將其都表述為一系列的動(dòng)作組合,但是本領(lǐng)域技術(shù)人員應(yīng)該知悉,本發(fā)明并不受所描述的動(dòng)作順序的限制,因?yàn)橐罁?jù)本發(fā)明,某些步驟可以采用其他順序或者同時(shí)進(jìn)行。其次,本領(lǐng)域技術(shù)人員也應(yīng)該知悉,說明書中所描述的實(shí)施例均屬于優(yōu)選實(shí)施例,所涉及的動(dòng)作和模塊并不一定是本發(fā)明所必須的。
在上述實(shí)施例中,對各個(gè)實(shí)施例的描述都各有側(cè)重,某個(gè)實(shí)施例中沒有詳述的部分,可以參見其他實(shí)施例的相關(guān)描述。
圖2為本發(fā)明另一實(shí)施例提供的排序模型的訓(xùn)練裝置的結(jié)構(gòu)示意圖,如圖2所示。本實(shí)施例的排序模型的訓(xùn)練裝置可以包括數(shù)據(jù)獲取單元21、函數(shù)獲取單元22和模型構(gòu)建單元23。其中,數(shù)據(jù)獲取單元21,用于獲取訓(xùn)練樣本數(shù)據(jù),所述訓(xùn)練樣本數(shù)據(jù)包括至少一個(gè)搜索關(guān)鍵詞所對應(yīng)的正例樣本頁面的特征數(shù)據(jù)和負(fù)例樣本頁面的特征數(shù)據(jù);函數(shù)獲取單元22,用于獲取神經(jīng)網(wǎng)絡(luò)的損失函數(shù),所述損失函數(shù)中包含約束項(xiàng);所述約束項(xiàng)用于對加入新特征數(shù)據(jù)之前的所述神經(jīng)網(wǎng)絡(luò)與其在加入新特征數(shù)據(jù)之后的所述神經(jīng)網(wǎng)絡(luò)中所對應(yīng)的權(quán)重參數(shù)之間的差值進(jìn)行二范數(shù)約束;模型構(gòu)建單元23,用于根據(jù)所述損失函數(shù)、所述正例樣本頁面的特征數(shù)據(jù)和所述負(fù)例樣本頁面的特征數(shù)據(jù),構(gòu)建頁面排序模型。
需要說明的是,本實(shí)施例所提供的排序模型的訓(xùn)練裝置的部分或全部可以為位于本地終端的應(yīng)用,或者還可以為設(shè)置在位于本地終端的應(yīng)用中的插件或軟件開發(fā)工具包(Software Development Kit,SDK)等功能單元,或者還可以為位于網(wǎng)絡(luò)側(cè)服務(wù)器中的處理引擎,或者還可以為位于網(wǎng)絡(luò)側(cè)的分布式系統(tǒng),本實(shí)施例對此不進(jìn)行特別限定。
可以理解的是,所述應(yīng)用可以是安裝在終端上的本地程序(nativeApp),或者還可以是終端上的瀏覽器的一個(gè)網(wǎng)頁程序(webApp),本實(shí)施例對此不進(jìn)行特別限定。
可選地,在本實(shí)施例的一個(gè)可能的實(shí)現(xiàn)方式中,所述損失函數(shù)中還可以進(jìn)一步包含第一調(diào)整因子和第二調(diào)整因子;所述第一調(diào)整因子用于調(diào)整所述正例樣本頁面的排序分?jǐn)?shù)趨向于大于指定閾值;所述第二調(diào)整因子用于調(diào)整所述負(fù)例樣本頁面的排序分?jǐn)?shù)趨向于小于指定閾值。
其中,所述第一調(diào)整因子,具體可以包括:
第一最大值與預(yù)先設(shè)置的第一常數(shù)的乘積;其中,所述第一最大值為所述指定閾值與第i組正例樣本頁面的排序分?jǐn)?shù)的相反數(shù)中的最大值;i為大于或等于1且小于或等于n的整數(shù),n為神經(jīng)網(wǎng)絡(luò)的層數(shù)。
所述第二調(diào)整因子,具體可以包括:
第二最大值與預(yù)先設(shè)置的第二常數(shù)的乘積;其中,所述第二最大值為所述指定閾值與第i組負(fù)例樣本頁面的排序分?jǐn)?shù)中的最大值;i為大于或等于1且小于或等于n的整數(shù),n為神經(jīng)網(wǎng)絡(luò)的層數(shù)。
可選地,在本實(shí)施例的一個(gè)可能的實(shí)現(xiàn)方式中,所述模型構(gòu)建單元23,具體可以用于根據(jù)所述正例樣本頁面的特征數(shù)據(jù)和所述正例樣本頁面的特征調(diào)整權(quán)重,以及所述負(fù)例樣本頁面的特征數(shù)據(jù)和所述負(fù)例樣本頁面的特征調(diào)整權(quán)重,獲得所述正例樣本頁面的調(diào)整特征數(shù)據(jù)和所述負(fù)例樣本頁面的調(diào)整特征數(shù)據(jù);以及根據(jù)所述損失函數(shù)、所述正例樣本頁面的調(diào)整特征數(shù)據(jù)和所述負(fù)例樣本頁面的調(diào)整特征數(shù)據(jù),構(gòu)建所述頁面排序模型。
需要說明的是,圖1對應(yīng)的實(shí)施例中方法,可以由本實(shí)施例提供的排序模型的訓(xùn)練裝置實(shí)現(xiàn)。詳細(xì)描述可以參見圖1對應(yīng)的實(shí)施例中的相關(guān)內(nèi)容,此處不再贅述。
本實(shí)施例中,通過數(shù)據(jù)獲取單元獲取訓(xùn)練樣本數(shù)據(jù),所述訓(xùn)練樣本數(shù)據(jù)包括至少一個(gè)搜索關(guān)鍵詞所對應(yīng)的正例樣本頁面的特征數(shù)據(jù)和負(fù)例樣本頁面的特征數(shù)據(jù),以及函數(shù)獲取單元獲取神經(jīng)網(wǎng)絡(luò)的損失函數(shù),所述損失函數(shù)中包含約束項(xiàng);所述約束項(xiàng)用于對加入新特征數(shù)據(jù)之前的所述神經(jīng)網(wǎng)絡(luò)即舊神經(jīng)網(wǎng)絡(luò)與其在加入新特征數(shù)據(jù)之后的所述神經(jīng)網(wǎng)絡(luò)即新神經(jīng)網(wǎng)絡(luò)中所對應(yīng)的權(quán)重參數(shù)之間的差值進(jìn)行二范數(shù)約束,使得模型構(gòu)建單元能夠根據(jù)所述損失函數(shù)、所述正例樣本頁面的特征數(shù)據(jù)和所述負(fù)例樣本頁面的特征數(shù)據(jù),構(gòu)建頁面排序模型,由于采用對舊神經(jīng)網(wǎng)絡(luò)與其在新神經(jīng)網(wǎng)絡(luò)中所對應(yīng)的權(quán)重參數(shù)之間的差值進(jìn)行二范數(shù)約束的約束項(xiàng),使得這個(gè)差值會(huì)比較小,這樣,舊神經(jīng)網(wǎng)絡(luò)與其在新神經(jīng)網(wǎng)絡(luò)中所對應(yīng)的權(quán)重參數(shù)趨于一致,能夠避免現(xiàn)有技術(shù)中由于模型重訓(xùn)而導(dǎo)致的性能差異較大的技術(shù)問題,從而提高了特征調(diào)研的可靠性。
另外,采用本發(fā)明所提供的技術(shù)方案,通過采用調(diào)整所述正例樣本頁面的排序分?jǐn)?shù)趨向于大于指定閾值,且調(diào)整所述負(fù)例樣本頁面的排序分?jǐn)?shù)趨向于小于指定閾值的調(diào)整因子,使得基于Pairwise的排序算法中不同搜索關(guān)鍵詞所對應(yīng)的頁面的排序分?jǐn)?shù)具有可比性,從而提高了頁面的排序分?jǐn)?shù)的可應(yīng)用性。
所屬領(lǐng)域的技術(shù)人員可以清楚地了解到,為描述的方便和簡潔,上述描述的系統(tǒng),裝置和單元的具體工作過程,可以參考前述方法實(shí)施例中的對應(yīng)過程,在此不再贅述。
在本發(fā)明所提供的幾個(gè)實(shí)施例中,應(yīng)該理解到,所揭露的系統(tǒng),裝置和方法,可以通過其它的方式實(shí)現(xiàn)。例如,以上所描述的裝置實(shí)施例僅僅是示意性的,例如,所述單元的劃分,僅僅為一種邏輯功能劃分,實(shí)際實(shí)現(xiàn)時(shí)可以有另外的劃分方式,例如,多個(gè)單元或組件可以結(jié)合或者可以集成到另一個(gè)系統(tǒng),或一些特征可以忽略,或不執(zhí)行。另一點(diǎn),所顯示或討論的相互之間的耦合或直接耦合或通信連接可以是通過一些接口,裝置或單元的間接耦合或通信連接,可以是電性,機(jī)械或其它的形式。
所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個(gè)地方,或者也可以分布到多個(gè)網(wǎng)絡(luò)單元上。可以根據(jù)實(shí)際的需要選擇其中的部分或者全部單元來實(shí)現(xiàn)本實(shí)施例方案的目的。
另外,在本發(fā)明各個(gè)實(shí)施例中的各功能單元可以集成在一個(gè)處理單元中,也可以是各個(gè)單元單獨(dú)物理存在,也可以兩個(gè)或兩個(gè)以上單元集成在一個(gè)單元中。上述集成的單元既可以采用硬件的形式實(shí)現(xiàn),也可以采用硬件加軟件功能單元的形式實(shí)現(xiàn)。
上述以軟件功能單元的形式實(shí)現(xiàn)的集成的單元,可以存儲(chǔ)在一個(gè)計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中。上述軟件功能單元存儲(chǔ)在一個(gè)存儲(chǔ)介質(zhì)中,包括若干指令用以使得一臺(tái)計(jì)算機(jī)裝置(可以是個(gè)人計(jì)算機(jī),服務(wù)器,或者網(wǎng)絡(luò)裝置等)或處理器(processor)執(zhí)行本發(fā)明各個(gè)實(shí)施例所述方法的部分步驟。而前述的存儲(chǔ)介質(zhì)包括:U盤、移動(dòng)硬盤、只讀存儲(chǔ)器(Read-Only Memory,ROM)、隨機(jī)存取存儲(chǔ)器(Random Access Memory,RAM)、磁碟或者光盤等各種可以存儲(chǔ)程序代碼的介質(zhì)。
最后應(yīng)說明的是:以上實(shí)施例僅用以說明本發(fā)明的技術(shù)方案,而非對其限制;盡管參照前述實(shí)施例對本發(fā)明進(jìn)行了詳細(xì)的說明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解:其依然可以對前述各實(shí)施例所記載的技術(shù)方案進(jìn)行修改,或者對其中部分技術(shù)特征進(jìn)行等同替換;而這些修改或者替換,并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明各實(shí)施例技術(shù)方案的精神和范圍。