本發(fā)明涉及計算機領域的推薦技術(shù),具體涉及一種教育資源個性化推薦方法及系統(tǒng)。
背景技術(shù):
隨著信息技術(shù)以及互聯(lián)網(wǎng)的發(fā)展,人們逐漸從信息匱乏的時代步入信息過載時代,在這個時代無論信息消費者還是信息生產(chǎn)者都遇到了很大的挑戰(zhàn):對于信息消費者,從大量信息中找到自己感興趣的信息是一件非常困難的事情;對于信息生產(chǎn)者,讓自己生產(chǎn)的信息脫穎而出,受到廣大用戶的關注,也是一件非常困難的事。在這一時代背景下,各種個性化推薦算法以及推薦系統(tǒng)層出不窮,且在電子商務領域取得了普遍應用。在教育資源領域,由于每個教育用戶的學習精力有限,很多資源的自身屬性特征完全不同,僅僅依靠評分來預測很可能會對用戶推薦出和研究方向偏差較大的資源。另外,所有教育用戶看到的資源都是一樣的,缺少個性化??傊逃Y源領域的個性化推薦仍然處于起步研究階段。
技術(shù)實現(xiàn)要素:
本發(fā)明要解決的技術(shù)問題:針對現(xiàn)有技術(shù)的上述問題,提供一種能夠?qū)崿F(xiàn)教育資源個性化推薦,為教育用戶推薦更加精準的興趣內(nèi)教育資源,推薦準確可靠、方法實現(xiàn)簡單的教育資源個性化推薦方法及系統(tǒng)。
為了解決上述技術(shù)問題,本發(fā)明采用的技術(shù)方案為:
一方面,本發(fā)明提供一種教育資源個性化推薦方法,實施步驟包括:
1)預先設置用戶-資源評分矩陣R、資源關鍵詞標簽矩陣L、關鍵詞標簽相似性閾值St、資源評分相似性閾值S1,所述用戶-資源評分矩陣R為m×n維的用戶-資源評分矩陣,用戶-資源評分矩陣R中的每一個資源包含給定的k個具有代表性的關鍵詞標簽描述,所述資源關鍵詞標簽矩陣L為基于用戶-資源評分矩陣R中的每一個資源包含給定的k個具有代表性的關鍵詞標簽描述建立的n×k的資源關鍵詞標簽矩陣;當需要針對用戶-資源評分矩陣R中包含的目標用戶u進行教育資源個性化推薦時,跳轉(zhuǎn)執(zhí)行步驟2);
2)從用戶-資源評分矩陣R從遍歷選擇一個資源作為目標資源x;針對每一個目標資源x,依次根據(jù)資源關鍵詞標簽矩陣L計算目標資源x和用戶-資源評分矩陣R中其他任一資源y之間的相似度,將相似度大于關鍵詞標簽相似性閾值St的資源y生成和目標資源x擁有相似關鍵詞標簽的資源候選集SRx,根據(jù)用戶-資源評分矩陣R計算目標資源x和資源候選集SRx中其他任一資源y之間的相似度,將相似度大于資源評分相似性閾值S1的資源y生成目標資源x的最近領域集SRx1,基于最近領域集SRx1計算目標用戶u對目標資源x的預測評分;
3)選擇預測評分最高的前N個教育資源推薦給當前用戶u。
優(yōu)選地,步驟2)中計算目標資源x和用戶-資源評分矩陣R中其他任一資源y之間的相似度的函數(shù)表達式如式(1)所示;
式(1)中,Sim(x,y)表示目標資源x和用戶-資源評分矩陣R中其他任一資源y之間的相似度,xi表示資源x在k維空間上第i個關鍵詞標簽值,yi表示資源y在k維空間上第i個關鍵詞標簽值,k表示用戶-資源評分矩陣R中的每一個資源包含具有代表性的關鍵詞標簽描述的數(shù)量。
優(yōu)選地,步驟2)中計算目標資源x和資源候選集SRx中其他任一資源y之間的相似度的函數(shù)表達式如式(2)所示;
式(2)中,sim(i,j)表示目標資源x和資源候選集SRx中其他任一資源y之間的相似度,Ui,j表示對資源i和j都有評分的用戶集合,Ru,i表示用戶u對資源i的評分,表示用戶u對資源i的平均評分,表示用戶u對資源j的平均評分。
優(yōu)選地,步驟2)中基于最近領域集SRx1計算目標用戶u對目標資源x的預測評分函數(shù)表達式如式(3)所示;
式(3)中,Pu,x表示目標用戶u對目標資源x的預測評分,表示用戶u對資源x的平均評分,SRx1表示最近領域集SRx1,sim(x,j)表示目標資源x和資源候選集SRx中鄰居j之間的相似度,Ru,j表示用戶u對資源j的評分,表示用戶u對資源j的平均評分。
另一方面,本發(fā)明還提供一種教育資源個性化推薦系統(tǒng),包括:
輸入程序模塊,用于預先設置用戶-資源評分矩陣R、資源關鍵詞標簽矩陣L、關鍵詞標簽相似性閾值St、資源評分相似性閾值S1,所述用戶-資源評分矩陣R為m×n維的用戶-資源評分矩陣,用戶-資源評分矩陣R中的每一個資源包含給定的k個具有代表性的關鍵詞標簽描述,所述資源關鍵詞標簽矩陣L為基于用戶-資源評分矩陣R中的每一個資源包含給定的k個具有代表性的關鍵詞標簽描述建立的n×k的資源關鍵詞標簽矩陣;當需要針對用戶-資源評分矩陣R中包含的目標用戶u進行教育資源個性化推薦時,跳轉(zhuǎn)執(zhí)行步驟2);
預測評分程序模塊,用于從用戶-資源評分矩陣R從遍歷選擇一個資源作為目標資源x;針對每一個目標資源x,依次根據(jù)資源關鍵詞標簽矩陣L計算目標資源x和用戶-資源評分矩陣R中其他任一資源y之間的相似度,將相似度大于關鍵詞標簽相似性閾值St的資源y生成和目標資源x擁有相似關鍵詞標簽的資源候選集SRx,根據(jù)用戶-資源評分矩陣R計算目標資源x和資源候選集SRx中其他任一資源y之間的相似度,將相似度大于資源評分相似性閾值S1的資源y生成目標資源x的最近領域集SRx1,基于最近領域集SRx1計算目標用戶u對目標資源x的預測評分;
選擇推薦程序模塊,用于選擇預測評分最高的前N個教育資源推薦給當前用戶u。
優(yōu)選地,所述預測評分程序模塊計算目標資源x和用戶-資源評分矩陣R中其他任一資源y之間的相似度的函數(shù)表達式如式(1)所示;
式(1)中,Sim(x,y)表示目標資源x和用戶-資源評分矩陣R中其他任一資源y之間的相似度,xi表示資源x在k維空間上第i個關鍵詞標簽值,yi表示資源y在k維空間上第i個關鍵詞標簽值,k表示用戶-資源評分矩陣R中的每一個資源包含具有代表性的關鍵詞標簽描述的數(shù)量。
優(yōu)選地,所述預測評分程序模塊計算目標資源x和資源候選集SRx中其他任一資源y之間的相似度的函數(shù)表達式如式(2)所示;
式(2)中,sim(i,j)表示目標資源x和資源候選集SRx中其他任一資源y之間的相似度,Ui,j表示對資源i和j都有評分的用戶集合,Ru,i表示用戶u對資源i的評分,表示用戶u對資源i的平均評分,表示用戶u對資源j的平均評分。
優(yōu)選地,所述預測評分程序模塊基于最近領域集SRx1計算目標用戶u對目標資源x的預測評分函數(shù)表達式如式(3)所示;
式(3)中,Pu,x表示目標用戶u對目標資源x的預測評分,表示用戶u對資源x的平均評分,SRx1表示最近領域集SRx1,sim(x,j)表示目標資源x和資源候選集SRx中鄰居j之間的相似度,Ru,j表示用戶u對資源j的評分,表示用戶u對資源j的平均評分。
本發(fā)明教育資源個性化推薦方法具有下述優(yōu)點:本發(fā)明基于個性化協(xié)同過濾機制來進行教育資源個性化推薦,能夠為教育用戶推薦更加精準的興趣內(nèi)教育資源,充分考慮資源本身屬性以及用戶評分兩種影響:在進行目標資源最近鄰居查詢時,首先基于資源關鍵詞標簽矩陣計算資源間相似性,篩選資源形成新的擁有相似關鍵詞標簽的資源候選集SRx,然后根據(jù)用戶-資源評分矩陣R計算目標資源x和資源候選集SRx中其他任一資源y之間的相似度,將相似度大于資源評分相似性閾值S1的資源y生成目標資源x的最近領域集SRx1。最后依據(jù)傳統(tǒng)協(xié)同過濾算法原理計算預測評分,最終做出推薦,能夠?qū)崿F(xiàn)教育資源個性化推薦,為教育用戶推薦更加精準的興趣內(nèi)教育資源,具有推薦準確可靠、方法實現(xiàn)簡單的優(yōu)點。
本發(fā)明教育資源個性化推薦系統(tǒng)為本發(fā)明教育資源個性化推薦方法完全對應的程序模塊構(gòu)建的系統(tǒng),因此同樣也具有本發(fā)明前述教育資源個性化推薦方法的優(yōu)點,在此不再贅述。
附圖說明
圖1為本發(fā)明實施例方法的基本流程示意圖。
具體實施方式
如圖1所示,本實施例教育資源個性化推薦方法的實施步驟包括:
1)預先設置用戶-資源評分矩陣R、資源關鍵詞標簽矩陣L、關鍵詞標簽相似性閾值St、資源評分相似性閾值S1,所述用戶-資源評分矩陣R為m×n維的用戶-資源評分矩陣,用戶-資源評分矩陣R中的每一個資源包含給定的k個具有代表性的關鍵詞標簽描述,所述資源關鍵詞標簽矩陣L為基于用戶-資源評分矩陣R中的每一個資源包含給定的k個具有代表性的關鍵詞標簽描述建立的n×k的資源關鍵詞標簽矩陣;當需要針對用戶-資源評分矩陣R中包含的目標用戶u進行教育資源個性化推薦時,跳轉(zhuǎn)執(zhí)行步驟2);
2)從用戶-資源評分矩陣R從遍歷選擇一個資源作為目標資源x;針對每一個目標資源x,依次根據(jù)資源關鍵詞標簽矩陣L計算目標資源x和用戶-資源評分矩陣R中其他任一資源y之間的相似度,將相似度大于關鍵詞標簽相似性閾值St的資源y生成和目標資源x擁有相似關鍵詞標簽的資源候選集SRx,根據(jù)用戶-資源評分矩陣R計算目標資源x和資源候選集SRx中其他任一資源y之間的相似度,將相似度大于資源評分相似性閾值S1的資源y生成目標資源x的最近領域集SRx1,基于最近領域集SRx1計算目標用戶u對目標資源x的預測評分;
3)選擇預測評分最高的前N個教育資源推薦給當前用戶u。
本實施例中,步驟2)中計算目標資源x和用戶-資源評分矩陣R中其他任一資源y之間的相似度的函數(shù)表達式如式(1)所示;
式(1)中,Sim(x,y)表示目標資源x和用戶-資源評分矩陣R中其他任一資源y之間的相似度,xi表示資源x在k維空間上第i個關鍵詞標簽值,yi表示資源y在k維空間上第i個關鍵詞標簽值,k表示用戶-資源評分矩陣R中的每一個資源包含具有代表性的關鍵詞標簽描述的數(shù)量。
本實施例中,步驟2)中計算目標資源x和資源候選集SRx中其他任一資源y之間的相似度的函數(shù)表達式如式(2)所示;
式(2)中,sim(i,j)表示目標資源x和資源候選集SRx中其他任一資源y之間的相似度,Ui,j表示對資源i和j都有評分的用戶集合,Ru,i表示用戶u對資源i的評分,表示用戶u對資源i的平均評分,表示用戶u對資源j的平均評分。
本實施例中,步驟2)中基于最近領域集SRx1計算目標用戶u對目標資源x的預測評分函數(shù)表達式如式(3)所示;
式(3)中,Pu,x表示目標用戶u對目標資源x的預測評分,表示用戶u對資源x的平均評分,SRx1表示最近領域集SRx1,sim(x,j)表示目標資源x和資源候選集SRx中鄰居j之間的相似度,Ru,j表示用戶u對資源j的評分,表示用戶u對資源j的平均評分。
本實施例教育資源個性化推薦方法具體是通過計算機程序的形式來實現(xiàn)的,基于計算機程序?qū)崿F(xiàn)的本實施例教育資源個性化推薦方法對應的教育資源個性化推薦系統(tǒng)包括:
輸入程序模塊,用于預先設置用戶-資源評分矩陣R、資源關鍵詞標簽矩陣L、關鍵詞標簽相似性閾值St、資源評分相似性閾值S1,所述用戶-資源評分矩陣R為m×n維的用戶-資源評分矩陣,用戶-資源評分矩陣R中的每一個資源包含給定的k個具有代表性的關鍵詞標簽描述,所述資源關鍵詞標簽矩陣L為基于用戶-資源評分矩陣R中的每一個資源包含給定的k個具有代表性的關鍵詞標簽描述建立的n×k的資源關鍵詞標簽矩陣;當需要針對用戶-資源評分矩陣R中包含的目標用戶u進行教育資源個性化推薦時,跳轉(zhuǎn)執(zhí)行步驟2);
預測評分程序模塊,用于從用戶-資源評分矩陣R從遍歷選擇一個資源作為目標資源x;針對每一個目標資源x,依次根據(jù)資源關鍵詞標簽矩陣L計算目標資源x和用戶-資源評分矩陣R中其他任一資源y之間的相似度,將相似度大于關鍵詞標簽相似性閾值St的資源y生成和目標資源x擁有相似關鍵詞標簽的資源候選集SRx,根據(jù)用戶-資源評分矩陣R計算目標資源x和資源候選集SRx中其他任一資源y之間的相似度,將相似度大于資源評分相似性閾值S1的資源y生成目標資源x的最近領域集SRx1,基于最近領域集SRx1計算目標用戶u對目標資源x的預測評分;
選擇推薦程序模塊,用于選擇預測評分最高的前N個教育資源推薦給當前用戶u。
本實施例中,所述預測評分程序模塊計算目標資源x和用戶-資源評分矩陣R中其他任一資源y之間的相似度的函數(shù)表達式如式(1)所示;
式(1)中,Sim(x,y)表示目標資源x和用戶-資源評分矩陣R中其他任一資源y之間的相似度,xi表示資源x在k維空間上第i個關鍵詞標簽值,yi表示資源y在k維空間上第i個關鍵詞標簽值,k表示用戶-資源評分矩陣R中的每一個資源包含具有代表性的關鍵詞標簽描述的數(shù)量。
本實施例中,所述預測評分程序模塊計算目標資源x和資源候選集SRx中其他任一資源y之間的相似度的函數(shù)表達式如式(2)所示;
式(2)中,sim(i,j)表示目標資源x和資源候選集SRx中其他任一資源y之間的相似度,Ui,j表示對資源i和j都有評分的用戶集合,Ru,i表示用戶u對資源i的評分,表示用戶u對資源i的平均評分,表示用戶u對資源j的平均評分。
本實施例中,所述預測評分程序模塊基于最近領域集SRx1計算目標用戶u對目標資源x的預測評分函數(shù)表達式如式(3)所示;
式(3)中,Pu,x表示目標用戶u對目標資源x的預測評分,表示用戶u對資源x的平均評分,SRx1表示最近領域集SRx1,sim(x,j)表示目標資源x和資源候選集SRx中鄰居j之間的相似度,Ru,j表示用戶u對資源j的評分,表示用戶u對資源j的平均評分。
以上所述僅是本發(fā)明的優(yōu)選實施方式,本發(fā)明的保護范圍并不僅局限于上述實施例,凡屬于本發(fā)明思路下的技術(shù)方案均屬于本發(fā)明的保護范圍。應當指出,對于本技術(shù)領域的普通技術(shù)人員來說,在不脫離本發(fā)明原理前提下的若干改進和潤飾,這些改進和潤飾也應視為本發(fā)明的保護范圍。