本發(fā)明涉及偏好學習,特別是涉及一種面向信息推薦的任務偏好學習方法和裝置。
背景技術:
1、偏好學習是信息推薦系統(tǒng)的重要任務,目的是通過對歷史數(shù)據的挖掘,得到特定用戶對待推薦對象特征的喜好差異。信息推薦系統(tǒng)可以利用對用戶的偏好學習結果,有針對性地向用戶推薦諸如電影、歌曲和商品等對象;信息推薦系統(tǒng)可以從任務規(guī)劃人員領受到不同任務指令時所選擇的狀態(tài)信息歷史記錄中,學習到不同任務指令對狀態(tài)信息的偏好差異,利用相應的偏好學習結果,基于任務指令向任務規(guī)劃人員推薦狀態(tài)信息,以減輕任務規(guī)劃人員的工作負荷,提高任務規(guī)劃的效率。
2、針對用戶的偏好學習方法已經十分成熟,通過分析用戶的個人基礎信息、用戶的歷史行為記錄,可以對用戶偏好進行充分建模。然而,針對任務指令的偏好學習仍缺乏有效的方法;傳統(tǒng)的任務偏好建模方法一般是對狀態(tài)信息的信息推薦歷史選擇記錄進行數(shù)據統(tǒng)計分析,這種方法雖然能直觀反映信息推薦歷史選擇記錄中“狀態(tài)信息-任務指令”的配對情況,但是并未在統(tǒng)計基礎上針對任務偏好情況進行總結提取,導致偏好學習結果難以直接被信息推薦系統(tǒng)使用。且當面臨海量狀態(tài)信息和任務指令時,數(shù)據統(tǒng)計分析方法存在處理效率低、直觀有余而抽象不足的問題,信息推薦系統(tǒng)需要的規(guī)律性的偏好信息難以被提取出來,嚴重影響狀態(tài)信息推薦的效率和質量。
3、鑒于此,克服該現(xiàn)有技術所存在的缺陷是本技術領域亟待解決的問題。
技術實現(xiàn)思路
1、本發(fā)明要解決的技術問題是提供一種面向信息推薦的任務偏好學習方法和裝置,其目的在于,挖掘在選擇狀態(tài)信息時起關鍵作用的任務特征,實現(xiàn)了任務指令的整體偏好表征和狀態(tài)信息的偏好主題詞表征的匹配,提高針對任務指令的偏好學習的質量和處理效率,有效改善現(xiàn)有技術在任務偏好建模中的成本與質量缺陷,解決了偏好學習結果難以直接被信息推薦系統(tǒng)使用的問題。
2、本發(fā)明采用如下技術方案:
3、第一方面,本發(fā)明提供了一種面向信息推薦的任務偏好學習方法,包括:
4、對于信息推薦歷史選擇記錄中的任務指令,生成所述任務指令的結構化任務表示;對所述信息推薦歷史選擇記錄中的狀態(tài)信息進行聚類,得到多個類別的狀態(tài)信息集合;對于不同任務的結構化任務表示,計算選擇各個類別的狀態(tài)信息集合的任務指令的結構化任務表示上每個任務元素的最大語義波動度;其中,所述結構化任務表示包括多個任務元素,所述多個任務元素包括任務類型;
5、根據所述最大語義波動度,計算每個所述任務元素的元素敏感度;聚合任務指令在相同類別的狀態(tài)信息集合上的元素敏感度,得到相應類別的狀態(tài)信息集合上任務指令的特征敏感度;聚合每個類型的任務指令在不同狀態(tài)信息集合類別上的特征敏感度,根據聚合后的特征敏感度得到每個任務類型的多個關鍵任務特征;
6、將所述元素敏感度對于各個類別的狀態(tài)信息集合的平均值,作為不同任務類型的關鍵任務特征的平均敏感度;根據所述結構化任務表示、所述多個關鍵任務特征和所述平均敏感度,生成所述結構化任務表示對應的整體偏好表征;
7、從所述狀態(tài)信息中提取狀態(tài)主題詞;根據選擇所述狀態(tài)信息對應的任務類型的關鍵任務特征及相應的平均敏感度,融合所述狀態(tài)主題詞進行嵌入學習,得到所述狀態(tài)信息的任務偏好主題詞;
8、根據所述任務偏好主題詞和所述整體偏好表征,確定所述狀態(tài)信息與所述任務指令的匹配度,篩選所述狀態(tài)信息對應的狀態(tài)主題詞,作為所述任務指令對應的偏好狀態(tài)信息標簽集合。
9、第二方面,本發(fā)明還提供了一種面向信息推薦的任務偏好學習裝置,用于實現(xiàn)第一方面所述的面向信息推薦的任務偏好學習方法,所述面向信息推薦的任務偏好學習裝置包括:
10、至少一個處理器;以及,與所述至少一個處理器通信連接的存儲器;其中,所述存儲器存儲有可被所述至少一個處理器執(zhí)行的指令,所述指令被所述處理器執(zhí)行,用于執(zhí)行第一方面所述的面向信息推薦的任務偏好學習方法。
11、第三方面,本發(fā)明還提供了一種非易失性計算機存儲介質,所述計算機存儲介質存儲有計算機可執(zhí)行指令,該計算機可執(zhí)行指令被一個或多個處理器執(zhí)行,用于完成第一方面所述的面向信息推薦的任務偏好學習方法。
12、區(qū)別于現(xiàn)有技術,本發(fā)明至少具有以下有益效果:
13、本發(fā)明通過生成任務指令的結構化任務表示,挖掘在選擇狀態(tài)信息過程中起關鍵作用的關鍵任務特征集合,結合其中每個任務類型的關鍵任務特征,生成相應的狀態(tài)主題詞,基于對任務指令和狀態(tài)信息文本的嵌入學習得到的偏好信息,進一步篩選與對相應的關鍵任務特征匹配度較高的狀態(tài)主題詞,最終得到目標狀態(tài)信息標簽集合,實現(xiàn)針對任務指令的狀態(tài)信息的偏好學習;本發(fā)明能夠提取出信息推薦系統(tǒng)所需的規(guī)律性的偏好信息(即,目標狀態(tài)信息標簽集合),有效提升信息推薦的效率和質量,改善現(xiàn)有技術在任務偏好建模中的成本與質量缺陷,作為用戶建模手段,針對任務指令為信息推薦系統(tǒng)的精準推薦提供工作基礎。
1.一種面向信息推薦的任務偏好學習方法,其特征在于,包括:
2.根據權利要求1所述的面向信息推薦的任務偏好學習方法,其特征在于,所述對于信息推薦歷史選擇記錄中的任務指令,生成所述任務指令的結構化任務表示;對所述信息推薦歷史選擇記錄中的狀態(tài)信息進行聚類,得到多個類別的狀態(tài)信息集合;對于不同任務的結構化任務表示,計算選擇各個類別的狀態(tài)信息集合的任務指令的結構化任務表示上每個任務元素的最大語義波動度包括:
3.根據權利要求2所述的面向信息推薦的任務偏好學習方法,其特征在于,所述訓練初始統(tǒng)計模型,得到完成任務指令類型識別和任務元素抽取的目標統(tǒng)計模型包括:
4.根據權利要求2所述的面向信息推薦的任務偏好學習方法,其特征在于,所述對于不同任務的結構化任務表示,計算選擇各個類別的狀態(tài)信息集合的任務指令的結構化任務表示上每個任務元素的最大語義波動度包括:
5.根據權利要求1所述的面向信息推薦的任務偏好學習方法,其特征在于,所述根據所述最大語義波動度,計算每個所述任務元素的元素敏感度;聚合任務指令在相同類別的狀態(tài)信息集合上的元素敏感度,得到相應類別的狀態(tài)信息集合上任務指令的特征敏感度;聚合每個類型的任務指令在不同狀態(tài)信息集合類別上的特征敏感度,根據聚合后的特征敏感度得到每個任務類型的多個關鍵任務特征包括:
6.根據權利要求1所述的面向信息推薦的任務偏好學習方法,其特征在于,所述根據所述結構化任務表示、所述多個關鍵任務特征和所述平均敏感度,生成所述結構化任務表示對應的整體偏好表征包括:
7.根據權利要求1所述的面向信息推薦的任務偏好學習方法,其特征在于,所述從所述狀態(tài)信息中提取狀態(tài)主題詞;根據選擇所述狀態(tài)信息對應的任務類型的關鍵任務特征及相應的平均敏感度,融合所述狀態(tài)主題詞進行嵌入學習,得到所述狀態(tài)信息的任務偏好主題詞包括:
8.根據權利要求1所述的面向信息推薦的任務偏好學習方法,其特征在于,所述根據所述任務偏好主題詞和所述整體偏好表征,確定所述狀態(tài)信息與所述任務指令的匹配度,篩選所述狀態(tài)信息對應的狀態(tài)主題詞,作為所述任務指令對應的偏好狀態(tài)信息標簽集合包括:
9.一種面向信息推薦的任務偏好學習裝置,其特征在于,所述面向信息推薦的任務偏好學習裝置包括至少一個處理器和存儲器,所述至少一個處理器和存儲器之間通過數(shù)據總線連接,所述存儲器存儲有可被所述至少一個處理器執(zhí)行的指令,所述指令在被所述處理器執(zhí)行后,用于實現(xiàn)權利要求1-8任一所述的面向信息推薦的任務偏好學習方法。
10.一種非易失性計算機存儲介質,其特征在于,所述計算機存儲介質有計算機可執(zhí)行指令,所述計算機可執(zhí)行指令被一個或多個處理器執(zhí)行,用于完成權利要求1-8任一所述的面向信息推薦的任務偏好學習方法。