本發(fā)明涉及人力資源,具體為一種基于大數(shù)據(jù)分析的精準推送的優(yōu)化方法及服務(wù)系統(tǒng)。
背景技術(shù):
1、基于大數(shù)據(jù)分析的精準推送技術(shù)廣泛應(yīng)用于多種領(lǐng)域,其中在人力資源領(lǐng)域的應(yīng)用尤為重要。隨著招聘平臺和求職方式的多樣化發(fā)展,如何通過海量數(shù)據(jù)分析,精準地將合適的崗位推送給合適的用戶,成為了現(xiàn)代招聘系統(tǒng)優(yōu)化的核心挑戰(zhàn)之一。特別是在用戶和崗位匹配的過程中,崗位和用戶之間的匹配推送不僅可以提高招聘的效率,還能夠使求職者更快找到適合自己的工作機會。
2、然而,當前的崗位推送系統(tǒng)往往面臨一些實際問題。例如,很多系統(tǒng)依賴靜態(tài)數(shù)據(jù),忽略了用戶在招聘平臺上的動態(tài)行為和活躍度,并且,傳統(tǒng)的崗位推薦方法更多依賴于崗位標簽的直接匹配,導致推薦的匹配度不夠精準,用戶之間的相似性、主動互動行為,以及用戶對某類崗位的實際滿意度,通常也沒有被充分考慮,導致推薦崗位的準確性偏低,用戶體驗較差。
技術(shù)實現(xiàn)思路
1、針對現(xiàn)有技術(shù)的不足,本發(fā)明提供了一種基于大數(shù)據(jù)分析的精準推送的優(yōu)化方法及服務(wù)系統(tǒng),解決了上述背景技術(shù)中的問題。
2、為實現(xiàn)以上目的,本發(fā)明通過以下技術(shù)方案予以實現(xiàn):一種基于大數(shù)據(jù)分析的精準推送的優(yōu)化方法,包括以下步驟,
3、s1、根據(jù)大數(shù)據(jù)技術(shù),預(yù)先對各類崗位需求和各用戶簡歷進行收集,以獲取各類崗位的相關(guān)需求數(shù)據(jù)信息及各用戶在招聘平臺投遞的相關(guān)簡歷數(shù)據(jù)信息,并生成靜態(tài)數(shù)據(jù)集;
4、s2、基于靜態(tài)數(shù)據(jù)集,構(gòu)建出未溝通的崗位匹配因子gpyz,并初步篩選出與相應(yīng)類型崗位適配的目標用戶,同時將目標用戶所對應(yīng)的崗位作為目標崗位;
5、s3、基于s2中篩選出的目標用戶,將該類型崗位中主動互動的用戶進行統(tǒng)計,以生成主動用戶集合a,并監(jiān)測主動用戶和目標用戶在招聘平臺上對各類崗位的活躍程度,以獲取動態(tài)數(shù)據(jù)集,基于動態(tài)數(shù)據(jù)集,分析目標用戶與主動用戶之間的相似度xsd,并結(jié)合主動用戶在招聘平臺上對各類崗位的活躍程度,構(gòu)建主動用戶對各類型崗位的滿意系數(shù);
6、s4、基于主動用戶對各類型崗位的滿意系數(shù),預(yù)測出目標用戶對目標崗位的滿意系數(shù),并結(jié)合目標崗位需求量,預(yù)先設(shè)置評估閾值q,將目標用戶對目標崗位的滿意系數(shù)與評估閾值q進行比對分析,以優(yōu)化目標崗位的待面試候選人。
7、優(yōu)選的,s1具體包括有:
8、s11、對各類崗位需求和各用戶簡歷進行收集,以獲取各類崗位的相關(guān)需求數(shù)據(jù)信息及各用戶在招聘平臺投遞的相關(guān)簡歷數(shù)據(jù)信息,其中,所述相關(guān)需求數(shù)據(jù)信息包括各類崗位對崗位的要求描述以及所有類型崗位描述文檔的總數(shù);
9、所述相關(guān)簡歷數(shù)據(jù)信息包括用戶在招聘平臺投遞的簡歷描述;
10、s12、將各類崗位的相關(guān)需求數(shù)據(jù)信息及各用戶在招聘平臺投遞的相關(guān)簡歷數(shù)據(jù)信息進行預(yù)處理后,以生成靜態(tài)數(shù)據(jù)集,其中,預(yù)處理包括去除噪聲、填補缺失值以及數(shù)據(jù)平滑操作,并且填補缺失值方法包括均值填補、中位數(shù)填補、插值法填補以及回歸法填補,并利用無量綱處理技術(shù),對靜態(tài)數(shù)據(jù)集內(nèi)信息進行縮放,使得靜態(tài)數(shù)據(jù)集內(nèi)信息范圍落在0到1之間。
11、優(yōu)選的,s2具體包括有:
12、s21、利用自然語言處理技術(shù)對靜態(tài)數(shù)據(jù)集進行分詞,去除停用詞,并提取出相關(guān)需求數(shù)據(jù)信息內(nèi)關(guān)鍵詞及相關(guān)簡歷數(shù)據(jù)信息內(nèi)關(guān)鍵詞;
13、s22、基于s21中獲取的相關(guān)需求數(shù)據(jù)信息內(nèi)關(guān)鍵詞及相關(guān)簡歷數(shù)據(jù)信息內(nèi)關(guān)鍵詞,分別獲取相關(guān)需求數(shù)據(jù)信息內(nèi)關(guān)鍵詞的詞頻cp1、相關(guān)簡歷數(shù)據(jù)信息內(nèi)關(guān)鍵詞的詞頻cp2、相關(guān)需求數(shù)據(jù)信息內(nèi)關(guān)鍵詞在所有類型崗位中的逆文檔頻率ndp1及相關(guān)簡歷數(shù)據(jù)信息內(nèi)關(guān)鍵詞在所有類型崗位中的逆文檔頻率ndp2;
14、s221、相關(guān)需求數(shù)據(jù)信息內(nèi)關(guān)鍵詞在所有類型崗位中的逆文檔頻率ndp1及相關(guān)簡歷數(shù)據(jù)信息內(nèi)關(guān)鍵詞在所有類型崗位中的逆文檔頻率ndp2均通過以下方式獲取:
15、;
16、式中,表示為第i關(guān)鍵詞在所有類型崗位中的逆文檔頻率,表示為所有類型崗位描述文檔的總數(shù),表示為第i關(guān)鍵詞出現(xiàn)在崗位描述文檔的數(shù)量。
17、優(yōu)選的,s2還包括有:
18、s23、基于s21中獲取的相關(guān)需求數(shù)據(jù)信息內(nèi)關(guān)鍵詞及相關(guān)簡歷數(shù)據(jù)信息內(nèi)關(guān)鍵詞,分析用戶與未溝通的崗位之間的崗位匹配程度,以計算獲取未溝通的崗位匹配因子gpyz,具體通過以下公式獲?。?/p>
19、;
20、式中,k為共同關(guān)鍵詞;k為相關(guān)需求數(shù)據(jù)信息和相關(guān)簡歷數(shù)據(jù)信息中共同出現(xiàn)的關(guān)鍵詞的集合;表示為相關(guān)需求數(shù)據(jù)信息內(nèi)共同關(guān)鍵詞k的詞頻;表示為相關(guān)簡歷數(shù)據(jù)信息內(nèi)共同關(guān)鍵詞的詞頻,表示為相關(guān)需求數(shù)據(jù)信息內(nèi)共同關(guān)鍵詞在所有類型崗位中的逆文檔頻率,表示為相關(guān)簡歷數(shù)據(jù)信息內(nèi)共同關(guān)鍵詞在所有類型崗位中的逆文檔頻率,表示為共同關(guān)鍵詞在相關(guān)需求數(shù)據(jù)信息中的權(quán)重向量,表示為共同關(guān)鍵詞在相關(guān)簡歷數(shù)據(jù)信息中的權(quán)重向量,表示共同關(guān)鍵詞k是相關(guān)需求數(shù)據(jù)信息和相關(guān)簡歷數(shù)據(jù)信息中共同出現(xiàn)的關(guān)鍵詞。
21、優(yōu)選的,s2還包括有:
22、s24、預(yù)先設(shè)置匹配閾值w,并將未溝通的崗位匹配因子gpyz與匹配閾值w進行比對分析,以初步篩選出與相應(yīng)類型崗位適配的目標用戶,具體初判內(nèi)容如下:
23、若未溝通的崗位匹配因子gpyz超過匹配閾值w時,初步判斷相應(yīng)用戶簡歷與相應(yīng)類型崗位的需求相適配,此時將對該用戶和該類型崗位進行標注作業(yè),分別標注為目標用戶和目標崗位;
24、若未溝通的崗位匹配因子gpyz未超過匹配閾值w時,初步判斷相應(yīng)用戶簡歷與相應(yīng)類型崗位的需求暫不適配,此時將對該用戶和該類型崗位不進行標注作業(yè)。
25、優(yōu)選的,s3具體包括有:
26、s31、基于s2中篩選出的目標用戶,將歷史時段內(nèi)主動咨詢目標崗位的用戶進行統(tǒng)計,將該用戶標記為主動用戶,并生成主動用戶集合a;
27、s32、實時監(jiān)測與記錄主動用戶和目標用戶在招聘平臺上對各類崗位的活躍程度,以獲取動態(tài)數(shù)據(jù)集,所述動態(tài)數(shù)據(jù)集包括主動用戶主動詢問的類型崗位、目標用戶主動詢問的類型崗位及主動用戶對其主動咨詢的崗位所進行的瀏覽次數(shù)lgcs;
28、s321、根據(jù)主動用戶主動詢問的類型崗位構(gòu)建出主動用戶主動詢問的類型崗位集合,根據(jù)目標用戶主動詢問的類型崗位構(gòu)建出目標用戶主動詢問的類型崗位集合。
29、優(yōu)選的,s3還包括有:
30、s33、基于所述動態(tài)數(shù)據(jù)集,分析目標用戶與主動用戶之間的相似度xsd,具體通過以下方式獲?。?/p>
31、;
32、式中,表示為目標用戶主動詢問的類型崗位集合,表示為主動用戶主動詢問的類型崗位集合,表示為兩個集合的交集,表示為兩個集合的并集;
33、s34、根據(jù)主動用戶在招聘平臺上對各類崗位的活躍程度,將瀏覽次數(shù)lgcs及瀏覽占比lzb作線性歸一化處理,并將對應(yīng)的數(shù)據(jù)值映射至區(qū)間內(nèi),以構(gòu)建主動用戶對各類型崗位的滿意系數(shù),具體按照以下方式獲取:
34、;
35、式中,n表示為主動用戶瀏覽類型崗位的數(shù)量,j=1、2、3、...、n,表示為第j類型崗位的瀏覽次數(shù),表示為平均瀏覽次數(shù),表示為第j類型崗位的瀏覽占比,表示為平均瀏覽占比,及均為權(quán)重值,表示為修正常數(shù)。
36、優(yōu)選的,s4具體包括有:
37、s41、基于主動用戶對各類型崗位的滿意度,結(jié)合目標用戶與主動用戶之間的相似度xsd,并經(jīng)線性歸一化處理后,預(yù)測出目標用戶對各類型崗位的滿意系數(shù),具體內(nèi)容如下:
38、;
39、式中,a表示為主動用戶的索引,a表示為主動用戶集合,表示為主動用戶a屬于主動用戶集合,表示為目標用戶與主動用戶a之間的相似度,表示為主動用戶a對第j類型崗位的滿意系數(shù)。
40、優(yōu)選的,s4還包括有:
41、s42、根據(jù)s41中獲取目標用戶對各類型崗位的滿意系數(shù),提取出目標用戶對目標崗位的滿意系數(shù);
42、s43、預(yù)先設(shè)置評估閾值q,并將目標用戶對目標崗位的滿意系數(shù)與評估閾值q進行比對分析,以篩選出目標崗位的待面試候選人,具體內(nèi)容如下:
43、若目標用戶對目標崗位的滿意系數(shù)超過評估閾值q時,此時通過招聘平臺將目標崗位推送給該目標用戶,并將該目標用戶推送給目標崗位,同時將該目標用戶作為待面試候選人;
44、若目標用戶對目標崗位的滿意系數(shù)未超過評估閾值q時,此時將暫不通過招聘平臺將目標崗位推送給該目標用戶,同時也暫不將該目標用戶推送給目標崗位。
45、一種基于大數(shù)據(jù)分析的精準推送的服務(wù)系統(tǒng),包括靜態(tài)數(shù)據(jù)監(jiān)測模塊、初步匹配分析模塊、推送分析模塊及鎖定模塊;
46、所述靜態(tài)數(shù)據(jù)監(jiān)測模塊根據(jù)大數(shù)據(jù)技術(shù),預(yù)先對各類崗位需求和各用戶簡歷進行收集,以獲取各類崗位的相關(guān)需求數(shù)據(jù)信息及各用戶在招聘平臺投遞的相關(guān)簡歷數(shù)據(jù)信息,并生成靜態(tài)數(shù)據(jù)集;
47、所述初步匹配分析模塊基于靜態(tài)數(shù)據(jù)集,構(gòu)建出未溝通的崗位匹配因子gpyz,并初步篩選出與相應(yīng)類型崗位適配的目標用戶,同時將目標用戶所對應(yīng)的崗位作為目標崗位;
48、所述推送分析模塊基于篩選出的目標用戶,將該類型崗位中主動互動的用戶進行統(tǒng)計,以生成主動用戶集合a,并監(jiān)測主動用戶和目標用戶在招聘平臺上對各類崗位的活躍程度,以獲取動態(tài)數(shù)據(jù)集,基于動態(tài)數(shù)據(jù)集,分析目標用戶與主動用戶之間的相似度xsd,并結(jié)合主動用戶在招聘平臺上對各類崗位的活躍程度,構(gòu)建主動用戶對各類型崗位的滿意系數(shù);
49、所述鎖定模塊基于主動用戶對各類型崗位的滿意系數(shù),預(yù)測出目標用戶對目標崗位的滿意系數(shù),并結(jié)合目標崗位需求量,預(yù)先設(shè)置評估閾值q,將目標用戶對目標崗位的滿意系數(shù)與評估閾值q進行比對分析,以優(yōu)化目標崗位的待面試候選人。
50、本發(fā)明提供了一種基于大數(shù)據(jù)分析的精準推送的優(yōu)化方法及服務(wù)系統(tǒng),具備以下有益效果:
51、(1)首先,s1步驟中通過預(yù)先收集并整合各類崗位需求與用戶簡歷數(shù)據(jù),生成靜態(tài)數(shù)據(jù)集,為后續(xù)匹配提供了基礎(chǔ)信息支持。接著,s2步驟利用崗位匹配因子gpyz,對未進行溝通的用戶與崗位進行初步篩選,從而精準定位潛在適配的目標用戶和目標崗位,提高了匹配效率。在s3步驟中,該方法通過統(tǒng)計目標用戶與主動互動用戶的行為,生成動態(tài)數(shù)據(jù)集并監(jiān)測活躍程度,分析相似度xsd,構(gòu)建主動用戶對各類崗位的滿意系數(shù),進一步增強了對崗位需求和用戶偏好之間的理解。最后,s4步驟通過滿意系數(shù)的預(yù)測,并結(jié)合評估閾值q,進行進一步的比對分析,使得系統(tǒng)能夠進一步篩選出與崗位需求高度匹配的候選人,確保了只有那些對崗位真正感興趣且匹配度高的候選人才能進入面試階段,從而提高了面試候選人的質(zhì)量,減少用人單位與求職者之間的匹配盲區(qū),以優(yōu)化崗位招聘的整體效果。
52、(2)基于用戶之間的相似性,通過主動用戶的行為和評分來預(yù)測目標用戶對未知項目的偏好,在現(xiàn)實場景中,數(shù)據(jù)稀疏性往往是個大問題。比如,在一個大型人力資源系統(tǒng)中,目標用戶可能只對少數(shù)幾個崗位進行過評分或瀏覽,而系統(tǒng)中的崗位類型和數(shù)量遠遠大于這些評分的數(shù)量,此時系統(tǒng)可以幫助解決這種稀疏性問題:通過利用與目標用戶相似的用戶對其他崗位的評分,進一步彌補由于目標用戶數(shù)據(jù)不足帶來的預(yù)測偏差,這是一種基于群體智慧的思想,通過其他用戶的行為和評分,提升對目標用戶偏好的預(yù)測精度。同時通過動態(tài)地利用主動用戶的最新行為和評分來不斷更新預(yù)測,可以捕捉目標用戶的興趣和偏好會隨著時間和經(jīng)驗而變化的問題,直接依賴于目標用戶的歷史評分,可能難以反映這些動態(tài)變化,而通過主動用戶來預(yù)測可以更好地適應(yīng)這些變化。
53、(3)該方法通過自然語言處理技術(shù)對崗位描述和用戶簡歷進行關(guān)鍵詞提取,進一步通過共同關(guān)鍵詞的分析,構(gòu)建未溝通的崗位匹配因子gpyz,從而精確衡量用戶與崗位之間的匹配程度,此方法基于關(guān)鍵詞的詞頻、逆文檔頻率以及權(quán)重向量的綜合計算,保證了對用戶簡歷與崗位需求的深度分析,實現(xiàn)了更加精細化的匹配,并且在初步篩選階段能夠快速排除與崗位需求不符的簡歷,進一步降低了后續(xù)的篩選負擔。通過對匹配因子的比對分析,系統(tǒng)能夠自動識別出適配度高的用戶并標注為目標用戶,同時標注相應(yīng)的目標崗位,這種動態(tài)的標注與判斷過程有效提升了崗位推薦和用戶簡歷篩選的效率,進一步避免了傳統(tǒng)匹配中粗糙或片面的篩選方式。
54、(4)相似度分析基于目標用戶與主動用戶在崗位詢問集合的交集與并集計算,確保了推薦系統(tǒng)能夠更精準地識別出與目標用戶行為相似的主動用戶,從而為目標用戶提供更加相關(guān)的崗位推薦。結(jié)合主動用戶對各類型崗位的滿意系數(shù),系統(tǒng)能夠更準確地預(yù)測目標用戶對各類型崗位的潛在滿意度,這種篩選機制可以有效地提高崗位推薦的相關(guān)性和有效性,從而減少不匹配的推薦結(jié)果,同時也優(yōu)化了用戶的求職體驗,通過這種基于數(shù)據(jù)的精準推送方法,招聘平臺能夠更有效地匹配用戶與崗位,減少了用戶的搜索成本,并增加了招聘成功的機會。
55、(5)通過精細化的滿意度預(yù)測與篩選機制,招聘平臺能夠更高效地匹配用戶與崗位,減少了無效推薦和篩選的時間,提高了招聘流程的整體效率,這種優(yōu)化不僅提升了平臺的服務(wù)質(zhì)量,也增強了用戶的參與感和平臺的競爭力。精準的崗位推薦和用戶匹配能夠盡可能的改善用戶體驗,提升用戶滿意度。用戶能夠更容易找到符合自己興趣和能力的崗位,從而增加了平臺的用戶粘性和活躍度。