基于文本履歷信息的信息可視化方法及智能可視分析系統(tǒng)的制作方法

文檔序號：6628216閱讀：354來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計算;推算;計數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

基于文本履歷信息的信息可視化方法及智能可視分析系統(tǒng)的制作方法
【專利摘要】本發(fā)明公開了一種基于文本履歷信息的信息可視化方法及智能可視分析系統(tǒng)。本方法為：1)對每一文本履歷信息中的經(jīng)歷信息，進行經(jīng)歷等級量化計算，得到成長軌跡序列數(shù)據(jù)，并將該數(shù)據(jù)可視化；2)選取多份文本履歷信息的成長軌跡序列數(shù)據(jù)進行關(guān)聯(lián)計算，得到文本履歷間的潛在社交關(guān)系，并將該潛在社交關(guān)系進行社交網(wǎng)絡(luò)可視化；3)基于履歷間的潛在社交關(guān)系，將具有單位交集的履歷轉(zhuǎn)化成相應(yīng)人員所在單位的組織層級關(guān)系，并將該組織層級關(guān)系進行組織機構(gòu)可視化。本發(fā)明通過數(shù)據(jù)挖掘與信息可視化技術(shù)能夠獲得履歷所代表的個人的時空成長經(jīng)歷，發(fā)現(xiàn)人員之間的潛在社交關(guān)系，還原出人員間的組織層級關(guān)系，從而獲得群體成長模式及社交關(guān)系的深層次認(rèn)知。
【專利說明】基于文本履歷信息的信息可視化方法及智能可視分析系統(tǒng)

【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于計算機應(yīng)用【技術(shù)領(lǐng)域】，涉及一種基于文本履歷信息的智能可視分析系統(tǒng)及信息可視化方法。

【背景技術(shù)】
[0002] 履歷信息是一種總結(jié)個人經(jīng)歷的信息，它存在于履歷數(shù)據(jù)中，主要包括個人基本信息以及個人經(jīng)歷資料的簡要說明。個人基本信息包括姓名、性別、出生年月、民族、教育程度、政治面貌、宗教信仰、主要家庭成員、主要社會關(guān)系、婚姻與個人健康狀況等。個人經(jīng)歷作為履歷的重要內(nèi)容通常包括個人過去的學(xué)習(xí)經(jīng)歷、任職經(jīng)歷等。
[0003] 個人履歷數(shù)據(jù)作為人員測評的重要依據(jù)，它從多個方面反映了個人過去的行為以及當(dāng)前的能力。履歷分析基于履歷數(shù)據(jù)所體現(xiàn)出來的人員過去的行為來預(yù)測將來的行為，從而廣泛應(yīng)用于各企事業(yè)單位的人事選拔與招聘，政府部門的干部考核與管理，以及科技人才流動研究與評價。
[0004] 隨著信息技術(shù)的不斷發(fā)展，近年來電子履歷數(shù)據(jù)呈爆炸方式增長與傳播。電子履歷從來源上劃分主要包括：①存在于互聯(lián)網(wǎng)上的公開履歷；②存在于各企事業(yè)單位以及人才招聘系統(tǒng)中的非公開履歷。此外，電子履歷從形態(tài)上劃分可以分為結(jié)構(gòu)化履歷和非結(jié)構(gòu) 化履歷兩種：①結(jié)構(gòu)化履歷。通常為表格形式，來源于人事招聘系統(tǒng)或單位內(nèi)部的管理系統(tǒng)，其履歷結(jié)構(gòu)較規(guī)范且固定，便于統(tǒng)一管理。但是，結(jié)構(gòu)化履歷因其結(jié)構(gòu)固定且擴展性較弱，很難對其進行基于語義的深層次分析。②非結(jié)構(gòu)化履歷。通常為文本形式，其來源較廣，例如互聯(lián)網(wǎng)各大新聞?wù)军c或社交媒體。非結(jié)構(gòu)化履歷結(jié)構(gòu)多樣，不便于統(tǒng)一分析與管理。但是，非結(jié)構(gòu)化履歷因其以文本作為載體，其中往往蘊含豐富的語義信息，故可以對其進行基于語義的智能分析，例如語義查找與分類等任務(wù)。
[0005] 與此同時，隨著履歷數(shù)據(jù)量的不斷增加，傳統(tǒng)的基于人工的履歷分析方法因其效率較低，在快速處理大量履歷數(shù)據(jù)的任務(wù)中往往顯得力不從心。因此，依靠計算機強大處理能力的履歷分析系統(tǒng)（CurriculumVitaeAnalysisSystem,CVAS)應(yīng)運而生。CVAS主要針對結(jié)構(gòu)化履歷數(shù)據(jù)進行自動化的履歷分析與管理。它借助于計算機其強大的處理與分析能力，能夠基于履歷數(shù)據(jù)快速過濾不符合要求的履歷，大大提高履歷分析的效率。而且，它也可以根據(jù)具體應(yīng)用需求，對履歷數(shù)據(jù)進行定量分析與科學(xué)評估，使得履歷分析結(jié)構(gòu)更加合理可靠。所以，近年來CVAS越來越受到企事業(yè)單位人事管理部門的重視，被廣泛地用于人員選拔等人事資源管理活動中。
[0006] 綜上所述，履歷分析技術(shù)的發(fā)展經(jīng)歷了最初的手工分析技術(shù)，到互聯(lián)網(wǎng)時代下的計算機自動分析技術(shù)。尤其是近年來出現(xiàn)的CVAS，運用計算機強大處理能力極大地提高了履歷分析的效率，得到了各領(lǐng)域的廣泛應(yīng)用。
[0007] 但是，現(xiàn)有CVAS依然存在著如下不足之處：（1)當(dāng)前系統(tǒng)不適用于針對非結(jié)構(gòu)化履歷數(shù)據(jù)的分析。非結(jié)構(gòu)化履歷通常為純文本形式存儲（例如tXt、w〇rd、pdf等形式），格式不統(tǒng)一且變化較大，很難直接應(yīng)用于當(dāng)前的CVAS。換句話說，當(dāng)前CVAS缺乏將非結(jié)構(gòu)化履歷轉(zhuǎn)化為結(jié)構(gòu)化履歷的能力。（2)當(dāng)前系統(tǒng)的分析能力主要體現(xiàn)在簡單規(guī)則下的定性分析與定量計算（例如履歷篩選與打分）以及統(tǒng)計管理方面（例如生成履歷信息報表），而忽略了對于履歷中所蘊含的潛在模式的智能挖掘以及直觀可視分析，尤其是忽略了從履歷中挖掘出個人成長模式以及對于成長模式的直觀可視化，從而無法幫助用戶完成一些復(fù)雜任務(wù)，例如基于語義的履歷查找與分類、人事任免推薦、職業(yè)生涯規(guī)劃等。（3)當(dāng)前系統(tǒng)僅針對單個履歷進行孤立分析，而忽視了履歷之間的關(guān)聯(lián)性。履歷間的潛在關(guān)聯(lián)能夠反映人員之間的潛在社交關(guān)系，該關(guān)系由個人的潛在經(jīng)歷交集產(chǎn)生，例如同學(xué)、同事、同鄉(xiāng)、戰(zhàn)友、合作者、競爭對手等關(guān)系?；谠撽P(guān)系能夠還原并構(gòu)建出人員之間的潛在社交網(wǎng)絡(luò)，該網(wǎng)絡(luò)對于履歷的科學(xué)管理、用戶掌握人員間的潛在社會關(guān)聯(lián)、發(fā)現(xiàn)人員間的組織機構(gòu)層級關(guān)系從而獲得深層次認(rèn)知能夠起到促進作用。

【發(fā)明內(nèi)容】

[0008] 本發(fā)明技術(shù)解決的問題：克服現(xiàn)有方法與系統(tǒng)的不足，提供一種基于文本履歷信息的智能可視分析系統(tǒng)及信息可視化方法，充分利用履歷數(shù)據(jù)中的潛在模式信息，基于自然語言處理、數(shù)據(jù)挖掘、機器學(xué)習(xí)以及信息可視化技術(shù)構(gòu)建履歷信息可視分析環(huán)境，幫助用戶理解履歷中的潛在成長模式及履歷間的潛在關(guān)聯(lián)信息，從而為基于語義的履歷查找與分類、人事任免推薦、職業(yè)生涯規(guī)劃以及人際關(guān)系把握等任務(wù)提供支持。該發(fā)明技術(shù)為通用框架，旨在發(fā)現(xiàn)履歷數(shù)據(jù)中所蘊含的潛在成長模式以及人員間的潛在社交關(guān)系，并將這些模式特征以及社交關(guān)系以直觀的可視化方式加以表達。它可以廣泛應(yīng)用于職員履歷、干部履歷、企業(yè)高管履歷以及科研人員履歷的智能挖掘及信息可視化領(lǐng)域。
[0009] 本發(fā)明技術(shù)解決方案：一種基于文本履歷信息的智能可視分析系統(tǒng)，包括：文本履歷預(yù)處理模塊；個人成長經(jīng)歷量化模塊；個人成長模式挖掘模塊；群體潛在社交關(guān)系挖掘模塊；組織機構(gòu)生成模塊；履歷信息可視化模塊；履歷可視分析模塊。其中：
[0010] 文本履歷預(yù)處理模塊。該模塊將非結(jié)構(gòu)化的文本履歷數(shù)據(jù)進行預(yù)處理，抽取履歷信息中的有效要素（包括個人基本信息以及經(jīng)歷信息），得到結(jié)構(gòu)化的履歷要素XML數(shù)據(jù) (ExtensibleMarkupLanguage,可擴展標(biāo)記語言）。該模塊借助自然語言處理技術(shù)將格式不統(tǒng)一的多源履歷文本轉(zhuǎn)化為具有統(tǒng)一結(jié)構(gòu)的履歷要素數(shù)據(jù)，為后續(xù)模塊的處理提供了數(shù) 據(jù)基礎(chǔ)。
[0011] 個人成長經(jīng)歷量化模塊。該模塊針對履歷要素中的經(jīng)歷信息，進行經(jīng)歷等級的量化計算，從而得到成長軌跡序列數(shù)據(jù)。該模塊利用自然語言處理技術(shù)將履歷要素中的經(jīng)歷信息量化為等級信息，為后續(xù)模塊的挖掘及可視化提供了基礎(chǔ)。
[0012] 個人成長模式挖掘模塊。該模塊利用機器學(xué)習(xí)以及數(shù)據(jù)挖掘技術(shù)，對成長軌跡序列數(shù)據(jù)進行時間維度以及空間維度的類型分析，得到履歷的時空成長模式。
[0013] 群體潛在社交關(guān)系挖掘模塊。該模塊利用數(shù)據(jù)挖掘中的關(guān)聯(lián)算法，對多份履歷的成長軌跡序列數(shù)據(jù)進行關(guān)聯(lián)計算，得到履歷間的潛在社交關(guān)系（例如同學(xué)、同事、同鄉(xiāng)、戰(zhàn) 友、合作者、競爭對手等關(guān)系）。
[0014] 組織機構(gòu)生成模塊。該模塊以多份履歷所代表群體的潛在社交關(guān)系為基礎(chǔ)，能夠從群體的單位交集信息中提取并還原出組織機構(gòu)的層級信息。
[0015] 履歷信息可視化模塊。該模塊以一種基于文本履歷信息的信息可視化方法為基礎(chǔ)，借助可視化隱喻手段，將前面提及的履歷成長軌跡序列數(shù)據(jù)以及各挖掘模塊所輸出的挖掘結(jié)果轉(zhuǎn)化成直觀易于理解的信息可視化圖。所生成的可視化圖能夠幫助用戶快速掌握履歷數(shù)據(jù)的特征以及其中蘊含的知識。
[0016] 履歷可視分析模塊。該模塊基于信息可視化圖構(gòu)建履歷信息可視分析環(huán)境，利用人機交互技術(shù)幫助用戶從時間和空間維度來理解履歷中的潛在信息及模式特征，從而獲得深層次的認(rèn)知。
[0017] 一種基于文本履歷信息的信息可視化方法，其實現(xiàn)步驟為：
[0018] 1.履歷時空軌跡可視化算法。該算法基于成長隱喻思想，將履歷中的抽象成長信息轉(zhuǎn)化為形象的時空軌跡可視化表達。該算法生成的時空軌跡可視化圖通過對成長軌跡序列數(shù)據(jù)的可視化，能夠?qū)⒃境橄蟮膫€人成長信息以時空圖的方式直觀地表達出來。
[0019] 2.履歷潛在社交網(wǎng)絡(luò)可視化算法。該算法基于履歷間的潛在社交關(guān)系，構(gòu)建履歷社交網(wǎng)絡(luò)可視化表達。該算法基于挖掘得到的履歷間潛在關(guān)系，構(gòu)建履歷社交網(wǎng)絡(luò)可視化表達，所生成的潛在關(guān)系圖能夠?qū)⒃境橄蟮穆臍v間潛在關(guān)系以網(wǎng)絡(luò)圖的方式直觀地表達出來。
[0020] 3.履歷組織層級可視化算法。該算法基于履歷間的潛在社交關(guān)系，構(gòu)建人員所在單位的組織層級可視化表達。該算法從履歷信息中抽取出履歷間的單位交集信息，將具有單位交集的履歷轉(zhuǎn)化成相應(yīng)單位的組織層級關(guān)系，并將這種關(guān)系以基于表格結(jié)構(gòu)的組織機構(gòu)圖的方式可視化出來。
[0021] 與現(xiàn)有技術(shù)相比，本發(fā)明的積極效果為：
[0022] 1.本發(fā)明與傳統(tǒng)方法相比，以非結(jié)構(gòu)化文本形式的履歷數(shù)據(jù)作為數(shù)據(jù)源，基于自然語言處理技術(shù)，通過履歷結(jié)構(gòu)化要素提取機制滿足了多源異構(gòu)履歷數(shù)據(jù)的統(tǒng)一處理需求，大大增強了系統(tǒng)及方法的適用范圍。
[0023] 2.本發(fā)明與傳統(tǒng)方法相比，側(cè)重于對履歷數(shù)據(jù)中所蘊含的潛在模式信息進行智能挖掘，同時針對履歷模式信息進行深層次的可視分析，能夠得到履歷數(shù)據(jù)中的成長軌跡模式與成長類別模式，從而能夠?qū)σ恍┗谡Z義的履歷查找與分類、人事考核與任免推薦等履歷信息深層次分析任務(wù)提供支持。
[0024] 3.本發(fā)明與傳統(tǒng)方法相比，創(chuàng)新性地將履歷間的潛在關(guān)聯(lián)引入分析過程，通過挖掘與信息可視化技術(shù)能夠獲得履歷所代表的人員之間的潛在社交關(guān)系?；谠摑撛陉P(guān)系能夠構(gòu)建一個人員間的潛在社交網(wǎng)絡(luò)?；谠撋缃痪W(wǎng)絡(luò)能夠還原出人員間的組織層級關(guān)系，從而將大量履歷所體現(xiàn)出的模式特征以一個宏觀視角提供給用戶，從而獲得群體社交關(guān)系的深層次認(rèn)知。

【專利附圖】

【附圖說明】
[0025] 圖1是本發(fā)明組成模塊框圖。
[0026] 圖2系統(tǒng)架構(gòu)圖。
[0027] 圖3是履歷時間維度成長軌跡類別定義范例圖，其中：(a)圖為成長型軌跡圖，（b) 圖為穩(wěn)健型軌跡圖，（C)圖為波動型軌跡圖，（d)圖為衰退型軌跡圖。各圖中實線為個人成長軌跡，虛線為總體樣本的成長軌跡平均值。
[0028] 圖4是履歷空間維度成長軌跡類別定義范例圖，其中：(a)圖為"地方一中央"型軌跡圖，（b)圖為"地方一中央一地方"型軌跡圖，（C)圖為"中央一地方"型軌跡圖，（C)圖為 "中央一地方一地方一中央"型軌跡圖。
[0029] 圖5是個人成長軌跡分類結(jié)果示意圖。
[0030] 圖6是群體潛在關(guān)系挖掘結(jié)果展示示意圖，其中：(a)圖為成長軌跡相似性關(guān)系圖，（b)圖為經(jīng)歷交集關(guān)系圖。
[0031] 圖7是個人成長圖，其中：(a)圖為時間維度的成長軌跡圖，（b)圖為空間維度的成長軌跡圖。
[0032] 圖8是潛在關(guān)系圖。
[0033] 圖9是組織機構(gòu)圖。
[0034] 圖10是履歷軌跡的信息統(tǒng)計分析示意圖。
[0035] 圖11是履歷軌跡的時空關(guān)聯(lián)交互分析示意圖。其中（a)為時間軌跡圖，（b)為空間軌跡圖，且（a)中虛線框所示的經(jīng)歷段與（b)中的虛線箭頭所示的成長軌跡相對應(yīng)。
[0036] 圖12是履歷時空軌跡的模式可視分析示意圖。圖中展示了個人成長過程中所體現(xiàn)出來的"成長期"、"瓶頸期"和"突破期"等模式。以官員升遷為例，"成長期"代表生涯初期的快速升遷；"瓶頸期"代表生涯中期遇到了瓶頸，升遷較慢；"突破期"代表生涯末期突破瓶頸，繼續(xù)升遷。
[0037] 圖13是履歷社交網(wǎng)絡(luò)交互可視分析示意圖。其中（a)為時間軌跡圖，（b)為空間軌跡圖，（c)社交網(wǎng)絡(luò)圖。（a)中的虛線框與（b)中的虛線框在時空維度上相對應(yīng)，且其履歷交集的具體信息在（c)中顯示。

【具體實施方式】
[0038] 為了使本發(fā)明的目的、技術(shù)方案和發(fā)明優(yōu)勢更加清楚明白，以下對本發(fā)明的實施方式做具體介紹。
[0039] 名詞定義
[0040] 人員：履歷所代表的主體,例如企事業(yè)單位員工,政府部門干部,企業(yè)高管以及科研人員。
[0041] 用戶：系統(tǒng)使用者，通常為決策者，例如領(lǐng)導(dǎo)以及其他企事業(yè)單位管理層人員。
[0042] 履歷：政府部門的干部履歷、企事業(yè)單位的職員履歷、企業(yè)高管履歷、科研人員履歷、明星履歷等。
[0043] 本發(fā)明所涉及思想、算法以及系統(tǒng)為通用框架，均可以推廣到上述各類型的履歷數(shù)據(jù)分析任務(wù)中。這里為便于說明本
【發(fā)明內(nèi)容】
，以政府部門的"干部履歷"為例進行闡述。[0044] 本發(fā)明基于自然語言處理、數(shù)據(jù)挖掘、機器學(xué)習(xí)和信息可視化技術(shù)，構(gòu)建履歷信息可視分析環(huán)境，可以充分利用文本履歷數(shù)據(jù)中的信息，將履歷信息中對決策起重要作用的潛在知識提取出來，并將這些潛在知識以基于成長隱喻的直觀可視化方式進行展示，從而幫助用戶理解履歷所表達的潛在模式特征及履歷間的潛在關(guān)聯(lián)信息，從而為履歷模糊查找與智能分類、自動人事任免、職業(yè)生涯規(guī)劃以及人際關(guān)系把握等任務(wù)提供支持。
[0045] 如圖1所示，本發(fā)明包括：文本履歷預(yù)處理模塊、個人成長經(jīng)歷量化模塊、個人成長模式挖掘模塊、群體潛在社交關(guān)系挖掘模塊、組織機構(gòu)生成模塊、履歷信息可視化模塊以及履歷可視分析模塊。本發(fā)明的系統(tǒng)架構(gòu)圖如圖2所示。其中：
[0046] 1.文本履歷預(yù)處理模塊
[0047] 該模塊將非結(jié)構(gòu)化的履歷文本數(shù)據(jù)進行預(yù)處理，通過格式過濾、中文分詞以及命名實體識別等自然語言處理技術(shù)抽取履歷信息中的有效要素，得到結(jié)構(gòu)化的履歷要素XML 數(shù)據(jù)（ExtensibleMarkupLanguage,可擴展標(biāo)記語言）。
[0048]XML數(shù)據(jù)格式按照履歷數(shù)據(jù)的特征設(shè)計而成。XML數(shù)據(jù)為層級結(jié)構(gòu)，其結(jié)構(gòu)如下所 /Jn〇
[0049]

【權(quán)利要求】
1. 一種基于文本履歷信息的信息可視化方法，其步驟為： 1) 對每一文本履歷信息中的經(jīng)歷信息，進行經(jīng)歷等級量化計算，得到成長軌跡序列數(shù) 據(jù)，并將該數(shù)據(jù)進行可視化； 2) 選取多份文本履歷信息的成長軌跡序列數(shù)據(jù)進行關(guān)聯(lián)計算，得到文本履歷間的潛在社交關(guān)系，并將該潛在社交關(guān)系進行社交網(wǎng)絡(luò)可視化； 3) 基于履歷間的潛在社交關(guān)系，構(gòu)建人員所在單位的組織層級可視化表達，將具有單位交集的履歷轉(zhuǎn)化成相應(yīng)單位的組織層級關(guān)系，并將該組織層級關(guān)系進行組織機構(gòu)可視化。
2. 如權(quán)利要求1所述的方法，其特征在于如果履歷為非結(jié)構(gòu)化文本履歷，則首先將其轉(zhuǎn)換為結(jié)構(gòu)化的文本履歷信息，其方法為： 1) 對非結(jié)構(gòu)化文本履歷進行格式過濾，獲得包含履歷信息的純履歷文本； 2) 利用自然語言處理技術(shù)對純履歷文本進行分詞與命名實體識別，然后進行履歷特征要素抽取，處理得到包含履歷要素的結(jié)構(gòu)化文本塊； 3) 將包含履歷要素的結(jié)構(gòu)化文本塊進行格式轉(zhuǎn)化，形成結(jié)構(gòu)化的文本履歷信息。
3. 如權(quán)利要求2所述的方法，其特征在于所述結(jié)構(gòu)化的文本履歷信息包括：履歷基本信息和經(jīng)歷信息表；所述履歷基本信息包括姓名、性別、民族和出生地，所述經(jīng)歷信息表為一個表結(jié)構(gòu)，表頭包含開始時間、終止時間、地點、單位、職務(wù)字段。
4. 如權(quán)利要求3所述的方法，其特征在于對于單位履歷特征要素，采用關(guān)鍵字匹配算法進行履歷特征要素的抽?。菏紫葎?chuàng)建一單位關(guān)鍵詞詞典，所述單位關(guān)鍵詞詞典中每一行元素包括關(guān)鍵字和輔助關(guān)鍵字兩部分信息，其中，輔助關(guān)鍵字包括R型和L型兩種，多個輔助關(guān)鍵字用逗號相隔；然后利用單位關(guān)鍵詞詞典進行單位要素識別：當(dāng)識別到了詞典中的某一關(guān)鍵字，且其右側(cè)無 R型輔助關(guān)鍵字，同時左側(cè)無 L型輔助關(guān)鍵字時，則識別成功；反之，識別失敗；對于其他履歷特征要素，采取正則表達式匹配法進行履歷特征要素的抽取。
5. 如權(quán)利要求3所述的方法，其特征在于得到所述成長軌跡序列數(shù)據(jù)的方法為： 1) 對每一文本履歷信息的經(jīng)歷信息表按照開始時間字段進行升序排序，得到有序經(jīng)歷信息表； 2) 逐條掃描有序經(jīng)歷信息表中的記錄，從每一條記錄中提取出地點、單位與職務(wù)字段，并將各個字段值分別與已有的經(jīng)歷等級量化庫進行比對識別，對匹配的實體賦予設(shè)定的量化量級； 3) 將包含不同量級大小的經(jīng)歷段集合組成有序序列，得到所述成長軌跡序列數(shù)據(jù)。
6. 如權(quán)利要求1或5所述的方法，其特征在于所述成長軌跡序列數(shù)據(jù)為一六元組，即〈起始時間，終止時間，地點，單位，職務(wù)，量化等級〉。
7. 如權(quán)利要求1?5任一所述的方法，其特征在于得到所述潛在社交關(guān)系的方法為： 1) 選取η份履歷的成長軌跡序列數(shù)據(jù)，計算其中任意兩個履歷Mi與％之間的成長軌跡序列數(shù)據(jù)的相似性sim(i，j)，得到一相似性矩陣sim ; 2) 掃描矩陣sim，如果sim(i，j) > Stl，則認(rèn)為Mi與％的成長軌跡具有相似性，Stl為相似性閾值； 3) 計算該η份履歷的成長軌跡序列數(shù)據(jù)中任意兩履歷Mi與％之間的匹配度mch(i, j)，并將二者的經(jīng)歷交集細(xì)節(jié)記錄到一履歷要素交集its (i，j); 4)根據(jù)匹配度mch (i，j)，判斷Mi與Mj的成長經(jīng)歷之間是否具有交集，如果有，則根據(jù) 對應(yīng)的交集its (i，j)確定Mi與Mj之間的潛在關(guān)系，并且根據(jù)sim(i，j)確定Mi與Mj之間的密切程度。
8. 如權(quán)利要求7所述的方法，其特征在于計算該η份履歷的成長軌跡序列數(shù)據(jù)中任意兩履歷Mi與Mj之間的匹配度mch(i，j)，并將二者的經(jīng)歷交集細(xì)節(jié)記錄到一履歷要素交集 its (i，j)的方法為： 1) 設(shè)置兩個初始值為〇的計數(shù)器Ct和(；：Ct代表Mi與％之間進行要素比對的次數(shù)： (；代表M i與％要素比對時出現(xiàn)相同要素的次數(shù)；定義一個差異要素成分列表err (i，j)，其元素為Mi與％之間不相同的履歷要素；定義一個履歷要素交集列表its (i，j)，其元素為Mi 與％之間相同的履歷要素； 2) 逐項掃描Mi和％的各基本信息要素，每掃描一個要素，Ct加1 ;同時，針對任意要素 f，如果其值在Mi和％中相同，則(；加1，并將該要素 f添加至its (i，j);反之，則將該要素 f 添加至 err (i, j); 3) 逐行掃描Mi和Mj的經(jīng)歷信息表，針對每一行經(jīng)歷段，逐項掃描該經(jīng)歷段所包含的時間、地點、單位、職務(wù)字段，且每掃描一個字段，C t加1 ;同時，針對任意字段e，如果其值在Mi 和％中相同，則(；加1，并將該要素添加至its (i，j);反之，則將該要素添加至err (i，j); 4) 根據(jù)公式mch (i, j) = Cr/Ct計算Mi與Mj的匹配度mch (i, j)。
9. 如權(quán)利要求1?5任一所述的方法，其特征在于所述基于履歷間的潛在社交關(guān)系，構(gòu) 建人員所在單位的組織層級的組織機構(gòu)生成方法，該方法為： 1) 將所述潛在社交關(guān)系記錄為一矩陣R，矩陣元素 Rij代表履歷Mi和履歷Mj之間的潛在社受關(guān)系； 2) 建立一組織機構(gòu)庫V，用于保存所有的組織機構(gòu)及其成員信息；其中庫中元素為樹狀結(jié)構(gòu)，樹的根節(jié)點為組織名稱，葉節(jié)點為成員信息，其具體結(jié)構(gòu)為：〈組織名稱，〈成員1，職務(wù)1，是否現(xiàn)任〉，〈成員2,職務(wù)2,是否現(xiàn)任 >，…，〈成員m，職務(wù)m，是否現(xiàn)任>> ; 3) 遍歷矩陣R，如果&所代表的履歷Mi和履歷％存在單位交集，則將該單位以及履歷 Mi和履歷Mj保存至該組織機構(gòu)庫V ; 4) 將V中的所有元素按照所述樹狀結(jié)構(gòu)，采用組織機構(gòu)可視化方法進行可視化表達。
10. 如權(quán)利要求1或2所述的方法，其特征在于對每一成長軌跡序列數(shù)據(jù)進行時間維度以及空間維度的類型分析，得到對應(yīng)文本履歷的時空成長模式；其中，得到所述時空成長模式的方法為：首先定義履歷隨時間變遷的成長類型和履歷隨空間遷移的成長類型，并確定每一成長類型的特征；其中，隨時間變遷的成長類型特征包括：等級時間跨度特征和或時序成長斜率特征，根據(jù)履歷中的單位地理位置確定隨空間遷移的成長類型特征；選取一部分成長軌跡序列數(shù)據(jù)作為樣本數(shù)據(jù)，根據(jù)確定的成長類型特征標(biāo)記其成長類型；利用機器學(xué)習(xí)分類器對樣本數(shù)據(jù)進行分類訓(xùn)練，得到分類器模型參數(shù)，然后對未標(biāo)記成長軌跡序列數(shù)據(jù)進行分類標(biāo)記。
11. 一種基于文本履歷信息的智能可視分析系統(tǒng)，其特征在于包括個人成長經(jīng)歷量化模塊、群體潛在社交關(guān)系挖掘模塊、組織機構(gòu)生成模塊和履歷信息可視化模塊，其中：個人成長經(jīng)歷量化模塊，用于對履歷要素中的經(jīng)歷信息進行經(jīng)歷等級的量化計算，得到成長軌跡序列數(shù)據(jù)；群體潛在社交關(guān)系挖掘模塊，用于對多份履歷的成長軌跡序列數(shù)據(jù)進行關(guān)聯(lián)計算，得到履歷間的潛在社交關(guān)系；組織機構(gòu)生成模塊，用于以多份履歷所代表群體的潛在社交關(guān)系為基礎(chǔ)，從群體的單位交集信息中提取并還原出組織機構(gòu)的層級信息；履歷信息可視化模塊，用于將履歷的成長軌跡序列數(shù)據(jù)以及群體潛在社交關(guān)系挖掘模塊、組織機構(gòu)生成模塊所輸出的結(jié)果轉(zhuǎn)化成信息可視化圖。
12.如權(quán)利要求11所述的系統(tǒng)，其特征在于所述系統(tǒng)還包括文本履歷預(yù)處理模塊和個人成長模式挖掘模塊；其中，文本履歷預(yù)處理模塊，用于將非結(jié)構(gòu)化的文本履歷數(shù)據(jù)進行預(yù) 處理，抽取履歷信息中的要素，得到結(jié)構(gòu)化的履歷要素 XML數(shù)據(jù)；個人成長模式挖掘模塊，用于對成長軌跡序列數(shù)據(jù)進行時間維度以及空間維度的類型分析，得到履歷的時空成長模式。
【文檔編號】G06Q10/06GK104318340SQ201410496047
【公開日】2015年1月28日申請日期:2014年9月25日優(yōu)先權(quán)日:2014年9月25日
【發(fā)明者】王浩, 張晨, 徐帆江, 王微申請人:中國科學(xué)院軟件研究所

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：王浩;張晨;徐帆江;王微
技術(shù)所有人：中國科學(xué)院軟件研究所
我是此專利的發(fā)明人

上一篇：一種網(wǎng)站實現(xiàn)頁面靜態(tài)化的方法
上一篇：一種異常信息的處理方法及裝置制造方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進行咨詢。
1、李老師：1.計算力學(xué) 2.無損檢測
2、畢老師：機構(gòu)動力學(xué)與控制
3、袁老師：1.計算機視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計算機網(wǎng)絡(luò)安全 2.計算機仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

基于文本履歷信息的信息可視化方法及智能可視分析系統(tǒng)的制作方法