本發(fā)明涉及數(shù)據(jù)分析,具體為基于多源數(shù)據(jù)采集分析的健康管理系統(tǒng)及方法。
背景技術(shù):
1、隨著信息技術(shù)的飛速發(fā)展,健康管理已成為現(xiàn)代社會關(guān)注的焦點(diǎn)。傳統(tǒng)的健康管理方式往往依賴于單一的醫(yī)療檢測手段,如體檢報(bào)告、問診記錄等,這些數(shù)據(jù)來源單一,難以全面反映個(gè)體的健康狀況及其動(dòng)態(tài)變化。隨著物聯(lián)網(wǎng),大數(shù)據(jù)、云計(jì)算等技術(shù)的興起,多源數(shù)據(jù)采集與分析在健康管理領(lǐng)域展現(xiàn)出巨大的潛力,能夠更精準(zhǔn)、更全面地評估個(gè)體的健康狀態(tài),并提供個(gè)性化的健康管理方案。
2、然而現(xiàn)有的健康管理系統(tǒng)在數(shù)據(jù)分析方面大多采用簡單的統(tǒng)計(jì)分析方法,難以深入挖掘數(shù)據(jù)背后的關(guān)聯(lián)性和趨勢性。同時(shí),由于不同來源的數(shù)據(jù)格式和質(zhì)量存在差異,現(xiàn)有的健康管理系統(tǒng)難以適應(yīng)多源數(shù)據(jù)的復(fù)雜性和多樣性,從而導(dǎo)致分析結(jié)果不夠準(zhǔn)確。另外,現(xiàn)有的集健康管理系統(tǒng)對應(yīng)的健康建議較為籠統(tǒng),缺乏針對性和個(gè)性化,往往只根據(jù)單一或有限的健康檢測指標(biāo)給出建議,忽略了個(gè)體差異和多元化需求,從而導(dǎo)致健康管理效果不佳。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明的目的在于提供基于多源數(shù)據(jù)采集分析的健康管理系統(tǒng)及方法,以解決上述背景技術(shù)中提出的問題。
2、為了解決上述技術(shù)問題,本發(fā)明提供如下技術(shù)方案:
3、基于多源數(shù)據(jù)采集分析的健康管理方法,方法包括以下步驟:
4、步驟s100.從數(shù)據(jù)庫中獲取所有預(yù)設(shè)用戶的多源歷史數(shù)據(jù),針對每個(gè)預(yù)設(shè)用戶的多源歷史數(shù)據(jù)進(jìn)行相應(yīng)的篩選合并,從而構(gòu)建預(yù)設(shè)用戶特征數(shù)據(jù)集;根據(jù)預(yù)設(shè)用戶特征數(shù)據(jù)集對預(yù)設(shè)用戶進(jìn)行分類,并針對每個(gè)類別的預(yù)設(shè)用戶創(chuàng)建相應(yīng)的預(yù)設(shè)用戶畫像;
5、步驟s200.針對每個(gè)類別的預(yù)設(shè)用戶,基于預(yù)設(shè)用戶特征數(shù)據(jù)集和預(yù)設(shè)用戶畫像,構(gòu)建預(yù)設(shè)用戶知識圖譜;結(jié)合預(yù)設(shè)用戶知識圖譜和預(yù)設(shè)用戶特征數(shù)據(jù)集進(jìn)行分析,并根據(jù)分析結(jié)果識別對應(yīng)類別的預(yù)設(shè)用戶的關(guān)鍵特征;
6、步驟s300.獲取數(shù)據(jù)庫中對于不同類別的預(yù)設(shè)用戶提供的預(yù)設(shè)健康管理方案,將每個(gè)類別的預(yù)設(shè)健康管理方案與對應(yīng)的預(yù)設(shè)用戶的關(guān)鍵特征進(jìn)行分析,從而得到預(yù)設(shè)健康管理方案與對應(yīng)預(yù)設(shè)用戶的關(guān)鍵特征之間的對應(yīng)關(guān)系;
7、步驟s400.實(shí)時(shí)用戶輸入初始數(shù)據(jù),根據(jù)初始數(shù)據(jù)構(gòu)建實(shí)時(shí)用戶畫像,將實(shí)時(shí)用戶畫像與預(yù)設(shè)用戶畫像進(jìn)行匹配,并根據(jù)匹配的結(jié)果輸出對應(yīng)的預(yù)設(shè)健康管理方案列表;獲取實(shí)時(shí)用戶的多源實(shí)時(shí)數(shù)據(jù),提取多源實(shí)時(shí)數(shù)據(jù)識別實(shí)時(shí)用戶的實(shí)時(shí)特征數(shù)據(jù),與預(yù)設(shè)用戶的關(guān)鍵特征進(jìn)行分析,從而生成個(gè)性化健康管理方案。
8、進(jìn)一步的,步驟s100包括:
9、s101.從數(shù)據(jù)庫中獲取所有預(yù)設(shè)用戶的多源歷史數(shù)據(jù),所述預(yù)設(shè)用戶是指數(shù)據(jù)庫中保存的用戶群體;所述多源歷史數(shù)據(jù)是指從多個(gè)不同的數(shù)據(jù)源中收集到的用戶健康相關(guān)信息;將預(yù)設(shè)用戶的多源歷史數(shù)據(jù)統(tǒng)一轉(zhuǎn)換為相同格式,并通過預(yù)設(shè)用戶id匯總多源歷史數(shù)據(jù),并對于每個(gè)預(yù)設(shè)用戶的多源歷史數(shù)據(jù)中提取相應(yīng)的特征數(shù)據(jù),并對提取到的特征數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,且具體的標(biāo)準(zhǔn)化處理計(jì)算公式為:
10、fi,j=(xi,j-μj)/σj,
11、其中,fi,j表示預(yù)設(shè)用戶i的第j個(gè)標(biāo)準(zhǔn)化特征數(shù)據(jù),xi,j表示預(yù)設(shè)用戶i的第j個(gè)原始特征數(shù)據(jù),μj和σj分別表示第j個(gè)特征數(shù)據(jù)的均值和標(biāo)準(zhǔn)差;
12、s102.針對每個(gè)預(yù)設(shè)用戶經(jīng)過標(biāo)準(zhǔn)化處理的特征數(shù)據(jù),進(jìn)行相關(guān)性分析,從而得到經(jīng)過標(biāo)準(zhǔn)化處理的特征數(shù)據(jù)之間的線性關(guān)系,并將衡量線性關(guān)系的值定義為相關(guān)系數(shù)r;通常使用皮爾遜相關(guān)系數(shù)來衡量兩個(gè)特征之間的線性關(guān)系,針對相關(guān)系數(shù)r的絕對值等于閾值r0的特征數(shù)據(jù)使用線性回歸模型來建立對應(yīng)的線性關(guān)系,且線性回歸模型表示為:fi,k=β0+β1fi,j+?,其中β0表示截距,β1表示特征fi,j的系數(shù),?表示誤差項(xiàng);使用最小二乘法計(jì)算回歸系數(shù)β0和β1,利用線性回歸模型對特征fi,k進(jìn)行更新,且f’i,k=β0+β1fi,j;遍歷預(yù)設(shè)用戶所有經(jīng)過標(biāo)準(zhǔn)化處理的特征數(shù)據(jù),從而構(gòu)建預(yù)設(shè)用戶特征數(shù)據(jù)集,且預(yù)設(shè)用戶特征數(shù)據(jù)集中的一個(gè)元素對應(yīng)一個(gè)預(yù)設(shè)用戶,預(yù)設(shè)用戶特征數(shù)據(jù)集中的元素?cái)?shù)量等于數(shù)據(jù)庫中預(yù)設(shè)用戶的數(shù)量;
13、s103.根據(jù)預(yù)設(shè)用戶特征數(shù)據(jù)集對預(yù)設(shè)用戶進(jìn)行聚類分析,將預(yù)設(shè)用戶劃分成k個(gè)類別,并對每個(gè)類別的預(yù)設(shè)用戶創(chuàng)建相應(yīng)的預(yù)設(shè)用戶畫像,且創(chuàng)建預(yù)設(shè)用戶畫像的過程如下:
14、對于每個(gè)類別的預(yù)設(shè)用戶,從預(yù)設(shè)用戶特征數(shù)據(jù)集中提取對應(yīng)的特征向量v,根據(jù)特征向量v計(jì)算類別內(nèi)每個(gè)特征的均值和標(biāo)準(zhǔn)差,并基于標(biāo)準(zhǔn)差進(jìn)行歸一化,從而得到特征的權(quán)重w;根據(jù)聚類類別的均值和權(quán)重,構(gòu)建每個(gè)類別的預(yù)設(shè)用戶畫像u,且預(yù)設(shè)用戶畫像u表示為加權(quán)特征向量。
15、進(jìn)一步的,根據(jù)預(yù)設(shè)用戶特征數(shù)據(jù)集對預(yù)設(shè)用戶進(jìn)行聚類分析,具體聚類分析過程如下:
16、根據(jù)預(yù)設(shè)用戶特征數(shù)據(jù)集,獲取預(yù)設(shè)用戶的特征數(shù)據(jù),使用歐式距離作為初始的距離度量,對所有預(yù)設(shè)用戶進(jìn)行兩兩之間的距離度量計(jì)算,且距離度量d(a,b)={σk∈[1,n],(fa,k-fb,k)^2}^(1/2),其中fa,k和fb,k分別表示預(yù)設(shè)用戶a和b在第k個(gè)特征上的標(biāo)準(zhǔn)化后的值,n表示特征的總數(shù);應(yīng)用層次聚類作為初始聚類,從每個(gè)預(yù)設(shè)用戶開始,將其視為單獨(dú)的簇,并逐步合并距離度量d(a,b)大于等于閾值d的簇;基于層次聚類的結(jié)果,選擇一個(gè)初始聚類的簇?cái)?shù)量k0,并從層次聚類的最終簇中選擇k0個(gè)簇作為k-means的初始中心點(diǎn);執(zhí)行k-means聚類算法,在每次迭代后,通過以下方式評估簇的質(zhì)量并動(dòng)態(tài)調(diào)整k值,具體分析過程為:
17、計(jì)算簇類方差總和wcss,且wcss具體計(jì)算公式為:
18、wcss=σm∈[1,m],σp∈cm,σk∈[1,n],[f(p,k)-μm,k]^2,
19、其中m表示簇的數(shù)量,cm表示第m個(gè)簇,f(p,k)表示第p個(gè)樣本在第k個(gè)特征上的值,μm,k表示第m個(gè)簇在第k個(gè)特征上的均值;若在連續(xù)c次迭代中,wcss的減小量小于閾值t,則停止迭代;否則繼續(xù)迭代并調(diào)整k值;基于最終確定的k,重新運(yùn)行k-means聚類算法將預(yù)設(shè)用戶劃分成k個(gè)類別。
20、進(jìn)一步的,步驟s200包括:
21、s201.針對每個(gè)類別的預(yù)設(shè)用戶,基于預(yù)設(shè)用戶特征數(shù)據(jù)集和預(yù)設(shè)用戶畫像,提取預(yù)設(shè)用戶特征數(shù)據(jù)作為實(shí)體,結(jié)合預(yù)設(shè)用戶畫像提取預(yù)設(shè)用戶特征數(shù)據(jù)之間的關(guān)系,將實(shí)體作為知識圖譜的節(jié)點(diǎn),對于實(shí)體之間的關(guān)系作為知識圖譜的邊,并結(jié)合s103中的聚類類別的均值和權(quán)重,對每個(gè)類別構(gòu)建預(yù)設(shè)用戶知識圖譜;
22、s202.獲取每個(gè)類別的預(yù)設(shè)用戶知識圖譜,任意定義一個(gè)節(jié)點(diǎn)為初始節(jié)點(diǎn),從初始節(jié)點(diǎn)出發(fā),遍歷預(yù)設(shè)用戶知識圖譜,收集所有可達(dá)節(jié)點(diǎn)j和路徑p,從而得到相應(yīng)的路徑集合pa;針對路徑集合中的每條路徑,計(jì)算相應(yīng)的路徑權(quán)重w(path),且w(path)的值等于路徑中每個(gè)特征的權(quán)重乘積;基于路徑權(quán)重w(path),定義關(guān)鍵性指標(biāo)g(j_h),且g(j_h)=σp∈pa,[w(path)/|p|]·i(j_h∈p),其中|p|表示路徑長度,i表示指示函數(shù),當(dāng)節(jié)點(diǎn)j_h在路徑p中,則i(j_h∈p)=1,否則i(j_h∈p)=0,h表示節(jié)點(diǎn)編號;判斷關(guān)鍵性指標(biāo)g(j_h)與相應(yīng)的閾值g0之間的大小關(guān)系,當(dāng)g(j_h)>g0則將對應(yīng)的節(jié)點(diǎn)j_h定義為關(guān)鍵節(jié)點(diǎn),且節(jié)點(diǎn)j_h對應(yīng)的特征為關(guān)鍵特征。
23、進(jìn)一步的,步驟s300包括:
24、從數(shù)據(jù)庫中提取不同類別的預(yù)設(shè)用戶對應(yīng)的健康管理方案,針對每個(gè)類別的預(yù)設(shè)用戶,將對應(yīng)的健康管理方案進(jìn)行對應(yīng);根據(jù)預(yù)設(shè)用戶對應(yīng)的關(guān)鍵特征,對每個(gè)預(yù)設(shè)用戶構(gòu)建關(guān)鍵特征集tu,且u表示預(yù)設(shè)用戶編號;依次對預(yù)設(shè)用戶的關(guān)鍵特征集tu求對稱差,將對應(yīng)預(yù)設(shè)用戶的健康管理方案進(jìn)行比較,將對稱差結(jié)果與比較結(jié)果進(jìn)行關(guān)聯(lián),從而得到預(yù)設(shè)健康管理方案與對應(yīng)的預(yù)設(shè)用戶的關(guān)鍵特征之間的對應(yīng)關(guān)系。
25、進(jìn)一步的,步驟s400包括:
26、s401.實(shí)時(shí)用戶輸入初始數(shù)據(jù),對初始數(shù)據(jù)進(jìn)行多源歷史數(shù)據(jù)相同的分析過程,從而根據(jù)初始數(shù)據(jù)構(gòu)建實(shí)時(shí)用戶畫像u1;將實(shí)時(shí)用戶畫像u1與預(yù)設(shè)用戶畫像u進(jìn)行相似度計(jì)算,并根據(jù)相似度計(jì)算結(jié)果匹配相應(yīng)的預(yù)設(shè)用用戶類別,將相似度最大的作為匹配結(jié)果,根據(jù)匹配結(jié)果輸出對應(yīng)預(yù)設(shè)用戶類別的預(yù)設(shè)健康管理方案列表;
27、s402.根據(jù)預(yù)設(shè)健康管理方案列表,實(shí)時(shí)用戶選擇一個(gè)預(yù)設(shè)健康管理方案,并實(shí)施預(yù)設(shè)健康方案,間隔選定時(shí)間段獲取實(shí)時(shí)用戶的多源實(shí)時(shí)數(shù)據(jù),基于多源實(shí)時(shí)數(shù)據(jù)提取相應(yīng)的實(shí)時(shí)特征數(shù)據(jù),將實(shí)時(shí)特征數(shù)據(jù)與預(yù)設(shè)健康管理方案列表對應(yīng)的關(guān)鍵特征進(jìn)行比對,若實(shí)時(shí)特征數(shù)據(jù)與除實(shí)時(shí)用戶當(dāng)前實(shí)施的預(yù)設(shè)健康管理方案以外的預(yù)設(shè)健康管理方案列表中,其他預(yù)設(shè)健康管理方案的關(guān)鍵特征相同,根據(jù)其他預(yù)設(shè)健康管理方案與預(yù)設(shè)用戶的關(guān)鍵特征之間的對應(yīng)關(guān)系,根據(jù)其他預(yù)設(shè)健康管理方案對當(dāng)前實(shí)施預(yù)設(shè)健康方案進(jìn)行相應(yīng)調(diào)整,從而生成個(gè)性化健康管理方案。
28、基于多源數(shù)據(jù)采集分析的健康管理系統(tǒng),系統(tǒng)包括:數(shù)據(jù)采集與處理模塊、用戶分類與畫像構(gòu)建模塊、知識圖譜構(gòu)建模塊、健康管理方案匹配模塊以及個(gè)性化健康管理模塊;
29、數(shù)據(jù)采集與處理模塊從多個(gè)數(shù)據(jù)庫中獲取預(yù)設(shè)用戶的多源歷史數(shù)據(jù),對不同格式和結(jié)構(gòu)的多源歷史數(shù)據(jù)進(jìn)行統(tǒng)一轉(zhuǎn)換,提取和標(biāo)準(zhǔn)化預(yù)設(shè)用戶的特征數(shù)據(jù),從而構(gòu)成預(yù)設(shè)用戶特征數(shù)據(jù)集;
30、用戶分類與畫像構(gòu)建模塊對預(yù)設(shè)用戶特征數(shù)據(jù)集中的特征數(shù)據(jù)進(jìn)行相關(guān)性分析,計(jì)算特征之間的線性關(guān)系,使用線性回歸模型建立特征之間的關(guān)系,通過聚類分析將用戶劃分為不同類別,并為每個(gè)類別創(chuàng)建相應(yīng)的預(yù)設(shè)用戶畫像;
31、知識圖譜構(gòu)建模塊基于預(yù)設(shè)用戶特征數(shù)據(jù)集和預(yù)設(shè)用戶畫像,定義節(jié)點(diǎn)和邊,建立實(shí)體之間的關(guān)系,構(gòu)建預(yù)設(shè)用戶知識圖譜,通過遍歷知識圖譜,識別關(guān)鍵節(jié)點(diǎn)和關(guān)鍵特征,從而為每個(gè)預(yù)設(shè)用戶建立關(guān)鍵特征集;
32、健康管理方案匹配模塊利用實(shí)時(shí)用戶輸入初始數(shù)據(jù)并構(gòu)建實(shí)時(shí)用戶畫像,與預(yù)設(shè)用戶畫像進(jìn)行匹配,從而得到實(shí)時(shí)用戶對應(yīng)的類別,根據(jù)匹配結(jié)果輸出對應(yīng)預(yù)設(shè)用戶類別的預(yù)設(shè)健康管理方案列表;
33、個(gè)性化健康管理模塊根據(jù)實(shí)時(shí)用戶選擇的預(yù)設(shè)健康管理方案,并獲取實(shí)時(shí)用戶的多源實(shí)時(shí)數(shù)據(jù),基于多源實(shí)時(shí)數(shù)據(jù)提取相應(yīng)的實(shí)時(shí)特征數(shù)據(jù),將實(shí)時(shí)特征數(shù)據(jù)與預(yù)設(shè)健康管理方案列表對應(yīng)的關(guān)鍵特征進(jìn)行比對,若實(shí)時(shí)特征數(shù)據(jù)與除實(shí)時(shí)用戶當(dāng)前實(shí)施的預(yù)設(shè)健康管理方案以外的預(yù)設(shè)健康管理方案列表中,其他預(yù)設(shè)健康管理方案的關(guān)鍵特征相同,根據(jù)其他預(yù)設(shè)健康管理方案與預(yù)設(shè)用戶的關(guān)鍵特征之間的對應(yīng)關(guān)系,根據(jù)其他預(yù)設(shè)健康管理方案對當(dāng)前實(shí)施預(yù)設(shè)健康方案進(jìn)行相應(yīng)調(diào)整,從而生成個(gè)性化健康管理方案。
34、進(jìn)一步的,數(shù)據(jù)采集與處理模塊包括數(shù)據(jù)采集單元與數(shù)據(jù)處理單元;
35、數(shù)據(jù)采集單元從數(shù)據(jù)庫中采集預(yù)設(shè)用戶的歷史多源數(shù)據(jù);數(shù)據(jù)處理單元對不同格式和結(jié)構(gòu)的多源歷史數(shù)據(jù)進(jìn)行統(tǒng)一轉(zhuǎn)換,提取和標(biāo)準(zhǔn)化預(yù)設(shè)用戶的特征數(shù)據(jù),從而構(gòu)成預(yù)設(shè)用戶特征數(shù)據(jù)集;
36、用戶分類與畫像構(gòu)建模塊包括用戶分類單元和用戶畫像創(chuàng)建單元;
37、用戶分類對預(yù)設(shè)用戶特征數(shù)據(jù)集中的預(yù)設(shè)用戶特征進(jìn)行聚類分析,將預(yù)設(shè)用戶劃分成若干個(gè)類別;用戶畫像創(chuàng)建單元針對每個(gè)類別的預(yù)設(shè)用戶,基于預(yù)設(shè)用戶特征數(shù)據(jù)集創(chuàng)建加權(quán)特征向量,從而創(chuàng)建預(yù)設(shè)用戶畫像。
38、進(jìn)一步的,知識圖譜構(gòu)建模塊包括知識圖譜構(gòu)建單元和關(guān)鍵特征識別單元;
39、知識圖譜構(gòu)建單元基于預(yù)設(shè)用戶特征數(shù)據(jù)集和預(yù)設(shè)用戶畫像,構(gòu)建每個(gè)類別的預(yù)設(shè)用戶知識圖譜;關(guān)鍵特征識別單元在知識圖譜上進(jìn)行關(guān)聯(lián)分析,識別出每個(gè)類別預(yù)設(shè)用戶的關(guān)鍵特征,為每個(gè)預(yù)設(shè)用戶建立關(guān)鍵特征集。
40、個(gè)性化健康管理模塊包括實(shí)時(shí)數(shù)據(jù)采集單元、相似度計(jì)算單元以及方案調(diào)整單元;
41、實(shí)時(shí)數(shù)據(jù)采集單元實(shí)時(shí)獲取用戶輸入的數(shù)據(jù),進(jìn)行相應(yīng)的分析以構(gòu)建實(shí)時(shí)用戶畫像;相似度計(jì)算單元計(jì)算實(shí)時(shí)用戶畫像與預(yù)設(shè)用戶畫像間的相似度,確定實(shí)時(shí)用戶對應(yīng)的預(yù)設(shè)用戶類別;方案調(diào)整單元將實(shí)時(shí)特征數(shù)據(jù)與預(yù)設(shè)健康管理方案列表對應(yīng)的關(guān)鍵特征進(jìn)行比對,若實(shí)時(shí)特征數(shù)據(jù)與除實(shí)時(shí)用戶當(dāng)前實(shí)施的預(yù)設(shè)健康管理方案以外的預(yù)設(shè)健康管理方案列表中,其他預(yù)設(shè)健康管理方案的關(guān)鍵特征相同,根據(jù)其他預(yù)設(shè)健康管理方案與預(yù)設(shè)用戶的關(guān)鍵特征之間的對應(yīng)關(guān)系,根據(jù)其他預(yù)設(shè)健康管理方案對當(dāng)前實(shí)施預(yù)設(shè)健康方案進(jìn)行相應(yīng)調(diào)整,從而生成個(gè)性化健康管理方案。
42、與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果是:通過對多源歷史數(shù)據(jù)的標(biāo)準(zhǔn)化處理與相關(guān)性分析,能夠揭示預(yù)設(shè)用戶的健康數(shù)據(jù)之間的復(fù)雜關(guān)系,從而提高分析的準(zhǔn)確性和可靠性;利用聚類分析和特征提取技術(shù),可以為每位預(yù)設(shè)用戶構(gòu)建詳細(xì)的用戶畫像,反映其獨(dú)特的健康狀況和需求,這種個(gè)性化的畫像有助于制定更為切合實(shí)際的健康管理方案;通過構(gòu)建預(yù)設(shè)用戶知識圖譜,可以有效整合預(yù)設(shè)用戶特征數(shù)據(jù)與健康管理方案之間的關(guān)系,幫助識別關(guān)鍵特征,從而為健康管理提供科學(xué)依據(jù);實(shí)時(shí)用戶數(shù)據(jù)的輸入和分析,使得健康管理方案可以根據(jù)用戶的實(shí)際情況進(jìn)行及時(shí)調(diào)整,確保方案的有效性與適應(yīng)性;系統(tǒng)能夠處理來自不同數(shù)據(jù)源的信息,解決了數(shù)據(jù)格式和質(zhì)量差異的問題,提升了系統(tǒng)對多源數(shù)據(jù)復(fù)雜性和多樣性的適應(yīng)能力;基于個(gè)性化的健康管理方案,能夠更好地滿足用戶的多元化需求,提升健康管理的整體效果和滿意度。