本發(fā)明涉及糖尿病預測,具體是一種基于k-means聚類分析的糖尿病并發(fā)癥預測方法。
背景技術(shù):
1、k-means聚類分析是一種廣泛使用的無監(jiān)督學習算法,k-means聚類分析在計算的過程中用于將數(shù)據(jù)點劃分為k個不同的簇或組,通過迭代優(yōu)化誤差平方和的目標函數(shù)將數(shù)據(jù)點分配給最近的聚類中心,并重新計算聚類中心的位置,直到聚類中心不再變化或變化很小為止,便于進一步分析和理解數(shù)據(jù)集的結(jié)構(gòu)和模式。k-means聚類分析的優(yōu)點包括簡單易實現(xiàn)、處理速度快,適用于處理大規(guī)模數(shù)據(jù)集。
2、如公開號為cn107403072a的專利公開了一種基于機器學習的2型糖尿病預測預警方法,該專利具體公開了“一種基于機器學習的2型糖尿病預測預警方法,通過k-means算法和logistic?regression算法建立先聚類再分類的糖尿病雙層預測分析模型,對非糖尿病的分類結(jié)果通過c4.5算法和k-means算法分析出的規(guī)則進行預警分級,對糖尿病數(shù)據(jù)集通過日常數(shù)據(jù)收集管理后并進行更新維護以優(yōu)化原始糖尿病雙層預測分析模型。本方法包括數(shù)據(jù)收集模塊、數(shù)據(jù)預處理模塊、預測分析模塊、預警分級模塊和日常管理模塊等五大模塊?!钡募夹g(shù)方案,實現(xiàn)了“本方法包括數(shù)據(jù)收集模塊、數(shù)據(jù)預處理模塊、預測分析模塊、預警分級模塊和日常管理模塊等五大模塊。主要應用在糖尿病早期預測分析、高危人群預警分級以及糖尿病日常健康管理等三大方面。本方法在實際應用中具有更高的預測準確性,更加專注每個實例的健康參數(shù),同時針對非糖尿病實例進行預警分級,能起到更好的防范作用,做到疾病的提早預防”的技術(shù)效果。
3、但是方法在使用的過程中存在著預警分級效果單一的問題,不能利用足夠的數(shù)據(jù)集進行更具說服性的技術(shù)目的。
4、公開號為cn103729798b的專利公開了基于改進的k-means聚類的煤礦安全評價系統(tǒng),該專利具體公開了“一種改進的k-means聚類的煤礦安全評價系統(tǒng),包括礦井安全數(shù)據(jù)輸入模塊、基于改進的k-means聚類的數(shù)據(jù)分析模塊、結(jié)果輸出模塊;礦井安全數(shù)據(jù)輸入模塊接收用戶提交的礦井安全狀態(tài)數(shù)據(jù),基于改進的k-means聚類的數(shù)據(jù)分析模塊根據(jù)礦井安全狀態(tài)數(shù)據(jù),采用改進的k-means聚類方法進行數(shù)據(jù)分析,結(jié)果輸出模塊顯示數(shù)據(jù)分析的結(jié)果,為煤礦企業(yè)的安全管理決策提供輔助依據(jù)”的技術(shù)方案,實現(xiàn)了“采用本發(fā)明的煤礦安全評價系統(tǒng)后,可以對煤炭企業(yè)所屬礦井安全評價的打分結(jié)果進行分析,實現(xiàn)煤礦安全評價的全面管理,其評價結(jié)果可為煤礦企業(yè)的管理決策提供重要的技術(shù)依據(jù)”的技術(shù)效果。
5、同樣的,該方法中雖然對k-means的模型進行了細化改進,但仍不能滿足糖尿病應用領(lǐng)域中的糖尿病預測目的,存在改善的余地。
技術(shù)實現(xiàn)思路
1、本發(fā)明的目的在于提供一種基于k-means聚類分析的糖尿病并發(fā)癥預測方法,通過利用k?-means聚類分析算法對患者的身體內(nèi)的數(shù)據(jù)(如血糖、尿酸、th等)進行分析,得出收斂值并預測出對用數(shù)據(jù)變化后利用圖譜反應各個對應糖尿病亞并發(fā)癥的具體預測結(jié)果,并解決上述背景技術(shù)中提出的問題。
2、為實現(xiàn)上述目的,本發(fā)明提供如下技術(shù)方案:一種基于k-means聚類分析的糖尿病并發(fā)癥預測系統(tǒng),包括特征選擇模塊,所述特征選擇模塊包括收集單元和清濾單元,所述特征選擇模塊通過收集單元收集患者數(shù)據(jù),所述特征選擇模塊通過清濾單元清洗并過濾出符合k-means聚類分析的數(shù)據(jù);閾值計算模塊,所述閾值計算模塊基于k-means聚類分析的特征數(shù)據(jù)并融合大津閾值加權(quán)計算出聚類結(jié)果;以及卷積預測模塊,所述卷積預測模塊基于神經(jīng)網(wǎng)絡(luò)算法將聚類結(jié)果和特征數(shù)據(jù)進行學習,自動識別并勾畫出糖尿病特征數(shù)據(jù)。
3、一種基于k-means聚類分析的糖尿病并發(fā)癥預測方法,包括
4、步驟s1:所述特征選擇模塊收集并過濾出符合k-means聚類分析的數(shù)據(jù);
5、步驟s2:所述閾值計算模塊集合k-means聚類分析的特征數(shù)據(jù)和rnn卷積算法、加權(quán)計算出k-means聚類分析的內(nèi)聚類結(jié)果;
6、步驟s3:rnn卷積算法再介入并晚上內(nèi)聚類結(jié)果計算,勾畫出供醫(yī)生診斷的糖尿病預測模型。
7、作為本發(fā)明再進一步的方案:所述收集單元包括區(qū)塊鏈以及云平臺,所述區(qū)塊鏈儲存有患者生理指標的唯一哈希值,所述云平臺供區(qū)塊鏈讀寫、修改以及儲存。
8、作為本發(fā)明再進一步的方案:所述清洗單元包括smartbi和etl工具,所述smartbi和etl工具聯(lián)動生成支持k-means聚類分析數(shù)據(jù)的可視化流程配置,所述可視化流程配置通過內(nèi)置排序、去重、映射、行列合并、行列轉(zhuǎn)換聚合、去空值等數(shù)據(jù)預處理功能對k-means聚類分析數(shù)據(jù)進行清濾處理。
9、作為本發(fā)明再進一步的方案:所述k-means聚類分析內(nèi)設(shè)有供患者群集分類的區(qū)別單元以及供數(shù)據(jù)分析的聚類單元,所述大津閾值包括數(shù)據(jù)化的自適應閾值選值單元,所述聚類單元和自適應閾值選值單元加權(quán)融合出聚類結(jié)果。
10、作為本發(fā)明再進一步的方案:所述聚類單元內(nèi)設(shè)有若干個聚類中心,所述自適應閾值選值單元內(nèi)設(shè)有若干個二維加權(quán)點,所述二維加權(quán)點與聚類中心進行對應計算并迭代更新出內(nèi)聚類單元,所述內(nèi)聚類單元供卷積預測模塊分配計算。
11、作為本發(fā)明再進一步的方案:所述卷積預測模塊包括復合rnn算法單元,所述復合rnn算法單元包括rnn算法和內(nèi)聚類單元,所述復合rnn算法單元通過內(nèi)聚類單元內(nèi)部的數(shù)據(jù)點之間的關(guān)系和特征分布學習并預測出糖尿病特征數(shù)據(jù)。
12、作為本發(fā)明再進一步的方案:所述復合rnn算法單元包括卷積池化層和融合層,所述復合rnn算法單元通過卷積池化層獲取內(nèi)聚類單元的提取特征,所述復合rnn算法單元通過融合層學習到內(nèi)聚類單元的多層抽象表示、并捕捉到內(nèi)聚類單元的模式和特征數(shù)據(jù)。
13、作為本發(fā)明再進一步的方案:所述復合rnn算法單元還包括有預測層、訓練層和評估層,所述復合rnn算法單元通過預測層供內(nèi)聚類單元的分類、回歸和空間映射,所述復合rnn算法單元通過訓練層供內(nèi)聚類單元的模型生成、模型訓練和模型優(yōu)化,所述復合rnn算法單元通過評估層供內(nèi)聚類單元的模型評估。
14、作為本發(fā)明再進一步的方案:所述模型評估包括驗證單元,所述模型評估通過驗證單元對復合rnn算法單元進行循環(huán)模擬和驗證。
15、與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果是:
16、1.本技術(shù)對k-means的模型進行了細化改進,結(jié)合當前的醫(yī)療數(shù)據(jù)細化操作過程并具體通過特征選擇模塊收集并過濾出符合k-means聚類分析的數(shù)據(jù),通過閾值計算模塊集合k-means聚類分析的特征數(shù)據(jù)和rnn卷積算法和加權(quán)計算出k-means聚類分析的內(nèi)聚類結(jié)果,最后rnn卷積算法再介入并完成內(nèi)聚類結(jié)果計算,實現(xiàn)并勾畫出供醫(yī)生診斷的糖尿病預測模型,預測方法先進。
17、2.本技術(shù)通過smartbi和etl工具篩選并分類數(shù)值,然后通過大津閾值進行數(shù)值的剔換,從而實現(xiàn)輸出聚類結(jié)果參數(shù)的分析和勾畫,實現(xiàn)對聚類結(jié)果的進一步分類。