国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      心腦血管患者相似性分析方法及系統(tǒng)與流程

      文檔序號(hào):12467352閱讀:685來(lái)源:國(guó)知局
      心腦血管患者相似性分析方法及系統(tǒng)與流程

      本發(fā)明涉及一種智慧醫(yī)療領(lǐng)域,具體地,涉及一種心腦血管患者相似性分析方法及系統(tǒng)。



      背景技術(shù):

      隨著社會(huì)的發(fā)展,心腦血管疾病的發(fā)病率逐年上升。在我國(guó),心腦血管疾病已成為當(dāng)今嚴(yán)重危害中老年人生命與健康的主要公共衛(wèi)生問(wèn)題,其發(fā)病率、病死率、致殘率較高。根據(jù)統(tǒng)計(jì),中國(guó)每年發(fā)生腦中風(fēng)病人達(dá)200萬(wàn),致殘率高達(dá)75%,約3/4的患者有不同程度勞動(dòng)喪失,生活需要照顧,給患者、家庭、社會(huì)帶來(lái)沉重的負(fù)擔(dān)。

      隨著康復(fù)醫(yī)學(xué)在我國(guó)得到迅速發(fā)展,心腦血管患者的病死率顯著降低,但致殘率仍非常高。今后臨床治療模式將越來(lái)越呈現(xiàn)個(gè)性化、精確化,精準(zhǔn)康復(fù)將是今后康復(fù)醫(yī)學(xué)發(fā)展方向。目前的康復(fù)治療沒(méi)有從臨床的角度根據(jù)病因、生理體征、生活習(xí)慣、生活環(huán)境等影響因子對(duì)患者群體進(jìn)行基于相似性的有效分組,因此也就無(wú)法對(duì)患者進(jìn)行個(gè)性化的康復(fù)治療,大大影響了患者的康復(fù)效果和滿意度。

      隨著醫(yī)療信息化的發(fā)展,醫(yī)院也積累了大量的數(shù)據(jù)。如何更好的利用數(shù)據(jù)以及醫(yī)學(xué)知識(shí),通過(guò)認(rèn)知計(jì)算技術(shù),提供精準(zhǔn)醫(yī)療的決策是心腦血管疾病臨床治療階段所需要的。本發(fā)明的主要目標(biāo)就是基于歷史數(shù)據(jù)將腦卒中康復(fù)患者細(xì)化分群,為特定患者找到患情最相似的一群其他患者,從而基于相似患者的診療實(shí)踐提取和挖據(jù)診療證據(jù),為目標(biāo)個(gè)體患者的個(gè)性化的康復(fù)治療項(xiàng)目。

      到目前為止,基于認(rèn)知計(jì)算技術(shù)的中國(guó)人群心腦血管疾病相似性分析方面尚屬空白。而國(guó)內(nèi)外認(rèn)知計(jì)算技術(shù)在心腦血管疾病中的應(yīng)用主要集中在發(fā)病風(fēng)險(xiǎn)預(yù)測(cè)及診斷方面,在心腦血管患者相似性分析方面還尚未見有報(bào)道。鑒于國(guó)內(nèi)外沒(méi)有可用于心腦血管患者相似性分析的智能模型,很有必要建立一種面向臨床醫(yī)生的心腦血管患者相似性分析模型。



      技術(shù)實(shí)現(xiàn)要素:

      針對(duì)現(xiàn)有技術(shù)中的缺陷,本發(fā)明的目的是提供一種心腦血管患者相似性分析方法及系統(tǒng),其建立有效地心腦血管患者相似性分析模型,臨床醫(yī)生通過(guò)患者特征就能得到給定患者的相似人群,然后推薦個(gè)性化治療方案,以達(dá)到精準(zhǔn)醫(yī)療的目的,能夠很好的對(duì)中國(guó)人群心腦血管疾病患者進(jìn)行基于相似性分析的人群分組,盡早針對(duì)不同的風(fēng)險(xiǎn)人群進(jìn)行有針對(duì)性的個(gè)性化康復(fù)治療,具有巨大的醫(yī)療和臨床使用價(jià)值。

      根據(jù)本發(fā)明的一個(gè)方面,提供一種心腦血管患者相似性分析方法,其特征在于,其包括以下步驟:

      步驟一,問(wèn)題定義,基于歷史數(shù)據(jù)對(duì)心腦血管患者進(jìn)行細(xì)化分群,研究特定治療手段對(duì)特定人群治療結(jié)局的影響,并針對(duì)個(gè)體患者推薦個(gè)性化治療方案,將幫助臨床醫(yī)生更精準(zhǔn)地認(rèn)識(shí)目標(biāo)患者的病情以及治療手段所帶來(lái)的預(yù)后效果,從而有效地實(shí)現(xiàn)個(gè)性化精準(zhǔn)醫(yī)療;

      步驟二,數(shù)據(jù)采集,針對(duì)目標(biāo)人群,從相關(guān)信息系統(tǒng)收集觀察期窗口內(nèi)的患者醫(yī)療健康數(shù)據(jù)及預(yù)后結(jié)局?jǐn)?shù)據(jù),所采集的數(shù)據(jù)包括:康復(fù)科門診數(shù)據(jù)、康復(fù)科治療室數(shù)據(jù)、神內(nèi)/神外門診數(shù)據(jù)、神內(nèi)/神外住院數(shù)據(jù)、康復(fù)科住院數(shù)據(jù)、腦卒中篩查門診數(shù)據(jù),這些數(shù)據(jù)涉及的內(nèi)容涵蓋有患者基本信息、病歷或電子病歷、檢測(cè)檢驗(yàn)、影像、診斷、處方、治療、評(píng)估表數(shù)據(jù);

      步驟三,數(shù)據(jù)預(yù)處理,所采集的數(shù)據(jù)類型多種多樣,包括:選擇項(xiàng)、日期時(shí)間、數(shù)值型、字符型以及是否型數(shù)據(jù),針對(duì)不同數(shù)據(jù)類型需要采取不同處理方法進(jìn)行針對(duì)性數(shù)據(jù)預(yù)處理;

      步驟四,特征工程,患者數(shù)據(jù)來(lái)自多個(gè)臨床數(shù)據(jù)庫(kù),涉及患者個(gè)體生理信息、歷史診療信息、病情信息,在使用機(jī)器學(xué)習(xí)技術(shù)建模學(xué)習(xí)數(shù)據(jù)之前,首先需要使用特定領(lǐng)域知識(shí)以及統(tǒng)計(jì)學(xué)習(xí)方法來(lái)提取或組合變化得到的各屬性數(shù)據(jù),從而生成有效的特征數(shù)據(jù);

      步驟五,基于相似性的患者聚類建模,采用基于劃分的聚類算法、k-均值算法進(jìn)行患者的聚類建模,其中通過(guò)夾角余弦來(lái)度量患者之間的相似性;

      步驟六,診療方案推薦,當(dāng)患者問(wèn)診時(shí),結(jié)合問(wèn)診患者的個(gè)體特征和病患群體特征,采用基于相似性計(jì)算的群組定向技術(shù),為問(wèn)診患者找到最相近歷史病患群組,抽取出該群組內(nèi)病患的主體診療方案作為首選診療方案推薦給問(wèn)診患者。

      優(yōu)選地,所述步驟三具體包括以下步驟:

      步驟三十一,數(shù)據(jù)集成,把不同來(lái)源的數(shù)據(jù)按照一定規(guī)則整合到一起,根據(jù)病人ID號(hào)把不同數(shù)據(jù)源但是有同樣ID號(hào)的信息連接在一起,這樣所有不同數(shù)據(jù)源的數(shù)據(jù)就整合到了一起;

      步驟三十二,數(shù)據(jù)清洗,針對(duì)不同數(shù)據(jù)類型存在的不同問(wèn)題,提出了基于規(guī)則的數(shù)據(jù)清洗方法;

      步驟三十三,缺失值處理,醫(yī)療領(lǐng)域的特征數(shù)據(jù)普遍在時(shí)間序列上比較稀疏,因此采用基于正則化最大期望算法進(jìn)行缺失數(shù)據(jù)的填補(bǔ),將缺失特征變量視為無(wú)法觀測(cè)的隱藏變量,此方法一般分為三步:一,計(jì)算最大期望;二,正則化EM,避免過(guò)度擬合;三,對(duì)上一步生成的方程進(jìn)行評(píng)估;

      步驟三十四,特征刪除,根據(jù)專家知識(shí)對(duì)那些無(wú)效值和缺失值超過(guò)總樣本量30%的,對(duì)于診斷問(wèn)題不是特別重要的特征進(jìn)行刪除處理;

      步驟三十五,去異常點(diǎn),采用偏差分析、基于分布不合理性的異常檢測(cè)方法,結(jié)合常識(shí)性規(guī)則、業(yè)務(wù)特定規(guī)則進(jìn)行異常值的識(shí)別,并對(duì)異常點(diǎn)進(jìn)行刪除處理。

      優(yōu)選地,所述步驟四具體包括以下步驟:

      步驟四十一,特征構(gòu)造和特征選擇,其基于預(yù)處理后的數(shù)據(jù),通過(guò)特征構(gòu)造和特征選擇技術(shù)識(shí)別潛在的風(fēng)險(xiǎn)因子;

      步驟四十二,特征處理,使用log映射函數(shù)將特征取值映射到[0,1]區(qū)間,同時(shí)采用等值劃分方法對(duì)連續(xù)數(shù)據(jù)的離散化處理,將特征空間按照值域進(jìn)行均分,每一段內(nèi)的取值等同處理。

      本發(fā)明還提供一種心腦血管患者相似性分析系統(tǒng),其特征在于,其包括:

      問(wèn)題定義模塊,基于歷史數(shù)據(jù)對(duì)心腦血管患者進(jìn)行細(xì)化分群,研究特定治療手段對(duì)特定人群治療結(jié)局的影響,并針對(duì)個(gè)體患者推薦個(gè)性化治療方案;

      數(shù)據(jù)采集模塊,從相關(guān)信息系統(tǒng)收集觀察期窗口內(nèi)的患者醫(yī)療健康數(shù)據(jù)及預(yù)后結(jié)局?jǐn)?shù)據(jù);

      數(shù)據(jù)預(yù)處理模塊,針對(duì)不同數(shù)據(jù)類型需要采取不同處理方法進(jìn)行針對(duì)性數(shù)據(jù)預(yù)處理;

      特征工程生成模塊,生成有效的特征數(shù)據(jù);

      患者聚類建模模塊,采用基于劃分的聚類算法,即k-均值算法進(jìn)行患者的聚類建模;

      診療方案推薦模塊,采用基于相似性計(jì)算的群組定向技術(shù),為問(wèn)診患者找到最相近歷史病患群組,抽取出該群組內(nèi)病患的主體診療方案作為首選診療方案推薦給問(wèn)診患者;

      數(shù)據(jù)庫(kù),存儲(chǔ)數(shù)據(jù)采集模塊采集的數(shù)據(jù)以及診療方案推薦模塊的治療方案。

      優(yōu)選地,所述問(wèn)題定義模塊、數(shù)據(jù)采集模塊、數(shù)據(jù)預(yù)處理模塊、特征工程生成模塊、患者聚類建模模塊、診療方案推薦模塊依次連接,數(shù)據(jù)庫(kù)與數(shù)據(jù)采集模塊連接。

      與現(xiàn)有技術(shù)相比,本發(fā)明具有如下的有益效果:本發(fā)明建立有效地心腦血管患者相似性分析模型,臨床醫(yī)生通過(guò)患者特征就能得到給定患者的相似人群,然后推薦個(gè)性化治療方案,以達(dá)到精準(zhǔn)醫(yī)療的目的,能夠很好的對(duì)中國(guó)人群心腦血管疾病患者進(jìn)行基于相似性分析的人群分組,盡早針對(duì)不同的風(fēng)險(xiǎn)人群進(jìn)行有針對(duì)性的個(gè)性化康復(fù)治療,具有巨大的醫(yī)療和臨床使用價(jià)值。

      附圖說(shuō)明

      通過(guò)閱讀參照以下附圖對(duì)非限制性實(shí)施例所作的詳細(xì)描述,本發(fā)明的其它特征、目的和優(yōu)點(diǎn)將會(huì)變得更明顯:

      圖1為本發(fā)明心腦血管疾病相似性分析方法的流程圖。

      圖2為特征選擇的一般過(guò)程的流程圖。

      圖3為本發(fā)明心腦血管疾病相似性分析系統(tǒng)的原理框圖。

      具體實(shí)施方式

      下面結(jié)合具體實(shí)施例對(duì)本發(fā)明進(jìn)行詳細(xì)說(shuō)明。以下實(shí)施例將有助于本領(lǐng)域的技術(shù)人員進(jìn)一步理解本發(fā)明,但不以任何形式限制本發(fā)明。應(yīng)當(dāng)指出的是,對(duì)本領(lǐng)域的普通技術(shù)人員來(lái)說(shuō),在不脫離本發(fā)明構(gòu)思的前提下,還可以做出若干變形和改進(jìn)。這些都屬于本發(fā)明的保護(hù)范圍。

      如圖1所示,本發(fā)明心腦血管患者相似性分析方法包括以下步驟:

      步驟一,問(wèn)題定義,基于歷史數(shù)據(jù)對(duì)心腦血管患者進(jìn)行細(xì)化分群,研究特定治療手段對(duì)特定人群治療結(jié)局的影響,并針對(duì)個(gè)體患者推薦個(gè)性化治療方案,將幫助臨床醫(yī)生更精準(zhǔn)地認(rèn)識(shí)目標(biāo)患者的病情以及可能的治療手段所帶來(lái)的預(yù)后效果,從而有效地實(shí)現(xiàn)個(gè)性化精準(zhǔn)醫(yī)療;

      步驟二,數(shù)據(jù)采集,針對(duì)目標(biāo)人群,從相關(guān)信息系統(tǒng)收集觀察期窗口內(nèi)的患者醫(yī)療健康數(shù)據(jù)及預(yù)后結(jié)局?jǐn)?shù)據(jù),所采集的數(shù)據(jù)包括:康復(fù)科門診數(shù)據(jù)、康復(fù)科治療室數(shù)據(jù)、神內(nèi)/神外門診數(shù)據(jù)、神內(nèi)/神外住院數(shù)據(jù)、康復(fù)科住院數(shù)據(jù)、腦卒中篩查門診數(shù)據(jù),這些數(shù)據(jù)涉及的內(nèi)容涵蓋有患者基本信息、病歷或EMR(電子病歷)、檢測(cè)檢驗(yàn)、影像、診斷、處方、治療、評(píng)估表等數(shù)據(jù);

      步驟三,數(shù)據(jù)預(yù)處理,所采集的數(shù)據(jù)類型多種多樣,包括:選擇項(xiàng)(比如性別為男/女)、日期時(shí)間、數(shù)值型(比如檢測(cè)值)、字符型(比如診斷)以及是否型數(shù)據(jù),針對(duì)不同數(shù)據(jù)類型需要采取不同處理方法進(jìn)行針對(duì)性數(shù)據(jù)預(yù)處理,具體處理過(guò)程如下:

      步驟三十一,數(shù)據(jù)集成,把不同來(lái)源的數(shù)據(jù)按照一定規(guī)則整合到一起,根據(jù)病人ID號(hào)把不同數(shù)據(jù)源但是有同樣ID號(hào)的信息連接在一起,這樣所有不同數(shù)據(jù)源的數(shù)據(jù)就整合到了一起;

      步驟三十二,數(shù)據(jù)清洗,針對(duì)不同數(shù)據(jù)類型存在的不同問(wèn)題,提出了基于規(guī)則的數(shù)據(jù)清洗方法;

      步驟三十三,缺失值處理,醫(yī)療領(lǐng)域的特征數(shù)據(jù)普遍在時(shí)間序列上比較稀疏,因此采用基于正則化最大期望算法進(jìn)行缺失數(shù)據(jù)的填補(bǔ),將缺失特征變量視為無(wú)法觀測(cè)的隱藏變量,此方法一般可以分為三步:1)計(jì)算最大期望;2)正則化EM(最大期望),避免過(guò)度擬合;3)對(duì)上一步生成的方程進(jìn)行評(píng)估;

      步驟三十四,特征刪除,根據(jù)專家知識(shí)對(duì)那些無(wú)效值和缺失值超過(guò)總樣本量30%的,對(duì)于診斷問(wèn)題不是特別重要的特征進(jìn)行刪除處理;

      步驟三十五,去異常點(diǎn),采用偏差分析、基于分布不合理性的異常檢測(cè)方法,結(jié)合常識(shí)性規(guī)則、業(yè)務(wù)特定規(guī)則進(jìn)行異常值的識(shí)別,并對(duì)異常點(diǎn)進(jìn)行刪除處理;

      步驟四,特征工程,患者數(shù)據(jù)來(lái)自多個(gè)臨床數(shù)據(jù)庫(kù),涉及患者個(gè)體生理信息、歷史診療信息、病情信息,在使用機(jī)器學(xué)習(xí)技術(shù)建模學(xué)習(xí)數(shù)據(jù)之前,首先需要使用特定領(lǐng)域知識(shí)以及統(tǒng)計(jì)學(xué)習(xí)方法來(lái)提取或組合變化得到的各屬性數(shù)據(jù),從而生成有效的特征數(shù)據(jù),具體處理過(guò)程如下:

      步驟四十一,特征構(gòu)造和特征選擇,其基于預(yù)處理后的數(shù)據(jù),通過(guò)特征構(gòu)造(轉(zhuǎn)換原始特征并衍生組合特征)和特征選擇(從原始特征和組合特征中自動(dòng)選擇潛在的風(fēng)險(xiǎn)因素)技術(shù)識(shí)別潛在的風(fēng)險(xiǎn)因子;

      步驟四十二,特征處理,使用log映射函數(shù)將特征取值映射到[0,1]區(qū)間,同時(shí)采用等值劃分方法對(duì)連續(xù)數(shù)據(jù)的離散化處理,將特征空間按照值域進(jìn)行均分,每一段內(nèi)的取值等同處理;

      步驟五,基于相似性的患者聚類建模,采用基于劃分的聚類算法、k-均值算法進(jìn)行患者的聚類建模,其中通過(guò)夾角余弦來(lái)度量患者之間的相似性;

      步驟六,診療方案推薦,當(dāng)患者問(wèn)診時(shí),結(jié)合問(wèn)診患者的個(gè)體特征和病患群體特征,采用基于相似性計(jì)算的群組定向技術(shù),為問(wèn)診患者找到最相近歷史病患群組,抽取出該群組內(nèi)病患的主體診療方案作為首選診療方案推薦給問(wèn)診患者。

      實(shí)施例

      本實(shí)施例涉及一種心腦血管患者相似性分析方法。

      本實(shí)施例以XXX醫(yī)院康復(fù)科所采集的700位有明確康復(fù)結(jié)局的腦卒中患者為樣本,樣本數(shù)據(jù)具體包括:患者的基本信息(性別、年齡、身高、體重、教育程度、婚姻狀態(tài)等),體征數(shù)據(jù)(血壓、心率),病史數(shù)據(jù)(門診及住院診斷、用藥史及治療歷史、檢查檢驗(yàn)歷史及相關(guān)影像數(shù)據(jù)),進(jìn)入康復(fù)科后的功能評(píng)估項(xiàng)目及康復(fù)治療后的評(píng)定結(jié)果。

      步驟一,問(wèn)題定義

      基于腦卒中患者康復(fù)治療的既往數(shù)據(jù),首先將患者人群按照特定康復(fù)預(yù)后結(jié)局分為子群,每個(gè)子群內(nèi)患者應(yīng)具有相似的預(yù)后結(jié)局,從以下幾方面對(duì)相似性分析模型進(jìn)行定義:1)訓(xùn)練集合患者總數(shù);2)群族數(shù)目及不同群族中的患者標(biāo)識(shí);3)分群元數(shù)據(jù)包括分群相似性度量,分群算法及參數(shù),數(shù)據(jù)變換矩陣等?;谙嗨菩苑治龅姆秩耗P停瑢?shí)現(xiàn)以下功能:1)針對(duì)特定患者,識(shí)別患情相似的患者群;2)發(fā)現(xiàn)并總結(jié)相似患者群的共性特征;3)根據(jù)相似患者為目標(biāo)患者推薦使用的康復(fù)治療方案。

      步驟二,數(shù)據(jù)采集

      首先使用病人ID號(hào)將不同數(shù)據(jù)源但是有同樣ID號(hào)的數(shù)據(jù)連接在一起,這樣所有來(lái)自不同數(shù)據(jù)源的數(shù)據(jù)就整合到了同一個(gè)數(shù)據(jù)文件中,

      步驟三,數(shù)據(jù)預(yù)處理,所采集的數(shù)據(jù)類型多種多樣,包括:選擇項(xiàng)、日期時(shí)間、數(shù)值型、字符型以及是否型數(shù)據(jù),針對(duì)不同數(shù)據(jù)類型需要采取不同處理方法進(jìn)行針對(duì)性數(shù)據(jù)預(yù)處理;具體處理過(guò)程如下:

      步驟三十一,數(shù)據(jù)集成,把不同來(lái)源的數(shù)據(jù)按照一定規(guī)則整合到一起,根據(jù)病人ID號(hào)把不同數(shù)據(jù)源但是有同樣ID號(hào)的信息連接在一起,這樣所有不同數(shù)據(jù)源的數(shù)據(jù)就整合到了一起;

      步驟三十二,數(shù)據(jù)清洗,如圖2所示,以數(shù)值型數(shù)據(jù)的清洗過(guò)程為例,分別針對(duì)不同原始數(shù)據(jù)的特征,使用相應(yīng)的清洗規(guī)則清洗數(shù)據(jù),進(jìn)而得到清洗后整齊的數(shù)據(jù)。

      步驟二十三,缺失值處理,將數(shù)據(jù)清洗后的數(shù)據(jù)集進(jìn)行最大期望的詳細(xì)計(jì)算方法如下:

      1、EM(最大期望)算法步驟,最大期望算法經(jīng)過(guò)兩個(gè)步驟交替進(jìn)行計(jì)算,第一步是計(jì)算期望(E),利用對(duì)隱藏變量的現(xiàn)有估計(jì)值,計(jì)算其最大似然估計(jì)值;第二步是最大化(M),最大化在期望(E)步上求得的最大似然值來(lái)計(jì)算參數(shù)的值,最大化(M)步找到的參數(shù)估計(jì)值被用于下一個(gè)期望(E)步計(jì)算中,這個(gè)過(guò)程不斷交替進(jìn)行。

      2、EM(最大期望)算法應(yīng)用,用于估計(jì)無(wú)法觀測(cè)的數(shù)據(jù),y表示能夠觀察到的不完整變量值,用x表示無(wú)法觀察到的變量值,在給定的觀察到的數(shù)據(jù)條件下未知數(shù)據(jù)的條件分布如下式(1):

      其中,p表示概率密度函數(shù);x表示輸入特征變量;y表示輸出目標(biāo)變量;θ表示模型的未知參數(shù)。

      3、處理效果評(píng)估,采用標(biāo)準(zhǔn)誤差(RMSE)對(duì)缺失值的填充效果進(jìn)行評(píng)估,RMSE(采用標(biāo)準(zhǔn)誤差)能夠很好地反映出所填充數(shù)據(jù)和真實(shí)數(shù)據(jù)的偏離程度,RMSE值越小,表示填充數(shù)據(jù)和真實(shí)數(shù)據(jù)的偏離程度越小,其精度越高,反之,RMSE(采用標(biāo)準(zhǔn)誤差)越大,表示填充數(shù)據(jù)和真實(shí)數(shù)據(jù)的偏離程度越大,RMSE(采用標(biāo)準(zhǔn)誤差)的數(shù)學(xué)表達(dá)式如下式(2):

      其中,n為樣本數(shù);Xobs,i代表第i個(gè)觀測(cè)值;Xmodel,i代表Xobs,i的模型預(yù)測(cè)值。

      本實(shí)施例中未發(fā)現(xiàn)滿足刪除條件的特征和異常值。

      步驟三十四,特征刪除,根據(jù)專家知識(shí)對(duì)那些無(wú)效值和缺失值超過(guò)總樣本量30%的,對(duì)于診斷問(wèn)題不是特別重要的特征進(jìn)行刪除處理;

      步驟三十五,去異常點(diǎn),采用偏差分析、基于分布不合理性的異常檢測(cè)方法,結(jié)合常識(shí)性規(guī)則、業(yè)務(wù)特定規(guī)則進(jìn)行異常值的識(shí)別,并對(duì)異常點(diǎn)進(jìn)行刪除處理。

      步驟四,特征工程,潛在風(fēng)險(xiǎn)因子識(shí)別

      如圖2所示,采用基于集合運(yùn)算(count,mean,min,max,std.)和領(lǐng)域知識(shí)的方法構(gòu)造新特征,例如某個(gè)病人一天中可能有幾個(gè)血壓值,我們可以采用平均值,最大值或最小值最為血壓這個(gè)特征變量的最后值,另外,采用的特征選擇過(guò)程包括產(chǎn)生過(guò)程、評(píng)價(jià)函數(shù)、停止準(zhǔn)則、驗(yàn)證過(guò)程四個(gè)部分。

      在產(chǎn)生過(guò)程中,采用基于啟發(fā)式搜索方法的序列前向選擇方法,假設(shè)特征子集X從空集開始,每次選擇一個(gè)特征加入特征子集,使得特征函數(shù)最優(yōu),即每次都選擇一個(gè)使得評(píng)價(jià)函數(shù)的取值達(dá)到最優(yōu)的特征加入,采用的評(píng)價(jià)函數(shù)是基于篩選器的方法,并且使用線性相關(guān)系數(shù)來(lái)衡量向量之間線性相關(guān)度,如下式(3):

      其中,Xi表示第i個(gè)特征向量;Y表示目標(biāo)輸出向量;cov(Xi,Y)表示Xi和Y的協(xié)方差;var(Xi)和var(Y)分別表示Xi和Y的方差。

      當(dāng)評(píng)價(jià)函數(shù)值達(dá)到停止準(zhǔn)則設(shè)定的閾值后停止搜索過(guò)程,最后在驗(yàn)證數(shù)據(jù)集上驗(yàn)證選出來(lái)的特征子集的有效性,最后,通過(guò)log函數(shù)歸一化映射函數(shù)將特征取值映射到[0,1]區(qū)間,然后通過(guò)等值劃分對(duì)連續(xù)特征進(jìn)行離散化處理。

      步驟四十一,特征構(gòu)造和特征選擇,其基于預(yù)處理后的數(shù)據(jù),通過(guò)特征構(gòu)造(轉(zhuǎn)換原始特征并衍生組合特征)和特征選擇(從原始特征和組合特征中自動(dòng)選擇潛在的風(fēng)險(xiǎn)因素)技術(shù)識(shí)別潛在的風(fēng)險(xiǎn)因子;

      步驟四十二,特征處理

      假設(shè)n維空間內(nèi)兩點(diǎn)a(x11,x12,...,x1n)與b(x21,x22,...,x2n),計(jì)算公式如下式(4):

      其中,x1k表示點(diǎn)a的第k個(gè)元素;x2k表示點(diǎn)b的第k個(gè)元素;θ表示兩點(diǎn)之間的夾角。

      其中夾角余弦取值范圍為[-1,1]。夾角余弦越大表示兩個(gè)向量的夾角越小,夾角余弦越小表示兩向量的夾角越大。當(dāng)兩個(gè)向量的方向重合時(shí)夾角余弦取最大值1,當(dāng)兩個(gè)向量的方向完全相反夾角余弦取最小值-1。

      步驟五,基于相似性的患者聚類建模

      對(duì)由700位腦卒中患者特征向量組成的數(shù)據(jù)集,基于KNN聚類算法構(gòu)造六個(gè)分組,每一個(gè)分組就代表一個(gè)聚類,詳細(xì)聚類過(guò)程如下:

      給定要構(gòu)建的群組數(shù),劃分方法首先創(chuàng)建一個(gè)初始化劃分;

      通過(guò)把對(duì)象從一個(gè)組移動(dòng)到另一個(gè)組來(lái)進(jìn)行劃分,使同一個(gè)群組中的各對(duì)象盡可能相互接近或相關(guān),而不同的群組中的對(duì)象盡可能遠(yuǎn)離或不同;

      反復(fù)迭代的方式更新分組,使得更新之后的分組方案都較前一次好,知道算法收斂。

      步驟六,個(gè)性化診療方案推薦

      采用基于相似性度量的KNN找到與目標(biāo)患者最相近的歷史患者群組,kNN算法的核心思想是如果一個(gè)樣本在特征空間中的k個(gè)最相鄰的樣本中的大多數(shù)屬于某一個(gè)類別,則該樣本也屬于這個(gè)類別,并具有這個(gè)類別上樣本的特性。該方法在確定分類決策上只依據(jù)最鄰近的一個(gè)或者幾個(gè)樣本的類別來(lái)決定待分樣本所屬的類別。

      如圖3所示,本發(fā)明心腦血管患者相似性分析系統(tǒng)包括:

      問(wèn)題定義模塊,基于歷史數(shù)據(jù)對(duì)心腦血管患者進(jìn)行細(xì)化分群,研究特定治療手段對(duì)特定人群治療結(jié)局的影響,并針對(duì)個(gè)體患者推薦個(gè)性化治療方案;

      數(shù)據(jù)采集模塊,從相關(guān)信息系統(tǒng)收集觀察期窗口內(nèi)的患者醫(yī)療健康數(shù)據(jù)及預(yù)后結(jié)局?jǐn)?shù)據(jù);

      數(shù)據(jù)預(yù)處理模塊,針對(duì)不同數(shù)據(jù)類型需要采取不同處理方法進(jìn)行針對(duì)性數(shù)據(jù)預(yù)處理;

      特征工程生成模塊,生成有效的特征數(shù)據(jù);

      患者聚類建模模塊,采用基于劃分的聚類算法、k-均值算法進(jìn)行患者的聚類建模;

      診療方案推薦模塊,采用基于相似性計(jì)算的群組定向技術(shù),為問(wèn)診患者找到最相近歷史病患群組,抽取出該群組內(nèi)病患的主體診療方案作為首選診療方案推薦給問(wèn)診患者;

      數(shù)據(jù)庫(kù),存儲(chǔ)數(shù)據(jù)采集模塊采集的數(shù)據(jù)以及診療方案推薦模塊的治療方案等。

      問(wèn)題定義模塊、數(shù)據(jù)采集模塊、數(shù)據(jù)預(yù)處理模塊、特征工程生成模塊、患者聚類建模模塊、診療方案推薦模塊依次連接,數(shù)據(jù)庫(kù)與數(shù)據(jù)采集模塊連接,這樣方便連接。

      綜上所述,本發(fā)明建立有效地心腦血管患者相似性分析模型,臨床醫(yī)生通過(guò)患者特征就能得到給定患者的相似人群,然后推薦個(gè)性化治療方案,以達(dá)到精準(zhǔn)醫(yī)療的目的,能夠很好的對(duì)中國(guó)人群心腦血管疾病患者進(jìn)行基于相似性分析的人群分組,盡早針對(duì)不同的風(fēng)險(xiǎn)人群進(jìn)行有針對(duì)性的個(gè)性化康復(fù)治療,具有巨大的醫(yī)療和臨床使用價(jià)值。

      以上對(duì)本發(fā)明的具體實(shí)施例進(jìn)行了描述。需要理解的是,本發(fā)明并不局限于上述特定實(shí)施方式,本領(lǐng)域技術(shù)人員可以在權(quán)利要求的范圍內(nèi)做出各種變形或修改,這并不影響本發(fā)明的實(shí)質(zhì)內(nèi)容。

      當(dāng)前第1頁(yè)1 2 3 
      網(wǎng)友詢問(wèn)留言 已有0條留言
      • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1