本發(fā)明涉及醫(yī)療數(shù)據(jù)分析領(lǐng)域,特別是涉及一種針對臨床疾病的多模態(tài)大數(shù)據(jù)的數(shù)據(jù)分析方法。
背景技術(shù):
隨著社會(huì)的發(fā)展,科學(xué)技術(shù)也相應(yīng)地不斷提高,全國各大小醫(yī)院開始將自己存儲(chǔ)數(shù)據(jù)的方式變得更加多樣化,因此醫(yī)療多模態(tài)大數(shù)據(jù)的概念得到了廣大專家學(xué)者的關(guān)注。臨床疾病的多模態(tài)大數(shù)據(jù)是指對疾病從不同的角度和視覺(如生理、習(xí)慣、心理、環(huán)境等)采集得到的各類數(shù)據(jù)的集合。多模態(tài)大數(shù)據(jù)為復(fù)雜疾病的診斷研究提供了新的研究思路。海量多模態(tài)醫(yī)療數(shù)據(jù)中隱含著數(shù)據(jù)與疾病之間的相關(guān)性信息。
然而目前在臨床上主要依靠臨床表現(xiàn)和實(shí)驗(yàn)室檢查做出診斷,而且隨著近年來檢測技術(shù)的發(fā)展,人類已經(jīng)能夠獲得到更多的人體疾病相關(guān)的多種檢查項(xiàng)目結(jié)果等多模態(tài)的數(shù)據(jù),而這些數(shù)據(jù)往往與疾病間存在相關(guān)性。醫(yī)療臨床資源豐富,病例病種全,多模態(tài)樣本量巨大。但是由于缺乏大數(shù)據(jù)處理環(huán)境的支撐和多模態(tài)數(shù)據(jù)的有效利用,當(dāng)前已有的疾病診斷研究仍然停留在傳統(tǒng)的基于單模態(tài)的數(shù)據(jù)研究。
醫(yī)學(xué)信息內(nèi)容豐富多樣,數(shù)據(jù)結(jié)構(gòu)特殊,臨床疾病大數(shù)據(jù)可能含有純數(shù)據(jù)、圖像、文字、檢測信號、音頻或者視頻信息等。同時(shí)許多醫(yī)學(xué)信息的表達(dá)、記錄具有不確定性、模糊性、不完整性、帶有噪聲和冗余性等特征加大了醫(yī)學(xué)數(shù)據(jù)挖掘的難度。盡管現(xiàn)如今科學(xué)界對數(shù)據(jù)的感知與獲取方法有不少舉足輕重的發(fā)展,但是在普適化多模態(tài)大數(shù)據(jù)環(huán)境下,數(shù)據(jù)量大及模態(tài)繁多給數(shù)據(jù)的采集、傳輸、清洗和儲(chǔ)存帶來了新的挑戰(zhàn),致使現(xiàn)有的方法無法直接融入到基于非侵入式普適化多模態(tài)大數(shù)據(jù)的信息提取及疾病演化規(guī)律的建模中。
除此之外,病人的飲食習(xí)慣、所在地區(qū)的氣候特征、風(fēng)土人情、近期的情緒波動(dòng)等等都與疾病的發(fā)生發(fā)展有密切關(guān)系。而且這種誤差隨著時(shí)間推進(jìn)以具有放大效應(yīng),會(huì)愈演愈烈,導(dǎo)致演化規(guī)律對實(shí)際治療效果起反作用。因此,基于臨床疾病的非侵入式普適化多模態(tài)醫(yī)療大數(shù)據(jù),最大化地少疾病演化規(guī)律與實(shí)際病情的誤差是大數(shù)據(jù)醫(yī)療發(fā)展路上的一大障礙。
綜上所述,想要實(shí)現(xiàn)普適化多模態(tài)大數(shù)據(jù)的研究并不容易,而且更大的難題是如何設(shè)法去分析疾病發(fā)病的內(nèi)在和外在原因,并揭示疾病的演化規(guī)律。由此可見,如何通過多模態(tài)大數(shù)據(jù)得到疾病診斷的相關(guān)研究是本領(lǐng)域技術(shù)人員亟待解決地問題。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的是提供一種針對臨床疾病的多模態(tài)大數(shù)據(jù)的數(shù)據(jù)分析方法,用于通過多模態(tài)大數(shù)據(jù)得到疾病診斷的相關(guān)研究。
為解決上述技術(shù)問題,本發(fā)明提供一種針對臨床疾病的多模態(tài)大數(shù)據(jù)的數(shù)據(jù)分析方法,包括:
根據(jù)確定好的疾病類型,從醫(yī)療系統(tǒng)中獲取所述疾病類型對應(yīng)的歷史大數(shù)據(jù);
通過所述歷史大數(shù)據(jù)在各模態(tài)下對應(yīng)的變化率設(shè)計(jì)多密度量化器以得到實(shí)時(shí)數(shù)據(jù)的感知與獲取方法;
對所述歷史大數(shù)據(jù)采用多模態(tài)數(shù)據(jù)挖掘方法,并結(jié)合卷積神經(jīng)網(wǎng)絡(luò)方法,提取出所述疾病類型對應(yīng)的特征信息;
依據(jù)所述特征信息推導(dǎo)出所述歷史大數(shù)據(jù)中感染所述疾病類型的個(gè)體的動(dòng)態(tài)演化規(guī)律;
結(jié)合所述個(gè)體的動(dòng)態(tài)演化規(guī)律得到所述實(shí)時(shí)數(shù)據(jù)的性能評估指標(biāo)。
優(yōu)選地,所述通過所述歷史大數(shù)據(jù)在各模態(tài)下對應(yīng)的變化率設(shè)計(jì)多密度量化器以得到實(shí)時(shí)數(shù)據(jù)的感知與獲取方法具體包括:
按照所述變化率將所述歷史大數(shù)據(jù)進(jìn)行分段,并求解各分段結(jié)果對應(yīng)的平均值;
按照各所述平均值的偏差的范圍將所述平均值劃分成多個(gè)集合,并求解所述集合的平均值;
計(jì)算所述集合中的測量數(shù)據(jù)的偏差,并根據(jù)所述測量數(shù)據(jù)的偏差與所述集合的平均值的對應(yīng)關(guān)系設(shè)計(jì)預(yù)測函數(shù);
根據(jù)所述預(yù)測函數(shù)將所述測量數(shù)據(jù)標(biāo)準(zhǔn)化;
對標(biāo)準(zhǔn)化后的測量數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗,并依據(jù)傳輸網(wǎng)絡(luò)的負(fù)載特性設(shè)置所述多密度量化器。
優(yōu)選地,所述對所述歷史大數(shù)據(jù)采用多模態(tài)數(shù)據(jù)挖掘方法具體包括:
將疾病與危險(xiǎn)因素的影響關(guān)系生成關(guān)系矩陣;
依據(jù)所述關(guān)系矩陣設(shè)定目標(biāo)函數(shù),并對所述目標(biāo)函數(shù)極小化;
其中,所述目標(biāo)函數(shù)為:
其中,mij為所述關(guān)系矩陣,u為疾病,v為危險(xiǎn)因素,xu表示疾病的特征,xv為危險(xiǎn)因素的特征,r(u,v)是對u與v的規(guī)則化約束,ru(u,xu)為u對xu的規(guī)則化約束,rv(v,xv)為v對xv的規(guī)則化約束,λ、λu和λv分別為對應(yīng)規(guī)則化約束項(xiàng)的權(quán)重,值在0~1之間,l(ui,vj,mij)為ui、vi和mij的關(guān)系函數(shù)。
優(yōu)選地,所述結(jié)合卷積神經(jīng)網(wǎng)絡(luò)方法,提取出所述疾病類型對應(yīng)的特征信息具體包括:
按照所述測量數(shù)據(jù)所屬模態(tài)的類型建立多種卷積核;
對所述卷積核進(jìn)行混合采樣得到所述特征信息;
將所述特征信息與所述卷積神經(jīng)網(wǎng)絡(luò)的輸出層全連接。
優(yōu)選地,所述個(gè)體的動(dòng)態(tài)演化規(guī)律具體通過如下步驟得到:
采用模糊邏輯系統(tǒng)辨識(shí)法建立所述特征信息與疾病個(gè)體演化規(guī)律之間的模糊動(dòng)態(tài)治療模型。
優(yōu)選地,所述結(jié)合所述個(gè)體的動(dòng)態(tài)演化規(guī)律得到所述實(shí)時(shí)數(shù)據(jù)的性能評估指標(biāo)具體包括:
基于所述模糊動(dòng)態(tài)治療模型中的目標(biāo)函數(shù),通過迭代優(yōu)化算法建立疾病性能評估指標(biāo);
計(jì)算所述疾病性能評估指標(biāo)的最小值。
優(yōu)選地,還包括:
基于所述疾病性能評估指標(biāo),利用滾動(dòng)優(yōu)化算法得到最優(yōu)的疾病治療序列。
優(yōu)選地,還包括:
通過所述實(shí)時(shí)數(shù)據(jù)對所述疾病治療序列進(jìn)行反饋矯正。
優(yōu)選地,還包括:
依據(jù)所述個(gè)體的動(dòng)態(tài)演化規(guī)律建立所述疾病類型對應(yīng)的群體的動(dòng)態(tài)演化規(guī)律。
本發(fā)明所提供的針對臨床疾病的多模態(tài)大數(shù)據(jù)的數(shù)據(jù)分析方法,包括:根據(jù)確定好的疾病類型,從醫(yī)療系統(tǒng)中獲取疾病類型對應(yīng)的歷史大數(shù)據(jù);通過歷史大數(shù)據(jù)在各模態(tài)下對應(yīng)的變化率設(shè)計(jì)多密度量化器以得到實(shí)時(shí)數(shù)據(jù)的感知與獲取方法;對歷史大數(shù)據(jù)采用多模態(tài)數(shù)據(jù)挖掘方法,并結(jié)合卷積神經(jīng)網(wǎng)絡(luò)方法,提取出疾病類型對應(yīng)的特征信息;依據(jù)特征信息推導(dǎo)出歷史大數(shù)據(jù)中感染疾病類型的個(gè)體的動(dòng)態(tài)演化規(guī)律;結(jié)合個(gè)體的動(dòng)態(tài)演化規(guī)律得到實(shí)時(shí)數(shù)據(jù)的性能評估指標(biāo)。由此可見,本方法可以有效地克服傳統(tǒng)數(shù)據(jù)分析方法僅考慮疾病患者生理單模態(tài)數(shù)據(jù)的局限性,能夠綜合考慮疾病的危險(xiǎn)因素,為醫(yī)院提供更加詳盡且準(zhǔn)確的臨床診斷標(biāo)準(zhǔn),同時(shí)能給出多模態(tài)大數(shù)據(jù)與疾病的個(gè)體的動(dòng)態(tài)演化規(guī)律,預(yù)測疾病的發(fā)病趨勢,為疾病的早診斷早治療提供決策依據(jù)和技術(shù)支撐,提高了診斷效率和診療質(zhì)量。
附圖說明
為了更清楚地說明本發(fā)明實(shí)施例,下面將對實(shí)施例中所需要使用的附圖做簡單的介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1為本發(fā)明實(shí)施例提供的一種針對臨床疾病的多模態(tài)大數(shù)據(jù)的數(shù)據(jù)分析方法的流程圖;
圖2為本發(fā)明實(shí)施例提供的一種基于滾動(dòng)優(yōu)化算法得到最優(yōu)的疾病治療序列的原理圖。
具體實(shí)施方式
下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部實(shí)施例。基于本發(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動(dòng)前提下,所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)范圍。
本發(fā)明的核心是提供一種針對臨床疾病的多模態(tài)大數(shù)據(jù)的數(shù)據(jù)分析方法。
為了使本技術(shù)領(lǐng)域的人員更好地理解本發(fā)明方案,下面結(jié)合附圖和具體實(shí)施方式對本發(fā)明作進(jìn)一步的詳細(xì)說明。
圖1為本發(fā)明實(shí)施例提供的一種針對臨床疾病的多模態(tài)大數(shù)據(jù)的數(shù)據(jù)分析方法的流程圖。如圖1所示,針對臨床疾病的多模態(tài)大數(shù)據(jù)的數(shù)據(jù)分析方法,包括:
s10:根據(jù)確定好的疾病類型,從醫(yī)療系統(tǒng)中獲取疾病類型對應(yīng)的歷史大數(shù)據(jù)。
可以理解的是疾病類型有很多種,例如,肛腸疾病,具體類型本實(shí)施例不再贅述。另外,醫(yī)療系統(tǒng)中,都存儲(chǔ)有每種疾病類型對應(yīng)的歷史大數(shù)據(jù),這些數(shù)據(jù)是真實(shí)數(shù)據(jù),具有非常高的參考價(jià)值,本發(fā)明就是將歷史大數(shù)據(jù)之間的相關(guān)性得到疾病類型所對應(yīng)的個(gè)體的動(dòng)態(tài)演化規(guī)律,從而通過這個(gè)動(dòng)態(tài)演化規(guī)律得到實(shí)時(shí)數(shù)據(jù)的性能評估指標(biāo),以完成對實(shí)時(shí)數(shù)據(jù)的分析和得到相應(yīng)的治療方案。
s11:通過歷史大數(shù)據(jù)在各模態(tài)下對應(yīng)的變化率設(shè)計(jì)多密度量化器以得到實(shí)時(shí)數(shù)據(jù)的感知與獲取方法。
本實(shí)施例中,從數(shù)據(jù)采集、數(shù)據(jù)清洗和量化壓縮三個(gè)方面,去構(gòu)建非侵入式普適化多模態(tài)數(shù)據(jù)的感知與獲取方法,分析歷史數(shù)據(jù)的特點(diǎn)(例如數(shù)據(jù)的變化率)以及與該臨床疾病的關(guān)聯(lián)關(guān)系,針對不同的數(shù)據(jù)設(shè)計(jì)基于多采樣率的數(shù)據(jù)采集方法。作為優(yōu)選地實(shí)施方式,步驟s11具體包括s110-s114。
s110:按照變化率將歷史大數(shù)據(jù)進(jìn)行分段,并求解各分段結(jié)果對應(yīng)的平均值。
依據(jù)歷史大數(shù)據(jù)的特性,分析不同模態(tài)數(shù)據(jù)的變化率,基于這種變化率對數(shù)據(jù)進(jìn)行分段。針對不同段的數(shù)據(jù),通過下面的公式求解平均值。
其中,n為s階段采樣數(shù)據(jù)的個(gè)數(shù),di為一個(gè)階段中的所有測量值。
s111:按照各平均值的偏差的范圍將平均值劃分成多個(gè)集合,并求解集合的平均值。
把μs相近的值歸為一類,定義為集合ωs,并記這集合的平均值為
s112:計(jì)算集合中的測量數(shù)據(jù)的偏差,并根據(jù)測量數(shù)據(jù)的偏差與集合的平均值的對應(yīng)關(guān)系設(shè)計(jì)預(yù)測函數(shù)。
測量數(shù)據(jù)的偏差計(jì)算公式為:
s113:根據(jù)預(yù)測函數(shù)將測量數(shù)據(jù)標(biāo)準(zhǔn)化。
針對一個(gè)具有動(dòng)態(tài)特性的測量數(shù)據(jù),基于有限步預(yù)測其對應(yīng)的平均值和偏差,即設(shè)計(jì)預(yù)測函數(shù)f(d(k),…d(k-n+1))預(yù)測d(k)時(shí)刻測量數(shù)據(jù)的平均值與偏差?;赿(k)時(shí)刻預(yù)測的平均值與偏差,把測量數(shù)據(jù)標(biāo)準(zhǔn)化,標(biāo)準(zhǔn)化公式如下:
s114:對標(biāo)準(zhǔn)化后的測量數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗,并依據(jù)傳輸網(wǎng)絡(luò)的負(fù)載特性設(shè)置多密度量化器。
其中,數(shù)據(jù)清洗具體為:定義一個(gè)常數(shù)θ>1,通過判斷y(k)的絕對值是否大于θ,來判斷當(dāng)前d(k)時(shí)刻的測量數(shù)據(jù)的是否屬于離群值,如果否,則剔除實(shí)現(xiàn)動(dòng)態(tài)數(shù)據(jù)清洗。
針對如上獲得的標(biāo)準(zhǔn)化后的數(shù)據(jù),基于傳輸網(wǎng)絡(luò)的負(fù)載特性,需按如下方法設(shè)計(jì)多密度量化器,量化器是對數(shù)據(jù)進(jìn)行量化,以方便數(shù)據(jù)采集、清洗和儲(chǔ)存。一般的量化器傳輸量化的設(shè)定值固定,這樣的弊端在于,網(wǎng)絡(luò)傳輸速度快時(shí),容易造成網(wǎng)絡(luò)資源浪費(fèi),網(wǎng)絡(luò)傳輸速度慢時(shí),容易丟失有效數(shù)據(jù)。而多密度量化器能根據(jù)傳輸網(wǎng)絡(luò)的情況,動(dòng)態(tài)的調(diào)節(jié)量化器的設(shè)定值,從而得到多密度量化器。由于多模態(tài)大數(shù)據(jù)對網(wǎng)絡(luò)性能要求高,而實(shí)際網(wǎng)絡(luò)情況是動(dòng)態(tài)的,時(shí)好時(shí)壞。為了最大效率量化數(shù)據(jù),所以要基于傳輸網(wǎng)絡(luò)的狀態(tài),實(shí)時(shí)變化設(shè)定值,下文中的步驟就是解釋如何去動(dòng)態(tài)調(diào)整設(shè)定值。
第一步,把量化測量值寫成量化輸出值加上一個(gè)高斯噪聲的形式,即
其中,yi(k)為實(shí)際測量數(shù)據(jù),
第二步,根據(jù)傳輸網(wǎng)絡(luò)分析每個(gè)數(shù)據(jù)包的比特?cái)?shù),定義為b1。同時(shí)定義k時(shí)刻實(shí)際傳輸?shù)臄?shù)據(jù)比特?cái)?shù)為b2(k)。本發(fā)明定義傳輸通道k時(shí)刻的負(fù)載度為:
第三步,根據(jù)歷史大數(shù)據(jù)統(tǒng)計(jì)出數(shù)據(jù)變化的窗口值,定義為m,設(shè)計(jì)長度為m的存儲(chǔ)器。這是一種數(shù)據(jù)處理的常用方法,此處是以某一個(gè)時(shí)間長度作為跨度,對數(shù)據(jù)進(jìn)行分區(qū),每一個(gè)時(shí)間區(qū)域的數(shù)據(jù)稱之為窗口值。定義m個(gè)長度內(nèi)平均負(fù)載度為:
結(jié)合數(shù)據(jù)源所需要滿足的精度和平均負(fù)載度設(shè)計(jì)多密度量化器。
根據(jù)求出的每一個(gè)時(shí)間段的平均負(fù)載度,基于這個(gè)值的大小并對照參考值,來調(diào)整量化器的設(shè)定值,以此來達(dá)到動(dòng)態(tài)的量化器的效果,也就是多密度量化器的運(yùn)作方式。
通過設(shè)計(jì)多密度量化器,可以有效地解決了同步傳輸情況下傳輸網(wǎng)絡(luò)吞吐量受限的難題,得到了基于有限歷史數(shù)據(jù)的動(dòng)態(tài)統(tǒng)計(jì)離群值判斷準(zhǔn)則,實(shí)現(xiàn)了多模態(tài)大數(shù)據(jù)的動(dòng)態(tài)清洗,提高了網(wǎng)絡(luò)資源的利用率。
s12:對歷史大數(shù)據(jù)采用多模態(tài)數(shù)據(jù)挖掘方法,并結(jié)合卷積神經(jīng)網(wǎng)絡(luò)方法,提取出疾病類型對應(yīng)的特征信息。
多模態(tài)大數(shù)據(jù)挖掘方法,首先是將疾病與危險(xiǎn)因素的關(guān)系抽象為一個(gè)關(guān)系矩陣mij,mij表示疾病i受危險(xiǎn)因素j的影響關(guān)系,可以是0或者1,表示有無影響關(guān)系;也可以是實(shí)數(shù)值,表示受影響的程度。
作為一種優(yōu)選地實(shí)施方式,對歷史大數(shù)據(jù)采用多模態(tài)數(shù)據(jù)挖掘方法具體包括:
將疾病與危險(xiǎn)因素的影響關(guān)系生成關(guān)系矩陣;
依據(jù)關(guān)系矩陣設(shè)定目標(biāo)函數(shù),并對目標(biāo)函數(shù)極小化;
其中,目標(biāo)函數(shù)為:
其中,mij為所述關(guān)系矩陣,u為疾病,v為危險(xiǎn)因素,xu表示疾病的特征,xv為危險(xiǎn)因素的特征,r(u,v)是對u與v的規(guī)則化約束,ru(u,xu)為u對xu的規(guī)則化約束,rv(v,xv)為v對xv的規(guī)則化約束,λ、λu和λv分別為對應(yīng)規(guī)則化約束項(xiàng)的權(quán)重,值在0~1之間,l(ui,vj,mij)為ui、vi和mij的關(guān)系函數(shù)。
通過極小化以上目標(biāo)函數(shù),即對目標(biāo)函數(shù)極小化:
通過極小化目標(biāo)函數(shù)可以最終得到的疾病與危險(xiǎn)因素之間的影響關(guān)系矩陣mij,實(shí)現(xiàn)對疾病危險(xiǎn)因素的挖掘預(yù)測。
通過上述挖掘方法,解決了多模態(tài)大數(shù)據(jù)的數(shù)據(jù)稀疏難題,得到了基于卷積神經(jīng)網(wǎng)絡(luò)的多模態(tài)大數(shù)據(jù)關(guān)聯(lián)性判定方法,提高了多模態(tài)大數(shù)據(jù)的分析效率。
上文中對歷史大數(shù)據(jù)中的疾病的危險(xiǎn)因素進(jìn)行了挖掘,下文中將描述特征信息的識(shí)別。作為一種優(yōu)選地實(shí)施方式,結(jié)合卷積神經(jīng)網(wǎng)絡(luò)方法,提取出疾病類型對應(yīng)的特征信息具體包括:
按照測量數(shù)據(jù)所屬模態(tài)的類型建立多種卷積核。
對卷積核進(jìn)行混合采樣得到特征信息。
將特征信息與卷積神經(jīng)網(wǎng)絡(luò)的輸出層全連接。
第一步,建立多種卷積核,局部區(qū)域感知能夠發(fā)現(xiàn)數(shù)據(jù)的一些局部特征,比如圖片上的一個(gè)角,一段弧,這些基本特征是構(gòu)成動(dòng)物視覺的基礎(chǔ);而后向傳播神經(jīng)網(wǎng)絡(luò)中,所有的像素點(diǎn)是一堆混亂的點(diǎn),相互之間的關(guān)系沒有被挖掘。卷積神經(jīng)網(wǎng)絡(luò)中每一層的由多個(gè)map組成,每個(gè)map由多個(gè)神經(jīng)單元組成,同一個(gè)map的所有神經(jīng)單元共用一個(gè)卷積核(即權(quán)重),卷積核往往代表一個(gè)特征,比如某個(gè)卷積和代表一段弧,那么把這個(gè)卷積核在整個(gè)圖片上滾一下,卷積值較大的區(qū)域就很有可能是一段弧。注意卷積核其實(shí)就是權(quán)重,我們并不需要單獨(dú)去計(jì)算一個(gè)卷積,而是一個(gè)固定大小的權(quán)重矩陣去圖像上匹配時(shí),這個(gè)操作與卷積類似,因此我們稱為卷積神經(jīng)網(wǎng)絡(luò)。實(shí)際上,后向傳播神經(jīng)網(wǎng)絡(luò)也可以看作一種特殊的卷積神經(jīng)網(wǎng)絡(luò),只是這個(gè)卷積核就是某層的所有權(quán)重,即感知區(qū)域是整個(gè)圖像。權(quán)重共享策略減少了需要訓(xùn)練的參數(shù),使得訓(xùn)練出來的模型的范化能力更強(qiáng)。
第二步,對不同的卷積核進(jìn)行混合采樣得到特征信息。采樣的目的主要是混淆特征的具體位置,因?yàn)槟硞€(gè)特征找出來后,它的具體位置已經(jīng)不重要了,我們只需要這個(gè)特征與其他的相對位置,比如一個(gè)“8”,當(dāng)我們得到了上面一個(gè)"o"時(shí),我們不需要知道它在圖像的具體位置,只需要知道它下面又是一個(gè)“o”我們就可以知道是一個(gè)'8'了,因?yàn)閳D片中"8"在圖片中偏左或者偏右都不影響我們認(rèn)識(shí)它,這種混淆具體位置的策略能對變形和扭曲的圖片進(jìn)行識(shí)別,實(shí)現(xiàn)多模態(tài)數(shù)據(jù)的互為補(bǔ)充,為精確刻畫該疾病提供基礎(chǔ)?!疤卣餍畔ⅰ敝复氖怯杏玫臄?shù)據(jù),能表征疾病信息的數(shù)據(jù)。例如記錄一個(gè)病人30天的體溫,若其中有四天體溫異常,雖然這30天都是有用數(shù)據(jù),但那四天異常體溫?cái)?shù)據(jù)就是特征信息。
第三步,實(shí)現(xiàn)混合采樣的特征信息與輸出層的全連接,并利用類似后向傳播神經(jīng)網(wǎng)絡(luò)的方式,即通過最小化殘差來調(diào)整權(quán)重和偏置。
假設(shè)我們有一個(gè)固定樣本集{(x,y)},它包含m個(gè)樣例。我們可以用批量梯度下降法來求解神經(jīng)網(wǎng)絡(luò)。具體來講,對于單個(gè)樣例(x,y),其代價(jià)函數(shù)為:
j(w,b;x,y)=||hw,b(x)-y||2
目標(biāo)是針對參數(shù)w和b來求其函數(shù)j(w,b)的最小值。為了求解神經(jīng)網(wǎng)絡(luò),我們需要將每一個(gè)參數(shù)w和b初始化為一個(gè)很小的、接近零的隨機(jī)值,之后對目標(biāo)函數(shù)使用批量梯度下降法的最優(yōu)化算法。因?yàn)閖(w,b)是一個(gè)非凸函數(shù),梯度下降法很可能會(huì)收斂到局部最優(yōu)解。但是在實(shí)際應(yīng)用中,梯度下降法通常能得到令人滿意的結(jié)果。以上公式中的第一項(xiàng)j(w,b)是一個(gè)均方差項(xiàng)。第二項(xiàng)是一個(gè)規(guī)則化項(xiàng)(也叫權(quán)重衰減項(xiàng)),其目的是減小權(quán)重的幅度,防止過度擬合。
s13:依據(jù)特征信息推導(dǎo)出歷史大數(shù)據(jù)中感染疾病類型的個(gè)體的動(dòng)態(tài)演化規(guī)律。
該步驟是基于普適化多模態(tài)大數(shù)據(jù)的特征信息對個(gè)體的動(dòng)態(tài)演化規(guī)律進(jìn)行研究。作為一種優(yōu)選地實(shí)施方式,個(gè)體的動(dòng)態(tài)演化規(guī)律具體通過如下步驟得到:采用模糊邏輯系統(tǒng)辨識(shí)法建立特征信息與疾病個(gè)體演化規(guī)律之間的模糊動(dòng)態(tài)治療模型。
模糊動(dòng)態(tài)治療模型為:
其中,θj代表模糊邏輯隸屬度函數(shù),u(t)代表了治療輸入,y(t)代表疾病個(gè)體的疾病輸出,狀態(tài)x(t)=[x1(t),...,xn(t)]t代表與疾病等級相關(guān)的n個(gè)特征信息,例如體溫、血壓、尿素等,非線性函數(shù)f(x(t))和g(x(t))代表特征信息對患病個(gè)體的影響,動(dòng)態(tài)系統(tǒng)矩陣b和d代表控制輸入對疾病個(gè)體的影響。
s14:結(jié)合個(gè)體的動(dòng)態(tài)演化規(guī)律得到實(shí)時(shí)數(shù)據(jù)的性能評估指標(biāo)。
在具體實(shí)施中,疾病性能評估指標(biāo)是評價(jià)疾病治療效果的重要參數(shù)之一,能夠描述在治療方案作用下該疾病的發(fā)展趨勢。作為一種優(yōu)選地實(shí)施方式,結(jié)合個(gè)體的動(dòng)態(tài)演化規(guī)律得到實(shí)時(shí)數(shù)據(jù)的性能評估指標(biāo)具體包括:
基于模糊動(dòng)態(tài)治療模型中的目標(biāo)函數(shù),通過迭代優(yōu)化算法建立疾病性能評估指標(biāo);
計(jì)算疾病性能評估指標(biāo)的最小值。
其中,疾病性能評估指標(biāo)具體為:
其中,j(t)為所述疾病性能評估指標(biāo)、矩陣r為治療輸入?yún)?shù)對所述疾病性能評估指標(biāo)的影響參數(shù)、u(t)為治療輸入?yún)?shù)、q為n個(gè)所述特征信息對所述疾病性能評估指標(biāo)的影響參數(shù)、s為疾病等級對所述疾病性能評估指標(biāo)的影響參數(shù)、
以上的疾病性能評價(jià)指標(biāo)涉及到未來時(shí)刻的狀態(tài)
本發(fā)明通過模糊邏輯系統(tǒng)辨識(shí)法,得到了個(gè)體的動(dòng)態(tài)演化規(guī)律,精確地描述了特征信息與疾病之間的動(dòng)態(tài)關(guān)聯(lián)關(guān)系,給出了疾病性能評估指標(biāo),解決了臨床疾病的疾病等級判別問題。
本實(shí)施例提供的針對臨床疾病的多模態(tài)大數(shù)據(jù)的數(shù)據(jù)分析方法,包括:根據(jù)確定好的疾病類型,從醫(yī)療系統(tǒng)中獲取疾病類型對應(yīng)的歷史大數(shù)據(jù);通過歷史大數(shù)據(jù)在各模態(tài)下對應(yīng)的變化率設(shè)計(jì)多密度量化器以得到實(shí)時(shí)數(shù)據(jù)的感知與獲取方法;對歷史大數(shù)據(jù)采用多模態(tài)數(shù)據(jù)挖掘方法,并結(jié)合卷積神經(jīng)網(wǎng)絡(luò)方法,提取出疾病類型對應(yīng)的特征信息;依據(jù)特征信息推導(dǎo)出歷史大數(shù)據(jù)中感染疾病類型的個(gè)體的動(dòng)態(tài)演化規(guī)律;結(jié)合個(gè)體的動(dòng)態(tài)演化規(guī)律得到實(shí)時(shí)數(shù)據(jù)的性能評估指標(biāo)。由此可見,本方法可以有效地克服傳統(tǒng)數(shù)據(jù)分析方法僅考慮疾病患者生理單模態(tài)數(shù)據(jù)的局限性,能夠綜合考慮疾病的危險(xiǎn)因素,為醫(yī)院提供更加詳盡且準(zhǔn)確的臨床診斷標(biāo)準(zhǔn),同時(shí)能給出多模態(tài)大數(shù)據(jù)與疾病的個(gè)體的動(dòng)態(tài)演化規(guī)律,預(yù)測疾病的發(fā)病趨勢,為疾病的早診斷早治療提供決策依據(jù)和技術(shù)支撐,提高了診斷效率和診療質(zhì)量。
在上述實(shí)施例的基礎(chǔ)上,作為優(yōu)選地實(shí)施方式,還包括:
基于疾病性能評估指標(biāo),利用滾動(dòng)優(yōu)化算法得到最優(yōu)的疾病治療序列。
滾動(dòng)優(yōu)化算法是利用閉環(huán)反饋的機(jī)制,將輸出結(jié)果反饋到輸入端進(jìn)行優(yōu)化調(diào)整之后再輸出,直到得到最優(yōu)的疾病治療序列。以肛腸疾病為例進(jìn)行說明,基于肛腸疾病的特征信息的反饋矯正調(diào)節(jié)模糊動(dòng)態(tài)治療模型的參數(shù),以得到肛腸疾病的預(yù)測動(dòng)態(tài)治療模型。所得到的預(yù)測動(dòng)態(tài)治療模型不僅能夠預(yù)測肛腸疾病的發(fā)展趨勢,還采用動(dòng)態(tài)治療方案替代以往的靜態(tài)治療方案,反復(fù)優(yōu)化計(jì)算并滾動(dòng)實(shí)施相應(yīng)的治療序列,有效地克服了治療過程中的不確定性,并能方便地處理特征信息之間的約束關(guān)系,達(dá)到較好的治療效果。
基于所設(shè)計(jì)的疾病性能評估指標(biāo)j(t),采用滾動(dòng)優(yōu)化算法找出如下最優(yōu)的疾病治療序列。所得到的治療序列能夠根據(jù)先驗(yàn)特征信息和治療輸入預(yù)測疾病個(gè)體未來的疾病等級,是一種優(yōu)化控制治療序列。區(qū)別于傳統(tǒng)的治療方案,滾動(dòng)優(yōu)化算法對治療時(shí)間具有嚴(yán)格的限制,是在有限時(shí)間段的滾動(dòng)優(yōu)化。圖2為本發(fā)明實(shí)施例提供的一種基于滾動(dòng)優(yōu)化算法得到最優(yōu)的疾病治療序列的原理圖。在所得最優(yōu)治療序列的作用下,最少的治療輸入能夠使得疾病性能評估指標(biāo)j(t)在最短的時(shí)間內(nèi)最小化,即疾病以最快的速度痊愈。
在上述實(shí)施例的基礎(chǔ)上,作為優(yōu)選地實(shí)施方式,還包括:
通過實(shí)時(shí)數(shù)據(jù)對疾病治療序列進(jìn)行反饋矯正。
在臨床疾病治療優(yōu)化過程中,利用實(shí)時(shí)的特征信息不斷進(jìn)行反饋矯正,通過疾病模型在線識(shí)別和治療方案在線修正的方式,調(diào)節(jié)個(gè)體的動(dòng)態(tài)演化規(guī)律中的參數(shù)用于補(bǔ)償模型預(yù)測治療誤差和外界環(huán)境對該疾病個(gè)體的干擾。定義誤差向量:
其中,e為治療誤差。
利用誤差,采樣加權(quán)的方法預(yù)測未來疾病誤差并補(bǔ)償基于模糊動(dòng)態(tài)治療模型對應(yīng)的預(yù)測模型的治療誤差,得到校正后的預(yù)測治療向量為:
由于反饋矯正是建立在個(gè)體反饋信息基礎(chǔ)上的反復(fù)決策過程,因此該動(dòng)態(tài)預(yù)測治療方案能夠得到較好的治療效果,在優(yōu)化疾病性能評估指標(biāo)的同時(shí)能夠?qū)膊€(gè)體未來的臨床疾病等級做出精準(zhǔn)地的預(yù)測。
在上述實(shí)施例的基礎(chǔ)上,作為優(yōu)選地實(shí)施方式,還包括:
依據(jù)個(gè)體的動(dòng)態(tài)演化規(guī)律建立疾病類型對應(yīng)的群體的動(dòng)態(tài)演化規(guī)律。
在具體實(shí)施中,針對個(gè)體之間的演化規(guī)律分析問題,對多個(gè)領(lǐng)域的數(shù)據(jù)進(jìn)行聯(lián)合建模,從而豐富數(shù)據(jù)避免過擬合并且對個(gè)體疾病特性進(jìn)行更準(zhǔn)確的描述。對每個(gè)領(lǐng)域的人群疾病與藥物之間的對應(yīng)模型,我們希望它們能夠盡量的相近,從而約束彼此。形式化地,擬最小化如下目標(biāo)函數(shù):
其中,ut與vt表示第t個(gè)領(lǐng)域的模型,由于多個(gè)ut的存在,人群疾病特性可以被精準(zhǔn)地建模;而最后那一個(gè)約束項(xiàng),又使得不同領(lǐng)域的信息可以通過全局模型ua進(jìn)行共享。
除了人群疾病和藥物本身的內(nèi)容數(shù)據(jù),人群之間還存在關(guān)聯(lián)。由于人群社會(huì)行為往往反應(yīng)了人群的部分特性,作為相互關(guān)聯(lián)的兩個(gè)人群,其特性往往也比較相似。通過對人群社會(huì)行為關(guān)系鏈的建模,我們可以建立更為精準(zhǔn)的人群模型u。具體來說,關(guān)系鏈數(shù)據(jù)可以用于約束相互關(guān)聯(lián)人群的人群模型。形式地,擬最小化如下的目標(biāo)函數(shù):
其中,dik表示人群間的關(guān)聯(lián)強(qiáng)度。
另一方面,也可以對沒有社會(huì)行為的“新”人群進(jìn)行建模。也就是說,一個(gè)新人群疾病的模型可以用相關(guān)聯(lián)的人群疾病模型進(jìn)行表示,從而使得模型能對新人群疾病與藥物之間的關(guān)系進(jìn)行精準(zhǔn)的預(yù)測,從而實(shí)現(xiàn)對臨床疾病的干預(yù)。
以上對本發(fā)明所提供的針對臨床疾病的多模態(tài)大數(shù)據(jù)的數(shù)據(jù)分析方法進(jìn)行了詳細(xì)介紹。說明書中各個(gè)實(shí)施例采用遞進(jìn)的方式描述,每個(gè)實(shí)施例重點(diǎn)說明的都是與其他實(shí)施例的不同之處,各個(gè)實(shí)施例之間相同相似部分互相參見即可。對于實(shí)施例公開的裝置而言,由于其與實(shí)施例公開的方法相對應(yīng),所以描述的比較簡單,相關(guān)之處參見方法部分說明即可。應(yīng)當(dāng)指出,對于本技術(shù)領(lǐng)域的普通技術(shù)人員來說,在不脫離本發(fā)明原理的前提下,還可以對本發(fā)明進(jìn)行若干改進(jìn)和修飾,這些改進(jìn)和修飾也落入本發(fā)明權(quán)利要求的保護(hù)范圍內(nèi)。
還需要說明的是,在本說明書中,術(shù)語“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、物品或者設(shè)備不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、物品或者設(shè)備所固有的要素。在沒有更多限制的情況下,由語句“包括一個(gè)……”限定的要素,并不排除在包括所述要素的過程、方法、物品或者設(shè)備中還存在另外的相同要素。