本發(fā)明涉及睡眠研究,具體涉及一種基于rescnn-bigru的自動(dòng)睡眠分期方法及系統(tǒng)。
背景技術(shù):
1、睡眠對(duì)人類的大腦和身體功能至關(guān)重要,人一生中大約有1/3的時(shí)間是在睡眠中度過的。高質(zhì)量的睡眠作為一項(xiàng)重要的生理活動(dòng),有助于人類維持正常的認(rèn)知和身體狀況,而長期睡眠剝奪或紊亂會(huì)嚴(yán)重影響身心健康,研究表明,某些疾病,如帕金森病和阿爾茨海默病,與睡眠障礙或異常密切相關(guān)。睡眠分期不僅奠定研究睡眠本質(zhì)基礎(chǔ),而且是睡眠診斷和治療的重要因素,臨床中要診斷睡眠障礙如阻塞性睡眠呼吸暫停以及罕見病如嗜睡癥等疾病,大多通過睡眠階段時(shí)長、睡眠周期、睡眠潛伏期和入睡后清醒時(shí)間等潛在的神經(jīng)生理過程,并且健康者在睡眠過程中會(huì)經(jīng)歷若干個(gè)睡眠階段的周期性循環(huán)過程,而存在睡眠問題的患者的睡眠結(jié)構(gòu)周期性不夠明顯或比較混亂。因此,進(jìn)行睡眠階段的準(zhǔn)確評(píng)分,對(duì)于提高睡眠質(zhì)量,預(yù)防睡眠障礙引起的疾病是非常重要的。
2、目前,睡眠評(píng)分是確定睡眠質(zhì)量和診斷睡眠障礙的常用方法,一般基于psg(polysomnogram,psg)進(jìn)行,被認(rèn)為是評(píng)估人類睡眠的黃金標(biāo)準(zhǔn)。psg又稱睡眠腦電圖,是通過身體不同部位的傳感器獲取的多種生物電信號(hào),其中包括腦電信號(hào)(electroencephalogram,eeg)、眼電信號(hào)(electrooculogram,eog)、心電信號(hào)(electrocardiogram,ecg)、肌電信號(hào)(electromyography,emg)等。由于睡眠腦電信號(hào)中含有人體大量的疾病相關(guān)信息以及生理相關(guān)信息。在臨床上,睡眠腦電信號(hào)可作為某種腦類疾病(如癲癇)的診斷依據(jù)。早期的睡眠分期標(biāo)準(zhǔn)是在1968年由美國的rechtschaffen和kales提出并制定的r&k標(biāo)準(zhǔn),將睡眠階段分為清醒期(awake),非快速眼期(no?rapid?eyemovement,nrem),快速眼動(dòng)期(rapid?eye?movement,rem),其中,nrem階段被細(xì)分為:s1、s2、s3、s4四個(gè)階段。隨后,美國睡眠醫(yī)學(xué)學(xué)會(huì)在此基礎(chǔ)上提出了aasm標(biāo)準(zhǔn),通過將s3和s4階段進(jìn)行合并,將睡眠階段分為w、n1、n2、n3、rem五個(gè)階段。傳統(tǒng)的睡眠階段分類是由睡眠專家將psg數(shù)據(jù)劃分為30s的片段,又稱為epoch,并觀察每一個(gè)epoch時(shí)域信號(hào)的形態(tài),結(jié)合相鄰時(shí)段的信息,將每個(gè)epoch分配到一個(gè)睡眠階段來實(shí)現(xiàn)的。這個(gè)過程不僅費(fèi)時(shí),且分類結(jié)果容易受到專家的可變性和主觀性的影響。因此有學(xué)者基于傳統(tǒng)機(jī)器學(xué)習(xí)研究了自動(dòng)睡眠階段分類方法。如zaman等使用時(shí)域和頻域特征,利用一種基于多級(jí)樹的集成模型,通過基于獎(jiǎng)勵(lì)的自適應(yīng)權(quán)重分配進(jìn)行調(diào)整,使用特征工程塊的過濾特征來對(duì)睡眠階段進(jìn)行分類,表現(xiàn)除了卓越的性能,準(zhǔn)確率為86.3%,cohen?kappa得分為0.807;satapathy等將頻率、時(shí)間和非線性統(tǒng)計(jì)特征進(jìn)行融合,利用adaboost將sleep-edfx的數(shù)據(jù)進(jìn)行五分類,準(zhǔn)確率能到96.40%?,F(xiàn)有研究證明,使用具有手工特征的機(jī)器學(xué)習(xí)方法進(jìn)行自動(dòng)睡眠評(píng)分是有效的。然而,機(jī)器學(xué)習(xí)方法的結(jié)果強(qiáng)烈依賴于手工制作的特征的類型和數(shù)據(jù)集依賴性。因此,經(jīng)訓(xùn)練的機(jī)器學(xué)習(xí)模型的性能和適用性可能取決于給定的數(shù)據(jù)集,并且存在效率低、泛化性不足等缺點(diǎn)。
3、隨著深度學(xué)習(xí)技術(shù)的不斷發(fā)展,為了提高分類效率,許多研究者利用深度學(xué)習(xí)算法,開發(fā)自動(dòng)睡眠分期模型。其中卷積神經(jīng)網(wǎng)絡(luò)(convolutional?neural?network,cnn)用于提取短期的局部時(shí)域特征,殘差網(wǎng)絡(luò)(residual?network,resnet)用以消除深度模型存在的梯度消失和梯度爆炸,長短期記憶網(wǎng)絡(luò)(long?short?term?memory?networks,lstm)、門控循環(huán)單元(gated?recurrent?unit,gru)等循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent?neuralnetwork,rnn)用于提取時(shí)序特征,學(xué)習(xí)睡眠階段之間的轉(zhuǎn)換規(guī)則,注意力機(jī)制學(xué)習(xí)時(shí)序上下文特征。如li使用卷積神經(jīng)網(wǎng)絡(luò)-單向長短時(shí)記憶網(wǎng)絡(luò)(cnn-uni-lstm)和卷積神經(jīng)網(wǎng)絡(luò)-雙向長短時(shí)記憶網(wǎng)絡(luò)(cnn-bi-lstm)的自動(dòng)睡眠分期方法分別獲得了80.7%和82.5%的分期準(zhǔn)確率,對(duì)n1期的分期準(zhǔn)確率僅為30.1%和38.9%;li利用1d-resnet塊從單通道原始腦電信號(hào)中提取多級(jí)特征,lstm網(wǎng)絡(luò)捕獲睡眠階段之間的轉(zhuǎn)換規(guī)則,總體準(zhǔn)確率為86.4%,且使用加權(quán)交叉熵?fù)p失函數(shù)來解決類別不平衡問題,從而導(dǎo)致n1階段性能的顯著改善,準(zhǔn)確率能到59.1%;liu將多尺度注意力resnet和雙向門控循環(huán)單元網(wǎng)絡(luò)(bigru)結(jié)合進(jìn)行睡眠分期,sleep-edf數(shù)據(jù)集上的分類準(zhǔn)確率84.24%,n1期召回率能到67.2%;jirakittayakorn利用不同損失函數(shù)權(quán)重的cnn模型用于特征提取,bilstm用于序列分類使用sleep-edf數(shù)據(jù)集對(duì)每個(gè)組件進(jìn)行單獨(dú)訓(xùn)練實(shí)現(xiàn)了87.02%的總體準(zhǔn)確率,n1期的f1分?jǐn)?shù)為54.23%。
4、雖然基于深度學(xué)習(xí)的整體模型大大提高了睡眠分期的效率,但仍存在幾個(gè)比較突出的問題:1)由于不同睡眠階段在整個(gè)睡眠過程中的比例嚴(yán)重不平衡,現(xiàn)有的睡眠腦電數(shù)據(jù)集中存在睡眠數(shù)據(jù)量不平衡的問題,其中n2階段占整個(gè)睡眠時(shí)間的45-55%,n3階段占20%,快速眼動(dòng)(rem)階段占25%,n1階段僅占2-5%.這種不平衡極大地影響了睡眠分期的準(zhǔn)確性;2)為了提高模型的表現(xiàn)力和泛化能力,很多學(xué)者可以通過增加網(wǎng)絡(luò)層數(shù)來獲得輸入信號(hào)的更有效的特征表達(dá),但層級(jí)過多的神經(jīng)網(wǎng)可能會(huì)造成梯度消失;3)在進(jìn)行睡眠分期時(shí),很多網(wǎng)絡(luò)對(duì)于時(shí)序特征及特異性特征深層提取不夠。
技術(shù)實(shí)現(xiàn)思路
1、針對(duì)上述存在的不足,本發(fā)明提供了一種基于rescnn-bigru的自動(dòng)睡眠分期方法及系統(tǒng),該模型通過訓(xùn)練優(yōu)化基礎(chǔ)網(wǎng)絡(luò)進(jìn)行后,證明了本發(fā)明模型在自動(dòng)睡眠分期方面的優(yōu)越性能同時(shí)可為構(gòu)建家庭睡眠監(jiān)測(cè)系統(tǒng)提供一定的方法支撐。
2、為實(shí)現(xiàn)上述目的,本發(fā)明采用如下技術(shù)手段:
3、本發(fā)明第一方面是提供一種基于rescnn-bigru的自動(dòng)睡眠分期方法,包括:
4、獲取睡眠分期用的睡眠數(shù)據(jù);
5、將睡眠數(shù)據(jù)進(jìn)行預(yù)處理;
6、將預(yù)處理后的睡眠數(shù)據(jù)輸入至預(yù)先訓(xùn)練的自動(dòng)睡眠分期模型中,得到自動(dòng)睡眠分期結(jié)果;所述預(yù)先訓(xùn)練的自動(dòng)睡眠分期模型的訓(xùn)練過程包括:
7、獲取數(shù)據(jù)集,得到少樣本類別的睡眠腦電數(shù)據(jù);將少樣本類別的睡眠腦電數(shù)據(jù)進(jìn)行數(shù)據(jù)濾波降噪處理,再通改進(jìn)的自適應(yīng)合成采樣技術(shù)方法進(jìn)行數(shù)據(jù)增強(qiáng);利用帶殘差塊的卷積神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)數(shù)據(jù)特征表示,再通過兩層雙向門控循環(huán)單元網(wǎng)絡(luò)挖掘深層時(shí)序信息,確定睡眠之間的相關(guān)性,對(duì)睡眠數(shù)據(jù)階段特征的自動(dòng)學(xué)習(xí)和睡眠周期提取,得到睡眠分期結(jié)果,訓(xùn)練和測(cè)試得到所述預(yù)先訓(xùn)練的自動(dòng)睡眠分期模型。
8、作為本發(fā)明進(jìn)一步改進(jìn),所述數(shù)據(jù)集采用sleep-edf數(shù)據(jù)集,sleep-edf數(shù)據(jù)集中記錄的每個(gè)時(shí)期由臨床醫(yī)生根據(jù)r&k規(guī)則手動(dòng)標(biāo)記為w、n1、n2、n3、n4、rem、運(yùn)動(dòng)和未知階段;psg數(shù)據(jù)包括雙通道eeg、單通道eog、單通道emg和事件標(biāo)記。
9、作為本發(fā)明進(jìn)一步改進(jìn),所述數(shù)據(jù)濾波降噪處理,包括:
10、使用sc數(shù)據(jù)集中單通道腦電fpz-cz;根據(jù)aasm判斷規(guī)則,將n3和n4時(shí)段合并為n3階段數(shù)據(jù);排除movement和unknown數(shù)據(jù);截取睡眠之前和之后包含預(yù)設(shè)時(shí)間的睡眠腦電信號(hào);使用巴特沃斯帶通濾波器對(duì)睡眠腦電信號(hào)進(jìn)行濾波處理;
11、再利用小波包降噪技術(shù)對(duì)睡眠腦電信號(hào)進(jìn)行降噪處理,通過小波變換將信號(hào)分解到不同的頻率層次上,然后對(duì)各層次的小波系數(shù)進(jìn)行閾值處理以去除噪聲,最后通過逆變換重構(gòu)出去噪后的信號(hào);使用多貝西小波函數(shù)族的db4小波基函數(shù)進(jìn)行基于數(shù)據(jù)長度和小波長度的適當(dāng)層數(shù)作為默認(rèn)層數(shù)分解的降噪方案,并且通過軟閥值函數(shù)來將其修正;
12、處理后,每一段時(shí)間將信號(hào)切片到相應(yīng)的睡眠階段,形成相應(yīng)階段的訓(xùn)練數(shù)據(jù)集;
13、所述通改進(jìn)的自適應(yīng)合成采樣技術(shù)方法進(jìn)行數(shù)據(jù)增強(qiáng),包括:
14、采用自適應(yīng)合成采樣技術(shù)對(duì)樣本較少的數(shù)據(jù)進(jìn)行增強(qiáng)處理,將不同少數(shù)樣本學(xué)習(xí)的困難程度按權(quán)重分布,合成更多的訓(xùn)練數(shù)據(jù)。
15、作為本發(fā)明進(jìn)一步改進(jìn),所述數(shù)據(jù)增強(qiáng)處理具體包括:
16、計(jì)算合成的樣本數(shù)gs,ms、ml分別為少數(shù)類樣本的數(shù)量和多數(shù)類樣本的數(shù)量,ms≤ml,ms+ml=m;β∈(0,1);
17、gs=(ml-ms)β(1)
18、對(duì)于每個(gè)少類樣本,通過歐幾里得距離計(jì)算k個(gè)鄰居,并且由ri表示當(dāng)前鄰居中包含的多數(shù)類樣本的比例,其中k表示當(dāng)前鄰居的數(shù)量,k表示當(dāng)前鄰居中的多數(shù)類樣本;
19、ri=k/k(2)
20、根據(jù)g計(jì)算每個(gè)少數(shù)樣本需要合成的樣本數(shù),根據(jù)式(4)合成樣本,并且xzi表示xi的k個(gè)鄰居中的隨機(jī)少數(shù)樣本,λ∈(0,1);
21、g=g×ri(3)
22、zi=xi+(xzi-xi)×λ(4)
23、其中,g表示要合成的數(shù)量,zi表示合成的新樣本,xi表示當(dāng)前少數(shù)樣本。
24、作為本發(fā)明進(jìn)一步改進(jìn),所述帶殘差塊的卷積神經(jīng)網(wǎng)絡(luò)在網(wǎng)絡(luò)架構(gòu)中加入了殘差網(wǎng)絡(luò);卷積神經(jīng)網(wǎng)絡(luò)主要通過1×50大卷積核層、1×8最大池化層、3個(gè)1×8小卷積核層以及1×4最大池化,并引入了隨機(jī)失活技術(shù)和梯度裁剪技術(shù)。
25、作為本發(fā)明進(jìn)一步改進(jìn),所述雙向門控循環(huán)單元網(wǎng)絡(luò)由兩個(gè)方向相反的單向gru組成,加入反向傳播機(jī)制,在t時(shí)刻的輸出由前向隱層和后向?qū)訝顟B(tài)信息加權(quán)求和得到:
26、
27、
28、式中,xt為t時(shí)刻的狀態(tài)信息,和分別為t-1時(shí)刻保留的前向和后向狀態(tài)特征,wt和vt分別為前向隱層和后向隱層狀態(tài)信息對(duì)應(yīng)的權(quán)重,b為偏置項(xiàng);bigru結(jié)構(gòu)包括兩層雙向gru,分別從前后學(xué)習(xí)序列依賴信息,同時(shí)每層bigru都添加了dropout正則化層。
29、作為本發(fā)明進(jìn)一步改進(jìn),所述訓(xùn)練和測(cè)試得到所述預(yù)先訓(xùn)練的自動(dòng)睡眠分期模型中,利用eeg信號(hào)的fpz-cz通道訓(xùn)練和測(cè)試;在訓(xùn)練時(shí),使用帶有權(quán)重衰減的自適應(yīng)梯度方法對(duì)網(wǎng)絡(luò)權(quán)重值進(jìn)行更新優(yōu)化,設(shè)置自適應(yīng)調(diào)度學(xué)習(xí)率動(dòng)態(tài)地調(diào)整模型訓(xùn)練過程中的學(xué)習(xí)率,使得在訓(xùn)練初期快速收斂,在訓(xùn)練后期保持較小的學(xué)習(xí)率以細(xì)致調(diào)整模型參數(shù)。
30、本發(fā)明第二個(gè)方面是提供一種基于rescnn-bigru的自動(dòng)睡眠分期方法系統(tǒng),包括:
31、獲取模塊,用于獲取睡眠分期用的睡眠數(shù)據(jù);
32、預(yù)處理模塊,用于將睡眠數(shù)據(jù)進(jìn)行預(yù)處理;
33、分期模塊,用于將預(yù)處理后的睡眠數(shù)據(jù)輸入至預(yù)先訓(xùn)練的自動(dòng)睡眠分期模型中,得到自動(dòng)睡眠分期結(jié)果;所述預(yù)先訓(xùn)練的自動(dòng)睡眠分期模型的訓(xùn)練過程包括:
34、獲取數(shù)據(jù)集,得到少樣本類別的睡眠腦電數(shù)據(jù);將少樣本類別的睡眠腦電數(shù)據(jù)進(jìn)行數(shù)據(jù)濾波降噪處理,再通改進(jìn)的自適應(yīng)合成采樣技術(shù)方法進(jìn)行數(shù)據(jù)增強(qiáng);利用帶殘差塊的卷積神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)數(shù)據(jù)特征表示,再通過兩層雙向門控循環(huán)單元網(wǎng)絡(luò)挖掘深層時(shí)序信息,確定睡眠之間的相關(guān)性,對(duì)睡眠數(shù)據(jù)階段特征的自動(dòng)學(xué)習(xí)和睡眠周期提取,得到睡眠分期結(jié)果,訓(xùn)練和測(cè)試得到所述預(yù)先訓(xùn)練的自動(dòng)睡眠分期模型。
35、本發(fā)明第三個(gè)方面是提供一種電子設(shè)備,其特征在于,包括存儲(chǔ)器、處理器以及存儲(chǔ)在所述存儲(chǔ)器中并可在所述處理器上運(yùn)行的計(jì)算機(jī)程序,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)所述基于rescnn-bigru的自動(dòng)睡眠分期方法。
36、本發(fā)明第四個(gè)方面是提供一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)所述基于rescnn-bigru的自動(dòng)睡眠分期方法。
37、與現(xiàn)有技術(shù)相比,本發(fā)明具有如下有益效果:
38、本發(fā)明提出一種基于睡眠eeg信號(hào)數(shù)據(jù)增強(qiáng)的自動(dòng)睡眠分期模型。該模型使用巴特沃斯帶通濾波技術(shù)、小波包降噪技術(shù)和改進(jìn)的adasyn技術(shù)對(duì)eeg數(shù)據(jù)進(jìn)行預(yù)處理,利用帶有殘差網(wǎng)絡(luò)的cnn提取數(shù)據(jù)間的時(shí)頻域特征,結(jié)合bigru提取數(shù)據(jù)間前后時(shí)間序列相關(guān)性信息特征,充分提取用于睡眠分期的eeg信號(hào)特征。模型通過訓(xùn)練優(yōu)化基礎(chǔ)網(wǎng)絡(luò)進(jìn)行后,證明了本發(fā)明模型在自動(dòng)睡眠分期方面的優(yōu)越性能同時(shí)可為構(gòu)建家庭睡眠監(jiān)測(cè)系統(tǒng)提供一定的方法支撐。