專利名稱:在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓的方法
技術(shù)領(lǐng)域:
本發(fā)明涉及信息技術(shù)行業(yè)圖像處理技術(shù)領(lǐng)域,具體地涉及ー種在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓的方法。
背景技術(shù):
目前人類對(duì)發(fā)音生理機(jī)理尚不明確,其中ー個(gè)重要原因是語(yǔ)音與器官間的運(yùn)動(dòng)關(guān)系缺乏有效的觀測(cè)和分析工具。目前針對(duì)口腔發(fā)音動(dòng)態(tài)圖像研究的常用輔助手段有X光影像、超聲圖像及核磁共振突圖像等。這些醫(yī)學(xué)圖像具有分辨率低、成像模糊、噪聲嚴(yán)重的特點(diǎn)。盡管國(guó)內(nèi)外研究人員提出了很多從醫(yī)學(xué)圖像中自動(dòng)提取和跟蹤人體器官運(yùn)動(dòng)輪廓的方法,但是由于人的發(fā)音器官種類較多、運(yùn)動(dòng)靈活多變、并且在視頻成圖像中相互遮擋嚴(yán)重,會(huì)出現(xiàn)幅度較寬的虛假輪廓等情況。申請(qǐng)人:發(fā)現(xiàn)傳統(tǒng)的圖像分析技術(shù)不適于低質(zhì)量醫(yī)學(xué)影像中的發(fā)音器官輪廓自動(dòng)獲取,從低質(zhì)量醫(yī)學(xué)圖像中自動(dòng)獲取發(fā)音器官輪廓目前任然是語(yǔ)音與視覺(jué)計(jì)算中的ー個(gè)挑戰(zhàn),特別是針對(duì)發(fā)音中的ー些舌位運(yùn)動(dòng)細(xì)節(jié)。
發(fā)明內(nèi)容
(一 )要解決的技術(shù)問(wèn)題為解決上述的一個(gè)或多個(gè)問(wèn)題,本發(fā)明提供了ー種在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓的方法。( ニ )技術(shù)方案根據(jù)本發(fā)明的ー個(gè)方面,提供了ー種在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓的方法。該 方法包括對(duì)于醫(yī)學(xué)圖像,利用唇部與背景的自動(dòng)分割閾值,對(duì)醫(yī)學(xué)影像中嘴唇與背景區(qū)域進(jìn)行ニ值化,得到唇部輪廓;在唇部輪廓包含的面部范圍內(nèi),提取上牙齒輪廓、下牙齒輪廓、上頜輪廓和下頜輪廓;針對(duì)上頜輪廓和下頜輪廓之間圖像區(qū)域,獲取舌位輪廓的可靠邊緣點(diǎn);以及由舌位輪廓的可靠邊緣點(diǎn)擬合出舌位邊緣輪廓。(三)有益效果從上述技術(shù)方案可以看出,本發(fā)明在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓的方法具有以下有益效果(I)本發(fā)明能自動(dòng)從影像背景中分割出發(fā)音人頭部、器官區(qū)域,整個(gè)過(guò)程自動(dòng)完成,無(wú)需人工交互;(2)本發(fā)明針對(duì)低質(zhì)量醫(yī)學(xué)影像中舌位成像模糊、噪聲和遮擋嚴(yán)重的情況,能很好獲取發(fā)音過(guò)程的舌位輪廓及舌位運(yùn)動(dòng)細(xì)節(jié);(3)本發(fā)明能自動(dòng)同時(shí)獲取包括唇、上下頜、牙齒、舌的運(yùn)動(dòng)輪廓,有利于直觀觀測(cè)和分析發(fā)音過(guò)程中的各發(fā)音器官運(yùn)動(dòng)特征。
圖I為本發(fā)明實(shí)施例在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓方法的流程圖。圖2是發(fā)音器官X光圖像;圖3是對(duì)于圖2所示X光圖像,由本發(fā)明實(shí)施例在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓方法中步驟A和步驟B得到的上唇輪廓、下唇輪廓、上牙齒輪廓、下牙齒輪廓、上頜輪廓、下頜輪廓及舌位初步輪廓的示意圖;圖4是本發(fā)明實(shí)施例在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓方法中擬合下頜輪廓曲線的不意圖;圖5是本發(fā)明在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓方法中擬合舌位輪廓的流程圖;圖6是本發(fā)明在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓方法中獲取舌位輪廓的可靠邊緣點(diǎn)步驟中0度方向的區(qū)域最大梯度估計(jì)的11X11大小的一個(gè)模板示意圖;
圖7是本發(fā)明在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓方法中基于隨機(jī)抽取一致性檢驗(yàn)(RANSAC)和過(guò)控制點(diǎn)B樣條曲線擬合的舌部輪廓的示意圖;圖8是說(shuō)話人發(fā)“Ban”音的X光圖像序列中,利用本發(fā)明實(shí)施例在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓方法所提取的上唇、下唇、上牙齒、下牙齒、上頜、下頜及舌位輪廓的效果圖;圖9是利用本發(fā)明實(shí)施例在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓方法提取超聲圖像中舌位輪廓的效果圖;圖10是本發(fā)明實(shí)施例在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓方法提取核磁共振圖像中舌部輪廓的效果圖。
具體實(shí)施例方式為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚明白,以下結(jié)合具體實(shí)施例,并參照附圖,對(duì)本發(fā)明進(jìn)ー步詳細(xì)說(shuō)明。需要說(shuō)明的是,在附圖或說(shuō)明書(shū)描述中,相似或相同的部分都使用相同的圖號(hào)。且在附圖中,以簡(jiǎn)化或是方便標(biāo)示。再者,附圖中未繪示或描述的實(shí)現(xiàn)方式,為所屬技術(shù)領(lǐng)域中普通技術(shù)人員所知的形式。另外,雖然本文可提供包含特定值的參數(shù)的示范,但應(yīng)了解,參數(shù)無(wú)需確切等于相應(yīng)的值,而是可在可接受的誤差容限或設(shè)計(jì)約束內(nèi)近似于相應(yīng)的值。本發(fā)明基于傳統(tǒng)的圖像處理方法,在發(fā)音器官輪廓提取與跟蹤的過(guò)程中,采用灰度直方圖及最大類間自動(dòng)閾值提取方法,實(shí)現(xiàn)對(duì)嘴唇輪廓的自動(dòng)提取;采用自適應(yīng)邊緣梯度方法,結(jié)合已知形狀的剛體輪廓投影匹配和曲線擬合技術(shù),提取出牙齒、上下頜輪廓;利用最大梯度估計(jì)的模糊圖像邊緣檢測(cè)算法,獲取發(fā)音過(guò)程中ロ腔內(nèi)部舌位邊緣點(diǎn),并結(jié)合隨機(jī)抽樣一致性驗(yàn)證(RANSAC)算法和B樣條曲線擬合方法,去除錯(cuò)誤的舌位邊緣輪廓點(diǎn),采用通過(guò)控制點(diǎn)的B樣條曲線技術(shù),擬合出發(fā)音過(guò)程的舌位輪廓。在本發(fā)明的一個(gè)示例性實(shí)施例中,提供了ー種在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓的方法。圖I為本發(fā)明實(shí)施例在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓方法的流程圖。如圖I所示,該方法包括步驟A,對(duì)于醫(yī)學(xué)圖像,利用唇部與背景的自動(dòng)分割閾值k,對(duì)醫(yī)學(xué)影像中嘴唇與背景區(qū)域進(jìn)行ニ值化,得到唇部輪廓;如圖2所示,嘴唇位于發(fā)音器官的外側(cè)部位,由于其背景為白色,在邊緣模糊處找到合適的灰度閾值即可區(qū)分出唇部輪廓。
采用以下公式,基于灰度直方圖的最大類間方差方法獲取醫(yī)學(xué)影像中唇部與背景的自動(dòng)分割閾值
權(quán)利要求
1.ー種在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓的方法,包括 對(duì)于醫(yī)學(xué)圖像,利用唇部與背景的自動(dòng)分割閾值,對(duì)所述醫(yī)學(xué)影像中嘴唇與背景區(qū)域進(jìn)行ニ值化,得到唇部輪廓; 在所述唇部輪廓包含的面部范圍內(nèi),提取上牙齒輪廓、下牙齒輪廓、上頜輪廓和下頜輪廓; 針對(duì)所述上頜輪廓和所述下頜輪廓之間圖像區(qū)域,獲取舌位輪廓的可靠邊緣點(diǎn);以及 由所述舌位輪廓的可靠邊緣點(diǎn)擬合出舌位邊緣輪廓。
2.根據(jù)權(quán)利要求I所述的在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓的方法,其中,采用以下公式,基于灰度直方圖的最大類間方差方法獲取醫(yī)學(xué)影像中唇部與背景的自動(dòng)分割閾值
3.根據(jù)權(quán)利要求I所述的在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓的方法,其中,所述提取上牙齒輪廓、下牙齒輪廓、上頜輪廓和下頜輪廓的步驟包括 針對(duì)所述唇部輪廓范圍內(nèi)的面部區(qū)域求出自動(dòng)分割閾值,得到上牙齒輪廓,下牙齒輪廓及下頜初步輪廓; 由所述下頜初步輪廓,采用剛體輪廓匹配和曲線擬合方法得到所述下頜輪廓; 對(duì)于所述上牙齒輪廓朝向頭內(nèi)部方向的口腔和鼻腔區(qū)域,計(jì)算出上頜區(qū)域的邊緣點(diǎn);以及 根據(jù)所述上牙齒輪廓的尖部以及所述上頜區(qū)域的邊緣點(diǎn),擬合所述上頜輪廓。
4.根據(jù)權(quán)利要求3所述的在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓的方法,其中,所述針對(duì)唇部輪廓范圍內(nèi)的面部區(qū)域求出自動(dòng)分割閾值,得到上牙齒輪廓,下牙齒輪廓及下頜初步輪廓的步驟包括 計(jì)算所述唇部輪廓范圍內(nèi)的面部區(qū)域的梯度圖像,把該梯度圖像歸一化到
之間,獲得灰度圖像I ; 獲取該灰度圖像I的直方圖,得到該直方圖的最大類間方差閾值;以及以該最大類間方差閾值對(duì)所述唇部輪廓范圍內(nèi)的面部區(qū)域進(jìn)行ニ值化,落在(r-255]范圍內(nèi)的圖像輪廓為上牙齒、下牙齒和下頜的初步輪廓。
在所述落在(r-255]范圍內(nèi)的圖像輪廓中,與其他器官輪廓分開(kāi)的部分為所述上牙齒的輪廓,剰余的部分為下牙齒和下頜的初步輪廓; 在所述下牙齒和下頜的初步輪廓中,下巴上部的輪廓為下牙齒輪廓,剰余的部分為所述下頜初步輪廓。
5.根據(jù)權(quán)利要求4所述的在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓的方法,其中,采用以下公式,得到直方圖的最大類間方差閾值
6.根據(jù)權(quán)利要求3所述的在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓的方法,其中,對(duì)于所述上牙齒輪廓朝向頭內(nèi)部方向的口腔和鼻腔區(qū)域,采用Sobel算子計(jì)算出上頜區(qū)域的邊緣點(diǎn)。
7.根據(jù)權(quán)利要求3所述的在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓的方法,其中,根據(jù)上牙齒輪廓的尖部以及上頜區(qū)域的邊緣點(diǎn),采用B樣條曲線方法擬合上頜輪廓。
8.根據(jù)權(quán)利要求I所述的在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓的方法,其中,所述針對(duì)上頜輪廓和所述下頜輪廓之間圖像區(qū)域,獲取舌位輪廓的可靠邊緣點(diǎn)的步驟包括 對(duì)所述上頜輪廓和所述下頜輪廓之間口腔區(qū)域部分圖像進(jìn)行銳化處理,使亮的區(qū)域更亮,暗的區(qū)域更暗; 采用0度及45度方向的區(qū)域最大梯度估計(jì)算法,在口腔區(qū)域部分的灰度圖像中計(jì)算舌部運(yùn)動(dòng)區(qū)域內(nèi)各像素的梯度;以及 取舌部運(yùn)動(dòng)區(qū)域最大梯度值的2/3作為閾值,梯度大于該閾值的像素組成舌位初步邊緣輪廓。
9.根據(jù)權(quán)利要求8所述的在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓的方法,其中,采用以下公式,計(jì)算舌部運(yùn)動(dòng)區(qū)域中像素的梯度 M(x, y) = I (X, y) *Mi+a *1 (X, y) *M2 其中,I(x,y)為舌部區(qū)域圖像某像素,M1為0度的梯度算子,M2為45度算子,a為加權(quán)系數(shù),這里取值為0.5。最后,M(x,y)即為舌部區(qū)域的邊緣圖像,M(x,y)中值越大的像素越可能是舌的邊緣。
10.根據(jù)權(quán)利要求8所述的在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓的方法,其中,所述取舌部運(yùn)動(dòng)區(qū)域最大梯度值的2/3作為閾值,梯度大于該閾值的像素組成初歩舌位邊緣輪廓的步驟之后還包括 以所述舌位邊緣輪廓作為初步舌位輪廓,采用兩階段的中值過(guò)濾方法對(duì)進(jìn)行錯(cuò)誤點(diǎn)排除。
11.根據(jù)權(quán)利要求I所述的在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓的方法,其中,所述由舌位輪廓的可靠邊緣點(diǎn)擬合出舌位邊緣輪廓包括 對(duì)于每個(gè)舌位輪廓的可靠邊緣點(diǎn),執(zhí)行以下步驟n次,得到n個(gè)縱向距離采用通過(guò)控制點(diǎn)的B樣條曲線方法,隨機(jī)抽取6個(gè)點(diǎn)擬合出曲線,計(jì)算出每個(gè)點(diǎn)到曲線的縱向距離;對(duì)于每個(gè)舌位輪廓的可靠邊緣點(diǎn),計(jì)算隨機(jī)抽樣得到的35個(gè)縱向距離的平均值;去除縱向距離平均值最大的2 3個(gè)舌位輪廓的可靠邊緣點(diǎn);以及利用剰余的舌位輪廓的可靠邊緣點(diǎn),采用通過(guò)控制點(diǎn)的B樣條曲線方法擬合出舌位邊緣輪廓。
12.根據(jù)權(quán)利要求I至11中任一項(xiàng)所述的在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓的方法,其中,所述醫(yī)學(xué)圖像為X光圖像、超聲圖像或核磁共振圖像。
全文摘要
本發(fā)明提供了一種在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓的方法。該方法包括對(duì)于醫(yī)學(xué)圖像,利用唇部與背景的自動(dòng)分割閾值,對(duì)醫(yī)學(xué)影像中嘴唇與背景區(qū)域進(jìn)行二值化,得到唇部輪廓;在唇部輪廓包含的面部范圍內(nèi),提取上牙齒輪廓、下牙齒輪廓、上頜輪廓和下頜輪廓;針對(duì)上頜輪廓和下頜輪廓之間圖像區(qū)域,獲取舌位輪廓的可靠邊緣點(diǎn);以及由舌位輪廓的可靠邊緣點(diǎn)擬合出舌位邊緣輪廓。本發(fā)明能自動(dòng)從影像背景中分割出發(fā)音人頭部、器官區(qū)域,整個(gè)過(guò)程自動(dòng)完成,無(wú)需人工交互。
文檔編號(hào)G06T7/00GK102831606SQ20121027218
公開(kāi)日2012年12月19日 申請(qǐng)日期2012年8月1日 優(yōu)先權(quán)日2012年8月1日
發(fā)明者陶建華, 楊明浩, 張大偉 申請(qǐng)人:中國(guó)科學(xué)院自動(dòng)化研究所