在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓的方法

文檔序號(hào)：6374325閱讀：383來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

專利名稱：在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓的方法
技術(shù)領(lǐng)域：
本發(fā)明涉及信息技術(shù)行業(yè)圖像處理技術(shù)領(lǐng)域，具體地涉及ー種在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓的方法。
背景技術(shù)：
目前人類對(duì)發(fā)音生理機(jī)理尚不明確，其中ー個(gè)重要原因是語(yǔ)音與器官間的運(yùn)動(dòng)關(guān)系缺乏有效的觀測(cè)和分析工具。目前針對(duì)口腔發(fā)音動(dòng)態(tài)圖像研究的常用輔助手段有X光影像、超聲圖像及核磁共振突圖像等。這些醫(yī)學(xué)圖像具有分辨率低、成像模糊、噪聲嚴(yán)重的特點(diǎn)。盡管國(guó)內(nèi)外研究人員提出了很多從醫(yī)學(xué)圖像中自動(dòng)提取和跟蹤人體器官運(yùn)動(dòng)輪廓的方法，但是由于人的發(fā)音器官種類較多、運(yùn)動(dòng)靈活多變、并且在視頻成圖像中相互遮擋嚴(yán)重，會(huì)出現(xiàn)幅度較寬的虛假輪廓等情況。申請(qǐng)人:發(fā)現(xiàn)傳統(tǒng)的圖像分析技術(shù)不適于低質(zhì)量醫(yī)學(xué)影像中的發(fā)音器官輪廓自動(dòng)獲取，從低質(zhì)量醫(yī)學(xué)圖像中自動(dòng)獲取發(fā)音器官輪廓目前任然是語(yǔ)音與視覺(jué)計(jì)算中的ー個(gè)挑戰(zhàn)，特別是針對(duì)發(fā)音中的ー些舌位運(yùn)動(dòng)細(xì)節(jié)。

發(fā)明內(nèi)容
(一 )要解決的技術(shù)問(wèn)題為解決上述的一個(gè)或多個(gè)問(wèn)題，本發(fā)明提供了ー種在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓的方法。( ニ )技術(shù)方案根據(jù)本發(fā)明的ー個(gè)方面，提供了ー種在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓的方法。該方法包括對(duì)于醫(yī)學(xué)圖像，利用唇部與背景的自動(dòng)分割閾值，對(duì)醫(yī)學(xué)影像中嘴唇與背景區(qū)域進(jìn)行ニ值化，得到唇部輪廓；在唇部輪廓包含的面部范圍內(nèi)，提取上牙齒輪廓、下牙齒輪廓、上頜輪廓和下頜輪廓；針對(duì)上頜輪廓和下頜輪廓之間圖像區(qū)域，獲取舌位輪廓的可靠邊緣點(diǎn)；以及由舌位輪廓的可靠邊緣點(diǎn)擬合出舌位邊緣輪廓。(三)有益效果從上述技術(shù)方案可以看出，本發(fā)明在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓的方法具有以下有益效果(I)本發(fā)明能自動(dòng)從影像背景中分割出發(fā)音人頭部、器官區(qū)域，整個(gè)過(guò)程自動(dòng)完成，無(wú)需人工交互；(2)本發(fā)明針對(duì)低質(zhì)量醫(yī)學(xué)影像中舌位成像模糊、噪聲和遮擋嚴(yán)重的情況，能很好獲取發(fā)音過(guò)程的舌位輪廓及舌位運(yùn)動(dòng)細(xì)節(jié)；(3)本發(fā)明能自動(dòng)同時(shí)獲取包括唇、上下頜、牙齒、舌的運(yùn)動(dòng)輪廓，有利于直觀觀測(cè)和分析發(fā)音過(guò)程中的各發(fā)音器官運(yùn)動(dòng)特征。

圖I為本發(fā)明實(shí)施例在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓方法的流程圖。圖2是發(fā)音器官X光圖像；圖3是對(duì)于圖2所示X光圖像，由本發(fā)明實(shí)施例在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓方法中步驟A和步驟B得到的上唇輪廓、下唇輪廓、上牙齒輪廓、下牙齒輪廓、上頜輪廓、下頜輪廓及舌位初步輪廓的示意圖；圖4是本發(fā)明實(shí)施例在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓方法中擬合下頜輪廓曲線的不意圖；圖5是本發(fā)明在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓方法中擬合舌位輪廓的流程圖；圖6是本發(fā)明在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓方法中獲取舌位輪廓的可靠邊緣點(diǎn)步驟中0度方向的區(qū)域最大梯度估計(jì)的11X11大小的一個(gè)模板示意圖；
圖7是本發(fā)明在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓方法中基于隨機(jī)抽取一致性檢驗(yàn)(RANSAC)和過(guò)控制點(diǎn)B樣條曲線擬合的舌部輪廓的示意圖；圖8是說(shuō)話人發(fā)“Ban”音的X光圖像序列中，利用本發(fā)明實(shí)施例在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓方法所提取的上唇、下唇、上牙齒、下牙齒、上頜、下頜及舌位輪廓的效果圖；圖9是利用本發(fā)明實(shí)施例在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓方法提取超聲圖像中舌位輪廓的效果圖；圖10是本發(fā)明實(shí)施例在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓方法提取核磁共振圖像中舌部輪廓的效果圖。
具體實(shí)施例方式為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚明白，以下結(jié)合具體實(shí)施例，并參照附圖，對(duì)本發(fā)明進(jìn)ー步詳細(xì)說(shuō)明。需要說(shuō)明的是，在附圖或說(shuō)明書(shū)描述中，相似或相同的部分都使用相同的圖號(hào)。且在附圖中，以簡(jiǎn)化或是方便標(biāo)示。再者，附圖中未繪示或描述的實(shí)現(xiàn)方式，為所屬技術(shù)領(lǐng)域中普通技術(shù)人員所知的形式。另外，雖然本文可提供包含特定值的參數(shù)的示范，但應(yīng)了解，參數(shù)無(wú)需確切等于相應(yīng)的值，而是可在可接受的誤差容限或設(shè)計(jì)約束內(nèi)近似于相應(yīng)的值。本發(fā)明基于傳統(tǒng)的圖像處理方法，在發(fā)音器官輪廓提取與跟蹤的過(guò)程中，采用灰度直方圖及最大類間自動(dòng)閾值提取方法，實(shí)現(xiàn)對(duì)嘴唇輪廓的自動(dòng)提取；采用自適應(yīng)邊緣梯度方法，結(jié)合已知形狀的剛體輪廓投影匹配和曲線擬合技術(shù)，提取出牙齒、上下頜輪廓；利用最大梯度估計(jì)的模糊圖像邊緣檢測(cè)算法，獲取發(fā)音過(guò)程中ロ腔內(nèi)部舌位邊緣點(diǎn)，并結(jié)合隨機(jī)抽樣一致性驗(yàn)證(RANSAC)算法和B樣條曲線擬合方法，去除錯(cuò)誤的舌位邊緣輪廓點(diǎn)，采用通過(guò)控制點(diǎn)的B樣條曲線技術(shù)，擬合出發(fā)音過(guò)程的舌位輪廓。在本發(fā)明的一個(gè)示例性實(shí)施例中，提供了ー種在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓的方法。圖I為本發(fā)明實(shí)施例在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓方法的流程圖。如圖I所示，該方法包括步驟A，對(duì)于醫(yī)學(xué)圖像，利用唇部與背景的自動(dòng)分割閾值k，對(duì)醫(yī)學(xué)影像中嘴唇與背景區(qū)域進(jìn)行ニ值化，得到唇部輪廓；如圖2所示，嘴唇位于發(fā)音器官的外側(cè)部位，由于其背景為白色，在邊緣模糊處找到合適的灰度閾值即可區(qū)分出唇部輪廓。
采用以下公式，基于灰度直方圖的最大類間方差方法獲取醫(yī)學(xué)影像中唇部與背景的自動(dòng)分割閾值
權(quán)利要求
1.ー種在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓的方法，包括對(duì)于醫(yī)學(xué)圖像，利用唇部與背景的自動(dòng)分割閾值，對(duì)所述醫(yī)學(xué)影像中嘴唇與背景區(qū)域進(jìn)行ニ值化，得到唇部輪廓；在所述唇部輪廓包含的面部范圍內(nèi)，提取上牙齒輪廓、下牙齒輪廓、上頜輪廓和下頜輪廓；針對(duì)所述上頜輪廓和所述下頜輪廓之間圖像區(qū)域，獲取舌位輪廓的可靠邊緣點(diǎn)；以及由所述舌位輪廓的可靠邊緣點(diǎn)擬合出舌位邊緣輪廓。
2.根據(jù)權(quán)利要求I所述的在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓的方法，其中，采用以下公式，基于灰度直方圖的最大類間方差方法獲取醫(yī)學(xué)影像中唇部與背景的自動(dòng)分割閾值
3.根據(jù)權(quán)利要求I所述的在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓的方法，其中，所述提取上牙齒輪廓、下牙齒輪廓、上頜輪廓和下頜輪廓的步驟包括針對(duì)所述唇部輪廓范圍內(nèi)的面部區(qū)域求出自動(dòng)分割閾值，得到上牙齒輪廓，下牙齒輪廓及下頜初步輪廓；由所述下頜初步輪廓，采用剛體輪廓匹配和曲線擬合方法得到所述下頜輪廓；對(duì)于所述上牙齒輪廓朝向頭內(nèi)部方向的口腔和鼻腔區(qū)域，計(jì)算出上頜區(qū)域的邊緣點(diǎn)；以及根據(jù)所述上牙齒輪廓的尖部以及所述上頜區(qū)域的邊緣點(diǎn)，擬合所述上頜輪廓。
4.根據(jù)權(quán)利要求3所述的在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓的方法，其中，所述針對(duì)唇部輪廓范圍內(nèi)的面部區(qū)域求出自動(dòng)分割閾值，得到上牙齒輪廓，下牙齒輪廓及下頜初步輪廓的步驟包括計(jì)算所述唇部輪廓范圍內(nèi)的面部區(qū)域的梯度圖像，把該梯度圖像歸一化到
之間，獲得灰度圖像I ; 獲取該灰度圖像I的直方圖，得到該直方圖的最大類間方差閾值；以及以該最大類間方差閾值對(duì)所述唇部輪廓范圍內(nèi)的面部區(qū)域進(jìn)行ニ值化，落在(r-255]范圍內(nèi)的圖像輪廓為上牙齒、下牙齒和下頜的初步輪廓。
在所述落在(r-255]范圍內(nèi)的圖像輪廓中，與其他器官輪廓分開(kāi)的部分為所述上牙齒的輪廓，剰余的部分為下牙齒和下頜的初步輪廓；在所述下牙齒和下頜的初步輪廓中，下巴上部的輪廓為下牙齒輪廓，剰余的部分為所述下頜初步輪廓。
5.根據(jù)權(quán)利要求4所述的在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓的方法，其中，采用以下公式，得到直方圖的最大類間方差閾值
6.根據(jù)權(quán)利要求3所述的在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓的方法，其中，對(duì)于所述上牙齒輪廓朝向頭內(nèi)部方向的口腔和鼻腔區(qū)域，采用Sobel算子計(jì)算出上頜區(qū)域的邊緣點(diǎn)。
7.根據(jù)權(quán)利要求3所述的在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓的方法，其中，根據(jù)上牙齒輪廓的尖部以及上頜區(qū)域的邊緣點(diǎn)，采用B樣條曲線方法擬合上頜輪廓。
8.根據(jù)權(quán)利要求I所述的在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓的方法，其中，所述針對(duì)上頜輪廓和所述下頜輪廓之間圖像區(qū)域，獲取舌位輪廓的可靠邊緣點(diǎn)的步驟包括對(duì)所述上頜輪廓和所述下頜輪廓之間口腔區(qū)域部分圖像進(jìn)行銳化處理，使亮的區(qū)域更亮，暗的區(qū)域更暗；采用0度及45度方向的區(qū)域最大梯度估計(jì)算法，在口腔區(qū)域部分的灰度圖像中計(jì)算舌部運(yùn)動(dòng)區(qū)域內(nèi)各像素的梯度；以及取舌部運(yùn)動(dòng)區(qū)域最大梯度值的2/3作為閾值，梯度大于該閾值的像素組成舌位初步邊緣輪廓。
9.根據(jù)權(quán)利要求8所述的在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓的方法，其中，采用以下公式，計(jì)算舌部運(yùn)動(dòng)區(qū)域中像素的梯度 M(x, y) = I (X, y) *Mi+a *1 (X, y) *M2 其中，I(x，y)為舌部區(qū)域圖像某像素，M1為0度的梯度算子，M2為45度算子，a為加權(quán)系數(shù)，這里取值為0.5。最后，M(x，y)即為舌部區(qū)域的邊緣圖像，M(x，y)中值越大的像素越可能是舌的邊緣。
10.根據(jù)權(quán)利要求8所述的在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓的方法，其中，所述取舌部運(yùn)動(dòng)區(qū)域最大梯度值的2/3作為閾值，梯度大于該閾值的像素組成初歩舌位邊緣輪廓的步驟之后還包括以所述舌位邊緣輪廓作為初步舌位輪廓，采用兩階段的中值過(guò)濾方法對(duì)進(jìn)行錯(cuò)誤點(diǎn)排除。
11.根據(jù)權(quán)利要求I所述的在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓的方法，其中，所述由舌位輪廓的可靠邊緣點(diǎn)擬合出舌位邊緣輪廓包括對(duì)于每個(gè)舌位輪廓的可靠邊緣點(diǎn)，執(zhí)行以下步驟n次，得到n個(gè)縱向距離采用通過(guò)控制點(diǎn)的B樣條曲線方法，隨機(jī)抽取6個(gè)點(diǎn)擬合出曲線，計(jì)算出每個(gè)點(diǎn)到曲線的縱向距離；對(duì)于每個(gè)舌位輪廓的可靠邊緣點(diǎn)，計(jì)算隨機(jī)抽樣得到的35個(gè)縱向距離的平均值；去除縱向距離平均值最大的2 3個(gè)舌位輪廓的可靠邊緣點(diǎn)；以及利用剰余的舌位輪廓的可靠邊緣點(diǎn)，采用通過(guò)控制點(diǎn)的B樣條曲線方法擬合出舌位邊緣輪廓。
12.根據(jù)權(quán)利要求I至11中任一項(xiàng)所述的在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓的方法，其中，所述醫(yī)學(xué)圖像為X光圖像、超聲圖像或核磁共振圖像。
全文摘要
本發(fā)明提供了一種在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓的方法。該方法包括對(duì)于醫(yī)學(xué)圖像，利用唇部與背景的自動(dòng)分割閾值，對(duì)醫(yī)學(xué)影像中嘴唇與背景區(qū)域進(jìn)行二值化，得到唇部輪廓；在唇部輪廓包含的面部范圍內(nèi)，提取上牙齒輪廓、下牙齒輪廓、上頜輪廓和下頜輪廓；針對(duì)上頜輪廓和下頜輪廓之間圖像區(qū)域，獲取舌位輪廓的可靠邊緣點(diǎn)；以及由舌位輪廓的可靠邊緣點(diǎn)擬合出舌位邊緣輪廓。本發(fā)明能自動(dòng)從影像背景中分割出發(fā)音人頭部、器官區(qū)域，整個(gè)過(guò)程自動(dòng)完成，無(wú)需人工交互。
文檔編號(hào)G06T7/00GK102831606SQ20121027218
公開(kāi)日2012年12月19日申請(qǐng)日期2012年8月1日優(yōu)先權(quán)日2012年8月1日
發(fā)明者陶建華, 楊明浩, 張大偉申請(qǐng)人:中國(guó)科學(xué)院自動(dòng)化研究所

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：陶建華;楊明浩;張大偉
技術(shù)所有人：中國(guó)科學(xué)院自動(dòng)化研究所
我是此專利的發(fā)明人

上一篇：變電站模型與調(diào)度主站cim模型的合并方法與系統(tǒng)的制作方法
上一篇：圖像處理裝置以及圖像處理方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無(wú)損檢測(cè)
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺(jué) 2.無(wú)線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢(shì)感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

如何正確的發(fā)聲相關(guān)技術(shù)

輪廓度測(cè)量方法相關(guān)技術(shù)

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓的方法