圖像文件處理及語音控制方法
【專利摘要】本發(fā)明公開了一種圖像文件處理及語音控制方法,其中語音控制方法,包括:S210接收語音信息,并提取該語音信息中的語音特征信息和語音內(nèi)容信息;S220查找到與該語音特征信息相對應(yīng)的圖像數(shù)據(jù)信息、音頻信息、文本信息組合;S230根據(jù)語音內(nèi)容信息,依次顯示圖像數(shù)據(jù)、文本數(shù)據(jù)以及播放音頻數(shù)據(jù)。本發(fā)明通過圖像文件處理和語音控制功能,可實現(xiàn)圖像,不但可實現(xiàn)圖像增強現(xiàn)實處理,還可實現(xiàn)通過語音控制來實現(xiàn)虛擬與現(xiàn)實之間的互動,3D模型之間會相互學(xué)習(xí)和影響,給用戶增加更強的趣味性和易用性。
【專利說明】
圖像文件處理及語音控制方法
技術(shù)領(lǐng)域
[0001]本發(fā)明涉及電子信息領(lǐng)域,尤其涉及圖像文件處理方法及語音控制方法。
【背景技術(shù)】
[0002]增強現(xiàn)實(Augmented Reality,簡稱AR),是在虛擬現(xiàn)實的基礎(chǔ)上發(fā)展起來的新技術(shù),也被稱之為混合現(xiàn)實。是通過計算機系統(tǒng)提供的信息增加用戶對現(xiàn)實世界感知的技術(shù),將虛擬的信息應(yīng)用到真實世界,并將計算機生成的虛擬物體、場景或系統(tǒng)提示信息疊加到真實場景中,從而實現(xiàn)對現(xiàn)實的增強。
[0003]現(xiàn)有技術(shù)中的增強現(xiàn)實的功能,不能通過語音進行控制,無自成長和學(xué)習(xí)功能。如果通過圖像文件處理和語音控制功能,可實現(xiàn)圖像,不但可實現(xiàn)圖像增強現(xiàn)實處理,還可實現(xiàn)通過語音控制來實現(xiàn)虛擬與現(xiàn)實之間的互動,3D模型之間會相互學(xué)習(xí)和影響,將給用戶增加更強的趣味性和易用性。
【發(fā)明內(nèi)容】
[0004]本發(fā)明的目的是提供一種圖像文件處理方法及語音控制方法。
[0005]本發(fā)明所提供的圖像文件處理方法,包括:S110獲取記載有虛擬圖像信息的第一數(shù)據(jù);S120獲取記載有現(xiàn)實圖像信息的第二數(shù)據(jù);S130將第一數(shù)據(jù)和第二數(shù)據(jù)進行結(jié)合處理,從而得到記載有虛擬圖像和現(xiàn)實圖像的第三數(shù)據(jù)。
[0006]本發(fā)明所提供的語音控制方法,包括:S210接收語音信息,并提取該語音信息中的語音特征信息和語音內(nèi)容信息;S220查找到與該語音特征信息相對應(yīng)的圖像數(shù)據(jù)信息、音頻信息、文本信息組合;S230根據(jù)語音內(nèi)容信息,依次顯示圖像數(shù)據(jù)、文本數(shù)據(jù)以及播放音頻數(shù)據(jù)。
[0007]本發(fā)明通過圖像文件處理和語音控制功能,可實現(xiàn)圖像,不但可實現(xiàn)圖像增強現(xiàn)實處理,還可實現(xiàn)通過語音控制來實現(xiàn)虛擬與現(xiàn)實之間的互動,3D模型之間會相互學(xué)習(xí)和影響,給用戶增加更強的趣味性和易用性。
【附圖說明】
[0008]圖1為本發(fā)明實施例一所述的圖像文件處理方法流程示意圖;
[0009]圖2為本發(fā)明實施例一所述的圖像文件處理方法中所述S120所述獲取記載有現(xiàn)實圖像信息的第二數(shù)據(jù)的步驟的示意圖;
[0010]圖3為本發(fā)明實施例二所述的語音控制方法流程示意圖;
[0011]圖4為本發(fā)明實施例二所述的語音控制方法中所述查找到與該語音特征信息相對應(yīng)的圖像數(shù)據(jù)信息組合的流程示意圖;
[0012]圖5為本發(fā)明實施例二所述的語音控制方法中所述根據(jù)語音內(nèi)容信息依次顯示圖像數(shù)據(jù)的流程示意圖;
[0013]圖6為本發(fā)明實施例二所述的語音控制方法中信息反饋步驟的流程示意圖;
[0014]圖7為本發(fā)明實施例二所述的語音控制方法中學(xué)習(xí)步驟的流程示意圖;
[0015]圖8為本發(fā)明實施例二所述的語音控制方法中建立與賬戶相匹配的第一性格數(shù)據(jù)和第二性格數(shù)據(jù)的流程示意圖。
【具體實施方式】
[0016]為使本發(fā)明實施例的目的、技術(shù)方案和優(yōu)點更加清楚,下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進行清楚、完整地描述,顯然,所描述的實施例是本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。
[0017]實施例一
[0018]如圖1所示,本實施例提供一種圖像文件處理方法,包括:
[0019]SllO獲取記載有虛擬圖像信息的第一數(shù)據(jù);本領(lǐng)域技術(shù)人員可以理解,所述虛擬圖像是指通過繪制得到的圖像,可以是平面圖像,也可以是呈現(xiàn)立體效果的立體圖像,如山谷、外太空等具有立體感觀效果的場景圖像;
[0020]S120獲取記載有現(xiàn)實圖像信息的第二數(shù)據(jù);本領(lǐng)域技術(shù)人員可以理解,所述現(xiàn)實圖像是指通過拍攝得到的圖像,其圖像的真實度更加接近現(xiàn)實,可以是物體、動物、人臉或者人體的圖像;
[0021]S130將第一數(shù)據(jù)和第二數(shù)據(jù)進行結(jié)合處理,從而得到記載有虛擬圖像和現(xiàn)實圖像的第三數(shù)據(jù)。
[0022]進一步,所述結(jié)合處理是指增強現(xiàn)實(Augmented Reality,簡稱AR)處理。本領(lǐng)域技術(shù)人員可以理解,所述增強現(xiàn)實,是在虛擬現(xiàn)實的基礎(chǔ)上發(fā)展起來的新技術(shù),也被稱之為混合現(xiàn)實。是通過計算機系統(tǒng)提供的信息增加用戶對現(xiàn)實世界感知的技術(shù),將虛擬的信息應(yīng)用到真實世界,并將計算機生成的虛擬物體、場景或系統(tǒng)提示信息疊加到真實場景中,從而實現(xiàn)對現(xiàn)實的增強。
[0023]如圖2所示,S120所述獲取記載有現(xiàn)實圖像信息的第二數(shù)據(jù)的步驟,包括:
[0024]S121讀取設(shè)備中存儲的記載有虛擬圖像信息的第一數(shù)據(jù),并根據(jù)所述第一數(shù)據(jù)計算出目標(biāo)特征數(shù)據(jù);
[0025]S122識別第一數(shù)據(jù);
[0026]S123在識別出的數(shù)據(jù)中找到符合目標(biāo)數(shù)據(jù)特征的部分作為記載有現(xiàn)實圖像信息的第二數(shù)據(jù)。
[0027]本領(lǐng)域技術(shù)人員可以理解,所述目標(biāo)特征數(shù)據(jù)包括形狀參數(shù)、范圍參數(shù)、大小參數(shù)、分辨率參數(shù)和色度參數(shù),本領(lǐng)域技術(shù)人員可根據(jù)目標(biāo)特征數(shù)據(jù)識別出照片中的哪一部分是與所述第一數(shù)據(jù)可相匹配、可進行增強現(xiàn)實處理、可處理為第二數(shù)據(jù)的部分。例如,如果第一數(shù)據(jù)是人體頸部以下部分的繪制圖像,那么與該第一數(shù)據(jù)相匹配的、可進行增強現(xiàn)實處理且可處理為第二數(shù)據(jù)的部分為照片中清晰度達到該第一數(shù)據(jù)圖片參數(shù)要求的人臉范圍數(shù)據(jù),即此時的第二數(shù)據(jù)為拍攝的人臉信息數(shù)據(jù)。
[0028]實施例二
[0029]如圖3所示,本實施例提供一種語音控制方法,包括:
[0030]S210接收語音信息,并提取該語音信息中的語音特征信息和語音內(nèi)容信息;本領(lǐng)域技術(shù)人員可以理解,所述語音特征信息包括音調(diào)參數(shù)和音色參數(shù)信息,根據(jù)該語音特征信息,可識別出該輸入該語音的用戶;
[0031 ] S220查找到與該語音特征信息相對應(yīng)的圖像數(shù)據(jù)信息、音頻信息、文本信息組合;
[0032]S230根據(jù)語音內(nèi)容信息,依次顯示圖像數(shù)據(jù)、文本數(shù)據(jù)以及播放音頻數(shù)據(jù)。
[0033]所述圖像數(shù)據(jù)信息組合是指具有實施例一所述的相同第二數(shù)據(jù)的圖像數(shù)據(jù)信息組合。這樣可實現(xiàn)當(dāng)輸入特定的語音信息時,具有相同現(xiàn)實圖像信息的圖片會根據(jù)語音內(nèi)容來依次進行顯示。
[0034]如圖4所示,所述查找到與該語音特征信息相對應(yīng)的圖像數(shù)據(jù)信息組合,包括:
[0035]S221建立圖像數(shù)據(jù)組合與賬戶的匹配關(guān)系;
[0036]S222建立語音特征信息與賬戶的匹配關(guān)系;
[0037]S223對語音特征信息進行識別,查找到與該語音特征信息相匹配的賬戶,再根據(jù)該賬戶查找到與該賬戶相匹配的圖像數(shù)據(jù)組合。
[0038]這樣,當(dāng)用戶通過麥克風(fēng)輸入語音時,系統(tǒng)接收到該語音信息后,將語音信息中的音調(diào)參數(shù)和音色參數(shù)進行提取,從而獲得音調(diào)參數(shù)和音色參數(shù),根據(jù)音調(diào)參數(shù)和音色參數(shù)可識別出該用戶并查找到與該用戶匹配的賬戶,從而查找到與該賬戶匹配的圖像數(shù)據(jù)組合,如查找到帶有該用戶頭像的所有圖像數(shù)據(jù),包括實施例一中所述的經(jīng)過將頭像數(shù)據(jù)和場景數(shù)據(jù)經(jīng)過增強現(xiàn)實處理而獲得的所有第三數(shù)據(jù)。
[0039]如圖5所示,所述根據(jù)語音內(nèi)容信息,依次顯示圖像數(shù)據(jù),包括:
[0040]S231建立與語音內(nèi)容信息與第三數(shù)據(jù)的匹配關(guān)系;
[0041]S232對語音內(nèi)容信息進行識別,查找到與該語音內(nèi)容信息相匹配的第三數(shù)據(jù);
[0042]S233顯示第三數(shù)據(jù)。例如當(dāng)語音內(nèi)容為跳舞時,查詢到與跳舞相匹配的圖片信息,并根據(jù)設(shè)定進行顯示,從而實現(xiàn)用戶利用語音控制設(shè)定的角色跳舞。另外,根據(jù)本實施例所述的語音控制方法,還可以實現(xiàn)虛擬3D寵物語音互動,或參與到虛擬戰(zhàn)爭中,指揮戰(zhàn)斗等。
[0043]如圖6所示,本實施例所述的語音控制方法,還包括S240信息反饋步驟,具體包括:
[0044]S241建立語音內(nèi)容信息與賬戶的匹配關(guān)系;
[0045]S242統(tǒng)計語音內(nèi)容信息并根據(jù)語音內(nèi)容信息分析出個性信息;
[0046]建立個性信息與賬戶的匹配關(guān)系;本領(lǐng)域技術(shù)人員可以理解,當(dāng)?shù)诙?shù)據(jù)為一 3D模型數(shù)據(jù)時,可通過反復(fù)執(zhí)行該信息反饋步驟,實現(xiàn)在用戶與設(shè)備交互的過程中,不經(jīng)意間,系統(tǒng)通過大數(shù)據(jù)分析得出用戶個性,并將個性賦予給3D模型,在長久的使用后,3D模型的反饋將越來越接近用戶的個性。
[0047]如圖7所示,本實施例所述的語音控制方法,還包括S250學(xué)習(xí)步驟,具體包括:
[0048]S251建立與賬戶相匹配的第一性格數(shù)據(jù)和第二性格數(shù)據(jù);
[0049]S252建立與第一性格數(shù)據(jù)相匹配的第一性格比例參數(shù)以及與第二性格數(shù)據(jù)相匹配的第二性格比例參數(shù),所述第一性格比例參數(shù)與所述第二性格比例參數(shù)的和為I ;
[0050]S253建立第一性格比例參數(shù)與時間的增長關(guān)系;
[0051]S254隨著時間更新第一性格比例參數(shù)。例如每24小時,所述第一性格比例參數(shù)增長0.05。本領(lǐng)域技術(shù)人員可以理解,這樣當(dāng)?shù)诙?shù)據(jù)為一 3D模型數(shù)據(jù)時,其所具有的第一性格將隨著時間的增長而增長,其所具有第二性格將隨時間的增長而減少,從而實現(xiàn)3D模型的成長。
[0052]如圖8所示,所述S251建立與賬戶相匹配的第一性格數(shù)據(jù)和第二性格數(shù)據(jù),具體包括:
[0053]S2511建立第一賬戶與第二賬戶之間的匹配關(guān)系;
[0054]S2512將第二賬戶的個性信息作為第一賬戶的第一性格數(shù)據(jù);且將第一賬戶的個性信息作為第一賬戶的第二性格數(shù)據(jù);本領(lǐng)域技術(shù)人員可以理解,所述第一賬戶的個性信息根據(jù)與第一賬戶相匹配的語音內(nèi)容信息統(tǒng)計分析而獲得;所述第二賬戶的個性信息根據(jù)與第二賬戶相匹配的語音內(nèi)容信息統(tǒng)計分析而獲得;這樣,隨著時間的增長,所述第一賬戶的第一性格數(shù)據(jù)會增長,即與第一賬戶所匹配的第二圖像數(shù)據(jù)將具有越來越多的第二賬戶的個性;隨著時間的增長,第一賬戶的第二性格數(shù)據(jù)會減少,即與第一賬戶所匹配的第二圖像數(shù)據(jù)自己的個性會越來越少。如與第一賬戶相匹配的第二圖像數(shù)據(jù)為少女照片,與第一賬戶相匹配的語音內(nèi)容信息為舞蹈內(nèi)容;與第二賬戶相匹配的第二圖像數(shù)據(jù)為男子照片,與第二賬戶匹配的語音內(nèi)容信息為戰(zhàn)爭指揮內(nèi)容;隨著時間的推移,第一賬戶匹配的少女將越來越多的顯示出指揮戰(zhàn)爭的動作,而越來越少的顯示出舞蹈動作,從而實現(xiàn)第一賬戶的第二圖像數(shù)據(jù)與第二賬戶的第二圖像數(shù)據(jù)相學(xué)習(xí)。通過本實施例所述的語音控制方法,還可實現(xiàn)第二圖像數(shù)據(jù)之間的相互影響,例如用戶擁有一個“孫悟空”3D模型,在進行增強現(xiàn)實體驗時,其他用戶的“豬八戒”模型進入到該用戶的增強現(xiàn)實體驗中,兩個帶著各自用戶的個性數(shù)據(jù)的3D模型會進行自動語音或文字互動,在這個過程中相互影響。
[0055]最后應(yīng)說明的是:以上實施例僅用以說明本發(fā)明的技術(shù)方案,而非對其限制;盡管參照前述實施例對本發(fā)明進行了詳細的說明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解:其依然可以對前述各實施例所記載的技術(shù)方案進行修改,或者對其中部分技術(shù)特征進行等同替換;而這些修改或者替換,并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明各實施例技術(shù)方案的精神和范圍。
【主權(quán)項】
1.一種圖像文件處理方法,其特征在于,包括: SllO獲取記載有虛擬圖像信息的第一數(shù)據(jù); S120獲取記載有現(xiàn)實圖像信息的第二數(shù)據(jù); S130將第一數(shù)據(jù)和第二數(shù)據(jù)進行結(jié)合處理,從而得到記載有虛擬圖像和現(xiàn)實圖像的第三數(shù)據(jù)。2.如權(quán)利要求1所述的圖像文件處理方法,其特征在于,所述結(jié)合處理是指增強現(xiàn)實處理。3.如權(quán)利要求2所述的圖像文件處理方法,其特征在于,所述S120所述獲取記載有現(xiàn)實圖像信息的第二數(shù)據(jù)的步驟,包括: S121讀取設(shè)備中存儲的記載有虛擬圖像信息的第一數(shù)據(jù),并根據(jù)所述第一數(shù)據(jù)計算出目標(biāo)特征數(shù)據(jù); S122識別第一數(shù)據(jù); S123在識別出的數(shù)據(jù)中找到符合目標(biāo)數(shù)據(jù)特征的部分作為記載有現(xiàn)實圖像信息的第二數(shù)據(jù)。4.一種語音控制方法,其特征在于,包括: S210接收語音信息,并提取該語音信息中的語音特征信息和語音內(nèi)容信息; S220查找到與該語音特征信息相對應(yīng)的圖像數(shù)據(jù)信息、音頻信息、文本信息組合; S230根據(jù)語音內(nèi)容信息,依次顯示圖像數(shù)據(jù)、文本數(shù)據(jù)以及播放音頻數(shù)據(jù)。5.如權(quán)利要求4所述的語音控制方法,其特征在于,所述圖像數(shù)據(jù)信息組合是指具有與相同權(quán)利要求1至3中任一項所述的第二數(shù)據(jù)的圖像數(shù)據(jù)信息組合。6.如權(quán)利要求5所述的語音控制方法,其特征在于,所述查找到與該語音特征信息相對應(yīng)的圖像數(shù)據(jù)信息組合,包括: S221建立圖像數(shù)據(jù)組合與賬戶的匹配關(guān)系; S222建立語音特征信息與賬戶的匹配關(guān)系; S223對語音特征信息進行識別,查找到與該語音特征信息相匹配的賬戶,再根據(jù)該賬戶查找到與該賬戶相匹配的圖像數(shù)據(jù)組合。7.如權(quán)利要求6所述的語音控制方法,其特征在于,所述根據(jù)語音內(nèi)容信息,依次顯示圖像數(shù)據(jù),包括: S231建立與語音內(nèi)容信息與第三數(shù)據(jù)的匹配關(guān)系; S232對語音內(nèi)容信息進行識別,查找到與該語音內(nèi)容信息相匹配的第三數(shù)據(jù); S233顯示第三數(shù)據(jù)。8.如權(quán)利要求7所述的語音控制方法,其特征在于,還包括: S241建立語音內(nèi)容信息與賬戶的匹配關(guān)系; S242統(tǒng)計語音內(nèi)容信息并根據(jù)語音內(nèi)容信息分析出個性信息。9.如權(quán)利要求8所述的語音控制方法,其特征在于,還包括: S251建立與賬戶相匹配的第一性格數(shù)據(jù)和第二性格數(shù)據(jù); S252建立與第一性格數(shù)據(jù)相匹配的第一性格比例參數(shù)以及與第二性格數(shù)據(jù)相匹配的第二性格比例參數(shù),所述第一性格比例參數(shù)與所述第二性格比例參數(shù)的和為I ; S253建立第一性格比例參數(shù)與時間的增長關(guān)系; S254隨著時間更新第一性格比例參數(shù)。10.如權(quán)利要求9所述的語音控制方法,其特征在于,所述S251建立與賬戶相匹配的第一性格數(shù)據(jù)和第二性格數(shù)據(jù),包括: S2511建立第一賬戶與第二賬戶之間的匹配關(guān)系; S2512將第二賬戶的個性信息作為第一賬戶的第一性格數(shù)據(jù);且將第一賬戶的個性信息作為第一賬戶的第二性格數(shù)據(jù)。
【文檔編號】G06F3/0487GK105989132SQ201510086642
【公開日】2016年10月5日
【申請日】2015年2月17日
【發(fā)明人】吳周亞, 陳曉峰
【申請人】上海觸趣網(wǎng)絡(luò)科技有限公司