本技術(shù)涉及人工智能和視頻增強(qiáng),尤其涉及一種視頻內(nèi)容增強(qiáng)方法、系統(tǒng)、終端和存儲介質(zhì)。
背景技術(shù):
1、數(shù)字媒體和網(wǎng)絡(luò)通訊技術(shù)的不斷發(fā)展極大地改變了人們溝通和交流的方式。語言交流的傳播媒介正在從傳統(tǒng)的單一模態(tài)的文字、語音等信息轉(zhuǎn)變?yōu)槿诤狭宋谋?、圖像、語音、動畫等多模態(tài)信息且更有效、更具吸引力的富媒體形式。近年來,來自在線會議、遠(yuǎn)程教學(xué)、講座、演講、采訪、討論、對話、故事講述等各類活動的大量敘述類音視頻數(shù)據(jù)在互聯(lián)網(wǎng)上呈現(xiàn)了快速增長的態(tài)勢。不同于監(jiān)控錄像等視覺信息豐富且視頻畫面本身就帶有人們?yōu)g覽和定位視頻所需的大量視覺線索,敘述類視頻通常由大量講話人的鏡頭和畫面組成,而這類視覺信息對于用戶快速查找感興趣的內(nèi)容發(fā)揮的作用往往十分有限,不得不花費(fèi)大量時間從非結(jié)構(gòu)化的語音中定位到感興趣的內(nèi)容。如何對敘述類視頻進(jìn)行有效的內(nèi)容增強(qiáng),為用戶提供直觀、有用的可視線索以輔助其進(jìn)行高效的內(nèi)容瀏覽和定位是目前多媒體領(lǐng)域亟待解決的關(guān)鍵挑戰(zhàn)之一。
2、現(xiàn)有的基于視頻本身的內(nèi)容增強(qiáng)方法對于以視覺為中心的視頻(如監(jiān)控類、體育類等)能夠發(fā)揮較好的作用,這是因?yàn)檫@類視頻的視覺通道中包含著大量與查找和瀏覽視頻內(nèi)容相關(guān)的語義線索。然而對于敘述類視頻,無法較好地滿足敘述類視頻內(nèi)容快速瀏覽和定位的需求。對于敘述類視頻的內(nèi)容增強(qiáng),現(xiàn)有方法之一是基于檢索的視覺增強(qiáng)方法,該方法通過從視頻字幕中提取查詢文本,然后從本地相冊或使用微軟bing圖像搜索api從在線存儲庫中檢索相關(guān)圖像并與語音進(jìn)行同步實(shí)現(xiàn)內(nèi)容實(shí)時增強(qiáng)。然而,這種方法嚴(yán)重依賴現(xiàn)有的圖片庫,對于復(fù)雜或罕見的檢索詞條,很可能出現(xiàn)無法匹配到相關(guān)圖像或圖像與查詢的文本語義關(guān)聯(lián)度不高的情況。
技術(shù)實(shí)現(xiàn)思路
1、針對上述技術(shù)問題,本技術(shù)提供一種視頻內(nèi)容增強(qiáng)方法、系統(tǒng)、終端和存儲介質(zhì),自動為視頻生成全面、準(zhǔn)確的內(nèi)容增強(qiáng)圖像,提高了視頻內(nèi)容增強(qiáng)的準(zhǔn)確性和成功率。
2、第一方面,本技術(shù)提供一種視頻內(nèi)容增強(qiáng)方法,包括:
3、獲取待增強(qiáng)的目標(biāo)視頻;
4、將所述目標(biāo)視頻分割為若干鏡頭單元,每個所述鏡頭單元包括若干連續(xù)幀且相同拍攝角度的畫面;
5、使用預(yù)設(shè)的語音識別工具從所述目標(biāo)視頻中提取若干字幕信息和與各個所述字幕信息對應(yīng)的時間戳;
6、從各個所述字幕信息中提取各自對應(yīng)的提示詞;
7、將各個所述提示詞輸入至預(yù)設(shè)的圖像生成模型,以使所述圖像生成模型生成與各個所述提示詞對應(yīng)的增強(qiáng)圖像,其中,所述圖像生成模型基于人工智能生成技術(shù)構(gòu)建獲得;
8、根據(jù)各個所述鏡頭單元的起止時間和各個所述字幕信息對應(yīng)的時間戳,將各個所述增強(qiáng)圖像分配至各個所述鏡頭單元中;
9、將各個所述鏡頭單元重新組合,獲得增強(qiáng)視頻。
10、本技術(shù)實(shí)施例提供一種視頻內(nèi)容增強(qiáng)方法,通過對原視頻的鏡頭分解和語音識別,利用人工智能內(nèi)容生成(aigc)技術(shù)自動生成與當(dāng)前視頻內(nèi)容相關(guān)的增強(qiáng)圖像并分配至原視頻的對應(yīng)鏡頭中,作為輔助視頻瀏覽、內(nèi)容查找等的視覺增強(qiáng)線索。相比于現(xiàn)有的視頻增強(qiáng)技術(shù)中基于檢索的方法,本技術(shù)實(shí)施例可以為視頻生成更加全面、準(zhǔn)確的內(nèi)容增強(qiáng)圖像,并且不受本地圖片數(shù)據(jù)庫的約束,有效克服了現(xiàn)有的基于檢索的技術(shù)方案中所得到的視覺增強(qiáng)內(nèi)容的片面性或無法匹配等技術(shù)問題,提高了視頻內(nèi)容增強(qiáng)的準(zhǔn)確性和成功率。
11、在一種可能實(shí)現(xiàn)的方式中,所述將所述目標(biāo)視頻分割為若干鏡頭單元,包括:
12、以預(yù)設(shè)的采樣速率和采樣尺寸對所述目標(biāo)視頻進(jìn)行采樣,獲得若干采樣圖像;
13、使用預(yù)設(shè)的圖像顯著性檢測算法對各個所述采樣圖像進(jìn)行顯著性檢測,獲得對應(yīng)的各個灰度圖像;
14、對各個所述灰度圖像進(jìn)行高斯模糊和二值化操作,獲得對應(yīng)的各個二值圖像;
15、將每幀所述二值圖像與下一幀二值圖像的內(nèi)容進(jìn)行對比,根據(jù)各個所述二值圖像的對比結(jié)果確定若干個鏡頭切換的邊界幀;
16、根據(jù)各個邊界幀將所述目標(biāo)視頻分割為若干鏡頭單元。
17、進(jìn)一步的,所述將每幀所述二值圖像與下一幀二值圖像的內(nèi)容進(jìn)行對比,根據(jù)各個所述二值圖像的對比結(jié)果確定若干個鏡頭切換的邊界幀,包括:
18、根據(jù)第一預(yù)設(shè)像素尺寸,將每個所述二值圖像劃分為若干圖像塊;
19、將每幀所述二值圖像中的若干圖像塊分別與下一幀二值圖像中相同位置的若干圖像塊進(jìn)行異或操作并以圖像塊為單位對所述異或操作的結(jié)果求和,獲得各個圖像塊對應(yīng)的相似值;
20、依次檢索各個二值圖像中的各個圖像塊的相似值,若某個當(dāng)前圖像塊對應(yīng)的相似值大于第一閾值,則將所述當(dāng)前圖像塊標(biāo)記為激活塊,若某個當(dāng)前二值圖像中的激活塊占比大于第二閾值,則將所述當(dāng)前二值圖像標(biāo)記為當(dāng)前鏡頭切換的邊界幀。
21、本技術(shù)實(shí)施例提供一種對目標(biāo)視頻進(jìn)行分割的方法,由于生成的視覺增強(qiáng)圖像應(yīng)該放置在視頻幀的非顯著區(qū)域以避免遮擋視頻的有效內(nèi)容,所以本技術(shù)實(shí)施例需要區(qū)分視頻中各幀畫面的顯著性區(qū)域和非顯著性區(qū)域,同時考慮到在同一個鏡頭單元中各幀畫面的顯著性區(qū)域和非顯著性區(qū)域基本相同,而不同鏡頭單元的顯著區(qū)域可能差異很大,因此本技術(shù)實(shí)施例首先需要將目標(biāo)視頻分割為不同的鏡頭單元。后續(xù)以鏡頭單元為單位進(jìn)行視頻內(nèi)容增強(qiáng)。在對視頻分割的具體過程中,以預(yù)設(shè)的采樣速率和采樣尺寸對所述目標(biāo)視頻進(jìn)行采樣,只對采樣圖像進(jìn)行處理,避免處理視頻中的全部幀圖像,可以有效提高視頻分割的效率。然后通過顯著性檢測、高斯模糊和二值化操作對各個采樣圖像進(jìn)行處理,確定各個采樣圖像中的有效內(nèi)容,可以避免視頻中無關(guān)內(nèi)容的影響,僅根據(jù)有效內(nèi)容進(jìn)行視頻分割,提高視頻分割的準(zhǔn)確性與合理性。最后根據(jù)各個采樣圖像中的有效內(nèi)容,確定各個鏡頭切換的邊界幀,基于各個邊界幀實(shí)現(xiàn)對目標(biāo)視頻的分割。
22、在一種可能實(shí)現(xiàn)的方式中,所述從各個所述字幕信息中提取各自對應(yīng)的提示詞,包括:
23、將各個所述字幕信息中所有的代詞替換為對應(yīng)的實(shí)體,獲得各個對應(yīng)的處理后字幕信息;
24、對各個所述處理后字幕信息進(jìn)行命名實(shí)體識別,獲得各個對應(yīng)的命名實(shí)體;
25、對各個所述處理后字幕信息進(jìn)行關(guān)鍵詞提取,獲得各個對應(yīng)的關(guān)鍵詞組;
26、使用預(yù)設(shè)的可成像評估算法對各個所述關(guān)鍵詞組進(jìn)行可成像性評估,從各個所述關(guān)鍵詞組中篩選出若干可成像詞;
27、根據(jù)預(yù)設(shè)格式將各個所述命名實(shí)體和各個所述可成像詞轉(zhuǎn)換為各自對應(yīng)的提示詞。
28、本技術(shù)實(shí)施例提供一種從字幕信息中提取提示詞的方法,同時解決了視頻內(nèi)容增強(qiáng)技術(shù)領(lǐng)域中的文本的可成像性度量問題和人工智能圖像生成模型的提示詞制定問題。關(guān)于可成像性度量問題,所述的可成像性是指心理學(xué)中的一個概念,即一段文本,無論是單個單詞還是句子,在多大程度上觸發(fā)讀者的心理圖像。例如,“日落”、“山”這樣的詞或“陽光普照的海灘展現(xiàn)在他們面前,綠松石色的海水輕輕拍打著珍珠白的沙灘”這樣的句子很容易讓人聯(lián)想到生動的圖像,因此具有很高的可視性。而像“忠誠”、“自由”這樣的詞或“因?yàn)樗恼\實(shí),她受到了大家的信任”這樣的句子則比較抽象,不容易可視化,可成像性較低。雖然已有技術(shù)研究了單詞級可視性數(shù)據(jù)庫和計(jì)算方法來自動估計(jì)單詞的視覺性,但現(xiàn)有的解決方案一方面數(shù)據(jù)庫中單詞數(shù)量有限,不能滿足實(shí)際應(yīng)用的需要,另一方面,也缺少短語和句子級的可成像性評估方法。而本技術(shù)實(shí)施例通過對各個所述字幕信息進(jìn)行代詞替換,并從中提取出對應(yīng)的關(guān)鍵詞組,然后基于可成像評估算法對各個所述關(guān)鍵詞組進(jìn)行可成像性評估,通過關(guān)鍵詞的可成像性反映出文本字幕的可成像性,實(shí)現(xiàn)了短語和句子級的可成像性評估。關(guān)于人工智能圖像生成模型的提示詞制定問題,現(xiàn)有的文本引導(dǎo)的圖像生成模型需要精心制作的提示詞(prompt)作為模型輸入,而這類提示詞往往由用戶根據(jù)自身經(jīng)驗(yàn)或模型使用技巧自行設(shè)計(jì)。這種方法不適用與本技術(shù)的應(yīng)用場景,因?yàn)楸炯夹g(shù)用于為大量視頻實(shí)現(xiàn)自動內(nèi)容增強(qiáng),依賴手工方法制作大量提示詞往往不切實(shí)際。而如果將整個原始文本不加修改或細(xì)化地作為提示詞輸入到圖像生成模型可能帶來缺乏焦點(diǎn)的問題,即整個句子可能包含不必要的細(xì)節(jié),分散模型對要可成像的核心概念的注意力。此外,與書面語言相比,視頻中語音轉(zhuǎn)錄得到的文本往往偏口語化,單詞根據(jù)上下文可能有多個含義,句子也可能缺乏清晰的結(jié)構(gòu),這可能導(dǎo)致誤解意圖或無關(guān)結(jié)果。因此,本技術(shù)從所述處理后字幕信息中提取命名實(shí)體和可成像詞,并根據(jù)預(yù)設(shè)格式將各個所述命名實(shí)體和各個所述可成像詞轉(zhuǎn)換為各自對應(yīng)的提示詞,加深了圖像生成模型對視頻字幕信息的理解,使其生成的每個增強(qiáng)圖像更加貼切對應(yīng)的字幕信息。本技術(shù)實(shí)施例通過解決上述兩個問題,進(jìn)一步提高了視頻內(nèi)容增強(qiáng)的準(zhǔn)確性和成功率。
29、在一種可能實(shí)現(xiàn)的方式中,所述根據(jù)各個所述鏡頭單元的起止時間和各個所述字幕信息對應(yīng)的時間戳,將各個所述增強(qiáng)圖像分配至各個所述鏡頭單元中,包括:
30、根據(jù)各個所述鏡頭單元的起止時間,確定各個所述增強(qiáng)圖像所屬的鏡頭單元;
31、確定各個所述增強(qiáng)圖像所對應(yīng)的字幕信息;
32、根據(jù)各個所述字幕信息對應(yīng)的時間戳,確定各個所述增強(qiáng)圖像在所述鏡頭單元中的存續(xù)時間;
33、根據(jù)預(yù)設(shè)規(guī)則確定各個所述鏡頭單元的關(guān)鍵幀圖像,并確定所述關(guān)鍵幀圖像中的顯著性區(qū)域和非顯著性區(qū)域;
34、根據(jù)各個所述增強(qiáng)圖像的尺寸和各個關(guān)鍵幀圖像中的顯著性區(qū)域和非顯著性區(qū)域的大小,確定各個所述增強(qiáng)圖像在各自對應(yīng)的鏡頭單元中的顯示位置;
35、根據(jù)各個所述增強(qiáng)圖像的存續(xù)時間和顯示位置,將各個所述增強(qiáng)圖像分配至各個所述鏡頭單元中。
36、本技術(shù)實(shí)施例提供了一種將增強(qiáng)圖像分配至各個鏡頭單元的方法,用于解決視覺增強(qiáng)內(nèi)容與視頻的合成顯示問題。為了增強(qiáng)用戶瀏覽和查找視頻的體驗(yàn),需要將生成的視覺增強(qiáng)圖像按照對應(yīng)的時間與視頻內(nèi)容進(jìn)行同步顯示。為了不破壞視頻內(nèi)容播放的整體性,本技術(shù)實(shí)施例擬采用集成顯示方案,即將視覺增強(qiáng)圖像嵌入到視頻幀畫面的非顯著性區(qū)域。同時,為了保障視覺增強(qiáng)內(nèi)容的可讀性,每張圖像需設(shè)定一定的存續(xù)時間(即在視頻播放時開始出現(xiàn)在播放器畫面中直至消失的時間),而這也會導(dǎo)致同一時刻會有多張視覺增強(qiáng)圖像需要整合在視頻幀畫面的非顯著性區(qū)域中。本技術(shù)實(shí)施例,先基于各個鏡頭單元的起止時間和各個字幕信息對應(yīng)的時間戳,將所有的增強(qiáng)圖像分配至不同的鏡頭單元。然后再分別確定各個鏡頭單元中各個增強(qiáng)圖像的存續(xù)時間和顯示位置,解決視覺增強(qiáng)內(nèi)容與視頻的合成顯示問題,進(jìn)一步提高了視頻內(nèi)容增強(qiáng)的準(zhǔn)確性。
37、進(jìn)一步的,當(dāng)需要確定所述各個增強(qiáng)圖像中的任意第一增強(qiáng)圖像在對應(yīng)的第一鏡頭單元中的顯示位置時,所述根據(jù)各個所述增強(qiáng)圖像的尺寸和各個關(guān)鍵幀圖像中的顯著性區(qū)域和非顯著性區(qū)域的大小,確定各個所述增強(qiáng)圖像在各自對應(yīng)的鏡頭單元中的顯示位置,包括:
38、根據(jù)第二預(yù)設(shè)像素尺寸,將所述第一鏡頭單元對應(yīng)的第一關(guān)鍵幀圖像分割為若干待增強(qiáng)圖像塊;
39、根據(jù)第一關(guān)鍵幀圖像的顯著性區(qū)域和非顯著性區(qū)域的大小,確定各個所述待增強(qiáng)圖像塊中的顯著性像素和非顯著性像素;
40、將所述第一增強(qiáng)圖像以預(yù)設(shè)縮放比例進(jìn)行縮放,獲得第一縮放圖像;
41、根據(jù)所述第一縮放圖像的像素?cái)?shù)量和預(yù)設(shè)比例系數(shù)計(jì)算獲得像素閾值;
42、遍歷各個所述待增強(qiáng)圖像塊的預(yù)設(shè)位置是否滿足顯示條件,若當(dāng)前所述待增強(qiáng)圖像塊的預(yù)設(shè)位置滿足所述顯示條件,則確定當(dāng)前所述待增強(qiáng)圖像塊的預(yù)設(shè)位置為所述第一縮放圖像的顯示位置,并將當(dāng)前所述待增強(qiáng)圖像塊的預(yù)設(shè)位置標(biāo)記為顯著性區(qū)域,其中,所述顯示條件為所述待增強(qiáng)圖像塊的預(yù)設(shè)位置的顯著性像素的數(shù)量不多于所述像素閾值;
43、若各個所述待增強(qiáng)圖像塊均不滿足所述顯示條件,則將所述第一縮放圖像進(jìn)一步縮放并更新像素閾值,然后重新遍歷各個所述待增強(qiáng)圖像塊,直到存在所述待增強(qiáng)圖像塊滿足所述顯示條件。
44、本技術(shù)實(shí)施例以第一增強(qiáng)圖像為例,提供一種確定增強(qiáng)圖像的顯示位置的方法,以各個鏡頭單元的關(guān)鍵幀圖像作為鏡頭單元的代表畫面,將增強(qiáng)圖像在關(guān)鍵幀圖像中的顯示位置作為增強(qiáng)圖像在整個鏡頭單元中的顯示位置。具體的,將關(guān)鍵幀圖像分割為若干待增強(qiáng)圖像塊,限定增強(qiáng)圖像只能從這些待增強(qiáng)圖像塊中選擇一塊作為顯示位置,使得增強(qiáng)圖像在視頻中的顯示更加規(guī)則有序;為了避免增強(qiáng)圖像遮擋原視頻的有效內(nèi)容,本技術(shù)基于顯著性區(qū)域和非顯著性區(qū)域的劃分,進(jìn)一步將關(guān)鍵幀圖像中的像素分為顯著性像素和非顯著性像素,并設(shè)置了顯示條件,使得增強(qiáng)圖像在選擇顯示位置的過程中,盡可能選擇顯著性像素較少的待增強(qiáng)圖像塊進(jìn)行顯示,提高了用戶的觀看體驗(yàn)。最后,考慮到可能存在某個關(guān)鍵幀圖像中的顯著性像素較多的情況,這會導(dǎo)致所有的待增強(qiáng)圖像塊均不滿足顯示條件,當(dāng)出現(xiàn)這種情況后,將第一縮放圖像進(jìn)一步縮放,降低像素閾值后重新進(jìn)行遍歷,在避免遮擋的同時,確保所有的增強(qiáng)圖像都能顯示在原視頻中。
45、在一種可能實(shí)現(xiàn)的方式中,當(dāng)需要確定所述各個增強(qiáng)圖像中的任意第一增強(qiáng)圖像在對應(yīng)的第一鏡頭單元中的顯示位置時,所述根據(jù)各個所述增強(qiáng)圖像的尺寸和各個關(guān)鍵幀圖像中的顯著性區(qū)域和非顯著性區(qū)域的大小,確定各個所述增強(qiáng)圖像在各自對應(yīng)的鏡頭單元中的顯示位置,包括:
46、根據(jù)第二預(yù)設(shè)像素尺寸,將所述第一鏡頭單元對應(yīng)的第一關(guān)鍵幀圖像分割為若干待增強(qiáng)圖像塊;
47、根據(jù)第一關(guān)鍵幀圖像的顯著性區(qū)域和非顯著性區(qū)域的大小,確定各個所述待增強(qiáng)圖像塊中的顯著性像素和非顯著性像素;
48、將所述第一增強(qiáng)圖像以預(yù)設(shè)縮放比例進(jìn)行縮放,獲得第一縮放圖像;
49、根據(jù)所述第一縮放圖像的像素?cái)?shù)量和預(yù)設(shè)比例系數(shù)計(jì)算獲得像素閾值;
50、隨機(jī)選擇所述各個待增強(qiáng)圖像塊中的任意第一待增強(qiáng)圖像塊,確認(rèn)所述第一待增強(qiáng)圖像塊的預(yù)設(shè)位置是否滿足顯示條件,若滿足所述顯示條件,則確定所述第一待增強(qiáng)圖像塊的預(yù)設(shè)位置為所述第一縮放圖像的顯示位置,并將所述第一待增強(qiáng)圖像塊的預(yù)設(shè)位置標(biāo)記為顯著性區(qū)域,其中,所述顯示條件為所述待增強(qiáng)圖像塊的預(yù)設(shè)位置的顯著性像素的數(shù)量不多于所述像素閾值;
51、若經(jīng)過預(yù)設(shè)次數(shù)的隨機(jī)選擇后,所選擇的各個所述待增強(qiáng)圖像塊均不滿足所述顯示條件,則將所述第一縮放圖像進(jìn)一步縮放并更新像素閾值,然后重新進(jìn)行預(yù)設(shè)次數(shù)的隨機(jī)選擇,直到存在所述待增強(qiáng)圖像塊滿足所述顯示條件。
52、本技術(shù)實(shí)施例以第一增強(qiáng)圖像為例,提供另一種確定增強(qiáng)圖像的顯示位置的方法,區(qū)別在于本技術(shù)實(shí)施例不遍歷所有的待增強(qiáng)圖像塊,而是隨機(jī)選擇待增強(qiáng)圖像塊進(jìn)行顯示條件的檢測,進(jìn)一步提高了算法的執(zhí)行效率。
53、第二方面,相應(yīng)的,本技術(shù)提供一種視頻內(nèi)容增強(qiáng)系統(tǒng),包括獲取模塊、分割模塊、語音識別模塊、提示詞提取模塊、圖像生成模塊、圖像分配模塊以及組合模塊;
54、其中,所述獲取模塊用于獲取待增強(qiáng)的目標(biāo)視頻;
55、所述分割模塊用于將所述目標(biāo)視頻分割為若干鏡頭單元,每個所述鏡頭單元包括若干連續(xù)幀且相同拍攝角度的畫面;
56、所述語音識別模塊用于使用預(yù)設(shè)的語音識別工具從所述目標(biāo)視頻中提取若干字幕信息和與各個所述字幕信息對應(yīng)的時間戳;
57、所述提示詞提取模塊用于從各個所述字幕信息中提取各自對應(yīng)的提示詞;
58、所述圖像生成模塊用于將各個所述提示詞輸入至預(yù)設(shè)的圖像生成模型,以使所述圖像生成模型生成與各個所述提示詞對應(yīng)的增強(qiáng)圖像,其中,所述圖像生成模型基于人工智能生成技術(shù)構(gòu)建獲得;
59、所述圖像分配模塊用于根據(jù)各個所述鏡頭單元的起止時間和各個所述字幕信息對應(yīng)的時間戳,將各個所述增強(qiáng)圖像分配至各個所述鏡頭單元中;
60、所述組合模塊用于將各個所述鏡頭單元重新組合,獲得增強(qiáng)視頻。
61、第三方面,本技術(shù)提供一種終端,包括處理器、存儲器以及存儲在所述存儲器中且被配置為由所述處理器執(zhí)行的計(jì)算機(jī)程序,所述處理器執(zhí)行所述計(jì)算機(jī)程序時實(shí)現(xiàn)本技術(shù)所述的視頻內(nèi)容增強(qiáng)方法。
62、第四方面,本技術(shù)提供一種計(jì)算機(jī)可讀存儲介質(zhì),所述計(jì)算機(jī)可讀存儲介質(zhì)包括存儲的計(jì)算機(jī)程序,其中,在所述計(jì)算機(jī)程序運(yùn)行時控制所述計(jì)算機(jī)可讀存儲介質(zhì)所在設(shè)備執(zhí)行本技術(shù)所述的視頻內(nèi)容增強(qiáng)方法。