一種場(chǎng)景切換點(diǎn)的檢測(cè)方法及裝置制造方法

文檔序號(hào)：7824339閱讀：340來源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>電子通信裝置的制造及其應(yīng)用技術(shù)

一種場(chǎng)景切換點(diǎn)的檢測(cè)方法及裝置制造方法
【專利摘要】本發(fā)明提供一種場(chǎng)景切換點(diǎn)的檢測(cè)方法及裝置，包括：獲取第一視頻；提取所述第一視頻中音頻數(shù)據(jù)作為第一音頻數(shù)據(jù)；根據(jù)所述第一音頻數(shù)據(jù)確定場(chǎng)景的切換位置。通過使用以上方法，可以根據(jù)視頻中的具體音頻信息來判斷視頻中場(chǎng)景的切換，避免了現(xiàn)有技術(shù)中依賴人工進(jìn)行標(biāo)注的復(fù)雜工作，提高了視頻處理的工作效率。
【專利說明】一種場(chǎng)景切換點(diǎn)的檢測(cè)方法及裝置

【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及數(shù)字多媒體【技術(shù)領(lǐng)域】，特別是一種場(chǎng)景切換點(diǎn)的檢測(cè)方法及裝置。

【背景技術(shù)】
[0002]隨著數(shù)字多媒體技術(shù)的快速發(fā)展，越來越多的多媒體技術(shù)應(yīng)用到人們的工作和生活中。
[0003]在視頻編輯領(lǐng)域，經(jīng)常會(huì)接觸到“關(guān)鍵幀”的概念，我們可以使用相關(guān)算法或工具處理得到某一視頻中存在的所有關(guān)鍵幀。例如，在某個(gè)電視劇中，從5分30秒開始至10分15秒是一個(gè)在咖啡廳會(huì)談的場(chǎng)景；而在10分16秒至12分30秒時(shí)是在汽車中對(duì)話的場(chǎng)景。因此，在10分16秒里包含一個(gè)關(guān)鍵幀，而此處正好是一個(gè)場(chǎng)景開始的位置。并且在該時(shí)間點(diǎn)后續(xù)的對(duì)話中，可能會(huì)頻繁的切換鏡頭角度，導(dǎo)致相關(guān)的算法或工具判斷出很多的關(guān)鍵幀，但這些關(guān)鍵幀都不是場(chǎng)景正確的結(jié)束位置。
[0004]由于在實(shí)際中一個(gè)場(chǎng)景會(huì)有很多個(gè)鏡頭切換，因此僅通過關(guān)鍵幀數(shù)據(jù)是無法比較準(zhǔn)確的定位一個(gè)較完整的場(chǎng)景的開始或結(jié)束位置?，F(xiàn)有的視頻場(chǎng)景的標(biāo)注方法是由人工瀏覽影片的方式確定不同場(chǎng)景的開始或結(jié)束位置。這對(duì)編輯人員的經(jīng)驗(yàn)以及工作強(qiáng)度要求較高，且處理效率很低。
[0005]因此，如何提供一種可以對(duì)場(chǎng)景切換點(diǎn)進(jìn)行自動(dòng)檢測(cè)的方法和裝置是本發(fā)明需要解決的問題。

【發(fā)明內(nèi)容】

[0006]針對(duì)現(xiàn)有技術(shù)的缺陷，本發(fā)明提供了一種場(chǎng)景切換點(diǎn)的檢測(cè)方法及裝置，解決了現(xiàn)有技術(shù)中依賴人工操作的問題，同時(shí)可以更加精確的判斷出場(chǎng)景切換的位置點(diǎn)。
[0007]一種場(chǎng)景切換點(diǎn)的檢測(cè)方法，包括:
獲取第一視頻；
提取所述第一視頻中音頻數(shù)據(jù)作為第一音頻數(shù)據(jù)；
根據(jù)所述第一音頻數(shù)據(jù)確定場(chǎng)景的切換位置。
[0008]優(yōu)選地，所述提取所述第一視頻中音頻數(shù)據(jù)作為第一音頻數(shù)據(jù)，具體為:
提取所述第一視頻中的人聲音頻作為所述第一音頻數(shù)據(jù)。
[0009]優(yōu)選地，所述提取所述第一視頻中音頻數(shù)據(jù)作為第一音頻數(shù)據(jù)，具體為:
提取所述第一視頻中的背景音頻作為所述第一音頻數(shù)據(jù)。
[0010]優(yōu)選地，所述根據(jù)所述第一音頻數(shù)據(jù)確定場(chǎng)景的切換位置，具體為:
檢測(cè)第一音頻數(shù)據(jù)中的聲波變化特征；
根據(jù)所述聲波變化特征確定場(chǎng)景的切換位置。
[0011]在根據(jù)所述第一音頻數(shù)據(jù)確定場(chǎng)景的切換位置之后，還包括:
獲取預(yù)判位置信息；
根據(jù)所述預(yù)判位置信息修正所述場(chǎng)景的切換位置。
[0012]一種場(chǎng)景切換點(diǎn)的檢測(cè)裝置，包括:視頻獲取單元、第一音頻提取單元和切換位置確定單元；
所述視頻獲取單元，用于獲取第一視頻；
所述第一音頻提取單元，用于提取所述第一視頻中音頻數(shù)據(jù)作為第一音頻數(shù)據(jù)；
所述切換位置確定單元，用于根據(jù)所述第一音頻數(shù)據(jù)確定場(chǎng)景的切換位置。
[0013]優(yōu)選地，所述第一音頻提取單元，包括:人聲音頻提取子單元；
所述人聲音頻提取子單元，用于提取所述第一視頻中的人聲音頻作為所述第一音頻數(shù)據(jù)。
[0014]優(yōu)選地，所述第一音頻提取單元，包括:背景音頻提取子單元；
所述背景音頻提取子單元，用于提取所述第一視頻中的背景音頻作為所述第一音頻數(shù)據(jù)。
[0015]優(yōu)選地，所述切換位置確定單元，包括:聲音檢測(cè)子單元和特征判定子單元；所述聲音檢測(cè)子單元，用于檢測(cè)第一音頻數(shù)據(jù)中的聲波變化特征；
所述特征判定子單元，用于根據(jù)所述聲波變化特征確定場(chǎng)景的切換位置。
[0016]優(yōu)選地，還包括:預(yù)判信息修正單元；
所述預(yù)判信息修正單元，用于獲取預(yù)判位置信息，根據(jù)所述預(yù)判位置信息修正所述場(chǎng)景的切換位置。
[0017]本發(fā)明的有益效果是:
在本實(shí)施例中，首先獲取第一視頻，之后提取所述第一視頻中音頻數(shù)據(jù)作為第一音頻數(shù)據(jù)，最后根據(jù)所述第一音頻數(shù)據(jù)確定場(chǎng)景的切換位置。通過使用以上方法，可以根據(jù)視頻中的具體音頻信息來判斷視頻中場(chǎng)景的切換，避免了現(xiàn)有技術(shù)中依賴人工進(jìn)行標(biāo)注的復(fù)雜工作，提高了視頻處理的工作效率。
[0018]

【專利附圖】

【附圖說明】
[0019]圖1是本發(fā)明提供的一種場(chǎng)景切換點(diǎn)的檢測(cè)方法第一實(shí)施例的流程圖；
圖2是本發(fā)明提供的一種場(chǎng)景切換點(diǎn)的檢測(cè)方法第二實(shí)施例的流程圖；
圖3是本發(fā)明提供的一種場(chǎng)景切換點(diǎn)的檢測(cè)方法第三實(shí)施例的流程圖；
圖4是本發(fā)明提供的一種場(chǎng)景切換點(diǎn)的檢測(cè)裝置第一實(shí)施例的原理框圖；
圖5是本發(fā)明提供的一種場(chǎng)景切換點(diǎn)的檢測(cè)裝置第二實(shí)施例的原理框圖；
圖6是本發(fā)明提供的一種場(chǎng)景切換點(diǎn)的檢測(cè)裝置第三實(shí)施例的原理框圖。
[0020]

【具體實(shí)施方式】
[0021]為使本發(fā)明的上述目的、特征和優(yōu)點(diǎn)能夠更加明顯易懂，下面結(jié)合附圖對(duì)本發(fā)明的【具體實(shí)施方式】做詳細(xì)的說明，使本發(fā)明的上述及其它目的、特征和優(yōu)勢(shì)將更加清晰。在全部附圖中相同的附圖標(biāo)記指示相同的部分。并未刻意按比例繪制附圖，重點(diǎn)在于示出本發(fā)明的主旨。
[0022]參見圖1，該圖為本發(fā)明提供的一種場(chǎng)景切換點(diǎn)的檢測(cè)方法第一實(shí)施例的流程圖。
[0023]本實(shí)施例中，包括:
SlOl:獲取第一視頻。
[0024]S102:提取所述第一視頻中音頻數(shù)據(jù)作為第一音頻數(shù)據(jù)。
[0025]S103:根據(jù)所述第一音頻數(shù)據(jù)確定場(chǎng)景的切換位置。
[0026]在本實(shí)施例中，首先獲取到需要進(jìn)行場(chǎng)景切換點(diǎn)校驗(yàn)的第一視頻數(shù)據(jù)。例如某一個(gè)電影或電視劇視頻。
[0027]在視頻的每一個(gè)場(chǎng)景中，一般都會(huì)對(duì)應(yīng)有某一場(chǎng)景的聲音特征。例如，在咖啡廳中會(huì)談，背景聲音一般為較為舒緩的音樂聲音，而如果在菜市場(chǎng)中的場(chǎng)景，則背景聲音一般為較為嘈雜的聲音。
[0028]因此，在得到第一視頻后，提取出第一視頻中的音頻數(shù)據(jù)(如視頻的中音頻波型圖)，作為第一音頻數(shù)據(jù)。
[0029]之后對(duì)第一音頻數(shù)據(jù)進(jìn)行分析，例如根據(jù)第一音頻數(shù)據(jù)中的波型圖判斷對(duì)話或背景音的中斷或起伏，從而判斷出否存在場(chǎng)景上的切換，進(jìn)而確定視頻中的場(chǎng)景切換位置。
[0030]在本實(shí)施例中，首先獲取第一視頻，之后提取所述第一視頻中音頻數(shù)據(jù)作為第一音頻數(shù)據(jù)，最后根據(jù)所述第一音頻數(shù)據(jù)確定場(chǎng)景的切換位置。通過使用以上方法，可以根據(jù)視頻中的具體音頻信息來判斷視頻中場(chǎng)景的切換，避免了現(xiàn)有技術(shù)中依賴人工進(jìn)行標(biāo)注的復(fù)雜工作，提高了視頻處理的工作效率。
[0031]參見圖2，該圖為本發(fā)明提供的一種場(chǎng)景切換點(diǎn)的檢測(cè)方法第一實(shí)施例的流程圖。
[0032]本實(shí)施例中的步驟S201與本發(fā)明提供的一種場(chǎng)景切換點(diǎn)的檢測(cè)方法第一實(shí)施例中的步驟SlOl相同，在此不再重復(fù)進(jìn)行介紹。
[0033]在本實(shí)施例中，所述提取所述第一視頻中音頻數(shù)據(jù)作為第一音頻數(shù)據(jù)，具體為: S202:提取所述第一視頻中的人聲音頻或背景音頻作為所述第一音頻數(shù)據(jù)。
[0034]由于在第一視頻的音頻數(shù)據(jù)中包括有多種聲音，因此可以使用其中不同聲音作為判斷場(chǎng)景切換的條件。其中，優(yōu)選地可以使用音頻數(shù)據(jù)中的人聲對(duì)話音頻或背景音頻進(jìn)行。
[0035]如果使用人聲對(duì)話音頻作為判斷條件，則需要首先獲取出第一視頻的音頻，之后對(duì)其中屬于人聲波段的聲音進(jìn)行加強(qiáng)，而對(duì)其它波段(如背景音等)進(jìn)行抑制，從而突出人聲音頻。
[0036]如果使用背景音頻作為判斷條件，則在獲取到第一視頻的音頻后，對(duì)處于人聲波段的聲音進(jìn)行抑制或去除，而只保留有非人聲波段的聲音(在一般情況下，該波段聲音大部分為背景聲音)。
[0037]在本實(shí)施例中，在得到上述的第一音頻后，還需要使用該音頻確定視頻中場(chǎng)景切換的具體位置。
[0038]具體地，
S203:檢測(cè)第一音頻數(shù)據(jù)中的聲波變化特征。
[0039]S204:根據(jù)所述聲波變化特征確定場(chǎng)景的切換位置。
[0040]以人聲音頻作為判斷條件為例:每個(gè)人的聲音都有自己的特點(diǎn)，因此在一個(gè)對(duì)話場(chǎng)景中對(duì)話雙方的音頻聲波是相同或相近似的。而此時(shí)如果切換到另外的一個(gè)場(chǎng)景，對(duì)話的雙方很可能發(fā)生了變化，則音頻聲波的較之前的聲波特征肯定會(huì)發(fā)生變化。根據(jù)該變化進(jìn)而確定出視頻中的場(chǎng)景發(fā)生了變化。
[0041]而以背景音頻作為判斷條件時(shí)，由于在某一個(gè)場(chǎng)景中一般都會(huì)伴有相同或相近似的聲音。如在咖啡廳會(huì)伴有持續(xù)優(yōu)雅的歌曲，而在菜市場(chǎng)中都會(huì)一直伴有嘈雜的背景音。因此，如果背景音頻發(fā)生了變化，則可以判斷為場(chǎng)景進(jìn)行了切換，發(fā)生變化的位置即場(chǎng)景切換的位置。
[0042]另外，如果只是單純使用人聲音頻或背景音頻進(jìn)行判斷可能還存在一定的誤判的情況。為了能夠更加準(zhǔn)確的判斷出場(chǎng)景的切換變化，還可以同時(shí)對(duì)第一視頻中的人聲音頻和背景音頻進(jìn)行判斷，這樣可以大幅提高場(chǎng)景切換位置判斷的準(zhǔn)確性。例如，如果只是人聲音頻上的變化而背景音頻沒有變化，則判斷可能是在同一場(chǎng)景上出現(xiàn)了新的談話對(duì)象，但劇情的場(chǎng)景沒有變化；而如果在視頻中的某一個(gè)時(shí)間位置上人聲和背景音都發(fā)生了變化，則可以認(rèn)為場(chǎng)景發(fā)生了變化。
[0043]通過使用以上方法，可以結(jié)合第一視頻中的音頻內(nèi)容對(duì)場(chǎng)景切換進(jìn)行準(zhǔn)確判斷，從而減少了人工對(duì)視頻進(jìn)行場(chǎng)景切換標(biāo)注的工作，提高了對(duì)視頻處理的工作效率。
[0044]參見圖3，該圖為本發(fā)明提供的一種場(chǎng)景切換點(diǎn)的檢測(cè)方法第三實(shí)施例的流程圖。
[0045]本實(shí)施例中的步驟S301-S303與本發(fā)明提供的一種場(chǎng)景切換點(diǎn)的檢測(cè)方法第一實(shí)施例中的步驟S101-S103相同，在此不再重復(fù)進(jìn)行介紹。
[0046]在本實(shí)施例中，在根據(jù)所述第一音頻數(shù)據(jù)確定場(chǎng)景的切換位置之后，還包括: S304:獲取預(yù)判位置信息；
S305:根據(jù)所述預(yù)判位置信息修正所述場(chǎng)景的切換位置。
[0047]在本實(shí)施例中，為了更加準(zhǔn)確的得到場(chǎng)景切換的位置，還可以進(jìn)一步結(jié)合關(guān)鍵幀的方式來修正得到的場(chǎng)景切換點(diǎn)位置。
[0048]具體的，在確定場(chǎng)景的切換位置之后，再進(jìn)一步獲取到已經(jīng)在第一視頻中標(biāo)注出的預(yù)判位置信息。這些預(yù)判位置信息是由人工、算法或其它工具根據(jù)視頻圖像判斷出的場(chǎng)景切換時(shí)間點(diǎn)信息。
[0049]例如，在第一視頻中標(biāo)注出在第5分30秒位置、10分15秒位置、12分鐘30秒位置存在多個(gè)場(chǎng)景切換。
[0050]此時(shí)，可以將通過音頻確認(rèn)得到的場(chǎng)景切換位置與標(biāo)注的預(yù)判位置信息進(jìn)行比較。如果兩者時(shí)間相同，則認(rèn)為該位置點(diǎn)即為場(chǎng)景切換位置。如果不相同，則以預(yù)判位置信息中的時(shí)間點(diǎn)作為第一視頻中的場(chǎng)景切換位置。
[0051]如，根據(jù)音頻數(shù)據(jù)確定在第5分30秒時(shí)存在場(chǎng)景切換點(diǎn)，經(jīng)與預(yù)判位置信息相比較，在預(yù)判位置信息中也存在第5分30秒的場(chǎng)景切換點(diǎn)，則認(rèn)為該位置確為場(chǎng)景切換的位置點(diǎn)。若根據(jù)音頻數(shù)據(jù)確定在第5分31秒時(shí)存在場(chǎng)景切換點(diǎn)，而在預(yù)判位置信息中的切換位置點(diǎn)為第5分30秒，則以第5分30秒為準(zhǔn)作為場(chǎng)景的切換位置。
[0052]通過使用以上方法，可以結(jié)合預(yù)判位置信息來更加準(zhǔn)確地修正的場(chǎng)景切換位置，從而為后續(xù)的視頻處理工作提供準(zhǔn)確的信息。
[0053]另外，結(jié)合本發(fā)明提供的一種場(chǎng)景切換點(diǎn)的檢測(cè)方法，還可以提供一種場(chǎng)景切換點(diǎn)的檢測(cè)裝置，具體如下:
參見圖4，該圖為本發(fā)明提供的一種場(chǎng)景切換點(diǎn)的檢測(cè)裝置第一實(shí)施例的原理框圖。
[0054]在本實(shí)施例中，包括:視頻獲取單元10、第一音頻提取單元20和切換位置確定單元30 ；所述視頻獲取單元10，用于獲取第一視頻。
[0055]所述第一音頻提取單元20，用于提取所述第一視頻中音頻數(shù)據(jù)作為第一音頻數(shù)據(jù)。
[0056]所述切換位置確定單元30，用于根據(jù)所述第一音頻數(shù)據(jù)確定場(chǎng)景的切換位置。
[0057]在本實(shí)施例中，視頻獲取單元10首先獲取到需要進(jìn)行場(chǎng)景切換點(diǎn)校驗(yàn)的第一視頻數(shù)據(jù)。例如某一個(gè)電影或電視劇視頻。
[0058]在視頻的每一個(gè)場(chǎng)景中，一般都會(huì)對(duì)應(yīng)有某一場(chǎng)景的聲音特征。例如，在咖啡廳中會(huì)談，背景聲音一般為較為舒緩的音樂聲音，而如果在菜市場(chǎng)中的場(chǎng)景，則背景聲音一般為較為嘈雜的聲音。
[0059]因此，在得到第一視頻后，第一音頻提取單元20提取出第一視頻中的音頻數(shù)據(jù)(如視頻的中音頻波型圖)，作為第一音頻數(shù)據(jù)。
[0060]之后切換位置確定單元30對(duì)第一音頻數(shù)據(jù)進(jìn)行分析，例如根據(jù)第一音頻數(shù)據(jù)中的波型圖判斷對(duì)話或背景音的中斷或起伏，從而判斷出否存在場(chǎng)景上的切換，進(jìn)而確定視頻中的場(chǎng)景切換位置。
[0061]在本實(shí)施例中，包括:視頻獲取單元、第一音頻提取單元和切換位置確定單元。其中，視頻獲取單元用于獲取第一視頻。第一音頻提取單元用于提取第一視頻中音頻數(shù)據(jù)作為第一音頻數(shù)據(jù)。切換位置確定單元用于根據(jù)第一音頻數(shù)據(jù)確定場(chǎng)景的切換位置。通過使用以上裝置，可以根據(jù)視頻中的具體音頻信息來判斷視頻中場(chǎng)景的切換，避免了現(xiàn)有技術(shù)中依賴人工進(jìn)行標(biāo)注的復(fù)雜工作，提高了視頻處理的工作效率。
[0062]參見圖5，該圖為本發(fā)明提供的一種場(chǎng)景切換點(diǎn)的檢測(cè)裝置第二實(shí)施例的原理框圖。
[0063]由于在第一視頻的音頻數(shù)據(jù)中包括有多種聲音，因此可以使用其中不同聲音作為判斷場(chǎng)景切換的條件。其中，優(yōu)選地可以使用音頻數(shù)據(jù)中的人聲對(duì)話音頻或背景音頻進(jìn)行。因此，在第一音頻提取單元20中，可以包括:人聲音頻提取子單元201，或者包括:背景音頻提取子單元202。
[0064]所述人聲音頻提取子單元201，用于提取所述第一視頻中的人聲音頻作為所述第一音頻數(shù)據(jù)。
[0065]所述背景音頻提取子單元202，用于提取所述第一視頻中的背景音頻作為所述第一音頻數(shù)據(jù)。
[0066]如果由人聲音頻提取子單元201使用人聲對(duì)話音頻作為判斷條件，則需要首先獲取出第一視頻的音頻，之后對(duì)其中屬于人聲波段的聲音進(jìn)行加強(qiáng)，而對(duì)其它波段(如背景音等)進(jìn)行抑制，從而突出人聲音頻。
[0067]如果由背景音頻提取子單元202使用背景音頻作為判斷條件，則在獲取到第一視頻的音頻后，對(duì)處于人聲波段的聲音進(jìn)行抑制或去除，而只保留有非人聲波段的聲音(在一般情況下，該波段聲音大部分為背景聲音)。
[0068]在本實(shí)施例中，在得到上述的第一音頻后，還需要使用該音頻確定視頻中場(chǎng)景切換的具體位置。
[0069]具體地，在所述切換位置確定單元30中，包括有:聲音檢測(cè)子單元301和特征判定子單元302。
[0070]所述聲音檢測(cè)子單元301，用于檢測(cè)第一音頻數(shù)據(jù)中的聲波變化特征。
[0071]所述特征判定子單元302，用于根據(jù)所述聲波變化特征確定場(chǎng)景的切換位置。
[0072]以人聲音頻作為判斷條件為例:每個(gè)人的聲音都有自己的特點(diǎn)，因此在一個(gè)對(duì)話場(chǎng)景中對(duì)話雙方的音頻聲波是相同或相近似的。而此時(shí)如果切換到另外的一個(gè)場(chǎng)景，對(duì)話的雙方很可能發(fā)生了變化，則聲音檢測(cè)子單元301檢測(cè)到音頻聲波的較之前的聲波特征發(fā)生變化。根據(jù)該變化特征判定子單元302進(jìn)而確定出視頻中的場(chǎng)景發(fā)生了變化。
[0073]而以背景音頻作為判斷條件時(shí)，由于在某一個(gè)場(chǎng)景中一般都會(huì)伴有相同或相近似的聲音。如在咖啡廳會(huì)伴有持續(xù)優(yōu)雅的歌曲，而在菜市場(chǎng)中都會(huì)一直伴有嘈雜的背景音。因此，如果聲音檢測(cè)子單元301檢測(cè)到背景音頻發(fā)生了變化，則特征判定子單元302可以判斷為場(chǎng)景進(jìn)行了切換，發(fā)生變化的位置即場(chǎng)景切換的位置。
[0074]另外，如果只是單純使用人聲音頻或背景音頻進(jìn)行判斷可能還存在一定的誤判的情況。為了能夠更加準(zhǔn)確的判斷出場(chǎng)景的切換變化，還可以同時(shí)使用人聲音頻提取子單元201和背景音頻提取子單元202進(jìn)行判斷，這樣可以大幅提高場(chǎng)景切換位置判斷的準(zhǔn)確性。例如，如果只是人聲音頻上的變化而背景音頻沒有變化，則判斷可能是在同一場(chǎng)景上出現(xiàn)了新的談話對(duì)象，但劇情的場(chǎng)景沒有變化；而如果在視頻中的某一個(gè)時(shí)間位置上人聲和背景音都發(fā)生了變化，則可以認(rèn)為場(chǎng)景發(fā)生了變化。
[0075]通過使用以上裝置，可以結(jié)合第一視頻中的音頻內(nèi)容對(duì)場(chǎng)景切換進(jìn)行準(zhǔn)確判斷，從而減少了人工對(duì)視頻進(jìn)行場(chǎng)景切換標(biāo)注的工作，提高了對(duì)視頻處理的工作效率。
[0076]參見圖6，該圖為本發(fā)明提供的一種場(chǎng)景切換點(diǎn)的檢測(cè)裝置第三實(shí)施例的原理框圖。
[0077]在本實(shí)施例中，還包括:預(yù)判信息修正單元40 ；
所述預(yù)判信息修正單元40，用于獲取預(yù)判位置信息，根據(jù)所述預(yù)判位置信息修正所述場(chǎng)景的切換位置。。
[0078]在本實(shí)施例中，為了更加準(zhǔn)確的得到場(chǎng)景切換的位置，還可以進(jìn)一步結(jié)合關(guān)鍵幀的方式來修正得到的場(chǎng)景切換點(diǎn)位置。
[0079]具體的，在確定場(chǎng)景的切換位置之后，使用預(yù)判信息修正單元40進(jìn)一步獲取到已經(jīng)在第一視頻中標(biāo)注出的預(yù)判位置信息。這些預(yù)判位置信息是由人工、算法或其它工具根據(jù)視頻圖像判斷出的關(guān)鍵幀場(chǎng)景切換信息。
[0080]例如，預(yù)判位置信息在第一視頻中標(biāo)注出在第5分30秒位置、10分15秒位置、12分鐘30秒位置存在多個(gè)場(chǎng)景切換。
[0081]此時(shí)，預(yù)判信息修正單元40將通過音頻確認(rèn)得到的場(chǎng)景切換位置與標(biāo)注的預(yù)判位置信息進(jìn)行比較。如果兩者時(shí)間相同，則認(rèn)為該位置點(diǎn)即為場(chǎng)景切換位置。如果不相同，則以預(yù)判位置信息中的時(shí)間點(diǎn)作為第一視頻中的場(chǎng)景切換位置。
[0082]如，根據(jù)音頻數(shù)據(jù)確定在第5分30秒時(shí)存在場(chǎng)景切換點(diǎn)，經(jīng)與預(yù)判位置信息相比較，在預(yù)判位置信息中也存在第5分30秒的場(chǎng)景切換點(diǎn)，則認(rèn)為該位置確為場(chǎng)景切換的位置點(diǎn)。若根據(jù)音頻數(shù)據(jù)確定在第5分31秒時(shí)存在場(chǎng)景切換點(diǎn)，而在預(yù)判位置信息中的切換位置點(diǎn)為第5分30秒，則以第5分30秒為準(zhǔn)作為場(chǎng)景的切換位置。
[0083]通過使用以上裝置，可以結(jié)合預(yù)判位置信息來更加準(zhǔn)確地修正的場(chǎng)景切換位置，從而為后續(xù)的視頻處理工作提供準(zhǔn)確的信息。
[0084]在以上的描述中闡述了很多具體細(xì)節(jié)以便于充分理解本發(fā)明。但是以上描述僅是本發(fā)明的較佳實(shí)施例而已，本發(fā)明能夠以很多不同于在此描述的其它方式來實(shí)施，因此本發(fā)明不受上面公開的具體實(shí)施的限制。同時(shí)任何熟悉本領(lǐng)域技術(shù)人員在不脫離本發(fā)明技術(shù)方案范圍情況下，都可利用上述揭示的方法和技術(shù)內(nèi)容對(duì)本發(fā)明技術(shù)方案做出許多可能的變動(dòng)和修飾，或修改為等同變化的等效實(shí)施例。凡是未脫離本發(fā)明技術(shù)方案的內(nèi)容，依據(jù)本發(fā)明的技術(shù)實(shí)質(zhì)對(duì)以上實(shí)施例所做的任何簡(jiǎn)單修改、等同變化及修飾，均仍屬于本發(fā)明技術(shù)方案保護(hù)的范圍內(nèi)。
【權(quán)利要求】
1.一種場(chǎng)景切換點(diǎn)的檢測(cè)方法，其特征在于，包括: 獲取第一視頻；提取所述第一視頻中音頻數(shù)據(jù)作為第一音頻數(shù)據(jù)；根據(jù)所述第一音頻數(shù)據(jù)確定場(chǎng)景的切換位置。
2.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述提取所述第一視頻中音頻數(shù)據(jù)作為第一音頻數(shù)據(jù)，具體為: 提取所述第一視頻中的人聲音頻作為所述第一音頻數(shù)據(jù)。
3.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述提取所述第一視頻中音頻數(shù)據(jù)作為第一音頻數(shù)據(jù)，具體為: 提取所述第一視頻中的背景音頻作為所述第一音頻數(shù)據(jù)。
4.根據(jù)權(quán)利要求2或3所述的方法，其特征在于，所述根據(jù)所述第一音頻數(shù)據(jù)確定場(chǎng)景的切換位置，具體為: 檢測(cè)第一音頻數(shù)據(jù)中的聲波變化特征；根據(jù)所述聲波變化特征確定場(chǎng)景的切換位置。
5.根據(jù)權(quán)利要求1所述的方法，其特征在于，在根據(jù)所述第一音頻數(shù)據(jù)確定場(chǎng)景的切換位置之后，還包括: 獲取預(yù)判位置信息；根據(jù)所述預(yù)判位置信息修正所述場(chǎng)景的切換位置。
6.一種場(chǎng)景切換點(diǎn)的檢測(cè)裝置，其特征在于，包括:視頻獲取單元、第一音頻提取單元和切換位置確定單元；所述視頻獲取單元，用于獲取第一視頻；所述第一音頻提取單元，用于提取所述第一視頻中音頻數(shù)據(jù)作為第一音頻數(shù)據(jù)；所述切換位置確定單元，用于根據(jù)所述第一音頻數(shù)據(jù)確定場(chǎng)景的切換位置。
7.根據(jù)權(quán)利要求6所述的裝置，其特征在于，所述第一音頻提取單元，包括:人聲音頻提取子單元；所述人聲音頻提取子單元，用于提取所述第一視頻中的人聲音頻作為所述第一音頻數(shù)據(jù)。
8.根據(jù)權(quán)利要求6所述的裝置，其特征在于，所述第一音頻提取單元，包括:背景音頻提取子單元；所述背景音頻提取子單元，用于提取所述第一視頻中的背景音頻作為所述第一音頻數(shù)據(jù)。
9.根據(jù)權(quán)利要求7或8所述的裝置，其特征在于，所述切換位置確定單元，包括:聲音檢測(cè)子單元和特征判定子單元；所述聲音檢測(cè)子單元，用于檢測(cè)第一音頻數(shù)據(jù)中的聲波變化特征；所述特征判定子單元，用于根據(jù)所述聲波變化特征確定場(chǎng)景的切換位置。
10.根據(jù)權(quán)利要求9所述的裝置，其特征在于，還包括:預(yù)判信息修正單元；所述預(yù)判信息修正單元，用于獲取預(yù)判位置信息，根據(jù)所述預(yù)判位置信息修正所述場(chǎng)景的切換位置。
【文檔編號(hào)】H04N21/233GK104469487SQ201410845412
【公開日】2015年3月25日申請(qǐng)日期:2014年12月31日優(yōu)先權(quán)日:2014年12月31日
【發(fā)明者】吳凱凱, 盧學(xué)裕, 付鵬, 白雪, 吳鑫, 姚鍵, 潘柏宇, 盧述奇申請(qǐng)人:合一網(wǎng)絡(luò)技術(shù)(北京)有限公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：吳凱凱;盧學(xué)裕;付鵬;白雪;吳鑫;姚鍵;潘柏宇;盧述奇;
技術(shù)所有人：合一網(wǎng)絡(luò)技術(shù)（北京）有限公司;
我是此專利的發(fā)明人

上一篇：一種遙控方法和雙模藍(lán)牙遙控器的制造方法
上一篇：基于視頻情感標(biāo)注輔助識(shí)別面部表情的方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、王老師：1.數(shù)字信號(hào)處理 2.傳感器技術(shù)及應(yīng)用 3.機(jī)電一體化產(chǎn)品開發(fā) 4.機(jī)械工程測(cè)試技術(shù) 5.逆向工程技術(shù)研究
2、王老師：1.機(jī)器人 2.嵌入式控制系統(tǒng)開發(fā)
3、孫老師：1.振動(dòng)信號(hào)時(shí)頻分析理論與測(cè)試系統(tǒng)設(shè)計(jì) 2.汽車檢測(cè)系統(tǒng)設(shè)計(jì) 3.汽車電子控制系統(tǒng)設(shè)計(jì)
4、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
5、袁老師：1.計(jì)算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

防雷裝置檢測(cè)方法相關(guān)技術(shù)

調(diào)教腳奴切換場(chǎng)景相關(guān)技術(shù)

flash場(chǎng)景切換相關(guān)技術(shù)

obs場(chǎng)景切換器相關(guān)技術(shù)

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

一種場(chǎng)景切換點(diǎn)的檢測(cè)方法及裝置制造方法