国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種場(chǎng)景切換點(diǎn)的檢測(cè)方法及裝置制造方法

      文檔序號(hào):7824339閱讀:340來源:國(guó)知局
      一種場(chǎng)景切換點(diǎn)的檢測(cè)方法及裝置制造方法
      【專利摘要】本發(fā)明提供一種場(chǎng)景切換點(diǎn)的檢測(cè)方法及裝置,包括:獲取第一視頻;提取所述第一視頻中音頻數(shù)據(jù)作為第一音頻數(shù)據(jù);根據(jù)所述第一音頻數(shù)據(jù)確定場(chǎng)景的切換位置。通過使用以上方法,可以根據(jù)視頻中的具體音頻信息來判斷視頻中場(chǎng)景的切換,避免了現(xiàn)有技術(shù)中依賴人工進(jìn)行標(biāo)注的復(fù)雜工作,提高了視頻處理的工作效率。
      【專利說明】一種場(chǎng)景切換點(diǎn)的檢測(cè)方法及裝置

      【技術(shù)領(lǐng)域】
      [0001]本發(fā)明涉及數(shù)字多媒體【技術(shù)領(lǐng)域】,特別是一種場(chǎng)景切換點(diǎn)的檢測(cè)方法及裝置。

      【背景技術(shù)】
      [0002]隨著數(shù)字多媒體技術(shù)的快速發(fā)展,越來越多的多媒體技術(shù)應(yīng)用到人們的工作和生活中。
      [0003]在視頻編輯領(lǐng)域,經(jīng)常會(huì)接觸到“關(guān)鍵幀”的概念,我們可以使用相關(guān)算法或工具處理得到某一視頻中存在的所有關(guān)鍵幀。例如,在某個(gè)電視劇中,從5分30秒開始至10分15秒是一個(gè)在咖啡廳會(huì)談的場(chǎng)景;而在10分16秒至12分30秒時(shí)是在汽車中對(duì)話的場(chǎng)景。因此,在10分16秒里包含一個(gè)關(guān)鍵幀,而此處正好是一個(gè)場(chǎng)景開始的位置。并且在該時(shí)間點(diǎn)后續(xù)的對(duì)話中,可能會(huì)頻繁的切換鏡頭角度,導(dǎo)致相關(guān)的算法或工具判斷出很多的關(guān)鍵幀,但這些關(guān)鍵幀都不是場(chǎng)景正確的結(jié)束位置。
      [0004]由于在實(shí)際中一個(gè)場(chǎng)景會(huì)有很多個(gè)鏡頭切換,因此僅通過關(guān)鍵幀數(shù)據(jù)是無法比較準(zhǔn)確的定位一個(gè)較完整的場(chǎng)景的開始或結(jié)束位置?,F(xiàn)有的視頻場(chǎng)景的標(biāo)注方法是由人工瀏覽影片的方式確定不同場(chǎng)景的開始或結(jié)束位置。這對(duì)編輯人員的經(jīng)驗(yàn)以及工作強(qiáng)度要求較高,且處理效率很低。
      [0005]因此,如何提供一種可以對(duì)場(chǎng)景切換點(diǎn)進(jìn)行自動(dòng)檢測(cè)的方法和裝置是本發(fā)明需要解決的問題。


      【發(fā)明內(nèi)容】

      [0006]針對(duì)現(xiàn)有技術(shù)的缺陷,本發(fā)明提供了一種場(chǎng)景切換點(diǎn)的檢測(cè)方法及裝置,解決了現(xiàn)有技術(shù)中依賴人工操作的問題,同時(shí)可以更加精確的判斷出場(chǎng)景切換的位置點(diǎn)。
      [0007]一種場(chǎng)景切換點(diǎn)的檢測(cè)方法,包括:
      獲取第一視頻;
      提取所述第一視頻中音頻數(shù)據(jù)作為第一音頻數(shù)據(jù);
      根據(jù)所述第一音頻數(shù)據(jù)確定場(chǎng)景的切換位置。
      [0008]優(yōu)選地,所述提取所述第一視頻中音頻數(shù)據(jù)作為第一音頻數(shù)據(jù),具體為:
      提取所述第一視頻中的人聲音頻作為所述第一音頻數(shù)據(jù)。
      [0009]優(yōu)選地,所述提取所述第一視頻中音頻數(shù)據(jù)作為第一音頻數(shù)據(jù),具體為:
      提取所述第一視頻中的背景音頻作為所述第一音頻數(shù)據(jù)。
      [0010]優(yōu)選地,所述根據(jù)所述第一音頻數(shù)據(jù)確定場(chǎng)景的切換位置,具體為:
      檢測(cè)第一音頻數(shù)據(jù)中的聲波變化特征;
      根據(jù)所述聲波變化特征確定場(chǎng)景的切換位置。
      [0011]在根據(jù)所述第一音頻數(shù)據(jù)確定場(chǎng)景的切換位置之后,還包括:
      獲取預(yù)判位置信息;
      根據(jù)所述預(yù)判位置信息修正所述場(chǎng)景的切換位置。
      [0012]一種場(chǎng)景切換點(diǎn)的檢測(cè)裝置,包括:視頻獲取單元、第一音頻提取單元和切換位置確定單元;
      所述視頻獲取單元,用于獲取第一視頻;
      所述第一音頻提取單元,用于提取所述第一視頻中音頻數(shù)據(jù)作為第一音頻數(shù)據(jù);
      所述切換位置確定單元,用于根據(jù)所述第一音頻數(shù)據(jù)確定場(chǎng)景的切換位置。
      [0013]優(yōu)選地,所述第一音頻提取單元,包括:人聲音頻提取子單元;
      所述人聲音頻提取子單元,用于提取所述第一視頻中的人聲音頻作為所述第一音頻數(shù)據(jù)。
      [0014]優(yōu)選地,所述第一音頻提取單元,包括:背景音頻提取子單元;
      所述背景音頻提取子單元,用于提取所述第一視頻中的背景音頻作為所述第一音頻數(shù)據(jù)。
      [0015]優(yōu)選地,所述切換位置確定單元,包括:聲音檢測(cè)子單元和特征判定子單元; 所述聲音檢測(cè)子單元,用于檢測(cè)第一音頻數(shù)據(jù)中的聲波變化特征;
      所述特征判定子單元,用于根據(jù)所述聲波變化特征確定場(chǎng)景的切換位置。
      [0016]優(yōu)選地,還包括:預(yù)判信息修正單元;
      所述預(yù)判信息修正單元,用于獲取預(yù)判位置信息,根據(jù)所述預(yù)判位置信息修正所述場(chǎng)景的切換位置。
      [0017]本發(fā)明的有益效果是:
      在本實(shí)施例中,首先獲取第一視頻,之后提取所述第一視頻中音頻數(shù)據(jù)作為第一音頻數(shù)據(jù),最后根據(jù)所述第一音頻數(shù)據(jù)確定場(chǎng)景的切換位置。通過使用以上方法,可以根據(jù)視頻中的具體音頻信息來判斷視頻中場(chǎng)景的切換,避免了現(xiàn)有技術(shù)中依賴人工進(jìn)行標(biāo)注的復(fù)雜工作,提高了視頻處理的工作效率。
      [0018]

      【專利附圖】

      【附圖說明】
      [0019]圖1是本發(fā)明提供的一種場(chǎng)景切換點(diǎn)的檢測(cè)方法第一實(shí)施例的流程圖;
      圖2是本發(fā)明提供的一種場(chǎng)景切換點(diǎn)的檢測(cè)方法第二實(shí)施例的流程圖;
      圖3是本發(fā)明提供的一種場(chǎng)景切換點(diǎn)的檢測(cè)方法第三實(shí)施例的流程圖;
      圖4是本發(fā)明提供的一種場(chǎng)景切換點(diǎn)的檢測(cè)裝置第一實(shí)施例的原理框圖;
      圖5是本發(fā)明提供的一種場(chǎng)景切換點(diǎn)的檢測(cè)裝置第二實(shí)施例的原理框圖;
      圖6是本發(fā)明提供的一種場(chǎng)景切換點(diǎn)的檢測(cè)裝置第三實(shí)施例的原理框圖。
      [0020]

      【具體實(shí)施方式】
      [0021]為使本發(fā)明的上述目的、特征和優(yōu)點(diǎn)能夠更加明顯易懂,下面結(jié)合附圖對(duì)本發(fā)明的【具體實(shí)施方式】做詳細(xì)的說明,使本發(fā)明的上述及其它目的、特征和優(yōu)勢(shì)將更加清晰。在全部附圖中相同的附圖標(biāo)記指示相同的部分。并未刻意按比例繪制附圖,重點(diǎn)在于示出本發(fā)明的主旨。
      [0022]參見圖1,該圖為本發(fā)明提供的一種場(chǎng)景切換點(diǎn)的檢測(cè)方法第一實(shí)施例的流程圖。
      [0023]本實(shí)施例中,包括:
      SlOl:獲取第一視頻。
      [0024]S102:提取所述第一視頻中音頻數(shù)據(jù)作為第一音頻數(shù)據(jù)。
      [0025]S103:根據(jù)所述第一音頻數(shù)據(jù)確定場(chǎng)景的切換位置。
      [0026]在本實(shí)施例中,首先獲取到需要進(jìn)行場(chǎng)景切換點(diǎn)校驗(yàn)的第一視頻數(shù)據(jù)。例如某一個(gè)電影或電視劇視頻。
      [0027]在視頻的每一個(gè)場(chǎng)景中,一般都會(huì)對(duì)應(yīng)有某一場(chǎng)景的聲音特征。例如,在咖啡廳中會(huì)談,背景聲音一般為較為舒緩的音樂聲音,而如果在菜市場(chǎng)中的場(chǎng)景,則背景聲音一般為較為嘈雜的聲音。
      [0028]因此,在得到第一視頻后,提取出第一視頻中的音頻數(shù)據(jù)(如視頻的中音頻波型圖),作為第一音頻數(shù)據(jù)。
      [0029]之后對(duì)第一音頻數(shù)據(jù)進(jìn)行分析,例如根據(jù)第一音頻數(shù)據(jù)中的波型圖判斷對(duì)話或背景音的中斷或起伏,從而判斷出否存在場(chǎng)景上的切換,進(jìn)而確定視頻中的場(chǎng)景切換位置。
      [0030]在本實(shí)施例中,首先獲取第一視頻,之后提取所述第一視頻中音頻數(shù)據(jù)作為第一音頻數(shù)據(jù),最后根據(jù)所述第一音頻數(shù)據(jù)確定場(chǎng)景的切換位置。通過使用以上方法,可以根據(jù)視頻中的具體音頻信息來判斷視頻中場(chǎng)景的切換,避免了現(xiàn)有技術(shù)中依賴人工進(jìn)行標(biāo)注的復(fù)雜工作,提高了視頻處理的工作效率。
      [0031]參見圖2,該圖為本發(fā)明提供的一種場(chǎng)景切換點(diǎn)的檢測(cè)方法第一實(shí)施例的流程圖。
      [0032]本實(shí)施例中的步驟S201與本發(fā)明提供的一種場(chǎng)景切換點(diǎn)的檢測(cè)方法第一實(shí)施例中的步驟SlOl相同,在此不再重復(fù)進(jìn)行介紹。
      [0033]在本實(shí)施例中,所述提取所述第一視頻中音頻數(shù)據(jù)作為第一音頻數(shù)據(jù),具體為: S202:提取所述第一視頻中的人聲音頻或背景音頻作為所述第一音頻數(shù)據(jù)。
      [0034]由于在第一視頻的音頻數(shù)據(jù)中包括有多種聲音,因此可以使用其中不同聲音作為判斷場(chǎng)景切換的條件。其中,優(yōu)選地可以使用音頻數(shù)據(jù)中的人聲對(duì)話音頻或背景音頻進(jìn)行。
      [0035]如果使用人聲對(duì)話音頻作為判斷條件,則需要首先獲取出第一視頻的音頻,之后對(duì)其中屬于人聲波段的聲音進(jìn)行加強(qiáng),而對(duì)其它波段(如背景音等)進(jìn)行抑制,從而突出人聲音頻。
      [0036]如果使用背景音頻作為判斷條件,則在獲取到第一視頻的音頻后,對(duì)處于人聲波段的聲音進(jìn)行抑制或去除,而只保留有非人聲波段的聲音(在一般情況下,該波段聲音大部分為背景聲音)。
      [0037]在本實(shí)施例中,在得到上述的第一音頻后,還需要使用該音頻確定視頻中場(chǎng)景切換的具體位置。
      [0038]具體地,
      S203:檢測(cè)第一音頻數(shù)據(jù)中的聲波變化特征。
      [0039]S204:根據(jù)所述聲波變化特征確定場(chǎng)景的切換位置。
      [0040]以人聲音頻作為判斷條件為例:每個(gè)人的聲音都有自己的特點(diǎn),因此在一個(gè)對(duì)話場(chǎng)景中對(duì)話雙方的音頻聲波是相同或相近似的。而此時(shí)如果切換到另外的一個(gè)場(chǎng)景,對(duì)話的雙方很可能發(fā)生了變化,則音頻聲波的較之前的聲波特征肯定會(huì)發(fā)生變化。根據(jù)該變化進(jìn)而確定出視頻中的場(chǎng)景發(fā)生了變化。
      [0041]而以背景音頻作為判斷條件時(shí),由于在某一個(gè)場(chǎng)景中一般都會(huì)伴有相同或相近似的聲音。如在咖啡廳會(huì)伴有持續(xù)優(yōu)雅的歌曲,而在菜市場(chǎng)中都會(huì)一直伴有嘈雜的背景音。因此,如果背景音頻發(fā)生了變化,則可以判斷為場(chǎng)景進(jìn)行了切換,發(fā)生變化的位置即場(chǎng)景切換的位置。
      [0042]另外,如果只是單純使用人聲音頻或背景音頻進(jìn)行判斷可能還存在一定的誤判的情況。為了能夠更加準(zhǔn)確的判斷出場(chǎng)景的切換變化,還可以同時(shí)對(duì)第一視頻中的人聲音頻和背景音頻進(jìn)行判斷,這樣可以大幅提高場(chǎng)景切換位置判斷的準(zhǔn)確性。例如,如果只是人聲音頻上的變化而背景音頻沒有變化,則判斷可能是在同一場(chǎng)景上出現(xiàn)了新的談話對(duì)象,但劇情的場(chǎng)景沒有變化;而如果在視頻中的某一個(gè)時(shí)間位置上人聲和背景音都發(fā)生了變化,則可以認(rèn)為場(chǎng)景發(fā)生了變化。
      [0043]通過使用以上方法,可以結(jié)合第一視頻中的音頻內(nèi)容對(duì)場(chǎng)景切換進(jìn)行準(zhǔn)確判斷,從而減少了人工對(duì)視頻進(jìn)行場(chǎng)景切換標(biāo)注的工作,提高了對(duì)視頻處理的工作效率。
      [0044]參見圖3,該圖為本發(fā)明提供的一種場(chǎng)景切換點(diǎn)的檢測(cè)方法第三實(shí)施例的流程圖。
      [0045]本實(shí)施例中的步驟S301-S303與本發(fā)明提供的一種場(chǎng)景切換點(diǎn)的檢測(cè)方法第一實(shí)施例中的步驟S101-S103相同,在此不再重復(fù)進(jìn)行介紹。
      [0046]在本實(shí)施例中,在根據(jù)所述第一音頻數(shù)據(jù)確定場(chǎng)景的切換位置之后,還包括: S304:獲取預(yù)判位置信息;
      S305:根據(jù)所述預(yù)判位置信息修正所述場(chǎng)景的切換位置。
      [0047]在本實(shí)施例中,為了更加準(zhǔn)確的得到場(chǎng)景切換的位置,還可以進(jìn)一步結(jié)合關(guān)鍵幀的方式來修正得到的場(chǎng)景切換點(diǎn)位置。
      [0048]具體的,在確定場(chǎng)景的切換位置之后,再進(jìn)一步獲取到已經(jīng)在第一視頻中標(biāo)注出的預(yù)判位置信息。這些預(yù)判位置信息是由人工、算法或其它工具根據(jù)視頻圖像判斷出的場(chǎng)景切換時(shí)間點(diǎn)信息。
      [0049]例如,在第一視頻中標(biāo)注出在第5分30秒位置、10分15秒位置、12分鐘30秒位置存在多個(gè)場(chǎng)景切換。
      [0050]此時(shí),可以將通過音頻確認(rèn)得到的場(chǎng)景切換位置與標(biāo)注的預(yù)判位置信息進(jìn)行比較。如果兩者時(shí)間相同,則認(rèn)為該位置點(diǎn)即為場(chǎng)景切換位置。如果不相同,則以預(yù)判位置信息中的時(shí)間點(diǎn)作為第一視頻中的場(chǎng)景切換位置。
      [0051]如,根據(jù)音頻數(shù)據(jù)確定在第5分30秒時(shí)存在場(chǎng)景切換點(diǎn),經(jīng)與預(yù)判位置信息相比較,在預(yù)判位置信息中也存在第5分30秒的場(chǎng)景切換點(diǎn),則認(rèn)為該位置確為場(chǎng)景切換的位置點(diǎn)。若根據(jù)音頻數(shù)據(jù)確定在第5分31秒時(shí)存在場(chǎng)景切換點(diǎn),而在預(yù)判位置信息中的切換位置點(diǎn)為第5分30秒,則以第5分30秒為準(zhǔn)作為場(chǎng)景的切換位置。
      [0052]通過使用以上方法,可以結(jié)合預(yù)判位置信息來更加準(zhǔn)確地修正的場(chǎng)景切換位置,從而為后續(xù)的視頻處理工作提供準(zhǔn)確的信息。
      [0053]另外,結(jié)合本發(fā)明提供的一種場(chǎng)景切換點(diǎn)的檢測(cè)方法,還可以提供一種場(chǎng)景切換點(diǎn)的檢測(cè)裝置,具體如下:
      參見圖4,該圖為本發(fā)明提供的一種場(chǎng)景切換點(diǎn)的檢測(cè)裝置第一實(shí)施例的原理框圖。
      [0054]在本實(shí)施例中,包括:視頻獲取單元10、第一音頻提取單元20和切換位置確定單元30 ; 所述視頻獲取單元10,用于獲取第一視頻。
      [0055]所述第一音頻提取單元20,用于提取所述第一視頻中音頻數(shù)據(jù)作為第一音頻數(shù)據(jù)。
      [0056]所述切換位置確定單元30,用于根據(jù)所述第一音頻數(shù)據(jù)確定場(chǎng)景的切換位置。
      [0057]在本實(shí)施例中,視頻獲取單元10首先獲取到需要進(jìn)行場(chǎng)景切換點(diǎn)校驗(yàn)的第一視頻數(shù)據(jù)。例如某一個(gè)電影或電視劇視頻。
      [0058]在視頻的每一個(gè)場(chǎng)景中,一般都會(huì)對(duì)應(yīng)有某一場(chǎng)景的聲音特征。例如,在咖啡廳中會(huì)談,背景聲音一般為較為舒緩的音樂聲音,而如果在菜市場(chǎng)中的場(chǎng)景,則背景聲音一般為較為嘈雜的聲音。
      [0059]因此,在得到第一視頻后,第一音頻提取單元20提取出第一視頻中的音頻數(shù)據(jù)(如視頻的中音頻波型圖),作為第一音頻數(shù)據(jù)。
      [0060]之后切換位置確定單元30對(duì)第一音頻數(shù)據(jù)進(jìn)行分析,例如根據(jù)第一音頻數(shù)據(jù)中的波型圖判斷對(duì)話或背景音的中斷或起伏,從而判斷出否存在場(chǎng)景上的切換,進(jìn)而確定視頻中的場(chǎng)景切換位置。
      [0061]在本實(shí)施例中,包括:視頻獲取單元、第一音頻提取單元和切換位置確定單元。其中,視頻獲取單元用于獲取第一視頻。第一音頻提取單元用于提取第一視頻中音頻數(shù)據(jù)作為第一音頻數(shù)據(jù)。切換位置確定單元用于根據(jù)第一音頻數(shù)據(jù)確定場(chǎng)景的切換位置。通過使用以上裝置,可以根據(jù)視頻中的具體音頻信息來判斷視頻中場(chǎng)景的切換,避免了現(xiàn)有技術(shù)中依賴人工進(jìn)行標(biāo)注的復(fù)雜工作,提高了視頻處理的工作效率。
      [0062]參見圖5,該圖為本發(fā)明提供的一種場(chǎng)景切換點(diǎn)的檢測(cè)裝置第二實(shí)施例的原理框圖。
      [0063]由于在第一視頻的音頻數(shù)據(jù)中包括有多種聲音,因此可以使用其中不同聲音作為判斷場(chǎng)景切換的條件。其中,優(yōu)選地可以使用音頻數(shù)據(jù)中的人聲對(duì)話音頻或背景音頻進(jìn)行。因此,在第一音頻提取單元20中,可以包括:人聲音頻提取子單元201,或者包括:背景音頻提取子單元202。
      [0064]所述人聲音頻提取子單元201,用于提取所述第一視頻中的人聲音頻作為所述第一音頻數(shù)據(jù)。
      [0065]所述背景音頻提取子單元202,用于提取所述第一視頻中的背景音頻作為所述第一音頻數(shù)據(jù)。
      [0066]如果由人聲音頻提取子單元201使用人聲對(duì)話音頻作為判斷條件,則需要首先獲取出第一視頻的音頻,之后對(duì)其中屬于人聲波段的聲音進(jìn)行加強(qiáng),而對(duì)其它波段(如背景音等)進(jìn)行抑制,從而突出人聲音頻。
      [0067]如果由背景音頻提取子單元202使用背景音頻作為判斷條件,則在獲取到第一視頻的音頻后,對(duì)處于人聲波段的聲音進(jìn)行抑制或去除,而只保留有非人聲波段的聲音(在一般情況下,該波段聲音大部分為背景聲音)。
      [0068]在本實(shí)施例中,在得到上述的第一音頻后,還需要使用該音頻確定視頻中場(chǎng)景切換的具體位置。
      [0069]具體地,在所述切換位置確定單元30中,包括有:聲音檢測(cè)子單元301和特征判定子單元302。
      [0070]所述聲音檢測(cè)子單元301,用于檢測(cè)第一音頻數(shù)據(jù)中的聲波變化特征。
      [0071]所述特征判定子單元302,用于根據(jù)所述聲波變化特征確定場(chǎng)景的切換位置。
      [0072]以人聲音頻作為判斷條件為例:每個(gè)人的聲音都有自己的特點(diǎn),因此在一個(gè)對(duì)話場(chǎng)景中對(duì)話雙方的音頻聲波是相同或相近似的。而此時(shí)如果切換到另外的一個(gè)場(chǎng)景,對(duì)話的雙方很可能發(fā)生了變化,則聲音檢測(cè)子單元301檢測(cè)到音頻聲波的較之前的聲波特征發(fā)生變化。根據(jù)該變化特征判定子單元302進(jìn)而確定出視頻中的場(chǎng)景發(fā)生了變化。
      [0073]而以背景音頻作為判斷條件時(shí),由于在某一個(gè)場(chǎng)景中一般都會(huì)伴有相同或相近似的聲音。如在咖啡廳會(huì)伴有持續(xù)優(yōu)雅的歌曲,而在菜市場(chǎng)中都會(huì)一直伴有嘈雜的背景音。因此,如果聲音檢測(cè)子單元301檢測(cè)到背景音頻發(fā)生了變化,則特征判定子單元302可以判斷為場(chǎng)景進(jìn)行了切換,發(fā)生變化的位置即場(chǎng)景切換的位置。
      [0074]另外,如果只是單純使用人聲音頻或背景音頻進(jìn)行判斷可能還存在一定的誤判的情況。為了能夠更加準(zhǔn)確的判斷出場(chǎng)景的切換變化,還可以同時(shí)使用人聲音頻提取子單元201和背景音頻提取子單元202進(jìn)行判斷,這樣可以大幅提高場(chǎng)景切換位置判斷的準(zhǔn)確性。例如,如果只是人聲音頻上的變化而背景音頻沒有變化,則判斷可能是在同一場(chǎng)景上出現(xiàn)了新的談話對(duì)象,但劇情的場(chǎng)景沒有變化;而如果在視頻中的某一個(gè)時(shí)間位置上人聲和背景音都發(fā)生了變化,則可以認(rèn)為場(chǎng)景發(fā)生了變化。
      [0075]通過使用以上裝置,可以結(jié)合第一視頻中的音頻內(nèi)容對(duì)場(chǎng)景切換進(jìn)行準(zhǔn)確判斷,從而減少了人工對(duì)視頻進(jìn)行場(chǎng)景切換標(biāo)注的工作,提高了對(duì)視頻處理的工作效率。
      [0076]參見圖6,該圖為本發(fā)明提供的一種場(chǎng)景切換點(diǎn)的檢測(cè)裝置第三實(shí)施例的原理框圖。
      [0077]在本實(shí)施例中,還包括:預(yù)判信息修正單元40 ;
      所述預(yù)判信息修正單元40,用于獲取預(yù)判位置信息,根據(jù)所述預(yù)判位置信息修正所述場(chǎng)景的切換位置。。
      [0078]在本實(shí)施例中,為了更加準(zhǔn)確的得到場(chǎng)景切換的位置,還可以進(jìn)一步結(jié)合關(guān)鍵幀的方式來修正得到的場(chǎng)景切換點(diǎn)位置。
      [0079]具體的,在確定場(chǎng)景的切換位置之后,使用預(yù)判信息修正單元40進(jìn)一步獲取到已經(jīng)在第一視頻中標(biāo)注出的預(yù)判位置信息。這些預(yù)判位置信息是由人工、算法或其它工具根據(jù)視頻圖像判斷出的關(guān)鍵幀場(chǎng)景切換信息。
      [0080]例如,預(yù)判位置信息在第一視頻中標(biāo)注出在第5分30秒位置、10分15秒位置、12分鐘30秒位置存在多個(gè)場(chǎng)景切換。
      [0081]此時(shí),預(yù)判信息修正單元40將通過音頻確認(rèn)得到的場(chǎng)景切換位置與標(biāo)注的預(yù)判位置信息進(jìn)行比較。如果兩者時(shí)間相同,則認(rèn)為該位置點(diǎn)即為場(chǎng)景切換位置。如果不相同,則以預(yù)判位置信息中的時(shí)間點(diǎn)作為第一視頻中的場(chǎng)景切換位置。
      [0082]如,根據(jù)音頻數(shù)據(jù)確定在第5分30秒時(shí)存在場(chǎng)景切換點(diǎn),經(jīng)與預(yù)判位置信息相比較,在預(yù)判位置信息中也存在第5分30秒的場(chǎng)景切換點(diǎn),則認(rèn)為該位置確為場(chǎng)景切換的位置點(diǎn)。若根據(jù)音頻數(shù)據(jù)確定在第5分31秒時(shí)存在場(chǎng)景切換點(diǎn),而在預(yù)判位置信息中的切換位置點(diǎn)為第5分30秒,則以第5分30秒為準(zhǔn)作為場(chǎng)景的切換位置。
      [0083]通過使用以上裝置,可以結(jié)合預(yù)判位置信息來更加準(zhǔn)確地修正的場(chǎng)景切換位置,從而為后續(xù)的視頻處理工作提供準(zhǔn)確的信息。
      [0084]在以上的描述中闡述了很多具體細(xì)節(jié)以便于充分理解本發(fā)明。但是以上描述僅是本發(fā)明的較佳實(shí)施例而已,本發(fā)明能夠以很多不同于在此描述的其它方式來實(shí)施,因此本發(fā)明不受上面公開的具體實(shí)施的限制。同時(shí)任何熟悉本領(lǐng)域技術(shù)人員在不脫離本發(fā)明技術(shù)方案范圍情況下,都可利用上述揭示的方法和技術(shù)內(nèi)容對(duì)本發(fā)明技術(shù)方案做出許多可能的變動(dòng)和修飾,或修改為等同變化的等效實(shí)施例。凡是未脫離本發(fā)明技術(shù)方案的內(nèi)容,依據(jù)本發(fā)明的技術(shù)實(shí)質(zhì)對(duì)以上實(shí)施例所做的任何簡(jiǎn)單修改、等同變化及修飾,均仍屬于本發(fā)明技術(shù)方案保護(hù)的范圍內(nèi)。
      【權(quán)利要求】
      1.一種場(chǎng)景切換點(diǎn)的檢測(cè)方法,其特征在于,包括: 獲取第一視頻; 提取所述第一視頻中音頻數(shù)據(jù)作為第一音頻數(shù)據(jù); 根據(jù)所述第一音頻數(shù)據(jù)確定場(chǎng)景的切換位置。
      2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述提取所述第一視頻中音頻數(shù)據(jù)作為第一音頻數(shù)據(jù),具體為: 提取所述第一視頻中的人聲音頻作為所述第一音頻數(shù)據(jù)。
      3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述提取所述第一視頻中音頻數(shù)據(jù)作為第一音頻數(shù)據(jù),具體為: 提取所述第一視頻中的背景音頻作為所述第一音頻數(shù)據(jù)。
      4.根據(jù)權(quán)利要求2或3所述的方法,其特征在于,所述根據(jù)所述第一音頻數(shù)據(jù)確定場(chǎng)景的切換位置,具體為: 檢測(cè)第一音頻數(shù)據(jù)中的聲波變化特征; 根據(jù)所述聲波變化特征確定場(chǎng)景的切換位置。
      5.根據(jù)權(quán)利要求1所述的方法,其特征在于,在根據(jù)所述第一音頻數(shù)據(jù)確定場(chǎng)景的切換位置之后,還包括: 獲取預(yù)判位置信息; 根據(jù)所述預(yù)判位置信息修正所述場(chǎng)景的切換位置。
      6.一種場(chǎng)景切換點(diǎn)的檢測(cè)裝置,其特征在于,包括:視頻獲取單元、第一音頻提取單元和切換位置確定單元; 所述視頻獲取單元,用于獲取第一視頻; 所述第一音頻提取單元,用于提取所述第一視頻中音頻數(shù)據(jù)作為第一音頻數(shù)據(jù); 所述切換位置確定單元,用于根據(jù)所述第一音頻數(shù)據(jù)確定場(chǎng)景的切換位置。
      7.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述第一音頻提取單元,包括:人聲音頻提取子單元; 所述人聲音頻提取子單元,用于提取所述第一視頻中的人聲音頻作為所述第一音頻數(shù)據(jù)。
      8.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述第一音頻提取單元,包括:背景音頻提取子單元; 所述背景音頻提取子單元,用于提取所述第一視頻中的背景音頻作為所述第一音頻數(shù)據(jù)。
      9.根據(jù)權(quán)利要求7或8所述的裝置,其特征在于,所述切換位置確定單元,包括:聲音檢測(cè)子單元和特征判定子單元; 所述聲音檢測(cè)子單元,用于檢測(cè)第一音頻數(shù)據(jù)中的聲波變化特征; 所述特征判定子單元,用于根據(jù)所述聲波變化特征確定場(chǎng)景的切換位置。
      10.根據(jù)權(quán)利要求9所述的裝置,其特征在于,還包括:預(yù)判信息修正單元; 所述預(yù)判信息修正單元,用于獲取預(yù)判位置信息,根據(jù)所述預(yù)判位置信息修正所述場(chǎng)景的切換位置。
      【文檔編號(hào)】H04N21/233GK104469487SQ201410845412
      【公開日】2015年3月25日 申請(qǐng)日期:2014年12月31日 優(yōu)先權(quán)日:2014年12月31日
      【發(fā)明者】吳凱凱, 盧學(xué)裕, 付鵬, 白雪, 吳鑫, 姚鍵, 潘柏宇, 盧述奇 申請(qǐng)人:合一網(wǎng)絡(luò)技術(shù)(北京)有限公司
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1