智能導(dǎo)航播放器的制造方法
【專利摘要】本發(fā)明公開了一種智能導(dǎo)航播放器,包括音頻特征分析模塊、智能搜索模塊、聲音采集模塊、智能音頻標(biāo)引制作模塊、音頻標(biāo)引導(dǎo)航模塊和網(wǎng)絡(luò)服務(wù)平臺;提供了音頻特征分析、識別與搜索,通過聲學(xué)建模、模式分類和動態(tài)規(guī)劃方法建立音頻的旋律特征和每個(gè)人物或?qū)ο螵?dú)特的聲紋特征,通過云計(jì)算分布式協(xié)同,進(jìn)行精確匹配,包括相關(guān)樂曲、演員、節(jié)目唯一標(biāo)識、節(jié)目屬性、版權(quán)信息、網(wǎng)絡(luò)服務(wù)平臺鏈接,以及與節(jié)目本身相關(guān)的各時(shí)間節(jié)點(diǎn)上的主題、人物、商品及內(nèi)容關(guān)聯(lián)的應(yīng)用程序、支付接口、多媒體、網(wǎng)絡(luò)鏈接、評價(jià)、贊助商索引及訪問方法;并能通過圖像水印進(jìn)行版權(quán)鑒別和輔助導(dǎo)航。本發(fā)明還公開了一種帶有社區(qū)服務(wù)功能的移動終端智能導(dǎo)航播放器。
【專利說明】智能導(dǎo)航播放器
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種具備可檢測音頻特征以及提取預(yù)先嵌入的數(shù)據(jù)信息的音頻分析與識別播放器,通過音頻中提取的導(dǎo)航信息能夠把原始音視頻節(jié)目中所有包含的物體都通過關(guān)聯(lián)引導(dǎo)到各自的相關(guān)數(shù)據(jù)、網(wǎng)址或電子商務(wù)接口。
【背景技術(shù)】
[0002]普通的音頻數(shù)據(jù)不具備導(dǎo)航的特點(diǎn),實(shí)現(xiàn)防偽、廣告和收費(fèi)應(yīng)用都很困難,如果能將音視頻節(jié)目中的所有劇情、人物和商品信息的相關(guān)服務(wù)和商務(wù)鏈接作為音頻標(biāo)引都放入對應(yīng)的時(shí)間軸上的音頻數(shù)據(jù)中,就能夠提供更適于媒體服務(wù)的智能導(dǎo)航播放器。
【發(fā)明內(nèi)容】
[0003]本發(fā)明解決了傳統(tǒng)多媒體播放器和音頻數(shù)據(jù)無法自動識別和導(dǎo)航的缺點(diǎn),提供了一種智能導(dǎo)航播放器,其特征在于,包括音頻特征分析模塊、智能搜索模塊、聲音采集模塊、智能音頻標(biāo)引制作模塊、音頻標(biāo)引導(dǎo)航模塊和網(wǎng)絡(luò)服務(wù)平臺組成,所述音頻特征分析模塊提供了音頻特征的分析、識別與搜索,通過聲學(xué)建模、模式分類和動態(tài)規(guī)劃方法建立音頻的旋律特征,通過以下方法的組合,進(jìn)行多媒體節(jié)目的精確匹配,并通過所述智能搜索模塊和所述網(wǎng)絡(luò)服務(wù)平臺提供相關(guān)多媒體節(jié)目的導(dǎo)航鏈接:
[0004](I)識別文件名或數(shù)據(jù)流的命名;
[0005](2)識別文件頭或數(shù)據(jù)流中的屬性信息;
[0006](3)識別文件分段或數(shù)據(jù)流分段的哈希值;
[0007](4)通過聲學(xué)建模、模式分類和動態(tài)規(guī)劃方法識別發(fā)聲者的聲紋特征;
[0008](5)通過聲學(xué)建模、模式分類和動態(tài)規(guī)劃方法識別音頻的旋律特征;
[0009](6)通過聲學(xué)建模、模式分類和動態(tài)規(guī)劃方法識別由聲音米集模塊米集的5-30秒范圍內(nèi)的哼唱特征。
[0010]對于文件形式的多媒體節(jié)目,通常以文件名,文件頭以及文件體中包含的特征數(shù)據(jù)能夠匹配對應(yīng)準(zhǔn)確的多媒體節(jié)目,為了保障更準(zhǔn)確,因此還使用了文件哈希值,以及某時(shí)間段的音頻旋律特征或者由用戶通過人聲哼唱提供的音頻數(shù)據(jù)旋律特征來加強(qiáng)對多媒體節(jié)目文件的識別。
[0011]對于在線數(shù)據(jù)流形式的多媒體節(jié)目,主要以音頻旋律特征和其中的發(fā)聲者的聲紋特征來識別。
[0012]所述聲紋特征是指能夠描述發(fā)聲者特征的數(shù)據(jù),通常每個(gè)發(fā)聲者具有自已獨(dú)特的發(fā)聲模式,比如構(gòu)成個(gè)人音色的多種特定頻率的組合模式,起始或結(jié)束時(shí)的能量特征,特定字眼的發(fā)聲特征,以及通過小波分析得到的從低頻到高頻進(jìn)行數(shù)據(jù)排列的規(guī)律。
[0013]通過聲紋能夠自動識別當(dāng)前多媒體節(jié)目中正在說話的人物或發(fā)聲對象,隨著采集數(shù)據(jù)的增多,能夠不斷逼近匹配對象,通過識別發(fā)聲對象,如演員或配音演員,通過智能搜素和網(wǎng)絡(luò)服務(wù)平臺能夠展開相關(guān)的多媒體節(jié)目、代言商品、關(guān)聯(lián)人物、評論、新聞等索引進(jìn)行導(dǎo)航。
[0014]由于焦點(diǎn)關(guān)注的著名人物是一小部分子集,通過云計(jì)算的方式能夠趨近于越來越精確的統(tǒng)計(jì)相關(guān)音頻特征。由于每個(gè)播放器都在使用音頻特征比對,也在通過運(yùn)算做特征補(bǔ)充的貢獻(xiàn),使得云計(jì)算模式的協(xié)同能夠有效進(jìn)行音頻特征的服務(wù)。
[0015]其它輔助的手段還包括使用額外數(shù)據(jù)包形式的數(shù)字水印,嵌入圖像的水印以及字幕文件中的文字信息。
[0016]這樣做的好處是,即使是沒有嵌入音頻標(biāo)引信息的多媒體節(jié)目,網(wǎng)絡(luò)服務(wù)平臺仍然可以提供關(guān)聯(lián)商品索引和廣告服務(wù),通過特征計(jì)算形成匹配數(shù)據(jù),并把相關(guān)標(biāo)引導(dǎo)航信息和所述匹配數(shù)據(jù)關(guān)聯(lián)起來,以后客戶端采用包含音頻標(biāo)引導(dǎo)航模塊的智能導(dǎo)航播放器能夠計(jì)算同樣的匹配數(shù)據(jù),通過網(wǎng)絡(luò)服務(wù)平臺找到并導(dǎo)入對應(yīng)的多媒體節(jié)目的標(biāo)引導(dǎo)航信
肩、Ο
[0017]所述的智能導(dǎo)航播放器,其特征在于,所述音頻特征分析模塊與所述網(wǎng)絡(luò)服務(wù)平臺配合工作,在所述智能導(dǎo)航播放器實(shí)時(shí)播放或采集音頻時(shí),一方面音頻特征分析模塊進(jìn)行分析和提取,通過智能導(dǎo)航播放器發(fā)送到網(wǎng)絡(luò)服務(wù)平臺,同數(shù)據(jù)庫中已有的旋律特征和/或聲紋特征進(jìn)行比對,網(wǎng)絡(luò)服務(wù)平臺按相似度從高到低返回對應(yīng)的匹配對象以及關(guān)聯(lián)導(dǎo)航數(shù)據(jù)給智能導(dǎo)航播放器;另一方面對于通過其它關(guān)聯(lián)數(shù)據(jù)或人工識別已經(jīng)確定的特定對象,音頻特征分析模塊分析和提取的數(shù)據(jù),通過智能導(dǎo)航播放器發(fā)送到網(wǎng)絡(luò)服務(wù)平臺進(jìn)行更新,作為對現(xiàn)有數(shù)據(jù)庫中對應(yīng)的所述特定對象的旋律特征和/或聲紋特征的補(bǔ)充。
[0018]所述的智能導(dǎo)航播放器,其特征在于,所述多媒體節(jié)目是指包含音頻數(shù)據(jù),以及在音頻數(shù)據(jù)基礎(chǔ)上包含多路音頻數(shù)據(jù)、文字?jǐn)?shù)據(jù)、圖片數(shù)據(jù)和視頻數(shù)據(jù)中的一種或多種格式數(shù)據(jù)的數(shù)字文件或數(shù)據(jù)流;所述智能音頻標(biāo)引制作模塊,通過識別和分析多媒體節(jié)目中原始音頻的特定壓縮算法,找到位于人的感知盲區(qū)的冗余數(shù)據(jù)同時(shí)又是處于所述特定壓縮算法的非確定區(qū)域不會被舍棄的數(shù)據(jù),在其中嵌入具有抗噪性、魯棒性和不可感知性的音頻標(biāo)引信息,同時(shí)為防止音頻受損帶來的音頻標(biāo)引信息損失,所述音頻標(biāo)引信息的數(shù)據(jù)做了一定數(shù)據(jù)量的備份、冗余和糾錯(cuò)處理;所述音頻標(biāo)引信息的基礎(chǔ)數(shù)據(jù)包括多媒體節(jié)目的唯一標(biāo)識、節(jié)目屬性、版權(quán)信息和網(wǎng)絡(luò)服務(wù)平臺鏈接,所述音頻標(biāo)引信息的擴(kuò)展數(shù)據(jù)是與多媒體節(jié)目本身相關(guān)的各時(shí)間節(jié)點(diǎn)上的信息及導(dǎo)航鏈接,包括:主題、人物與內(nèi)容介紹,關(guān)聯(lián)的應(yīng)用程序、支付接口、多媒體節(jié)目、人物及相關(guān)商品的鏈接,按時(shí)間或好評等級分類的評價(jià)信息,附加的詳細(xì)節(jié)目介紹、導(dǎo)演、主演、主題分類、發(fā)行年份、國家地區(qū)和贊助商的索引及鏈接;所述音頻標(biāo)引導(dǎo)航模塊,通過分析和識別多媒體節(jié)目的音頻標(biāo)引信息,能夠獲得多媒體節(jié)目的唯一標(biāo)識和版權(quán)信息,并能根據(jù)網(wǎng)絡(luò)服務(wù)平臺鏈接和音頻標(biāo)引信息的擴(kuò)展數(shù)據(jù)中的導(dǎo)航鏈接,獲取實(shí)時(shí)的鏈接信息,指向相關(guān)的應(yīng)用程序、支付接口、網(wǎng)頁、博客和多媒體節(jié)目鏈接;所述網(wǎng)絡(luò)服務(wù)平臺提供相關(guān)導(dǎo)航鏈接的信息與電子商務(wù)服務(wù)。
[0019]這樣實(shí)現(xiàn)的好處是,節(jié)省了媒體資源,原先廣告只能位于片頭、片尾等關(guān)鍵位置,且不是每個(gè)用戶都適合。而音頻標(biāo)引信息是直接以音視頻節(jié)目每個(gè)時(shí)刻所在時(shí)間點(diǎn)上的劇情、人物和商品為索引,進(jìn)行展開,相當(dāng)于以內(nèi)容為引導(dǎo)和分類的智能廣告檢索與導(dǎo)航系統(tǒng)。
[0020]所述的智能導(dǎo)航播放器,其特征在于,所述智能音頻標(biāo)引制作模塊還通過在多媒體節(jié)目中附加額外的數(shù)據(jù)包,添加整體節(jié)目的哈希值和防偽認(rèn)證數(shù)據(jù)作為數(shù)字水印進(jìn)行原始節(jié)目鑒別,當(dāng)多媒體節(jié)目被截取、編輯或重新壓縮,其音頻旋律特征和魯棒性的音頻標(biāo)引信息不會丟失,但以額外數(shù)據(jù)包形式存在的數(shù)字水印會丟失或不完整,因此能夠用于檢測多媒體節(jié)目的完整性和原始性。
[0021]所述的智能導(dǎo)航播放器,其特征在于,所述網(wǎng)絡(luò)服務(wù)平臺使用基于標(biāo)識認(rèn)證的安全技術(shù)為通過審核的注冊會員提供自助廣告服務(wù)和電子商務(wù)服務(wù),會員通過基于多媒體節(jié)目本身相關(guān)的各時(shí)間節(jié)點(diǎn)上的信息及導(dǎo)航鏈接,包括:主題、人物與內(nèi)容介紹,關(guān)聯(lián)的應(yīng)用程序、支付接口、多媒體節(jié)目、人物及相關(guān)商品的鏈接,按時(shí)間或好評等級分類的評價(jià)信息,以及附加的詳細(xì)節(jié)目介紹、導(dǎo)演、主演、主題分類、發(fā)行年份、國家地區(qū)和贊助商的索引及鏈接,進(jìn)行廣告和商品匹配以及競價(jià)排名;所述基于標(biāo)識認(rèn)證的技術(shù)是指,通過橢圓曲線算法構(gòu)建多個(gè)種子公私鑰對,按特定次序編號,使用用戶標(biāo)識的哈希值作為多項(xiàng)式,把相關(guān)子項(xiàng)值指向的編號對應(yīng)的公鑰進(jìn)行點(diǎn)加運(yùn)算形成用戶的公鑰,同樣把相關(guān)子項(xiàng)值指向的編號對應(yīng)的私鑰進(jìn)行模加運(yùn)算形成用戶的私鑰,這樣就構(gòu)建了用戶標(biāo)識與公鑰之間的唯一映射關(guān)系,生成用戶公鑰的種子公鑰及算法庫公開,包括在所述音頻標(biāo)引導(dǎo)航模塊中,生成用戶私鑰的種子私鑰及算法庫保密,包括在所述網(wǎng)絡(luò)服務(wù)平臺中,用戶私鑰通過用戶設(shè)備的唯一標(biāo)識加密后存儲在專用的硬件中或存儲空間。
[0022]所述的智能導(dǎo)航播放器,其特征在于,所述網(wǎng)絡(luò)服務(wù)平臺具有電子商務(wù)功能,包含帶有商品審核與發(fā)布功能的電子商城和電子支付功能;所述電子商城除采用標(biāo)準(zhǔn)的商品購買模式,還采用團(tuán)購模式和反向團(tuán)購模式;所述團(tuán)購模式分成由用戶發(fā)起的散單拼團(tuán)按統(tǒng)一批發(fā)價(jià)進(jìn)行購買的用戶團(tuán)購和由商家指定的特定數(shù)量商品按統(tǒng)一批發(fā)價(jià)進(jìn)行銷售且認(rèn)購數(shù)量超過一定比例才成交的商家團(tuán)購;所述反向團(tuán)購模式也分為兩種,一種是由用戶自由出價(jià),網(wǎng)絡(luò)服務(wù)平臺進(jìn)行自動撮合,按用戶出價(jià)價(jià)格和出價(jià)時(shí)間以非統(tǒng)一批發(fā)價(jià)的價(jià)格組合成交的用戶反向團(tuán)購,另一種是商家根據(jù)已出價(jià)用戶的平均價(jià)格和數(shù)量信息,選擇以特定數(shù)量和均價(jià)成交的商家反向團(tuán)購。
[0023]所述的智能導(dǎo)航播放器,其特征在于,所述音頻標(biāo)引導(dǎo)航模塊包含快捷支付接口,與所述網(wǎng)絡(luò)服務(wù)平臺的電子商城配合,對于包含支付信息的商品導(dǎo)航鏈接,能夠進(jìn)入直接所述電子商城的支付流程。
[0024]所述的智能導(dǎo)航播放器,其特征在于,當(dāng)所述多媒體節(jié)目的載體是帶有電子標(biāo)簽的光盤、硬盤或其它包裝形式的硬件時(shí),所述音頻標(biāo)引信息中還包含有和電子標(biāo)簽進(jìn)行匹配的驗(yàn)證數(shù)據(jù)。用戶終端通過電子標(biāo)簽讀卡器進(jìn)行電子標(biāo)簽的加密讀寫,能夠控制所述電子標(biāo)簽的有效性、使用條件和使用次數(shù),所述電子標(biāo)簽?zāi)軌蛱峁┒嗝襟w節(jié)目的真實(shí)性驗(yàn)證及解碼條件信息,包括有效期和使用次數(shù)。
[0025]所述的智能導(dǎo)航播放器,其特征在于,所述電子標(biāo)簽的信息存儲空間分為多個(gè)數(shù)據(jù)區(qū),每個(gè)數(shù)據(jù)區(qū)除具備讀寫密碼外,還采用多種加密算法及密鑰進(jìn)行組合的加密方法進(jìn)行密文存儲信息及生成驗(yàn)證碼,主機(jī)通過特定的解密程序才能驗(yàn)證并還原數(shù)據(jù)信息。
[0026]所述的智能導(dǎo)航播放器,其特征在于,所述多媒體節(jié)目中的音頻數(shù)據(jù)和/或其它關(guān)聯(lián)數(shù)據(jù)為加密數(shù)據(jù),解密密鑰由所述音頻標(biāo)引信息或電子標(biāo)簽中包含的數(shù)據(jù)進(jìn)行計(jì)算;所述關(guān)聯(lián)數(shù)據(jù)包括視頻數(shù)據(jù)、多路音頻數(shù)據(jù),文字?jǐn)?shù)據(jù)和圖片數(shù)據(jù)。
[0027]所述的智能導(dǎo)航播放器,其特征在于,所述多媒體節(jié)目是由網(wǎng)絡(luò)服務(wù)平臺提供的在線播放數(shù)據(jù)流或通過用戶端設(shè)備采集的人聲哼唱的數(shù)據(jù)。[0028]這樣的應(yīng)用類似智能搜索引擎,通過一段音頻就能為用戶鏈接原始的多媒體節(jié)目以及相關(guān)的首頻標(biāo)引/[目息。
[0029]所述的智能導(dǎo)航播放器,其特征在于,所述多媒體節(jié)目數(shù)據(jù)和音頻標(biāo)引信息數(shù)據(jù)采用多種對稱加密算法和非對稱加密算法進(jìn)行組合。
[0030]對稱算法包括:已公開的對稱算法,典型的如AES算法、3DES算法、IDEA算法、SM1算法等,以及自定義的對稱算法。
[0031 ] 非對稱算法包括:已公開的非對稱算法,典型的如RSA算法、ECC算法、SM2算法等,以及自定義的非對稱算法。
[0032]多種密鑰組合指采用多個(gè)密鑰進(jìn)行復(fù)合運(yùn)算,如密鑰的疊加、異或和分散等。典型的用法包括:先產(chǎn)生隨機(jī)數(shù),用原始密鑰加密隨機(jī)數(shù)生成的密文作為分散密鑰,再對數(shù)據(jù)進(jìn)行加密,使得原始密鑰沒有直接使用,而是通過隨機(jī)數(shù)分散生成過程密鑰,實(shí)現(xiàn)一次一密。
[0033]驗(yàn)證碼的生成方法通常還包括摘要算法。
[0034]摘要算法包括:已公開的摘要算法,典型的如:MD5算法、SHA1算法、SM3算法等,以及自定義的摘要算法。
[0035]驗(yàn)證碼也能夠通過多種摘要算法組合來實(shí)現(xiàn)針對關(guān)鍵數(shù)據(jù)生成的驗(yàn)證數(shù)據(jù),用于接收方檢驗(yàn)數(shù)據(jù)的有效性。
【專利附圖】
【附圖說明】[0036]無【具體實(shí)施方式】
[0037]本發(fā)明的智能導(dǎo)航播放器【具體實(shí)施方式】為,首先對提供關(guān)聯(lián)服務(wù)的多媒體節(jié)目進(jìn)行分析與運(yùn)算,計(jì)算各時(shí)間段的音頻數(shù)據(jù)的旋律特征,以及計(jì)算對應(yīng)音頻的人聲哼唱的旋律特征,存儲在網(wǎng)絡(luò)服務(wù)平臺的音頻特征數(shù)據(jù)庫中。同時(shí)針對多媒體節(jié)目中原始音頻的特定壓縮算法,找到各時(shí)間點(diǎn)上位于人的感知盲區(qū)的冗余數(shù)據(jù)同時(shí)又是處于所述特定壓縮算法的非確定區(qū)域不會被舍棄的數(shù)據(jù),做好標(biāo)記,為后續(xù)在其中嵌入具有抗噪性、魯棒性和不可感知性的音頻標(biāo)引信息做好基礎(chǔ)。
[0038]抗噪性通常使用位于高頻區(qū)域的數(shù)據(jù),由于人耳不敏感而噪聲不在該頻率范圍,通常不受外部干擾,但容易被音頻再壓縮損失掉,魯棒性不強(qiáng),所以本發(fā)明采用變換域模型,變換域算法采用離散小波變換。基本思想都是結(jié)合聽覺特性對原始音頻數(shù)據(jù)在一定的頻域內(nèi)進(jìn)行變換處理,然后改變相應(yīng)的變換系數(shù)來嵌入數(shù)據(jù)。離散小波變換算法是利用小波基的原始音頻進(jìn)行L級小波分解,保留前L-1級的差別分量而對第L級的細(xì)節(jié)分量進(jìn)行處理并嵌入數(shù)據(jù)。此算法的一個(gè)特點(diǎn)是將嵌入數(shù)據(jù)放在音頻信號能量最集中的低頻部分。也是利用了人的感知盲區(qū),具有很好的魯棒性和不可感知性。
[0039]為防止音頻受損帶來的音頻標(biāo)引信息損失,所述音頻標(biāo)引信息的數(shù)據(jù)做了一定數(shù)據(jù)量的備份、冗余和糾錯(cuò)處理。
[0040]網(wǎng)絡(luò)服務(wù)平臺對外提供自助招商模式,商家通過把商品或網(wǎng)址鏈接信息與某多媒體節(jié)目某時(shí)間段的音視頻數(shù)據(jù)或數(shù)據(jù)中的物體對象做關(guān)聯(lián)。
[0041]所述音頻標(biāo)引信息的基礎(chǔ)數(shù)據(jù)包括多媒體節(jié)目的唯一標(biāo)識、節(jié)目屬性、版權(quán)信息和網(wǎng)絡(luò)服務(wù)平臺鏈接,所述音頻標(biāo)引信息的擴(kuò)展數(shù)據(jù)是與多媒體節(jié)目本身相關(guān)的各時(shí)間節(jié)點(diǎn)上的信息及導(dǎo)航鏈接,包括:主題、人物與內(nèi)容介紹,關(guān)聯(lián)的應(yīng)用程序、支付接口、多媒體節(jié)目、人物及相關(guān)商品的鏈接,按時(shí)間或好評等級分類的評價(jià)信息,附加的詳細(xì)節(jié)目介紹、導(dǎo)演、主演、主題分類、發(fā)行年份、國家地區(qū)和贊助商的索引及鏈接。
[0042]用戶通過包含音頻標(biāo)引導(dǎo)航模塊的智能導(dǎo)航播放器,分析和識別多媒體節(jié)目的音頻標(biāo)引信息,能夠獲得多媒體節(jié)目的唯一標(biāo)識和版權(quán)信息,并能根據(jù)網(wǎng)絡(luò)服務(wù)平臺鏈接和音頻標(biāo)引信息的擴(kuò)展數(shù)據(jù)中的導(dǎo)航鏈接,獲取實(shí)時(shí)的鏈接信息,指向相關(guān)的應(yīng)用程序、支付接口、網(wǎng)頁、博客和多媒體節(jié)目鏈接;所述網(wǎng)絡(luò)服務(wù)平臺提供相關(guān)導(dǎo)航鏈接的信息與電子商務(wù)服務(wù)。
[0043]實(shí)施例1 (移動終端智能導(dǎo)航播放器)
[0044]本發(fā)明的移動終端智能導(dǎo)航播放器,其特征在于,針對移動終端操作系統(tǒng)開發(fā),能夠兼容各種多媒體文件進(jìn)行離線播放或在線播放;用戶在移動終端上安裝并登錄移動終端智能導(dǎo)航播放器,所述移動終端智能導(dǎo)航播放器采用聲學(xué)建模、模式分類和動態(tài)規(guī)劃方法識別音頻的旋律特征和/或聲紋特征,生成音頻特征數(shù)據(jù)庫,用戶隨時(shí)可以通過移動終端采集當(dāng)前音頻判斷當(dāng)前多媒體節(jié)目或人聲哼唱的音頻對應(yīng)的音頻特征數(shù)據(jù)庫中的哪些數(shù)據(jù),從而建立起動態(tài)的社區(qū)服務(wù)平臺,用戶在移動終端智能導(dǎo)航播放器中還能夠發(fā)表評論,共享關(guān)聯(lián)信息與鏈接,以及相互交流,所述移動終端智能導(dǎo)航播放器通過采集用戶語音生成聲紋,根據(jù)音頻特征還能夠判斷是否是真實(shí)的用戶。
【權(quán)利要求】
1.一種智能導(dǎo)航播放器,其特征在于,包括音頻特征分析模塊、智能搜索模塊、聲音采集模塊、智能音頻標(biāo)引制作模塊、音頻標(biāo)引導(dǎo)航模塊和網(wǎng)絡(luò)服務(wù)平臺組成,所述音頻特征分析模塊提供了音頻特征的分析、識別與搜索,通過聲學(xué)建模、模式分類和動態(tài)規(guī)劃方法建立音頻的旋律特征和每個(gè)人物或發(fā)聲對象的獨(dú)特的聲紋特征,通過以下方法的組合,進(jìn)行多媒體節(jié)目和 人物的精確匹配,并通過所述智能搜索模塊和所述網(wǎng)絡(luò)服務(wù)平臺提供相關(guān)多媒體節(jié)目的導(dǎo)航鏈接:(1)識別文件名或數(shù)據(jù)流的命名;(2)識別文件頭或數(shù)據(jù)流中的屬性信息;(3)識別文件分段或數(shù)據(jù)流分段的哈希值;(4)通過聲學(xué)建模、模式分類和動態(tài)規(guī)劃方法識別發(fā)聲者的聲紋特征;(5)通過聲學(xué)建模、模式分類和動態(tài)規(guī)劃方法識別音頻的旋律特征;(6)通過聲學(xué)建模、模式分類和動態(tài)規(guī)劃方法識別由聲音米集模塊米集的5-30秒范圍內(nèi)的哼唱特征,進(jìn)行旋律和聲紋的自適應(yīng)匹配。
2.根據(jù)權(quán)利要求1中所述的智能導(dǎo)航播放器,其特征在于,所述智能導(dǎo)航播放器通過云計(jì)算的協(xié)同模式進(jìn)行音頻特征比對與逐步完善音頻特征;即各音頻特征分析模塊與網(wǎng)絡(luò)服務(wù)平臺配合工作,在所述智能導(dǎo)航播放器實(shí)時(shí)播放或采集音頻時(shí),一方面音頻特征分析模塊進(jìn)行分析和提取,通過智能導(dǎo)航播放器發(fā)送到網(wǎng)絡(luò)服務(wù)平臺,同數(shù)據(jù)庫中已有的旋律特征和/或聲紋特征進(jìn)行比對,網(wǎng)絡(luò)服務(wù)平臺按相似度從高到低返回對應(yīng)的匹配對象以及關(guān)聯(lián)導(dǎo)航數(shù)據(jù)給智能導(dǎo)航播放器;另一方面各音頻特征分析模塊也在協(xié)同進(jìn)行特定播放對象的音頻特征的分布式運(yùn)算;對于通過其它關(guān)聯(lián)數(shù)據(jù)或人工識別已經(jīng)確定的特定對象,音頻特征分析模塊分析和提取的數(shù)據(jù),還通過智能導(dǎo)航播放器發(fā)送到網(wǎng)絡(luò)服務(wù)平臺進(jìn)行更新,作為對現(xiàn)有數(shù)據(jù)庫中對應(yīng)的所述特定對象的旋律特征和/或聲紋特征的補(bǔ)充。
3.根據(jù)權(quán)利要求2中所述的智能導(dǎo)航播放器,其特征在于,所述多媒體節(jié)目是指包含音頻數(shù)據(jù),以及在音頻數(shù)據(jù)基礎(chǔ)上包含多路音頻數(shù)據(jù)、文字?jǐn)?shù)據(jù)、圖片數(shù)據(jù)和視頻數(shù)據(jù)中的一種或多種格式數(shù)據(jù)的數(shù)字文件或數(shù)據(jù)流;所述智能音頻標(biāo)引制作模塊,通過識別和分析多媒體節(jié)目中原始音頻的特定壓縮算法,找到位于人的感知盲區(qū)的冗余數(shù)據(jù)同時(shí)又是處于所述特定壓縮算法的非確定區(qū)域不會被舍棄的數(shù)據(jù),在其中嵌入具有抗噪性、魯棒性和不可感知性的音頻標(biāo)引信息,同時(shí)為防止音頻受損帶來的音頻標(biāo)引信息損失,所述音頻標(biāo)引信息的數(shù)據(jù)做了一定數(shù)據(jù)量的備份、冗余和糾錯(cuò)處理;所述音頻標(biāo)引信息的基礎(chǔ)數(shù)據(jù)包括多媒體節(jié)目的唯一標(biāo)識、節(jié)目屬性、版權(quán)信息和網(wǎng)絡(luò)服務(wù)平臺鏈接,所述音頻標(biāo)引信息的擴(kuò)展數(shù)據(jù)是與多媒體節(jié)目本身相關(guān)的各時(shí)間節(jié)點(diǎn)上的信息及導(dǎo)航鏈接,包括:主題、人物與內(nèi)容介紹,關(guān)聯(lián)的應(yīng)用程序、支付接口、多媒體節(jié)目、人物及相關(guān)商品的鏈接,按時(shí)間或好評等級分類的評價(jià)信息,附加的詳細(xì)節(jié)目介紹、導(dǎo)演、主演、主題分類、發(fā)行年份、國家地區(qū)和贊助商的索引及鏈接;所述音頻標(biāo)引導(dǎo)航模塊,通過分析和識別多媒體節(jié)目的音頻標(biāo)引信息,能夠獲得多媒體節(jié)目的唯一標(biāo)識和版權(quán)信息,并能根據(jù)網(wǎng)絡(luò)服務(wù)平臺鏈接和音頻標(biāo)引信息的擴(kuò)展數(shù)據(jù)中的導(dǎo)航鏈接,獲取實(shí)時(shí)的鏈接信息,指向相關(guān)的應(yīng)用程序、支付接口、網(wǎng)頁、博客和多媒體節(jié)目鏈接;所述網(wǎng)絡(luò)服務(wù)平臺提供相關(guān)導(dǎo)航鏈接的信息與電子商務(wù)服務(wù)。
4.根據(jù)權(quán)利要求3中所述的智能導(dǎo)航播放器,其特征在于,所述多媒體節(jié)目的數(shù)據(jù)或數(shù)據(jù)流中還包含帶有圖像水印的圖片數(shù)據(jù)和/或視頻數(shù)據(jù),智能導(dǎo)航播放器通過所述網(wǎng)絡(luò)服務(wù)平臺更新的插件,還能夠識別圖像水印,進(jìn)行版權(quán)鑒別和導(dǎo)航服務(wù)。
5.根據(jù)權(quán)利要求4中所述的智能導(dǎo)航播放器,其特征在于,所述智能音頻標(biāo)引制作模塊還通過在多媒體節(jié)目中附加額外的數(shù)據(jù)包,添加整體節(jié)目的哈希值和防偽認(rèn)證數(shù)據(jù)作為數(shù)字水印進(jìn)行原始節(jié)目鑒別,當(dāng)多媒體節(jié)目被截取、編輯或重新壓縮,其音頻旋律特征和魯棒性的音頻標(biāo)引信息不會丟失,但以額外數(shù)據(jù)包形式存在的數(shù)字水印會丟失或不完整,因此能夠用于檢測多媒體節(jié)目的完整性和原始性。
6.根據(jù)權(quán)利要求5中所述的智能導(dǎo)航播放器,其特征在于,所述網(wǎng)絡(luò)服務(wù)平臺使用基于標(biāo)識認(rèn)證的安全技術(shù)為通過審核的注冊會員提供自助廣告服務(wù)和電子商務(wù)服務(wù),會員通過基于多媒體節(jié)目本身相關(guān)的各時(shí)間節(jié)點(diǎn)上的信息及導(dǎo)航鏈接,包括:主題、人物與內(nèi)容介紹,關(guān)聯(lián)的應(yīng)用程序、支付接口、多媒體節(jié)目、人物及相關(guān)商品的鏈接,按時(shí)間或好評等級分類的評價(jià)信息,以及附加的詳細(xì)節(jié)目介紹、導(dǎo)演、主演、主題分類、發(fā)行年份、國家地區(qū)和贊助商的索引及鏈接,進(jìn)行廣告和商品匹配以及競價(jià)排名;所述基于標(biāo)識認(rèn)證的技術(shù)是指,通過橢圓曲線算法構(gòu)建多個(gè)種子公私鑰對,按特定次序編號,使用用戶標(biāo)識的哈希值作為多項(xiàng)式,把相關(guān)子項(xiàng)值指向的編號對應(yīng)的公鑰進(jìn)行點(diǎn)加運(yùn)算形成用戶的公鑰,同樣把相關(guān)子項(xiàng)值指向的編號對應(yīng)的私鑰進(jìn)行模加運(yùn)算形成用戶的私鑰,這樣就構(gòu)建了用戶標(biāo)識與公鑰之間的唯一映射關(guān)系,生成用戶公鑰的種子公鑰及算法庫公開,包括在所述音頻標(biāo)引導(dǎo)航模塊中,生成用戶私鑰的種子私鑰及算法庫保密,包括在所述網(wǎng)絡(luò)服務(wù)平臺中,用戶私鑰通過用戶設(shè)備的唯一標(biāo)識加密后存儲在專用的硬件中或存儲空間。
7.根據(jù)權(quán)利要求6中所述的智能導(dǎo)航播放器,其特征在于,所述網(wǎng)絡(luò)服務(wù)平臺具有電子商務(wù)功能,包含帶有商品審核與發(fā)布功能的電子商城和電子支付功能;所述電子商城除采用標(biāo)準(zhǔn)的商品購買模式,還采用團(tuán)購模式和反向團(tuán)購模式;所述團(tuán)購模式分成由用戶發(fā)起的散單拼團(tuán)按統(tǒng)一批發(fā)價(jià)進(jìn)行購買的用戶團(tuán)購和由商家指定的特定數(shù)量商品按統(tǒng)一批發(fā)價(jià)進(jìn)行銷售且認(rèn)購數(shù)量 超過一定比例才成交的商家團(tuán)購;所述反向團(tuán)購模式也分為兩種,一種是由用戶自由出價(jià),網(wǎng)絡(luò)服務(wù)平臺進(jìn)行自動撮合,按用戶出價(jià)價(jià)格和出價(jià)時(shí)間以非統(tǒng)一批發(fā)價(jià)的價(jià)格組合成交的用戶反向團(tuán)購,另一種是商家根據(jù)已出價(jià)用戶的平均價(jià)格和數(shù)量信息,選擇以特定數(shù)量和均價(jià)成交的商家反向團(tuán)購。
8.根據(jù)權(quán)利要求7中所述的智能導(dǎo)航播放器,其特征在于,所述音頻標(biāo)引導(dǎo)航模塊包含快捷支付接口,與所述網(wǎng)絡(luò)服務(wù)平臺的電子商城配合,對于包含支付信息的商品導(dǎo)航鏈接,能夠進(jìn)入直接所述電子商城的支付流程。
9.根據(jù)權(quán)利要求8中所述的智能導(dǎo)航播放器,其特征在于,當(dāng)所述多媒體節(jié)目的載體是帶有電子標(biāo)簽的光盤、硬盤或其它包裝形式的硬件時(shí),所述音頻標(biāo)引信息中還包含有和電子標(biāo)簽進(jìn)行匹配的驗(yàn)證數(shù)據(jù)。用戶終端通過電子標(biāo)簽讀卡器進(jìn)行電子標(biāo)簽的加密讀寫,能夠控制所述電子標(biāo)簽的有效性、使用條件和使用次數(shù),所述電子標(biāo)簽?zāi)軌蛱峁┒嗝襟w節(jié)目的真實(shí)性驗(yàn)證及解碼條件信息,包括有效期和使用次數(shù);所述電子標(biāo)簽的信息存儲空間分為多個(gè)數(shù)據(jù)區(qū),每個(gè)數(shù)據(jù)區(qū)除具備讀寫密碼外,還采用多種加密算法及密鑰進(jìn)行組合的加密方法進(jìn)行密文存儲信息及生成驗(yàn)證碼,主機(jī)通過特定的解密程序才能驗(yàn)證并還原數(shù)據(jù)信息。
10.根據(jù)權(quán)利要求9中所述的智能導(dǎo)航播放器,其特征在于,所述多媒體節(jié)目中的音頻數(shù)據(jù)和/或其它關(guān)聯(lián)數(shù)據(jù)為加密數(shù)據(jù),解密密鑰由所述音頻標(biāo)引信息或電子標(biāo)簽中包含的數(shù)據(jù)進(jìn)行 計(jì)算;所述關(guān)聯(lián)數(shù)據(jù)包括視頻數(shù)據(jù)、多路音頻數(shù)據(jù),文字?jǐn)?shù)據(jù)和圖片數(shù)據(jù)。
【文檔編號】G10L15/02GK103678308SQ201210319021
【公開日】2014年3月26日 申請日期:2012年9月3日 優(yōu)先權(quán)日:2012年9月3日
【發(fā)明者】許豐 申請人:許豐