0138] EE 2.根據(jù)EE 1所述的方法,進(jìn)一步包括:
[0139] 針對(duì)所述第二音頻部分中的每個(gè)音頻分段,
[0140] 確定所述第一音頻部分中預(yù)定數(shù)目的音頻分段,其中所述第二音頻部分中的該音 頻分段與所確定的音頻分段之間的內(nèi)容相似度高于所述第二音頻部分中的該音頻分段與 所述第一音頻部分中的所有其它音頻分段之間的內(nèi)容相似度;以及
[0141] 計(jì)算所述第二音頻部分中的該音頻分段與所確定的音頻分段之間的內(nèi)容相似度 的平均值;
[0142] 將第二內(nèi)容一致性計(jì)算為針對(duì)所述第二音頻部分中的各音頻分段而計(jì)算的各平 均值的平均值、最小值或最大值;
[0143] 基于所述第一內(nèi)容一致性和所述第二內(nèi)容一致性計(jì)算對(duì)稱內(nèi)容一致性。
[0144] EE 3.根據(jù)EE 1或2所述的方法,其中,將所述第一音頻部分中的音頻分段su與 所確定的音頻分段Sy之間的內(nèi)容相似度S (s u,Sy)中的每一個(gè)計(jì)算為所述第一音頻部分 中的序列[su,…,Shu]與所述第二音頻部分中的序列[Sy,…,sj+^J之間的內(nèi)容相似 度,L>1。
[0145] EE 4.根據(jù)EE 3所述的方法,其中,通過應(yīng)用動(dòng)態(tài)時(shí)間規(guī)整方案或動(dòng)態(tài)規(guī)劃方案 來計(jì)算所述序列之間的內(nèi)容相似度。
[0146] EE 5.根據(jù)EE 1或2所述的方法,其中,通過以下步驟來計(jì)算兩個(gè)音頻分段之間的 內(nèi)容相似度:
[0147] 從所述音頻分段中提取第一特征向量;
[0148] 根據(jù)所述特征向量生成用于計(jì)算所述內(nèi)容相似度的統(tǒng)計(jì)模型;以及
[0149] 基于所生成的統(tǒng)計(jì)模型計(jì)算所述內(nèi)容相似度。
[0150] EE 6.根據(jù)EE 5所述的方法,其中,所述第一特征向量中的每一個(gè)中的所有特征 值都是非負(fù)的且所述特征值的和為1,并且所述統(tǒng)計(jì)模型基于狄里克雷分布。
[0151 ] EE 7.根據(jù)EE 6所述的方法,其中,所述提取包括:
[0152] 從所述音頻分段中提取第二特征向量;以及
[0153] 針對(duì)所述第二特征向量中的每一個(gè),計(jì)算用于測(cè)量該第二特征向量與參考向量中 的每一個(gè)之間的關(guān)系的量,其中與所述第二特征向量相對(duì)應(yīng)的所有量形成所述第一特征向 量中的一個(gè)。
[0154] EE 8.根據(jù)EE 7所述的方法,其中,通過以下方法之一確定所述參考向量:
[0155] 隨機(jī)產(chǎn)生法,其中隨機(jī)生成所述參考向量;
[0156] 無監(jiān)督聚類法,其中提取自訓(xùn)練樣本的訓(xùn)練向量被分組為聚類,并計(jì)算所述參考 向量以分別代表所述聚類;
[0157] 監(jiān)督建模法,其中根據(jù)所述訓(xùn)練向量來人工定義和學(xué)習(xí)所述參考向量;以及
[0158] 特征分解法,其中將所述參考向量計(jì)算為以所述訓(xùn)練向量作為行的矩陣的特征向 量。
[0159] EE 9.根據(jù)EE 7所述的方法,其中,通過以下各量之一測(cè)量所述第二特征向量與 所述參考向量中的每一個(gè)之間的關(guān)系:
[0160] 所述第二特征向量與該參考向量之間的距離;
[0161] 所述第二特征向量與該參考向量之間的相關(guān);
[0162] 所述第二特征向量與該參考向量之間的內(nèi)積;以及
[0163] 該參考向量的以所述第二特征向量作為相關(guān)證據(jù)的后驗(yàn)概率。
[0164] EE 10.根據(jù)EE 9所述的方法,其中,將第二特征向量X與參考向量ζ」之間的距尚 Vj計(jì)算為
[0166] 其中,Μ為所述參考向量的數(shù)目,I I I I表示歐式距離。
[0167] EE 11.根據(jù)EE 9所述的方法,其中,參考向量Zj的以第二特征向量X作為相關(guān)證 據(jù)的后驗(yàn)概率P(Z]|x)被計(jì)算為
[0169] 其中,p(x|Zj)代表給定參考向量\的情況下第二特征向量X的概率,Μ為所述參 考向量的數(shù)目,Ρ(Ζ])為先驗(yàn)分布。
[0170] ΕΕ 12.根據(jù)ΕΕ 6所述的方法,其中,通過最大似然法估計(jì)所述統(tǒng)計(jì)模型的參數(shù)。
[0171] ΕΕ 13.根據(jù)ΕΕ 6所述的方法,其中,所述統(tǒng)計(jì)模型基于一個(gè)或多個(gè)狄里克雷分 布。
[0172] ΕΕ 14.根據(jù)ΕΕ 6所述的方法,其中,通過以下度量之一測(cè)量所述內(nèi)容相似度:
[0173] 海林格距離;
[0174] 平方距離;
[0175] K-L散度;以及
[0176] 貝葉斯信息準(zhǔn)則差。
[0177] ΕΕ 15.根據(jù)ΕΕ 14所述的方法,其中,將海林格距離D(a,β)計(jì)算為
[0179] 其中,a i,. . .,a d>0為所述統(tǒng)計(jì)模型中的一個(gè)的參數(shù)且β i,. . .,β d>0為所述統(tǒng) 計(jì)模型中的另一個(gè)的參數(shù),d彡2為所述第一特征向量的維數(shù),且Γ ()為伽馬函數(shù)。
[0180] ΕΕ 16.根據(jù)ΕΕ 14所述的方法,其中,將平方距離Ds計(jì)算為
[0183] a u . . .,a d>0為所述統(tǒng)計(jì)模型中的一個(gè)的參數(shù)且β d . . .,β d>0為所述統(tǒng)計(jì)模型 中的另一個(gè)的參數(shù),d多2為所述第一特征向量的維數(shù),且Γ ()為伽馬函數(shù)。
[0184] EE 17. -種用于測(cè)量第一音頻部分與第二音頻部分之間的內(nèi)容一致性的設(shè)備,包 括:
[0185] 相似度計(jì)算器,其針對(duì)所述第一音頻部分中的每個(gè)音頻分段,
[0186] 確定所述第二音頻部分中預(yù)定數(shù)目的音頻分段,其中所述第一音頻部分中的該音 頻分段與所確定的音頻分段之間的內(nèi)容相似度高于所述第一音頻部分中的該音頻分段與 所述第二音頻部分中的所有其它音頻分段之間的內(nèi)容相似度;以及
[0187] 計(jì)算所述第一音頻部分中的該音頻分段與所確定的音頻分段之間的內(nèi)容相似度 的平均值;以及
[0188] 一致性計(jì)算器,其將第一內(nèi)容一致性計(jì)算為,針對(duì)所述第一音頻部分中的各音頻 分段而計(jì)算的各平均值的平均值、最小值或最大值。
[0189] EE 18.根據(jù)EE 17所述的設(shè)備,其中所述相似度計(jì)算器被進(jìn)一步配置為,針對(duì)所 述第二音頻部分中的每個(gè)音頻分段,
[0190] 確定所述第一音頻部分中預(yù)定數(shù)目的音頻分段,其中所述第二音頻部分中的該音 頻分段與所確定的音頻分段之間的內(nèi)容相似度高于所述第二音頻部分中的該音頻分段與 所述第一音頻部分中的所有其它音頻分段之間的內(nèi)容相似度;以及
[0191] 計(jì)算所述第二音頻部分中的該音頻分段與所確定的音頻分段之間的內(nèi)容相似度 的平均值,以及
[0192] 其中所述一致性計(jì)算器被進(jìn)一步配置為,
[0193] 將第二內(nèi)容一致性計(jì)算為針對(duì)所述第二音頻部分中的各音頻分段而計(jì)算的各平 均值的平均值、最小值或最大值,以及
[0194] 基于所述第一內(nèi)容一致性和所述第二內(nèi)容一致性計(jì)算對(duì)稱內(nèi)容一致性。
[0195] EE 19.根據(jù)EE 17或18所述的設(shè)備,其中,將所述第一音頻部分中的音頻分段Su與所確定的音頻分段Sy之間的內(nèi)容相似度S (s u,Sy)中的每一個(gè)計(jì)算為所述第一音頻部 分中的序列[su,…,Shu]與所述第二音頻部分中的序列[Sy,…,sj+^J之間的內(nèi)容相 似度,L>1。
[0196] EE 20.根據(jù)EE 19所述的設(shè)備,其中,通過應(yīng)用動(dòng)態(tài)時(shí)間規(guī)整方案或動(dòng)態(tài)規(guī)劃方 案來計(jì)算所述序列之間的內(nèi)容相似度。
[0197] EE 21.根據(jù)EE 17所述的設(shè)備,其中,所述相似度計(jì)算器包括:
[0198] 特征生成器,其針對(duì)所述內(nèi)容相似度中的每一個(gè),從相關(guān)聯(lián)的音頻分段中提取第 一特征向量;
[0199] 模型生成器,其根據(jù)所述特征向量生成用于計(jì)算所述內(nèi)容相似度中的每一個(gè)的統(tǒng) 計(jì)模型;以及
[0200] 相似度計(jì)算單元,其基于所生成的統(tǒng)計(jì)模型計(jì)算所述內(nèi)容相似度。
[0201] EE 22.根據(jù)EE 21所述的設(shè)備,其中,所述第一特征向量中的每一個(gè)中的所有特 征值都是非負(fù)的且所述特征值的和為1,并且所述統(tǒng)計(jì)模型基于狄里克雷分布。
[0202] EE 23.根據(jù)EE 22所述的設(shè)備,其中,所述特征生成器被進(jìn)一步配置為,
[0203] 從所述音頻分段中提取第二特征向量;以及
[0204] 針對(duì)所述第二特征向量中的每一個(gè),計(jì)算用于測(cè)量該第二特征向量與參考向量中 的每一個(gè)之間的關(guān)系的量,其中與所述第二特征向量相對(duì)應(yīng)的所有量形成所述第一特征向 量中的一個(gè)。
[0205] EE 24.根據(jù)EE 23所述的設(shè)備,其中,通過以下方法之一確定所述參考向量:
[0206] 隨機(jī)產(chǎn)生法,其中隨機(jī)生成所述參考向量;
[0207] 無監(jiān)督聚類法,其中提取自訓(xùn)練樣本的訓(xùn)練向量被分組為聚類,并計(jì)算所述參考 向量以分別代表所述聚類;
[0208] 監(jiān)督建模法,其中根據(jù)所述訓(xùn)練向量來人工定義和學(xué)習(xí)所述參考向量;以及
[0209] 特征分解法,其中將所述參考向量計(jì)算為以所述訓(xùn)練向量作為行的矩陣的特征向 量。
[0210] EE 25.根據(jù)EE 23所述的設(shè)備,其中,通過以下各量之一測(cè)量所述第二特征向量 與所述參考向量中的每一個(gè)之間的關(guān)系:
[0211] 所述第二特征向量與該參考向量之間的距離;
[0212] 所述第二特征向量與該參考向量之間的相關(guān);
[0213] 所述第二特征向量與該參考向量之間的內(nèi)積;以及
[0214] 該參考向量的以所述第二特征向量作為相關(guān)證據(jù)的后驗(yàn)概率。
[0215] EE 26.根據(jù)EE 25所述的設(shè)備,其中,將第二特征向量X與參考向量\之間的距 離Vj計(jì)算為
[0217] 其中,Μ為所述參考向量的數(shù)目,| | | |表示歐式距離。
[0218] ΕΕ 27.根據(jù)ΕΕ 25所述的設(shè)備,其中,參考向量Zj的以第二特征向量X作為相關(guān) 證據(jù)的后驗(yàn)概率p(z_j|x)被計(jì)算為
[0220] 其中,p(x|Zj)代表給定參考向量\的情況下第二特征向量X的概率,Μ為所述參 考向量的數(shù)目,Ρ(Ζ])為先驗(yàn)分布。
[0221] ΕΕ 28.根據(jù)ΕΕ 22所述的設(shè)備,其中,通過最大似然法估計(jì)所述統(tǒng)計(jì)模型的參數(shù)。
[0222] ΕΕ 29.根據(jù)ΕΕ 22所述的設(shè)備,其中,所述統(tǒng)計(jì)模型基于一個(gè)或多個(gè)狄里克雷分 布。
[0223] ΕΕ 30.根據(jù)ΕΕ 22所述的設(shè)備,其中,通過以下度量之一測(cè)量所述內(nèi)容相似度:
[0224] 海林格距離;
[0225] 平方距離;
[0226] K-L散度;以及
[0227] 貝葉斯信息準(zhǔn)則差。
[0228] ΕΕ 31.根據(jù)ΕΕ 30所述的設(shè)備,其中,將海林格距離D ( α,β )計(jì)算為
[0230] 其中,a i,. . .,a d>0為所述統(tǒng)計(jì)模型中的一個(gè)的參數(shù)且β i,. . .,β d>0為所述統(tǒng) 計(jì)模型中的另一個(gè)的參數(shù),d彡2為所述第一特征向量的維數(shù),且Γ ()為伽馬函數(shù)。
[0231] ΕΕ 32.根據(jù)ΕΕ 30所述的設(shè)備,其中,將平方距離Ds計(jì)算為
[0234] α · · ·,a d>0為所述統(tǒng)計(jì)模型中的一個(gè)的參數(shù)且β · · ·,β d>0為所述統(tǒng)計(jì)模型 中的另一個(gè)的參數(shù),d多2為所述第一特征向量的維數(shù),且Γ ()為伽馬函數(shù)。
[0235] EE 33. -種測(cè)量兩個(gè)音頻分段之間的內(nèi)容相似度的方法,包括:
[0236] 從所述音頻分段中提取第一特征向量,其中所述第一特征向量中的每一個(gè)中的所 有特征值都是非負(fù)的并被歸一化,使得所述特征值的和為1 ;
[0237] 根據(jù)所述特征向量,基于狄里克雷分布生成用于計(jì)算所述內(nèi)容相似度的統(tǒng)計(jì)模 型;以及
[0238] 基于所生成的統(tǒng)計(jì)模型計(jì)算所述內(nèi)容相似度。
[0239] EE 34.根據(jù)EE 33所述的方法,其中,所述提取包括:
[0240] 從所述音頻分段中提取第二特征向量;以及
[0241] 針對(duì)所述第二特征向量中的每一個(gè),計(jì)算用于測(cè)量該第二特征向量與參考向量中 的每一個(gè)之間的關(guān)系的量,其中與所述第二特征向量相對(duì)應(yīng)的所有量形成所述第一特征向 量中的一個(gè)。<