国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      用于對(duì)數(shù)字聲音信號(hào)進(jìn)行減速的方法和設(shè)備的制作方法

      文檔序號(hào):2825799閱讀:479來源:國知局
      用于對(duì)數(shù)字聲音信號(hào)進(jìn)行減速的方法和設(shè)備的制作方法
      【專利摘要】用于對(duì)來自發(fā)射機(jī)的數(shù)字聲音信號(hào)進(jìn)行減速,以將減速的數(shù)字聲音信號(hào)發(fā)送給接收機(jī)的方法,該方法包括:將從發(fā)射機(jī)接收到的數(shù)字聲音信號(hào)轉(zhuǎn)換為由一系列的詞語構(gòu)成的文本;向文本中的每個(gè)詞語分配時(shí)間戳?xí)?;識(shí)別屬于在數(shù)據(jù)庫中被引用的模式的詞語,數(shù)據(jù)庫包括將被刪除的模式;限定減速的速度;基于減速的速度來調(diào)整加了時(shí)間戳的書簽,使其適應(yīng)減速的時(shí)間幀;對(duì)數(shù)字聲音信號(hào)進(jìn)行減速;刪除將被刪除的模式;將減速的數(shù)字聲音信號(hào)發(fā)送至接收機(jī)。
      【專利說明】用于對(duì)數(shù)字聲音信號(hào)進(jìn)行減速的方法和設(shè)備
      [0001]交叉引用
      [0002]本申請(qǐng)基于2011年8月31日提交的編號(hào)為1157705的法國專利申請(qǐng),該法國專利申請(qǐng)的內(nèi)容通過引用整體結(jié)合至此,并在此根據(jù)35U.S.C.§ 119要求該法國專利申請(qǐng)的優(yōu)先權(quán)。
      【背景技術(shù)】
      [0003]本發(fā)明涉及一種方法,該方法用于對(duì)數(shù)字聲音信號(hào)進(jìn)行減速,以在人和人之間(在其中至少一個(gè)人對(duì)于所說的語言不是完全流利的情況下)實(shí)現(xiàn)有效的實(shí)時(shí)口頭交流。
      [0004]最讓人尷尬的經(jīng)歷之一是不能理解使用不同語言的說話人所說的話。經(jīng)常在理解對(duì)我們而言陌生的語言時(shí)會(huì)遇到困難。但是,人類互動(dòng)的本質(zhì)之一是聆聽、理解、并與他人進(jìn)行交流。世界正變得全球一體化,與說不同語言的人進(jìn)行交流的機(jī)會(huì)不斷增加。舉例來說,一個(gè)公司的雇員之間的語言多樣性就呈現(xiàn)出了諸多挑戰(zhàn)。
      [0005]語言的不同之處在于它們所使用的音位,在面對(duì)不同語言時(shí)這會(huì)導(dǎo)致困難。口頭語言省略了很多元素,并且依賴于對(duì)話所發(fā)生的環(huán)境。由于思考和說話同時(shí)發(fā)生,導(dǎo)致許多語法錯(cuò)誤。最頻繁出現(xiàn)的情況是背景噪音同所說的話混在一起。聲音識(shí)別計(jì)算機(jī)系統(tǒng)在識(shí)別人類語言時(shí)所遇到的困難尤其可以說明這一點(diǎn)。所有這些障礙要求聽話人努力思考,這妨礙了他或她的瞬間理解,并且可能導(dǎo)致他或她失去對(duì)話的頭緒。
      [0006]舉例來說,現(xiàn)今需要進(jìn)行全球交流的人主要使用英語進(jìn)行交流。不幸的是,他們的英語技能不盡相同,通常很難理解母語人士所講的快速英語。因此,問題是如何在保持透明互動(dòng)交流的同時(shí),減慢交談速度,而不損失交談的意思。
      [0007]若干年前就存在對(duì)發(fā)言進(jìn)行減速的`方案。但是,它們的固有次生效應(yīng)是使對(duì)話所花的時(shí)間變得更長。這會(huì)打斷交流,使交流變得冗長,存在交流失敗的風(fēng)險(xiǎn)。在應(yīng)用至播放項(xiàng)目(電視,網(wǎng)絡(luò),等)時(shí),這些方案不存在缺點(diǎn),但是對(duì)于交互式交流而言則是不可接受的。如果僅將這種減速應(yīng)用至對(duì)所用語言比較不熟練的人,則語言更流利的說話人不得不在獲得響應(yīng)之前等待他或她的問題被緩慢地傳輸。這使得交流中的交互變得問題重重。

      【發(fā)明內(nèi)容】

      [0008]因此,本發(fā)明的一個(gè)目的是在兩個(gè)對(duì)所用語言流利程度不同的說話人之間實(shí)現(xiàn)改善的交互式交流,而不打擾他們之中任何人的口頭交流。
      [0009]本發(fā)明的另一個(gè)目的是使聽話人分配更多的時(shí)間去理解說話人的講話,而口頭交流的速度不受此影響。
      [0010]本發(fā)明的另一個(gè)目的是提出一種方法,該方法能夠以只有聽他或她講話的人才會(huì)察覺到的方式減慢講話人講話的速度。
      [0011]本發(fā)明的目的是一種用于對(duì)來自發(fā)射機(jī)的數(shù)字聲音信號(hào)進(jìn)行減速,以將減速的數(shù)字聲音信號(hào)發(fā)送給接收機(jī)的方法,該方法包括以下步驟;
      [0012]將從發(fā)射機(jī)接收到的數(shù)字聲音信號(hào)轉(zhuǎn)換為文本,該文本由一系列詞語構(gòu)成,[0013]相對(duì)于絕對(duì)時(shí)間參考,向文本中的每個(gè)詞語分配時(shí)間戳?xí)灒?br> [0014]識(shí)別屬于在數(shù)據(jù)庫中被引用的模式的詞語,并由此推斷將被刪除的模式,
      [0015]基于將被刪除的模式來限定減速的速度,
      [0016]基于減速的速度來調(diào)整時(shí)間戳?xí)?,使其適應(yīng)減速的時(shí)間幀,
      [0017]對(duì)來自發(fā)射機(jī)的數(shù)字聲音信號(hào)進(jìn)行減速,
      [0018]在從發(fā)射機(jī)接收到的數(shù)字聲音信號(hào)中刪除將被刪除的模式,
      [0019]將減速的數(shù)字聲音信號(hào)發(fā)送至接收機(jī)。
      [0020]在對(duì)討論或講話進(jìn)行分析時(shí),注意到在由語言表達(dá)的思考過程中存在各種事件,例如:
      [0021]暫停;
      [0022]擬聲所隱藏的疑問;
      [0023]通常與語言抽搐相關(guān)的無意義的“偽詞語”;
      [0024]重復(fù)。
      [0025]所有這些事件都對(duì)交流做出貢獻(xiàn),因?yàn)樗鼈冃纬烧Z境,以及正在說話的人的個(gè)性的一部分。但是,它們不對(duì)向被交換的詞語賦予意義做出貢獻(xiàn)。因此,本發(fā)明的目的不是滿足于大致的,甚至是錯(cuò)誤的理解,而是清除這些事件,以釋放時(shí)間,分配足夠的時(shí)間以對(duì)句子進(jìn)行減速而不失去其實(shí)際意思,由此保持實(shí)時(shí)交互。
      [0026]根據(jù)第一方面,模式數(shù)據(jù)庫從模式識(shí)別模塊(block)接收新的模式。特別地,它可以是特定于說話人的重復(fù)、或語言抽搐(tic)。
      [0027]根據(jù)第二方面,模式數(shù)據(jù)庫接收一系列所需要的詞語,這些詞語被允許在構(gòu)成對(duì)話的模式中存在。特別地,合適的名詞,例如公司或人的名字,或者名或綽號(hào)可能頻繁地進(jìn)入對(duì)話中。在這種情況下,它們可能被識(shí)別為語言抽搐。自然,絕對(duì)需要避免刪除它們,因?yàn)檫@樣的話發(fā)言會(huì)變得無法理解。
      [0028]根據(jù)第三方面,向每個(gè)模式分配優(yōu)先級(jí)。這樣就能夠基于它們的優(yōu)先級(jí)來選擇將被刪除的模式,由此能夠使減速的速度適應(yīng)于發(fā)射機(jī)的語速。
      [0029]最開始,參考由參考時(shí)鐘所提供的絕對(duì)時(shí)間,時(shí)間戳?xí)灡环峙渲廖谋局械拿總€(gè)詞語,接下來它們被轉(zhuǎn)換為減速的時(shí)間幀,該減速的時(shí)間幀是基于已限定的減速的速度而建立的新參考。
      [0030]本發(fā)明的另一個(gè)目的是提供實(shí)施上述方法的設(shè)備。特別地,本發(fā)明的目的是用于實(shí)施上述方法的設(shè)備,該設(shè)備包括:
      [0031]輸入,其從發(fā)射機(jī)接收數(shù)字聲音信號(hào);
      [0032]轉(zhuǎn)換器,其將數(shù)字聲音信號(hào)轉(zhuǎn)換為由一系列詞語構(gòu)成的文本;
      [0033]時(shí)間戳處理器(timestamper),其將時(shí)間戳?xí)炁c文本的每個(gè)詞語關(guān)聯(lián)起來;
      [0034]模式數(shù)據(jù)庫,其包含被引用模式;
      [0035]模式識(shí)別模塊,其識(shí)別被引用模式中所包含的詞語,并從它們中推斷將被刪除的模式;
      [0036]模式過濾模塊,其過濾將被刪除的模式;
      [0037]流量控制器,其限定減速的速度;
      [0038]數(shù)字聲音信號(hào)減速器,其基于減速的速度來對(duì)數(shù)字聲音信號(hào)進(jìn)行減速;[0039]時(shí)間幀調(diào)整模塊,其基于減速的速度來限定減速的時(shí)間幀;
      [0040]時(shí)間戳?xí)炚{(diào)整模塊,其對(duì)減速的時(shí)間幀中的時(shí)間戳?xí)炦M(jìn)行調(diào)整;
      [0041]參考時(shí)鐘,其向模式識(shí)別模塊,減速器,以及時(shí)間幀調(diào)整模塊提供絕對(duì)參考時(shí)間;
      [0042]重建模塊,其從數(shù)字聲音信號(hào)刪除將被刪除的模式,并重建數(shù)字聲音信號(hào);
      [0043]輸出,其恢復(fù)減速的數(shù)字聲音信號(hào)。
      [0044]根據(jù)一個(gè)方面,模式數(shù)據(jù)庫是特定于每種語言的。這事因?yàn)楸磉_(dá),例如與語言抽搐相關(guān)的偽詞語,不能從一種語言變換到另一種語言。
      [0045]根據(jù)一個(gè)變型,可以將語言檢測器添加到轉(zhuǎn)換器上,這樣做的特別目的是為了能夠基于所使用的語言,從一個(gè)數(shù)據(jù)庫切換到另一個(gè)數(shù)據(jù)庫。
      [0046]本發(fā)明的一個(gè)優(yōu)點(diǎn)是它能夠在兩個(gè)說話人(其中一個(gè)說話人對(duì)所使用的語言并不流利)之間實(shí)現(xiàn)即時(shí)、互動(dòng)、并且透明的交流。
      【專利附圖】

      【附圖說明】
      [0047]通過閱讀接下來以非限制性實(shí)施例形式對(duì)實(shí)施方式進(jìn)行的描述、以及附圖,本發(fā)明的其它特征和優(yōu)點(diǎn)會(huì)變得更加明顯,其中
      [0048]圖1描繪了所述設(shè)備的一個(gè)實(shí)施方式,
      [0049]圖2描繪了所述方法的一個(gè)實(shí)施方式。
      [0050]接下來的描述涉及一個(gè)優(yōu)選實(shí)施方式,在該實(shí)施方式中,數(shù)字信號(hào)是講話人和聽話人之間交換的數(shù)字聲音信號(hào)。
      【具體實(shí)施方式】
      [0051]在圖1所示的本發(fā)明的實(shí)施方式中,設(shè)備I包括輸入2和輸出4,輸入2接收與說話人的發(fā)言相對(duì)應(yīng)的數(shù)字聲音信號(hào)3,減速的數(shù)字聲音信號(hào)5通過輸出4被發(fā)送至接收說話人的被減速的發(fā)言的說話人。
      [0052]輸入2連接至轉(zhuǎn)換器6,轉(zhuǎn)換器6的作用是將數(shù)字聲音信號(hào)3轉(zhuǎn)換為由一系列詞語構(gòu)成的文本7,舉例來說,詞語的格式為ASCII (“美國信息交換標(biāo)準(zhǔn)碼”)。
      [0053]獲得的文本7被發(fā)送至?xí)r間戳處理器8,時(shí)間戳處理器8向每個(gè)詞語分配一個(gè)時(shí)間戳?xí)?,時(shí)間戳?xí)炓馕吨砣掌诤蜁r(shí)間(或“時(shí)間戳”)的字符序列。加時(shí)間戳是這樣的機(jī)制:其包括將日期和時(shí)間同計(jì)算機(jī)數(shù)據(jù)關(guān)聯(lián)。這樣就能夠估計(jì)從參考時(shí)刻開始過去了多少時(shí)間。時(shí)間戳?xí)灡环峙浣o每個(gè)詞語的開頭和結(jié)尾。每個(gè)詞語接收時(shí)間戳?xí)灒瑫r(shí)間戳?xí)炏薅ㄔ~語被說出時(shí)的絕對(duì)時(shí)間、以及詞語在文本中所占的時(shí)長。
      [0054]參考時(shí)鐘9向時(shí)間戳處理器8提供絕對(duì)時(shí)間中心參考,基于該絕對(duì)時(shí)間中心參考設(shè)定用于進(jìn)行時(shí)間比較的時(shí)間戳?xí)灐?br> [0055]ASCII格式的加了時(shí)間戳的詞語10接下來被發(fā)送至與模式數(shù)據(jù)庫12相關(guān)聯(lián)的模式識(shí)別模塊11。
      [0056]模式數(shù)據(jù)庫12是用于存儲(chǔ)被引用模式的位置,被引用模式是多組將被刪除的詞語。向這些模式分配限定符(qualifier)。舉例來說,限定符包括詞語或一組詞語出現(xiàn)的次數(shù)(用于識(shí)別重復(fù)的詞語),或者必須刪除的作為語言特點(diǎn)但是沒有意義的填充模式,包括諸如法語中“tu sais”, “voila”, “d,accord”, “effectivement” 等,或英語中“you know”,“there you go”, “right”, “clearly”, “ like” 等這樣的表達(dá)。
      [0057]模式識(shí)別模塊11接收各個(gè)加了時(shí)間戳的詞語10。模式識(shí)別模塊11識(shí)別屬于在模式數(shù)據(jù)庫12中被引用的模式的加了時(shí)間戳的詞語12,以及被保留的其它詞語13。模式識(shí)別模塊11基于這些模式將識(shí)別的詞語組合為多組詞語,舉例來說,以與詞語在模式中出現(xiàn)的順序相同的順序來組合。特別地,模式識(shí)別模塊11特別標(biāo)記那些必須被刪除的重復(fù)的詞語。最后,模式識(shí)別模塊11向數(shù)據(jù)庫12中添加先前未包括的模式,從而豐富數(shù)據(jù)庫12。把將被刪除的新模式添加到數(shù)據(jù)庫12中是模式識(shí)別模塊11的一個(gè)基本功能,因?yàn)閷?duì)應(yīng)的詞語如果未包括在被引用模式中,則可能最終被保留。接下來的目的是能夠用一次操作就刪除所有屬于被引用模式的不需要的詞語。因此,對(duì)數(shù)據(jù)庫11進(jìn)行豐富是該方法的一個(gè)重要步驟。
      [0058]一旦完成模式識(shí)別,多組ASII格式的加了時(shí)間戳的詞語10被發(fā)送至模式過濾模塊14。模式過濾模塊14的一個(gè)功能是把將被保留的詞語13從將被刪除的模式15分離開,模式15可以在模式數(shù)據(jù)庫12中找到,并由模式識(shí)別模塊11所識(shí)別。模式過濾模塊14的輸出由將被刪除的模式15以及加了時(shí)間戳的將被保留的多組詞語13的集合構(gòu)成,并被對(duì)語言不熟悉的聽話人聽到。
      [0059]模式識(shí)別模塊11及模式過濾模塊14能夠訪問模式數(shù)據(jù)庫12,模式數(shù)據(jù)庫12從模式識(shí)別模塊11接收新模式,模式過濾模塊14分離將被刪除的模式15和將被保留在文本中的加了時(shí)間戳的詞語13。
      [0060]當(dāng)然,模式數(shù)據(jù)庫12是特定于所使用的語言的,并且包含作為該語言的特點(diǎn)的模式。對(duì)于每種語言而言,它們是公知的簡單文本模式。這些模式能夠由語言學(xué)家提供,并通過將模式打印為ASCII文本形式而存儲(chǔ)在模式數(shù)據(jù)庫12中。但是,對(duì)模式數(shù)據(jù)庫12的豐富需要謹(jǐn)慎,因?yàn)榻?jīng)常重復(fù)的詞語或表達(dá)可能是重要信息,例如在談話過程中頻繁重復(fù)的公司名稱。通過模式識(shí)別模塊11,可以在要求得到一系列在對(duì)話中允許出現(xiàn)的詞語的同時(shí)實(shí)現(xiàn)對(duì)模式數(shù)據(jù)庫12的自動(dòng)豐富。這樣的話,模式識(shí)別模塊11應(yīng)該能夠借助于出現(xiàn)次數(shù)計(jì)數(shù)器對(duì)模式數(shù)據(jù)庫12進(jìn)行豐富。其它形式的模式識(shí)別是可以預(yù)期的,并且可能會(huì)導(dǎo)致數(shù)據(jù)庫的內(nèi)容增加。
      [0061]一個(gè)有效的實(shí)施方式是向每個(gè)模式分配一個(gè)優(yōu)先級(jí):將高優(yōu)先級(jí)分配給最初就出現(xiàn)在模式數(shù)據(jù)庫12中的模式,例如,由語言學(xué)家所添加的模式,將較低的優(yōu)先級(jí)分配給來自模式識(shí)別模塊11的模式。根據(jù)所需要的發(fā)言減速的速度,可以保留或刪除低優(yōu)先級(jí)模式。
      [0062]設(shè)備I還包括數(shù)字聲音信號(hào)減速器16,減速器16接收數(shù)字聲音信號(hào)3以及由速度控制器17發(fā)送的指令,數(shù)字聲音信號(hào)3保持其進(jìn)入設(shè)備I時(shí)的初始狀態(tài),指令是關(guān)于期望的減速的速度的。使用商業(yè)可購的優(yōu)化減速算法來對(duì)數(shù)字聲音信號(hào)3進(jìn)行減速。接下來,最初接收的數(shù)字聲音信號(hào)3轉(zhuǎn)換為減速的數(shù)字聲音信號(hào)18。
      [0063]速度控制器17計(jì)算將被刪除的時(shí)間,該時(shí)間對(duì)應(yīng)于模式識(shí)別模塊11所識(shí)別的將被刪除的模式15的時(shí)長。
      [0064]速度控制器17的功能是確定將要應(yīng)用的減速的速度,以及使數(shù)字聲音信號(hào)3的減速的速度適應(yīng)于模式過濾模塊14的過濾效率。這是因?yàn)橐恍┱f話人說話風(fēng)格簡明,這種風(fēng)格使用很少的重復(fù)詞語,或不需要的詞語。這樣的話,過濾對(duì)說話速度的降低較少,保持近乎實(shí)時(shí)的交互。因此,必須對(duì)減速進(jìn)行控制。這通過在過濾后不斷地把將被保留的詞語13的時(shí)間戳?xí)灪蛥⒖紩r(shí)鐘9提供的參考時(shí)間相比較來實(shí)現(xiàn)。速度控制器17由此推斷出時(shí)間偏移的負(fù)方向或正方向,這樣可以確定出所需要的減速的速度。
      [0065]減速的數(shù)字聲音信號(hào)18被發(fā)送至重建模塊19,基于位于每個(gè)詞語的開頭和結(jié)尾的時(shí)間戳?xí)灒亟K19刪除將被刪除的模式15,并且從模式過濾模塊14所保留的加了時(shí)間戳的詞語13來重建文本。但是,由時(shí)間戳處理器8添加到文本7中的時(shí)間戳?xí)瀸?duì)應(yīng)于初始數(shù)字聲音信號(hào)3被接收時(shí)的實(shí)際時(shí)間,其不同于減速的數(shù)字聲音信號(hào)17的時(shí)間。
      [0066]相對(duì)于參考時(shí)鐘9所提供的絕對(duì)時(shí)間,時(shí)間幀調(diào)整模塊20基于所期望的減速的速度來限定減速的時(shí)間幀。時(shí)間戳?xí)炚{(diào)整模塊21將與每個(gè)詞語關(guān)聯(lián)的時(shí)間戳?xí)炥D(zhuǎn)換為與減速的時(shí)間幀相匹配。
      [0067]設(shè)備I接下來在重建模塊19的輸出4處將減速的數(shù)字聲音信號(hào)5發(fā)送給聽話人,該聽話人改善對(duì)說話人的理解,而說話人不會(huì)注意到這些,或者需要調(diào)整他或她正在說話的速度。
      [0068]現(xiàn)在參考圖2,其描述了借助上述設(shè)備I而實(shí)施的方法的示例性應(yīng)用。說話人21說出詞語21,例如“Marvellous, you know”。這個(gè)短語以數(shù)字聲音信號(hào)的形式被轉(zhuǎn)換器6接收,轉(zhuǎn)換器6將它轉(zhuǎn)換為由詞語構(gòu)成的文本22,舉例來說,詞語22是ASCII格式的。文本的每個(gè)詞語23被分隔開,并由時(shí)間戳處理器8分配一個(gè)時(shí)間戳?xí)?。模式識(shí)別模塊11識(shí)別不必要的詞語24,不必要的詞語24屬于數(shù)據(jù)庫12中引用的模式,接下來不必要的詞語24被模式過濾模塊14刪除。
      [0069]說話人20的話語21還被傳輸給由速度控制器17所控制的減速器16。說話人20的話語21被轉(zhuǎn)換為減速的話語18。同時(shí),時(shí)間戳?xí)灮跍p速的時(shí)間幀被時(shí)間戳?xí)炚{(diào)整模塊21相應(yīng)地修改。保留的詞語接下來被重建模塊19重新組織,減速的并且更簡明的話語22被發(fā)送給聽話人23。
      [0070]在說話人決定在討論過程中改變語言(例如,切換到不同于他或她的母語的語言)的情況下,有兩種選擇。
      [0071]絕大多數(shù)情況下,使用外語會(huì)導(dǎo)致講話比他或她使用母語時(shí)要差得多。因此可以基于轉(zhuǎn)換器6所報(bào)告的事件來禁用減速。
      [0072]或者,可以給轉(zhuǎn)換器6增加一個(gè)語言檢測器,以通過調(diào)整參考、數(shù)據(jù)庫以及識(shí)別模式來將設(shè)備I的功能從一種語言切換為另一種語言。但是,必須要強(qiáng)調(diào)的是,該第二選擇要求在語言檢測器能夠識(shí)別語言變化以及所使用的語言之前說出若干詞語。在這種情況下,在說話期間發(fā)生的事件不會(huì)被校正,而是會(huì)在減速過程中保留并發(fā)送給說話人。因此,兩種語言之間的過渡對(duì)說話人雙方而言是完全透明的。
      [0073]這種對(duì)數(shù)字信號(hào)進(jìn)行減速的過程可以在其它應(yīng)用中使用。由于加了時(shí)間戳,以上針對(duì)數(shù)字聲音信號(hào)所描述的同樣的方法還可以應(yīng)用至同數(shù)字聲音信號(hào)相關(guān)的數(shù)字視頻信號(hào)。在某些圖像通道由于難以與剩余圖像結(jié)合而被刪除的情況下,減速的數(shù)字視頻信號(hào)可能會(huì)引起觀看者不適。更方便的方法是僅僅對(duì)數(shù)字聲音信號(hào)進(jìn)行減速,同時(shí)確保數(shù)字聲音信號(hào)和圖像同步。但是,盡管更加復(fù)雜,完全可以對(duì)數(shù)字聲音信號(hào)和數(shù)字視頻信號(hào)二者一起減速。
      [0074]通過使用同一設(shè)備描述的方法來對(duì)數(shù)字聲音信號(hào)進(jìn)行減速。減速的速度必須考慮一個(gè)額外參數(shù),即(例如在對(duì)話過程中)圖像與話語之間的匹配。減速的數(shù)字聲音信號(hào)接下來與保持不變的數(shù)字視頻信號(hào)組合在一起。
      [0075]當(dāng)然,本發(fā)明不限于以上所描述和描繪的實(shí)施方式,相反,在不偏離本發(fā)明的精神的情況下,本領(lǐng)域技術(shù)人員可以得到本發(fā)明的多種變型。特別是,在不偏離本發(fā)明的范圍的情況下,可以將數(shù)字聲音信號(hào)轉(zhuǎn)換為ASCI1、二進(jìn)制、語音、或任意其它格式。
      【權(quán)利要求】
      1.一種用于對(duì)來自發(fā)射機(jī)的數(shù)字聲音信號(hào)進(jìn)行減速以將減速的數(shù)字聲音信號(hào)發(fā)送給接收機(jī)的方法,該方法包括以下步驟: 將從所述發(fā)射機(jī)接收到的數(shù)字聲音信號(hào)轉(zhuǎn)換為文本,該文本由一系列詞語構(gòu)成; 相對(duì)于絕對(duì)時(shí)間參考,向所述文本中的每個(gè)詞語分配時(shí)間戳?xí)灒? 識(shí)別屬于在數(shù)據(jù)庫中被引用的模式的詞語,并由此推斷將被刪除的模式; 基于所述將被刪除的模式來限定減速的速度; 基于所述減速的速度來調(diào)整所述時(shí)間戳?xí)?,使其適應(yīng)減速的時(shí)間幀; 對(duì)來自所述發(fā)射機(jī)的所述數(shù)字聲音信號(hào)進(jìn)行減速; 在從所述發(fā)射機(jī)接收到的數(shù)字聲音信號(hào)中刪除將被刪除的模式; 將減速的數(shù)字聲音信號(hào)發(fā)送至所述接收機(jī)。
      2.如權(quán)利要求1所述的方法,其中所述模式數(shù)據(jù)庫從所述模式識(shí)別模塊接收新模式。
      3.如權(quán)利要求1和2之一所述的方法,其中所述模式數(shù)據(jù)庫接收一系列所需要的詞語,所述詞語被允許在構(gòu)成會(huì)話的模式中存在。
      4.如上述權(quán)利要求中任意一項(xiàng)所述的方法,其中向每個(gè)模式分配優(yōu)先級(jí)。
      5.如上述權(quán)利要求中任意一項(xiàng)所述的方法,其中所述書簽時(shí)間戳參考所述絕對(duì)時(shí)間被分配,接下來被轉(zhuǎn)換為減速的時(shí)間幀。
      6.一種用于實(shí)施如上述權(quán)利要求中任意一項(xiàng)所述的方法的設(shè)備,該設(shè)備包括: 輸入,該輸入從發(fā)射機(jī)接收數(shù)字聲音信號(hào); 轉(zhuǎn)換器,該轉(zhuǎn)換器將所述數(shù)字聲音信號(hào)轉(zhuǎn)換為由一系列詞語構(gòu)成的文本; 時(shí)間戳處理器,該時(shí)間戳處理器將時(shí)間戳?xí)炁c所述文本的每個(gè)詞語關(guān)聯(lián)起來; 模式數(shù)據(jù)庫,該模式數(shù)據(jù)庫包含被引用模式; 模式識(shí)別模塊,該模式識(shí)別模塊識(shí)別所述被引用模式中所包含的詞語,并從所述詞語中推斷將被刪除的模式; 模式過濾模塊,該模式過濾模塊過濾所述將被刪除的模式; 流量控制器,該流量控制器限定減速的速度; 數(shù)字聲音信號(hào)減速器,該數(shù)字聲音信號(hào)減速器基于所述減速的速度來對(duì)所述數(shù)字聲音信號(hào)進(jìn)行減速; 時(shí)間幀調(diào)整模塊,該時(shí)間幀調(diào)整模塊基于所述減速的速度來限定減速的時(shí)間幀;時(shí)間戳?xí)炚{(diào)整模塊,該時(shí)間戳?xí)炚{(diào)整模塊對(duì)所述減速的時(shí)間幀中的時(shí)間戳?xí)炦M(jìn)行調(diào)整; 參考時(shí)鐘,該參考時(shí)鐘向所述模式識(shí)別模塊、減速減速器、以及時(shí)間幀調(diào)整模塊提供絕對(duì)參考時(shí)間; 重建模塊,該重建模塊從所述數(shù)字聲音信號(hào)刪除所述將被刪除的模式,并重建所述數(shù)字聲音信號(hào); 輸出,該輸出恢復(fù)所述減速的數(shù)字聲音信號(hào)。
      7.如權(quán)利要求6所述的設(shè)備,其中所述模式數(shù)據(jù)庫是特定于每種語言的。
      8.如權(quán)利要求6和7之一所述的設(shè)備,其中向所述轉(zhuǎn)換器添加語言檢測器。
      【文檔編號(hào)】G10L21/045GK103782340SQ201280041871
      【公開日】2014年5月7日 申請(qǐng)日期:2012年8月8日 優(yōu)先權(quán)日:2011年8月31日
      【發(fā)明者】C·沃爾夫 申請(qǐng)人:阿爾卡特朗訊公司
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1