專利名稱:信息處理裝置、信息處理方法和程序的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及信息處理裝置、信息處理方法和程序。
背景技術(shù):
近年來,將作為數(shù)字?jǐn)?shù)據(jù)的由TV廣播所廣播的節(jié)目記錄到諸如DVD(數(shù)字多功能光盤)或HDD(硬盤驅(qū)動(dòng)器)之類的具有隨機(jī)存取性能的記錄介質(zhì)中的視頻一記錄/回放裝置迅速普及。此外,通過因特網(wǎng)對(duì)諸如視頻和音頻之類的內(nèi)容進(jìn)行發(fā)行變得流行,并且具有內(nèi)置HDD或閃存的回放裝置已經(jīng)廣泛普及,通過該回放裝置能夠在室內(nèi)或室外欣賞從因特網(wǎng)下載得到的內(nèi)容。
利用數(shù)字和隨機(jī)存取特性,將如上所述的用于數(shù)字內(nèi)容的回放裝置實(shí)現(xiàn)為具有各種功能。變速回放功能可以作為示例,其在維持聲音的恒定音高(pitch)的同時(shí)可變地設(shè)定回放速度。變速回放功能是減緩或加快視頻和音頻的回放速度的功能,并且例如,該功能針對(duì)語言的初學(xué)者等將回放速度減緩大約20%(慢回放),或者將回放速度加快大約50%以節(jié)省觀看時(shí)間等(快回放)。變速回放功能是這樣的功能,其從數(shù)字內(nèi)容回放裝置開始普及起就被一般地實(shí)現(xiàn)在該裝置中,并且如今,數(shù)字內(nèi)容回放裝置已經(jīng)十分普遍。本發(fā)明不僅關(guān)注音頻內(nèi)容,而且關(guān)注視頻內(nèi)容的音頻部分。
在數(shù)字內(nèi)容的回放裝置中,在維持聲音的恒定音高的同時(shí)可變地設(shè)定回放速度的技術(shù)被稱作語速轉(zhuǎn)換。在下文中,語速轉(zhuǎn)換意味著在維持聲音的恒定音高的同時(shí)拉伸或壓縮信號(hào)的轉(zhuǎn)換。已知幾種用于語速轉(zhuǎn)換的方法,例如,用作在對(duì)應(yīng)于數(shù)字音頻信號(hào)的時(shí)域上的時(shí)間軸拉伸/壓縮算法的PICOLA(指針間隔控制交疊和相加)(參見“Expansion/compression on theaudio time-axis using duplication adding method by pointer amount-of-movement control(PICOLA)and its evaluation”,by Morita and Itakura,Acoustic Society of Japan collected papers,October 1986,pp.149-150)。該算法的優(yōu)點(diǎn)在于雖然其處理簡(jiǎn)單輕量,但是可以獲得好的聲音質(zhì)量。
發(fā)明內(nèi)容
然而,經(jīng)過語速轉(zhuǎn)換,在維持聲音的恒定音高的同時(shí)執(zhí)行了回放速度轉(zhuǎn)換,已經(jīng)很難在聽覺上識(shí)別轉(zhuǎn)換后的回放速度。
因此,考慮到上述問題而提出本發(fā)明,并且期望提供在轉(zhuǎn)換音頻信號(hào)的回放速度時(shí)使得能夠在聽覺上識(shí)別轉(zhuǎn)換后的回放速度的新的并改良的信息處理裝置、新的并改良的信息處理方法以及新的并改良的程序。
根據(jù)本發(fā)明的實(shí)施例,提供了一種信息處理裝置,該信息處理裝置包括參數(shù)調(diào)節(jié)部分,其根據(jù)指示所輸入的回放速度變量因子的第一參數(shù)來設(shè)定第二參數(shù)和第三參數(shù);以及信號(hào)處理部分,其基于第二參數(shù)和第三參數(shù)來調(diào)節(jié)音頻信號(hào)的回放速度和聲音音高中的至少一個(gè),其中信號(hào)處理部分在所輸入的回放速度變量因子小于預(yù)定閾值時(shí)調(diào)節(jié)音頻信號(hào)的回放速度,并且在所輸入的回放速度變量因子在預(yù)定閾值以上時(shí)調(diào)節(jié)音頻信號(hào)的回放速度和聲音音高。
通過這樣的配置,參數(shù)調(diào)節(jié)部分根據(jù)指示所輸入的回放速度變量因子的第一參數(shù)來設(shè)定第二參數(shù)和第三參數(shù),并且信號(hào)處理部分基于第二參數(shù)和第三參數(shù)來調(diào)節(jié)音頻信號(hào)的回放速度和聲音音高的至少一個(gè)。在此,信號(hào)處理部分在所輸入的回放速度變量因子小于預(yù)定閾值時(shí)調(diào)節(jié)音頻信號(hào)的回放速度,并且在所輸入的回放速度變量因子在預(yù)定閾值以上時(shí)調(diào)節(jié)音頻信號(hào)的回放速度和聲音音高。因此,通過根據(jù)本發(fā)明的信息處理裝置,在音頻信號(hào)的回放速度被轉(zhuǎn)換的情況下,可以在聽覺上識(shí)別轉(zhuǎn)換后的回放速度。
信號(hào)處理部分包括回放速度轉(zhuǎn)換部分,其轉(zhuǎn)換音頻信號(hào)的回放速度;以及音高調(diào)節(jié)部分,其調(diào)節(jié)音頻信號(hào)的聲音音高,并且回放速度轉(zhuǎn)換部分可以基于第二參數(shù)來轉(zhuǎn)換音頻信號(hào)的回放速度,而音高調(diào)節(jié)部分可以基于第三參數(shù)來調(diào)節(jié)音頻信號(hào)的聲音音高。
第一參數(shù)可以近似等于第二參數(shù)和第三參數(shù)的乘積。
信號(hào)處理部分還包括音頻信號(hào)輸出控制部分,其控制將從信號(hào)處理部分中被輸出的、被執(zhí)行了預(yù)定信號(hào)處理的音頻信號(hào)的輸出,并且當(dāng)回放速度和聲音音高均經(jīng)過調(diào)節(jié)的音頻信號(hào)從信號(hào)處理部分中被輸出時(shí),音頻信號(hào)輸出控制部分可以降低回放速度和聲音音高均經(jīng)過調(diào)節(jié)的音頻信號(hào)的音頻音量。
信號(hào)處理部分還包括擬聲聲音(onomatopoeic sound)切換判斷部分,其根據(jù)第一參數(shù),判斷是調(diào)節(jié)音頻信號(hào)的回放速度和聲音音高的至少一個(gè),還是將音頻信號(hào)切換到指示正在執(zhí)行高速回放的預(yù)定擬聲聲音,并且當(dāng)?shù)谝粎?shù)在預(yù)定閾值以上時(shí),擬聲聲音切換判斷部分可以判斷將音頻信號(hào)切換到預(yù)定擬聲聲音;并且當(dāng)擬聲聲音切換判斷部分判斷將音頻信號(hào)切換到預(yù)定擬聲聲音時(shí),音頻信號(hào)輸出控制部分可以在將音頻信號(hào)切換到預(yù)定擬聲聲音后輸出音頻信號(hào)。
信息處理裝置還包括內(nèi)容管理部分,該內(nèi)容管理部分管理包括音頻信號(hào)的內(nèi)容,并且參數(shù)調(diào)節(jié)部分可以根據(jù)待輸入的第一參數(shù)來確定第四參數(shù),該第四參數(shù)對(duì)將從內(nèi)容管理部分被輸出到信號(hào)處理部分的音頻信號(hào)的數(shù)據(jù)量進(jìn)行調(diào)節(jié)。
當(dāng)?shù)谝粎?shù)在預(yù)定閾值以上時(shí),參數(shù)調(diào)節(jié)部分可以減小第四參數(shù)以減小將從內(nèi)容管理部分被輸出到信號(hào)處理部分的內(nèi)容的數(shù)據(jù)量。
第一參數(shù)和第四參數(shù)的乘積可以近似等于第二參數(shù)和第三參數(shù)的乘積。
信息處理裝置還包括內(nèi)容管理部分,該內(nèi)容管理部分管理包括音頻信號(hào)的內(nèi)容,并且參數(shù)調(diào)節(jié)部分可以基于對(duì)將從內(nèi)容管理部分被輸出到信號(hào)處理部分的音頻數(shù)據(jù)的數(shù)據(jù)量進(jìn)行調(diào)節(jié)的第四參數(shù)和待輸入的第一參數(shù),確定第二參數(shù)和第三參數(shù)。
當(dāng)?shù)谝粎?shù)在預(yù)定閾值以上時(shí),內(nèi)容管理部分可以減小第四參數(shù)以減小將從內(nèi)容管理部分被輸出到信號(hào)處理部分的內(nèi)容的數(shù)據(jù)量。
信息處理裝置還包括存儲(chǔ)部分,該存儲(chǔ)部分存儲(chǔ)其中待輸入的第一參數(shù)與第二參數(shù)和第三參數(shù)相互相關(guān)的數(shù)據(jù)庫,并且參數(shù)調(diào)節(jié)部分可以通過參考在存儲(chǔ)部分中所存儲(chǔ)的數(shù)據(jù)庫來確定第二參數(shù)和第三參數(shù)。
信息處理裝置還包括存儲(chǔ)部分,該存儲(chǔ)部分存儲(chǔ)其中待輸入的第一參數(shù)與第二參數(shù)、第三參數(shù)和第四參數(shù)相互相關(guān)的數(shù)據(jù)庫,并且參數(shù)調(diào)節(jié)部分可以通過參考在存儲(chǔ)部分中所存儲(chǔ)的數(shù)據(jù)庫來確定第二參數(shù)、第三參數(shù)和第四參數(shù)。
當(dāng)?shù)谝粎?shù)在預(yù)定閾值以上時(shí),參數(shù)調(diào)節(jié)部分可以根據(jù)第一參數(shù)與預(yù)定閾值之間的差來增大第二參數(shù)。
數(shù)據(jù)庫被存儲(chǔ)為指示第二參數(shù)和第三參數(shù)隨第一參數(shù)的變化的曲線,并且指示第三參數(shù)的變化的曲線可以在預(yù)定閾值前后具有平滑的形狀。
根據(jù)本發(fā)明的另一實(shí)施例,提供了一種信息處理方法,該信息處理方法包括參數(shù)調(diào)節(jié)步驟,其根據(jù)指示所輸入的回放速度變量因子的第一參數(shù)來設(shè)定第二參數(shù)和第三參數(shù);以及信號(hào)處理步驟,其基于第二參數(shù)和第三參數(shù),調(diào)節(jié)音頻信號(hào)的回放速度和聲音音高的至少一個(gè),其中信號(hào)處理步驟在所輸入的回放速度變量因子小于預(yù)定閾值時(shí),基于第二參數(shù)來調(diào)節(jié)音頻信號(hào)的回放速度,并且在所輸入的回放速度變量因子在預(yù)定閾值以上時(shí),基于第二參數(shù)和第三參數(shù)來調(diào)節(jié)音頻信號(hào)的回放速度和聲音音高。
通過這樣的配置,參數(shù)調(diào)節(jié)步驟根據(jù)指示所輸入的回放速度變量因子的第一參數(shù)來設(shè)定第二參數(shù)和第三參數(shù),并且信號(hào)處理步驟基于第二參數(shù)和第三參數(shù)來調(diào)節(jié)音頻信號(hào)的回放速度和聲音音高的至少一個(gè)。此時(shí),信號(hào)處理步驟在所輸入的回放速度變量因子小于預(yù)定閾值時(shí),基于第二參數(shù)來調(diào)節(jié)音頻信號(hào)的回放速度,并且在所輸入的回放速度變量因子在預(yù)定閾值以上時(shí),基于第二參數(shù)和第三參數(shù)來調(diào)節(jié)音頻信號(hào)的回放速度和聲音音高。因此,通過根據(jù)本發(fā)明的信息處理裝置,在音頻信號(hào)的回放速度被轉(zhuǎn)換的情況下,可以在聽覺上識(shí)別轉(zhuǎn)換后的回放速度。
在參數(shù)調(diào)節(jié)步驟中,可以確定第二參數(shù)和第三參數(shù)以使得第一參數(shù)可以近似等于第二參數(shù)和第三參數(shù)的乘積。
在信號(hào)處理步驟中,可以對(duì)音頻信號(hào)的信號(hào)波形振幅進(jìn)行控制以使得當(dāng)音頻信號(hào)的回放速度和聲音音高均經(jīng)過調(diào)節(jié)時(shí),音頻信號(hào)的音頻音量可以較小。
在信號(hào)處理步驟中,當(dāng)?shù)谝粎?shù)在預(yù)定閾值以上時(shí),音頻信號(hào)可以被切換到指示正在執(zhí)行高速回放的預(yù)定擬聲聲音。
在參數(shù)調(diào)節(jié)步驟中,還可以根據(jù)第一參數(shù)來確定第四參數(shù),該第四參數(shù)對(duì)將在信號(hào)處理步驟中被處理的音頻信號(hào)的數(shù)據(jù)量進(jìn)行調(diào)節(jié)。
在參數(shù)調(diào)節(jié)步驟中,當(dāng)?shù)谝粎?shù)在預(yù)定閾值以上時(shí),第四參數(shù)可以被減小以減小音頻信號(hào)的數(shù)據(jù)量。
在參數(shù)調(diào)節(jié)步驟中,可以根據(jù)對(duì)將在信號(hào)處理步驟中被處理的音頻信號(hào)的數(shù)據(jù)量進(jìn)行調(diào)節(jié)的第四參數(shù)和第一參數(shù)來確定第二參數(shù)和第三參數(shù)。
在參數(shù)調(diào)節(jié)步驟中,可以確定第二參數(shù)、第三參數(shù)和第四參數(shù)以使得第一參數(shù)和第四參數(shù)的乘積可以近似等于第二參數(shù)和第三參數(shù)的乘積。
根據(jù)本發(fā)明的另一實(shí)施例,提供了一種在計(jì)算機(jī)中實(shí)現(xiàn)的程序參數(shù)調(diào)節(jié)功能,其根據(jù)指示所輸入的回放速度變量因子的第一參數(shù)來設(shè)定第二參數(shù)和第三參數(shù);以及信號(hào)處理功能,其基于第二參數(shù)和第三參數(shù)來調(diào)節(jié)音頻信號(hào)的回放速度和聲音音高的至少一個(gè)。
通過這樣的配置,計(jì)算機(jī)程序被存儲(chǔ)在計(jì)算機(jī)中所包括的存儲(chǔ)部分中,并且被計(jì)算機(jī)中所包括的CPU讀取以執(zhí)行,因此,該程序使計(jì)算機(jī)用作上述的信息處理裝置。此外,還可以提供一種其中記錄了計(jì)算機(jī)程序并且可以被計(jì)算機(jī)讀取的記錄介質(zhì)。記錄介質(zhì)例如是磁盤、光盤、磁光盤和閃存。此外,例如可以經(jīng)由網(wǎng)絡(luò)來發(fā)布上述的計(jì)算機(jī)程序而無需使用記錄介質(zhì)。
根據(jù)上述本發(fā)明的實(shí)施例,在音頻信號(hào)的回放速度被轉(zhuǎn)換的情況下,可以在聽覺上識(shí)別轉(zhuǎn)換后的回放速度。
圖1A是示出通過PICOLA來拉伸音頻信號(hào)的方法的說明性示圖。
圖1B是示出通過PICOLA來拉伸音頻信號(hào)的方法的說明性示圖。
圖1C是示出通過PICOLA來拉伸音頻信號(hào)的方法的說明性示圖。
圖1D是示出通過PICOLA來拉伸音頻信號(hào)的方法的說明性示圖。
圖2A是示出搜索類似波形長(zhǎng)度的示例的說明性示圖。
圖2B是示出搜索類似波形長(zhǎng)度的示例的說明性示圖。
圖2C是示出搜索類似波形長(zhǎng)度的示例的說明性示圖。
圖3A是示出通過PICOLA來拉伸音頻信號(hào)的方法的說明性示圖。
圖3B是示出通過PICOLA來拉伸音頻信號(hào)的方法的說明性示圖。
圖4A是示出通過PICOLA來壓縮音頻信號(hào)的方法的說明性示圖。
圖4B是示出通過PICOLA來壓縮音頻信號(hào)的方法的說明性示圖。
圖4C是示出通過PICOLA來壓縮音頻信號(hào)的方法的說明性示圖。
圖4D是示出通過PICOLA來壓縮音頻信號(hào)的方法的說明性示圖。
圖5A是示出通過PICOLA來壓縮音頻信號(hào)的方法的說明性示圖。
圖5B是示出通過PICOLA來壓縮音頻信號(hào)的方法的說明性示圖。
圖6是示出通過PICOLA來拉伸音頻信號(hào)的方法的流程圖。
圖7是示出通過PICOLA來壓縮音頻信號(hào)的方法的流程圖。
圖8是示出根據(jù)PICOLA的語速轉(zhuǎn)換裝置的配置的框圖。
圖9是示出檢測(cè)類似波形長(zhǎng)度的處理的流程圖。
圖10是示出檢測(cè)類似波形長(zhǎng)度的處理的流程圖。
圖11是示出生成交叉淡入淡出信號(hào)的處理示例的流程圖。
圖12是示出降低采樣率的方法的說明性示圖。
圖13是示出提高采樣率的方法的說明性示圖。
圖14A是示出與回放速度成比例地升高聲音音高的處理示例的說明性示圖。
圖14B是示出與回放速度成比例地升高聲音音高的處理示例的說明性示圖。
圖14C是示出與回放速度成比例地升高聲音音高的處理示例的說明性示圖。
圖15A是示出在相關(guān)技術(shù)的第一回放裝置中回放速度變量因子與語速轉(zhuǎn)換率之間關(guān)系的坐標(biāo)圖。
圖15B是示出在相關(guān)技術(shù)的第一回放裝置中回放速度變量因子與聲音音高之間關(guān)系的坐標(biāo)圖。
圖16A是示出在相關(guān)技術(shù)的第二回放裝置中回放速度變量因子與語速轉(zhuǎn)換率之間關(guān)系的坐標(biāo)圖。
圖16B是示出在相關(guān)技術(shù)的第二回放裝置中回放速度變量因子與聲音音高之間關(guān)系的坐標(biāo)圖。
圖17是示出包括根據(jù)本發(fā)明第一實(shí)施例的信息處理裝置的回放速度轉(zhuǎn)換系統(tǒng)的說明性示圖。
圖18是示出根據(jù)本實(shí)施例的信息處理裝置配置的框圖。
圖19A是示出第一參數(shù)R和第二參數(shù)Rs之間關(guān)系的坐標(biāo)圖。
圖19B是示出第一參數(shù)R和第三參數(shù)Rp之間關(guān)系的坐標(biāo)圖。
圖20是示出根據(jù)本實(shí)施例的信息處理裝置的處理流程的流程圖。
圖21是示出根據(jù)本實(shí)施例的信息處理部分的功能的框圖。
圖22A是示出第一參數(shù)R和第二參數(shù)Rs之間關(guān)系的坐標(biāo)圖。
圖22B是示出第一參數(shù)R和第三參數(shù)Rp之間關(guān)系的坐標(biāo)圖。
圖23是示出根據(jù)本實(shí)施例的信號(hào)處理方法的流程圖。
圖24A是以樣本為單位示出由根據(jù)本實(shí)施例的信息處理裝置所執(zhí)行的信號(hào)處理示例的說明性示圖。
圖24B是以樣本為單位示出由根據(jù)本實(shí)施例的信息處理裝置所執(zhí)行的信號(hào)處理示例的說明性示圖。
圖24C是以樣本為單位示出由根據(jù)本實(shí)施例的信息處理裝置所執(zhí)行的信號(hào)處理示例的說明性示圖。
圖24D是以樣本為單位示出由根據(jù)本實(shí)施例的信息處理裝置所執(zhí)行的信號(hào)處理示例的說明性示圖。
圖25A是以樣本為單位示出由根據(jù)本實(shí)施例的信息處理裝置所執(zhí)行的信號(hào)處理的另一示例的說明性示圖。
圖25B是以樣本為單位示出由根據(jù)本實(shí)施例的信息處理裝置所執(zhí)行的信號(hào)處理的另一示例的說明性示圖。
圖25C是以樣本為單位示出由根據(jù)本實(shí)施例的信息處理裝置所執(zhí)行的信號(hào)處理的另一示例的說明性示圖。
圖25D是以樣本為單位示出由根據(jù)本實(shí)施例的信息處理裝置所執(zhí)行的信號(hào)處理的另一示例的說明性示圖。
圖26A是示出第一參數(shù)R和第二參數(shù)Rs之間關(guān)系的坐標(biāo)圖。
圖26B是示出第一參數(shù)R和第三參數(shù)Rp之間關(guān)系的坐標(biāo)圖。
圖27A是示出第一參數(shù)R和第二參數(shù)Rs之間關(guān)系的坐標(biāo)圖。
圖27B是示出第一參數(shù)R和第三參數(shù)Rp之間關(guān)系的坐標(biāo)圖。
圖28A是示出第一參數(shù)R和第二參數(shù)Rs之間關(guān)系的坐標(biāo)圖。
圖28B是示出第一參數(shù)R和第三參數(shù)Rp之間關(guān)系的坐標(biāo)圖。
圖29是示出根據(jù)本實(shí)施例的信號(hào)處理部分的修改示例的框圖。
圖30是示出根據(jù)修改示例的信號(hào)處理方法的流程圖。
圖31是示出轉(zhuǎn)換采樣率的另一種方法的說明性示圖。
圖32是示意性示出回放速度變量因子隨時(shí)間的變化的說明性示圖。
圖33是示出根據(jù)本發(fā)明第二實(shí)施例的信息處理裝置的功能的框圖。
圖34A是示出第一參數(shù)R和第四參數(shù)Rt之間關(guān)系的坐標(biāo)圖。
圖34B是示出第一參數(shù)R和將被輸入到信號(hào)處理部分的音頻信號(hào)數(shù)據(jù)量之間關(guān)系的坐標(biāo)圖。
圖35A是示出根據(jù)本實(shí)施例的調(diào)節(jié)數(shù)據(jù)讀取速度的方法示例的說明性示圖。
圖35B是示出根據(jù)本實(shí)施例的調(diào)節(jié)數(shù)據(jù)讀取速度的方法示例的說明性示圖。
圖36A是示出根據(jù)本實(shí)施例的調(diào)節(jié)數(shù)據(jù)讀取速度的方法示例的說明性示圖。
圖36B是示出根據(jù)本實(shí)施例的調(diào)節(jié)數(shù)據(jù)讀取速度的方法示例的說明性示圖。
圖37A是示出根據(jù)本實(shí)施例的調(diào)節(jié)數(shù)據(jù)讀取速度的方法示例的說明性示圖。
圖37B是示出根據(jù)本實(shí)施例的調(diào)節(jié)數(shù)據(jù)讀取速度的方法示例的說明性示圖。
圖37C是示出根據(jù)本實(shí)施例的調(diào)節(jié)數(shù)據(jù)讀取速度的方法示例的說明性示圖。
圖38A是示出第一參數(shù)R和第二參數(shù)Rs之間關(guān)系的坐標(biāo)圖。
圖38B是示出第一參數(shù)R和第三參數(shù)Rp之間關(guān)系的坐標(biāo)圖。
圖39是示出根據(jù)本實(shí)施例的信息處理裝置的處理流程的流程圖。
圖40是示出根據(jù)本實(shí)施例的信號(hào)處理部分的功能的框圖。
圖41A是示出第一參數(shù)R和第二參數(shù)Rs之間關(guān)系的坐標(biāo)圖。
圖41B是示出第一參數(shù)R和第三參數(shù)Rp之間關(guān)系的坐標(biāo)圖。
圖42是示出根據(jù)本實(shí)施例的信號(hào)處理方法的流程圖。
圖43是示出根據(jù)本實(shí)施例的信息處理裝置的第一修改示例的功能的框圖。
圖44是示出根據(jù)本修改示例的信號(hào)處理方法的流程圖。
圖45是示出根據(jù)本實(shí)施例以及本修改示例的信號(hào)處理部分的修改示例的框圖。
圖46是示出根據(jù)本修改示例的信號(hào)處理方法的流程圖。
圖47是示出根據(jù)本發(fā)明每個(gè)實(shí)施例的信息處理裝置的硬件配置的框圖。
具體實(shí)施例方式 在下文中,將參考附圖詳細(xì)描述本發(fā)明的優(yōu)選實(shí)施例。應(yīng)注意,在本說明書和附圖中,用相同標(biāo)號(hào)來表示實(shí)質(zhì)上具有相同功能和結(jié)構(gòu)的結(jié)構(gòu)元件,并且省略對(duì)這些結(jié)構(gòu)元件的重復(fù)說明。
順便提及,以下,由語音構(gòu)成的信號(hào)稱作語音信號(hào),由諸如音樂之類的除語音外的聲音構(gòu)成的信號(hào)稱作聲響信號(hào),并且由語音信號(hào)和聲響信號(hào)構(gòu)成的信號(hào)稱作音頻信號(hào)。
(基礎(chǔ)技術(shù)描述) 首先,在給出對(duì)本發(fā)明的優(yōu)選實(shí)施例的詳細(xì)描述之前,將描述實(shí)現(xiàn)本發(fā)明所基于的技術(shù)問題。順便提及,本發(fā)明被配置為能夠通過改進(jìn)如下所述的基礎(chǔ)技術(shù)來獲得顯著效果。因此,與改進(jìn)有關(guān)的技術(shù)是本實(shí)施例的特征。也就是,雖然本實(shí)施例遵循如下所述的技術(shù)問題的基本概念,但是實(shí)施例的本質(zhì)關(guān)注改進(jìn),并且應(yīng)注意,所述配置清楚地區(qū)別于基礎(chǔ)技術(shù),并且在本實(shí)施例的效果和基礎(chǔ)技術(shù)的效果之間存在清楚的差別。
(PICOLA描述) 如上所述,PICOLA是在對(duì)應(yīng)于數(shù)字語音信號(hào)的時(shí)域上的時(shí)間軸拉伸/壓縮算法,并且如下所述,對(duì)語音信號(hào)執(zhí)行拉伸和壓縮。以下,通過參考圖1A到圖5B,將描述根據(jù)PICOLA的信號(hào)處理方法。
圖1A到1D是示出通過PICOLA來拉伸音頻信號(hào)的方法的說明性視圖。順便提及,在以下描述中,原始波形是信號(hào)最初被輸入到PICOLA時(shí)的波形。此外,在圖1A到1D中,縱軸代表信號(hào)振幅(即強(qiáng)度),并且橫軸代表時(shí)間。
(根據(jù)PICOLA對(duì)波形進(jìn)行拉伸的處理) 根據(jù)PICOLA,首先,從原始波形中檢測(cè)到具有類似波形的周期A和周期B。如圖1A所示,周期A和周期B是連續(xù)并且具有相同長(zhǎng)度的兩個(gè)周期,并且周期A的樣本數(shù)和周期B的樣本數(shù)相同。隨后,生成在圖1B中示出的波形,圖1B的波形在所檢測(cè)到的周期A中保持不變,然后在所檢測(cè)到的周期B中淡出(fade out)。類似地,生成在圖1C中示出的波形,圖1C的波形從周期A開始淡入(fade in)并且在周期B中保持不變。然后,通過相加在圖1B和圖1C中示出的所生成波形,可以獲得在圖1D中示出的經(jīng)拉伸的波形。
如上所述的相加淡出波形和淡入波形被稱作交叉淡入淡出(cross-fade)。當(dāng)周期A和周期B的交叉淡入淡出周期被表示為周期A×B并且上述操作被執(zhí)行時(shí),在圖1A中示出的原始波形的周期A和周期B變?yōu)樵趫D1D中示出的經(jīng)拉伸波形的周期A、周期A×B和周期B。
(類似波形長(zhǎng)度檢測(cè)) 在此,在如上所述的拉伸波長(zhǎng)的處理中,將要從所輸入的信號(hào)中檢測(cè)出連續(xù)并且具有類似波形的兩個(gè)周期。在下文中,通過參考圖2A到圖2C,來描述檢測(cè)具有類似波形的周期A和周期B的周期長(zhǎng)度W的方法。圖2A到圖2C是示出搜索類似波形長(zhǎng)度的示例的說明性示圖。順便提及,在以下的描述中,周期A和周期B的周期長(zhǎng)度被稱作類似波形長(zhǎng)度。
首先,使信號(hào)波形中的處理開始位置P0作為開始點(diǎn),如圖2A所示,j個(gè)樣本的周期A和周期B被指定。接下來,如圖2A→圖2B→圖2C所示,j(即,樣本數(shù))逐漸增大,并且彼此十分類似的具有周期A的j和具有周期B的j被檢測(cè)到。在此,作為測(cè)量周期A與周期B之間的相似性的尺度,例如,可以使用如以下等式1所示的函數(shù)D(j)。 ...(等式1) 在類似長(zhǎng)度波形的搜索范圍的最小值(WMIN)到最大值(WMAX)的范圍內(nèi)(即,WMIN≤j≤WMAX)計(jì)算函數(shù)D(j),并且導(dǎo)致最小D(j)的j被獲得。該導(dǎo)致最小D(j)的參數(shù)j是周期A和周期B的周期長(zhǎng)度W。順便提及,上述j、WMIN和WMAX表示周期的樣本數(shù)。
在此,在上述的等式1中,x(i)代表周期A的每個(gè)樣本值,并且y(i)代表周期B的每個(gè)樣本值。此外,x(i)代表周期B的每個(gè)樣本值并且y(i)代表周期A的每個(gè)樣本值是可以的。順便提及,例如,類似波形長(zhǎng)度的搜索頻率范圍可以近似是50Hz到250Hz。例如,當(dāng)采樣頻率為8kHz時(shí),近似地,WMAX是160并且WMIN是32。在如圖2B所示的示例中,j被選作使函數(shù)D(j)最小的j。
隨后,通過參考圖3A到圖3B,將描述利用PICOLA來將音頻信號(hào)拉伸到任意長(zhǎng)度的方法。圖3A和圖3B是示出通過PICOLA來拉伸音頻信號(hào)的方法的說明性示圖。
首先,如參考圖2A到圖2C所描述的,在將處理開始位置P0作為開始點(diǎn)的情況下,使函數(shù)D(j)最小的j被獲得,并且W被設(shè)定為j。隨后,周期301被復(fù)制到周期303,并且周期301和周期302的交叉淡入淡出波形被產(chǎn)生在周期301中。然后,從在3A中示出的原始波形的位置P0到位置P0’的周期被復(fù)制到在圖3B中示出的經(jīng)拉伸的波形。通過如上所述的操作,從在圖3A中示出的原始波形的位置P0到位置P0’的L個(gè)樣本變?yōu)樵趫D3B中示出的經(jīng)拉伸波形的W+L個(gè)樣本,并且樣本數(shù)變?yōu)閞倍。在此,利用如下等式2來定義表示樣本數(shù)的拉伸率(樣本數(shù)的增長(zhǎng)率)的r。 ...(等式2) 在此,關(guān)于L重寫上述等式2得出如下等式3。
...(等式3) 也就是,從等式3顯然可見,當(dāng)期望將原始波形的樣本數(shù)乘以r時(shí),可以通過利用如下等式4指定位置P0’來實(shí)現(xiàn)。
P0′=P0+L ...(等式4) 此外,通過定義如下式5所示的參數(shù)Rs,樣本數(shù)L可以被表示為如下等式6。
...(等式5) ...(等式6) 通過使用如上文所定義的Rs,使得能夠?qū)崿F(xiàn)諸如原始波形“以Rs倍速度被回放”之類的表達(dá)。在下文中,Rs將被稱作“語速轉(zhuǎn)換率”。
當(dāng)完成了對(duì)原始波形的位置P0到位置P0’的處理時(shí),位置P0’被切換到將被視為進(jìn)行處理的新的開始點(diǎn)的位置P1,并且相同處理被重復(fù)。通過重復(fù)這樣的處理,原始波形可以被拉伸。
在如圖3A和3B所示的示例中,樣本數(shù)L近似是2.5W,因此,根據(jù)等式2和5,語速轉(zhuǎn)換率Rs近似是0.7。也就是,如圖3A和3B所示的示例對(duì)應(yīng)于具有近似0.7倍速度的慢回放。
(根據(jù)PICOLA對(duì)波形進(jìn)行壓縮的處理) 隨后,通過參考圖4A到圖5B,來描述通過PICOLA對(duì)波形進(jìn)行壓縮的處理。
圖4A到4D是示出通過使用PICOLA來壓縮音頻信號(hào)的示例的說明性視圖。根據(jù)PICOLA,首先,從如圖4A所示的原始波形中檢測(cè)出具有類似波形的周期A和周期B。如圖4A所示,周期A和周期B是連續(xù)并且具有相同長(zhǎng)度的兩個(gè)周期,并且周期A和周期B的樣本數(shù)相同。順便提及,通過參考圖2A到圖2C而描述的方法可以被應(yīng)用于檢測(cè)具有類似波形的周期。隨后,在周期A中淡出的、在圖4B中示出的波形和從周期B開始淡入的、在圖4C中示出的波形被生成。然后,通過相加在圖4B和圖4C中示出的所生成波形,可以獲得在圖4D中示出的壓縮波形。通過如上所述的處理,在圖4A中示出的原始波形的周期A和周期B變?yōu)樵趫D4D中示出的壓縮波形的周期A×B。
隨后,通過參考圖5A和圖5B,來描述利用PICOLA來將音頻信號(hào)壓縮到任意長(zhǎng)度的方法。圖5A和圖5B是示出通過PICOLA來壓縮音頻信號(hào)的方法的說明性示圖。
首先,如參考圖2A到圖2C所描述的,在將處理開始位置P0作為開始點(diǎn)的情況下,使函數(shù)D(j)最小的j被獲得,并且W被設(shè)定為j。隨后,周期501和周期502的交叉淡入淡出波形被產(chǎn)生在周期502中。然后,其中從在圖5A中示出的原始波形的位置P0到位置P0’的周期中排除周期501的剩余周期被復(fù)制到在圖5B中示出的壓縮波形。通過上述操作,從在圖5A中示出的原始波形的位置P0到位置P0’的W+L個(gè)樣本變?yōu)樵趫D5B中示出的壓縮波形的L個(gè)樣本,并且樣本數(shù)變?yōu)閞倍。在此,利用如下等式7來定義表示樣本數(shù)的壓縮率的r。
...(等式7) 在此,關(guān)于L重寫上述等式7得出如下等式8。
...(等式8) 也就是,從等式8顯然可見,當(dāng)期望將原始波形的樣本數(shù)乘以r時(shí),可以通過利用如下等式9指定位置P0’來實(shí)現(xiàn)。
P0′=P0+(W+L) ...(等式9) 此外,通過定義如下式10所示的參數(shù)Rs,樣本數(shù)L可以被表示為如下等式11。
...(等式10) ...(等式11) 通過使用如上文所定義的Rs,使得能夠?qū)崿F(xiàn)諸如原始波形“以Rs倍速度被回放”之類的表達(dá)。當(dāng)完成了對(duì)原始波形的位置P0到位置P0’的處理時(shí),位置P0’被切換到將被視為進(jìn)行處理的新的開始點(diǎn)的位置P1,并且相同處理被重復(fù)。通過重復(fù)這樣的處理,原始波形可以被壓縮。
在如圖5A和5B所示的示例中,樣本數(shù)L近似是1.5W,因此,根據(jù)等式7和10,語速轉(zhuǎn)換率Rs近似是1.7。也就是,如圖5A和5B所示的示例等價(jià)于具有近似1.7倍速度的快回放。
(根據(jù)PICOLA對(duì)信號(hào)進(jìn)行拉伸的處理流程) 隨后,通過參考圖6,來簡(jiǎn)要描述根據(jù)PICOLA對(duì)信號(hào)進(jìn)行拉伸的處理流程。圖6是示出利用PICOLA來拉伸音頻信號(hào)的處理流程的流程圖。
首先,根據(jù)PICOLA,判斷在實(shí)現(xiàn)了PICOLA的信息處理裝置等的輸入緩沖器中是否存在待處理的音頻信號(hào)(步驟S601)。在此,如果判斷不存在待處理的音頻信號(hào),那么處理終止。然而,如果判斷存在待處理的音頻信號(hào),那么在使處理開始位置P作為開始點(diǎn)的情況下獲得使函數(shù)D(j)最小的j,并且W被設(shè)定為j(步驟S602)。隨后,根據(jù)PICOLA,根據(jù)由使用者所指定的語速轉(zhuǎn)換率Rs來獲得L(步驟S603),并且對(duì)應(yīng)于從處理開始位置P起的W個(gè)樣本的周期A被輸出到實(shí)現(xiàn)了PICOLA的信息處理裝置等的輸出緩沖器(步驟S604)。
接下來,根據(jù)PICOLA,具有從處理開始位置P起的W個(gè)樣本的周期A與具有從周期A起連續(xù)的下一組W個(gè)樣本的周期B之間的交叉淡入淡出被獲得,并且被置于周期A中(步驟S605)。隨后,輸入緩沖器的具有從位置P起的L個(gè)樣本的信號(hào)被輸出到輸出緩沖器(步驟S606)。隨后,PICOLA將處理開始位置P移至P+L(步驟S607),并且返回到步驟S601以重復(fù)處理。通過重復(fù)這樣的處理直到在輸入緩沖器中不再有待處理的音頻信號(hào),可以執(zhí)行對(duì)音頻信號(hào)的拉伸處理。
(根據(jù)PICOLA對(duì)信號(hào)進(jìn)行壓縮的處理流程) 隨后,通過參考圖7,來簡(jiǎn)要描述根據(jù)PICOLA對(duì)信號(hào)進(jìn)行壓縮的處理流程。圖7是示出利用PICOLA來壓縮音頻信號(hào)的處理流程的流程圖。
首先,根據(jù)PICOLA,判斷在實(shí)現(xiàn)了PICOLA的信息處理裝置等的輸入緩沖器中是否存在待處理的音頻信號(hào)(步驟S701)。在此,如果判斷不存在待處理的音頻信號(hào),那么處理終止。然而,如果判斷存在待處理的音頻信號(hào),那么在使處理開始位置P作為開始點(diǎn)的情況下獲得使函數(shù)D(j)最小的j,并且W被設(shè)定為j(步驟S702)。隨后,根據(jù)PICOLA,根據(jù)由使用者所指定的語速轉(zhuǎn)換率Rs來獲得L(步驟S703)。
接下來,具有從處理開始位置P起的W個(gè)樣本的周期A與具有從周期A起連續(xù)的下一組W個(gè)樣本的周期B之間的交叉淡入淡出被獲得,并且被置于周期B中(步驟S704)。隨后,輸入緩沖器的具有從位置P+W起的L個(gè)樣本的信號(hào)被輸出到輸出緩沖器(步驟S705)。隨后,PICOLA將處理開始位置P移至P+(W+L)(步驟S706),并且返回到步驟S701以重復(fù)處理。通過重復(fù)這樣的處理直到在輸入緩沖器中不再有待處理的音頻信號(hào),可以執(zhí)行對(duì)音頻信號(hào)的壓縮處理。
(根據(jù)PICOLA的語速轉(zhuǎn)換裝置的配置) 接下來,通過參考圖8,來描述根據(jù)PICOLA的語速轉(zhuǎn)換裝置的配置。圖8是示出根據(jù)PICOLA的語速轉(zhuǎn)換裝置的配置的框圖。順便提及,在以下描述中,在圖1A和圖4A中的周期A和周期B的周期長(zhǎng)度被稱作類似波形長(zhǎng)度。
如圖8所示,根據(jù)PICOLA的信息處理裝置800例如包括輸入緩沖器801、類似波形長(zhǎng)度檢測(cè)部分802、連接信號(hào)生成部分803和輸出緩沖器804。
輸入緩沖器801,在緩沖被輸入到信息處理裝置800的音頻信號(hào)的同時(shí),將所輸入的音頻信號(hào)發(fā)送到隨后將描述的類似波形長(zhǎng)度檢測(cè)部分802和連接信號(hào)生成部分803,并且將根據(jù)語速轉(zhuǎn)換率Rs而生成的音頻信號(hào)輸出到輸出緩沖器804。順便提及,將被輸入到輸入緩沖器801的音頻信號(hào)可以是直接被輸入到信息處理裝置800的數(shù)字信號(hào),或者是被信息處理裝置800 AD(模擬到數(shù)字)轉(zhuǎn)換到數(shù)字信號(hào)的模擬信號(hào)。
具體地,基于由隨后將描述的類似波形長(zhǎng)度檢測(cè)部分802所檢測(cè)到的類似波形長(zhǎng)度W,輸入緩沖器801將2W個(gè)樣本的音頻信號(hào)傳送到連接信號(hào)生成部分803。根據(jù)語速轉(zhuǎn)換率Rs,輸入緩沖器801將由連接信號(hào)生成部分803所生成的連接信號(hào)存儲(chǔ)到輸入緩沖器801中的適當(dāng)位置中。此外,根據(jù)語速轉(zhuǎn)換率Rs,輸入緩沖器801將輸入緩沖器801中的音頻信號(hào)發(fā)送到輸出緩沖器804。
關(guān)于被輸入到輸入緩沖器801的音頻信號(hào),類似波形長(zhǎng)度檢測(cè)部分802檢測(cè)使函數(shù)D(j)最小的參數(shù)j,并且所檢測(cè)到的參數(shù)j被設(shè)定為類似波形長(zhǎng)度W(W=j(luò))。所檢測(cè)到的類似波形長(zhǎng)度W被發(fā)送到輸入緩沖器801。順便提及,所檢測(cè)到的類似波形長(zhǎng)度W可以直接被輸出到隨后將描述的連接信號(hào)生成部分803。此外,所檢測(cè)到的類似波形長(zhǎng)度W可以被存儲(chǔ)在被配置為RAM、存儲(chǔ)設(shè)備等的存儲(chǔ)部分(未示出)中。
通過使用從輸入緩沖器801發(fā)送的音頻信號(hào)和類似波形長(zhǎng)度W,連接信號(hào)生成部分803生成將被用于音頻信號(hào)的拉伸/壓縮處理中的連接信號(hào),并且將所生成的連接信號(hào)發(fā)送到輸入緩沖器801。具體地,連接信號(hào)生成部分803將所接收的2W個(gè)樣本的音頻信號(hào)交叉淡入淡出為W個(gè)樣本,并且將經(jīng)交叉淡入淡出的信號(hào)發(fā)送到輸入緩沖器801。此外,可以將所生成的連接信號(hào)存儲(chǔ)在被配置為RAM、存儲(chǔ)設(shè)備等的存儲(chǔ)部分(未示出)中。
輸出緩沖器804緩沖由輸入緩沖器801所生成的音頻信號(hào),并且在輸出緩沖器804上執(zhí)行拉伸/壓縮處理。被執(zhí)行了拉伸/壓縮處理的音頻信號(hào)在經(jīng)過DA(數(shù)字到模擬)轉(zhuǎn)換后,經(jīng)由諸如揚(yáng)聲器之類的輸出設(shè)備作為輸出音頻信號(hào)被輸出。
(類似波形長(zhǎng)度檢測(cè)流程) 隨后,通過參考圖9和圖10,來詳細(xì)描述檢測(cè)類似波形長(zhǎng)度的處理。圖9和圖10是示出檢測(cè)類似波形長(zhǎng)度的處理的流程圖。
關(guān)于檢測(cè)類似波形長(zhǎng)度,首先,作為參數(shù)的索引值j被設(shè)定為初始值WMIN(步驟S901)。在此,如上所述,WMIN是在其中搜索類似波形的搜索范圍的最小值。當(dāng)設(shè)定了類似波形長(zhǎng)度搜索的初始值時(shí),如圖10所示的子程序在實(shí)現(xiàn)了PICOLA的信息處理等中被執(zhí)行(步驟S902)。如隨后將描述的,該子程序是,用于計(jì)算用以判斷波形之間的相似性的函數(shù)D(j)的子程序。在此,D(j)是通過如下等式12被給出的函數(shù)。...(等式12) 在此,在上述等式12中,f是輸入音頻信號(hào),并且例如在如圖2A到圖2C所示的示例中,在使位置P0作為開始點(diǎn)的情況下,它指示樣本。順便提及,等式1和等式12表示相同問題。
隨后,通過子程序而獲得的函數(shù)D(j)的值被指定給變量min,并且索引j被指定給W(步驟S903)。然后,索引j被增大1(步驟S904)。接下來,判斷索引j是否小于WMAX(步驟S905)。如果不小于WMAX(也就是,如果超過WMAX),那么處理終止,并且當(dāng)終止處理時(shí)在變量W中存儲(chǔ)的值是使函數(shù)D(j)最小的索引j,也就是,類似波形長(zhǎng)度,并且此時(shí)變量min的值是函數(shù)D(j)的最小值。
此外,如果索引j小于WMAX,那么通過上述的子程序,針對(duì)新的索引j的函數(shù)D(j)被獲得(步驟S906)。接下來,判斷針對(duì)新的索引j而獲得的函數(shù)D(j)的值是否小于min(步驟S907)。在此,如果函數(shù)D(j)的值小于min,那么函數(shù)D(j)的值被指定給變量min,并且索引j被指定給W(步驟S908),然后處理返回步驟S904。此外,如果函數(shù)D(j)的值不小于min(也就是,如果超過min),那么處理返回步驟S904。通過執(zhí)行這樣的處理,輸入音頻信號(hào)的類似波形部分可以被搜索到,并且類似波形長(zhǎng)度可以被檢測(cè)到。
(函數(shù)D(j)的值的計(jì)算) 隨后,通過參考圖10,來詳細(xì)描述用于計(jì)算函數(shù)D(j)的子程序流程,該函數(shù)D(j)用于判斷波形之間的相似性。
當(dāng)子程序的處理開始時(shí),首先,索引i和變量s被設(shè)定為0(步驟S1001)。接下來,判斷索引i是否小于索引j(步驟S1002)。如果索引i小于索引j,那么執(zhí)行隨后將描述的步驟S1003,并且如果索引i不小于索引j(也就是,如果索引i等于或大于索引j),那么執(zhí)行隨后將描述的步驟S1005。在此,索引j與如圖9所示的流程圖中的索引j相同。
在步驟S1003,輸入音頻信號(hào)的差被平方,然后與變量s相加。然后,索引i被增大1(步驟S1004),并且處理返回步驟S1002。此外,在步驟S1005,變量s被除以索引j,并且商被作為函數(shù)D(j)的值,然后子程序終止。
(交叉淡入淡出信號(hào)的生成) 隨后,通過參考圖11,來詳細(xì)描述在連接信號(hào)生成部分803中執(zhí)行的生成交叉淡入淡出信號(hào)的方法。圖11是示出生成交叉淡入淡出信號(hào)的處理示例的流程圖。
關(guān)于生成交叉淡入淡出信號(hào),首先,索引i被設(shè)定為0(步驟S1101)。接下來,比較索引i和類似波形長(zhǎng)度W(步驟S1102),并且如果索引i不小于W(也就是,如果索引i等于或大于W),那么處理終止。此外,如果索引i小于W,那么將被用于淡入和淡出的系數(shù)h被獲得(步驟S1103)。當(dāng)完成了對(duì)系數(shù)h的計(jì)算時(shí),淡入的信號(hào)x(i)被乘以系數(shù)h,并且淡出的信號(hào)y(i)被乘以(1-h),并且這些信號(hào)的和被指定給z(i)(步驟S1104)。例如,在如圖1A到1D所示的示例中,周期A中的信號(hào)對(duì)應(yīng)于x(i),并且周期B中的信號(hào)對(duì)應(yīng)于y(i)。此外,在如圖4A到4D所示的示例中,周期B中的信號(hào)對(duì)應(yīng)于x(i),并且周期A中的信號(hào)對(duì)應(yīng)于y(i)。以這樣的方式生成的信號(hào)z(i)被作為交叉淡入淡出信號(hào)。在接下來的處理中,索引i被增大1(步驟S1105),并且處理返回到步驟S1102。通過重復(fù)這樣的處理,交叉淡入淡出信號(hào)可以被算出。
如在上文中參考圖1A到圖11所描述的,通過語速轉(zhuǎn)換算法,PICOLA,使得能夠通過任意的語速轉(zhuǎn)換率Rs(Rs<1.0,1.0<Rs)來拉伸/壓縮音頻信號(hào),并且能夠關(guān)于語音信號(hào)實(shí)現(xiàn)尤其良好的聲音質(zhì)量。此外,如果語速轉(zhuǎn)換率Rs是1.0,那么信息處理裝置800可以將輸入音頻信號(hào)如其原樣地用作輸出音頻信號(hào)。
(關(guān)于語速轉(zhuǎn)換處理的考慮) 甚至在利用如上所述的語速轉(zhuǎn)換的數(shù)字內(nèi)容回放裝置普及之前,針對(duì)用于盒式磁帶的模擬回放裝置等,已經(jīng)存在可變地設(shè)定回放速度的裝置。然而,通過這樣的模擬回放裝置,聲音音高與回放速度成比例地改變,并且當(dāng)回放速度被減緩時(shí),聲音音高降低,并且當(dāng)回放速度被加快時(shí),聲音音高升高。
例如,當(dāng)回放內(nèi)容主要由諸如用于語言學(xué)習(xí)的內(nèi)容或新聞節(jié)目之類的語音構(gòu)成時(shí),如果聲音音高改變,那么出現(xiàn)語音內(nèi)容變得很難理解的問題。此外,作為另一個(gè)問題,即使聲音音高僅略微地改變,識(shí)別說話人也變得很難。在其中知道哪個(gè)語音由哪個(gè)人物發(fā)出很重要的內(nèi)容中,例如戲劇內(nèi)容等,對(duì)于使用者而言,很難通過以不同速度回放的語音來識(shí)別說話人是回放裝置的缺點(diǎn)。此外,還存在一個(gè)問題,即就音樂內(nèi)容而言,甚至聲音音高的輕微改變也會(huì)很大程度上改變音樂的情緒。在下文中,將描述如上所述的由于在以不同速度回放時(shí)聲音音高的改變而引出的問題,該問題被稱作第一問題。
在維持恒定的聲音音高的同時(shí)可變地設(shè)定回放速度的變速回放,即近年來在許多數(shù)字內(nèi)容回放裝置中實(shí)現(xiàn)的變速回放功能,解決了第一問題。在回放速度的范圍大約是0.5到4.0倍速度的情況下,可以獲得尤其良好的結(jié)果。在下文中,其中獲得了尤其良好的結(jié)果的這個(gè)范圍被稱作第一范圍,并且沒有落入第一范圍內(nèi)的范圍(即低于第一范圍的下限的范圍和高于第一范圍的上限的范圍)將被稱作第二范圍。容易理解,第一范圍根據(jù)內(nèi)容而改變。例如,如果內(nèi)容的說話人的語速較慢,那么即使回放速度被大大加快也可以理解內(nèi)容。然而,如果內(nèi)容的說話人的語速較快,那么即使回放速度僅略微被加快也很難理解內(nèi)容。
另一方面,還存在以諸如10或20倍速度之類的高速來回放聲音的需求。例如,雖然由用于盒式磁帶的模擬回放裝置等所提供的變速回放功能具有第一問題,但是即使當(dāng)以高速回放時(shí)也能夠概略地領(lǐng)會(huì)內(nèi)容。對(duì)內(nèi)容的概略領(lǐng)會(huì)是諸如“有個(gè)人正在說話”、“音樂正在播放”或“沒有聲音”之類的領(lǐng)會(huì)。即使是這個(gè)級(jí)別的領(lǐng)會(huì),在目標(biāo)內(nèi)容中急速搜索期望部分時(shí)也是十分有用的。
此外,因?yàn)榛胤潘俣缺患涌煸蕉?,聲音音高變得越高,所以能夠根?jù)聲音音高在聽覺上感受到近似的回放速度。存在如下的優(yōu)點(diǎn)通過在聽覺上識(shí)別近似的回放速度,能夠本能地感受到內(nèi)容中的每個(gè)事件之間的時(shí)間位置關(guān)系(例如,諸如“有個(gè)人正在說話”、“音樂正在播放”或“沒有聲音”之類的事件,等等)。因此,當(dāng)在目標(biāo)內(nèi)容中搜索期望部分時(shí),很容易控制回放速度,例如,“該部分好像不相關(guān)所以讓我們加快回放速度”或者“該部分好像相關(guān)所以讓我們減緩回放速度”。因此,當(dāng)在目標(biāo)內(nèi)容中急速搜索期望部分時(shí)十分有用。
(基礎(chǔ)技術(shù)轉(zhuǎn)換聲音音高的處理) 在下文中,將考慮其中聲音音高與回放速度成比例地改變的數(shù)字內(nèi)容回放裝置,例如,用于盒式磁帶的模擬回放裝置。作為將被用于與回放速度成比例地改變聲音音高的方法的示例,例如,有用于轉(zhuǎn)換采樣率的方法。在下文中,通過參考圖12和圖13,來簡(jiǎn)要描述用于轉(zhuǎn)換采用率的方法示例。
(降低采樣率的方法) 圖12是示出用于降低采樣率的方法的說明性示圖(下采樣方法)。圖12的(a)是待處理的原始信號(hào),其中T是采樣周期并且fs是采樣頻率。
在采樣率轉(zhuǎn)換過程中,首先,原始信號(hào)(a)通過低通濾波器(LPF)1201。低通濾波器1201是將截止頻率設(shè)定為fs/(2M)的濾波器。原始信號(hào)(a)被低通濾波器1201濾波為信號(hào)(b)。如圖12的(b)所示,原始信號(hào)(a)的波形通過低通濾波器1201變得平滑。隨后,下采樣器1202從信號(hào)(b)中間隔剔除(thin out)M-1個(gè)樣本并針對(duì)每M個(gè)樣本留下一個(gè)樣本。在如圖12所示的示例中,M是2。因此獲得的信號(hào)(c)具有采樣率fs/M,即原始信號(hào)(a)的采樣率的1/M倍。此外,信號(hào)(c)的樣本數(shù)也是原始信號(hào)(a)的樣本數(shù)的的1/M倍。當(dāng)?shù)屯V波器1201沒有被用于上述操作中時(shí),在信號(hào)(c)中可能生成混迭分量(aliasing component)。如圖12所示的包括低通濾波器1201和下采樣器1202的配置被稱作抽取器(decimator)。
(提高采樣率的方法) 圖13是示出用于提高采樣率的方法的說明性示圖(上采樣方法)。圖13的(a)是待處理的原始信號(hào),其中T是采樣周期并且fs是采樣頻率。
在采樣率轉(zhuǎn)換過程中,首先,預(yù)定數(shù)目的零值被插入原始信號(hào)(a)中。具體地,上采樣器1301將L-1個(gè)零值插入到原始信號(hào)(a)的每個(gè)樣本之間。在如圖13所示的示例中,L是2。圖中,經(jīng)上采樣的信號(hào)是信號(hào)(b)。信號(hào)(b)具有fsL的采樣率,所述fsL是L乘以原始信號(hào)(a)的采樣率。此外,信號(hào)(c)的樣本數(shù)也是L乘以原始信號(hào)(a)的樣本數(shù)。隨后,隨著信號(hào)(b)通過低通濾波器1302,信號(hào)(c)生成。低通濾波器1302是將截止頻率設(shè)定為fs/2的濾波器。此外,在通過低通濾波器1302對(duì)信號(hào)(b)進(jìn)行處理后,經(jīng)處理的信號(hào)的振幅可以被調(diào)節(jié)。當(dāng)?shù)屯V波器1302沒有被用于如上所述的操作中時(shí),在信號(hào)(c)中生成鏡像分量。如圖13所示的包括上采樣器1301和低通濾波器1302的配置被稱作內(nèi)插器。
如圖12所示的抽取器和如圖13所示的內(nèi)插器僅能夠轉(zhuǎn)換整數(shù)比值的采樣率。然而,通過結(jié)合這兩種配置,使得能夠進(jìn)行有理數(shù)采樣率的轉(zhuǎn)換。例如,使內(nèi)插器的參數(shù)L為3,并且使抽取器的參數(shù)M為2。首先由內(nèi)插器來處理原始信號(hào)以獲得經(jīng)處理的信號(hào)1。隨后,由抽取器來進(jìn)一步處理經(jīng)處理的信號(hào)以獲得經(jīng)處理的信號(hào)2。因此獲得的經(jīng)處理信號(hào)2以因子3被上采樣,然后被下采樣到1/2,因此采樣率被轉(zhuǎn)換為原始信號(hào)的采樣率的3/2倍。因此,通過結(jié)合抽取器和內(nèi)插器,使得能夠?qū)崿F(xiàn)L/M倍的采樣率轉(zhuǎn)換。
圖14A到圖14C是示出與回放速度成比例地升高聲音音高的處理示例的說明性示圖。首先,通過根據(jù)回放速度利用抽取器和內(nèi)插器來轉(zhuǎn)換采樣率,將在圖14A中示出的采樣率為fs(=1/T)的原始信號(hào)轉(zhuǎn)換為在圖14B中示出的采樣率為fs’(=1/T’)的信號(hào)。隨后,在圖14B中示出的采樣率為fs’(=1/T’)的信號(hào)的采樣頻率被在圖14A中示出的原始信號(hào)的采樣頻率fs(=1/T)取代,并且使其變?yōu)樵趫D14C中示出的信號(hào)。因此獲得的在圖14C中示出的信號(hào)的聲音音高根據(jù)回放速度的改變量,高于在圖14A中示出的原始信號(hào)的聲音音高。如圖14A到圖14C所示的示例示出其中回放速度是2倍的示例。在圖14B中示出的信號(hào)的采樣頻率是在圖14A中示出的原始信號(hào)的采樣頻率的1/2倍。此外,在圖14C中示出的信號(hào)的聲音音高是在圖14A中示出的原始信號(hào)的聲音音高的2倍,并且在圖14C中示出的信號(hào)的樣本數(shù)是在圖14A中示出的原始信號(hào)的樣本數(shù)的1/2倍。
(本實(shí)施例的描述) 在以下描述中,其中聲音音高與回放速度成比例地改變的回放裝置將被稱作“相關(guān)技術(shù)的第一回放裝置”,并且其中當(dāng)回放速度改變時(shí)恒定的聲音音高被維持的回放裝置將被稱作“相關(guān)技術(shù)的第二回放裝置”。
(相關(guān)技術(shù)的第一回放裝置) 圖15A是示出在相關(guān)技術(shù)的第一回放裝置中回放速度變量因子和語速轉(zhuǎn)換率之間關(guān)系的坐標(biāo)圖,并且圖15B是示出在相關(guān)技術(shù)的第一回放裝置中回放速度變量因子和聲音音高之間關(guān)系的坐標(biāo)圖。在此,圖15A的回放速度變量因子代表回放速度與正常回放速度的比值。例如,當(dāng)以2倍的正?;胤潘俣冗M(jìn)行回放時(shí),回放速度變量因子是2,并且當(dāng)以一半的正?;胤潘俣冗M(jìn)行回放時(shí),回放速度變量因子是0.5。此外,圖15B的聲音音高代表頻率與正?;胤艜r(shí)的頻率的比值。例如,當(dāng)以2倍的正常回放頻率進(jìn)行回放時(shí),聲音音高是2,并且當(dāng)以一半的正?;胤蓬l率進(jìn)行回放時(shí),聲音音高是0.5。
在相關(guān)技術(shù)的第一回放裝置中,因?yàn)闆]有執(zhí)行語速轉(zhuǎn)換,所以如圖15A所示,語速轉(zhuǎn)換率是1并且恒定。此外,如圖15B所示,在相關(guān)技術(shù)的第一回放裝置中,聲音音高與回放速度變量因子成比例,并且一般地,聲音音高等于回放速度變量因子。
順便提及,圖15A和圖15B僅示出以正常速度或以比正常速度更快的速度(換言之,回放速度變量因子為1或更大)來進(jìn)行回放的情況。在下文中,為了避免自變量變得復(fù)雜,將討論比正常速度更快的回放速度。然而,顯然,針對(duì)以小于正常速度的速度(例如,0.5倍速度)進(jìn)行回放的情況,可以做出相同的自變量。
(相關(guān)技術(shù)的第二回放裝置) 圖16A是示出在相關(guān)技術(shù)的第二回放裝置中回放速度變量因子和語速轉(zhuǎn)換率之間關(guān)系的坐標(biāo)圖,并且圖16B是示出在相關(guān)技術(shù)的第二回放裝置中回放速度變量因子和聲音音高之間關(guān)系的坐標(biāo)圖。在相關(guān)技術(shù)的第二回放裝置中,因?yàn)閳?zhí)行了語速轉(zhuǎn)換,所以如圖16A所示,語速轉(zhuǎn)換率與回放速度變量因子成比例,并且一般地,語速轉(zhuǎn)換率的值等于回放速度變量因子值。此外,如圖16B所示,在相關(guān)技術(shù)的第二回放裝置中,聲音音高為1并且恒定。
(關(guān)于相關(guān)技術(shù)的語速轉(zhuǎn)換裝置的再考慮) 在相關(guān)技術(shù)的第二回放裝置中,即使通過語速轉(zhuǎn)換生成了具有超出第一范圍的回放速度(換言之,在第二范圍內(nèi)的回放速度)的聲音,也很難從聽覺上感受到回放速度。例如,通過諸如如上所述的PICOLA之類的語速轉(zhuǎn)換算法,即使指定了例如10倍或20倍的回放速度,也能夠生成相應(yīng)聲音。然而,通過語速轉(zhuǎn)換而獲得的聲音物理上是10倍或20倍的速度,而在聽覺上感覺在10倍速度和20倍速度之間實(shí)際沒有差別。換言之,即使加快了速度,正在收聽聲音的收聽者在轉(zhuǎn)換后也不能夠在聽覺上感受到加速。因此,存在很難在聽覺上感受到第二范圍內(nèi)的回放速度的問題。這樣的問題被稱作第二問題。
如上所述,就相關(guān)技術(shù)的第一回放裝置而言,雖然存在第一問題,但是沒有出現(xiàn)第二問題。另一方面,就相關(guān)技術(shù)的第二回放裝置而言,雖然解決了第一問題,但是出現(xiàn)了第二問題。
因此,本發(fā)明的發(fā)明人就上述問題進(jìn)行了認(rèn)真的研究,并且實(shí)現(xiàn)了一種包括變速回放方法的信息處理裝置,該變速回放方法通過在第一范圍內(nèi)的變速回放使能夠容易領(lǐng)會(huì)語音內(nèi)容或指定說話人,此外,通過在第二范圍內(nèi)的變速回放使能夠在聽覺上感受到回放速度(換言之,即能夠同時(shí)解決第一和第二問題的變速回放)。
(第一實(shí)施例) 在下文中,通過參考圖17到圖32,來詳細(xì)描述根據(jù)本發(fā)明第一實(shí)施例的信息處理裝置。順便提及,在以下描述中,回放速度變量因子將被稱作第一參數(shù),語速轉(zhuǎn)換率將被稱作第二參數(shù),并且聲音音高將被稱作第三參數(shù)。
(回放速度轉(zhuǎn)換系統(tǒng)) 圖17是示出包括根據(jù)本實(shí)施例的信息處理裝置1701的回放速度轉(zhuǎn)換系統(tǒng)的說明性示圖。如圖17所示,在回放速度轉(zhuǎn)換系統(tǒng)中,作為用于控制回放速度變量因子的裝置的信息處理裝置1701,可以經(jīng)由諸如因特網(wǎng)和家用網(wǎng)絡(luò)之類的各種網(wǎng)絡(luò)1702連接到內(nèi)容服務(wù)器1703和客戶端裝置1704。此外,諸如AV設(shè)備(例如電視、DVD錄像機(jī)和音樂組件、計(jì)算機(jī)等)之類的各種外部連接裝置1705可以直接連接到根據(jù)本實(shí)施例的信息處理裝置1701。
在此,內(nèi)容服務(wù)器1703是與諸如URL(統(tǒng)一資源定位符)等之類位置信息、元數(shù)據(jù)等相關(guān)聯(lián)地來管理包括音頻信號(hào)的內(nèi)容的服務(wù)器。例如,內(nèi)容服務(wù)器1703可以是諸如電視、DVD錄像機(jī)和音樂組件、計(jì)算機(jī)等之類的AV設(shè)備,或者是符合DLNA(數(shù)字生活網(wǎng)絡(luò)聯(lián)盟)規(guī)范的DMS(數(shù)字媒體服務(wù)器)。此外,客戶端裝置1704是從內(nèi)容服務(wù)器1703獲得各種內(nèi)容以進(jìn)行回放的設(shè)備。客戶端裝置1704可以是諸如電視、DVD錄像機(jī)和音樂組件、計(jì)算機(jī)等之類的AV設(shè)備,或者是符合DLNA(數(shù)字生活網(wǎng)絡(luò)聯(lián)盟)規(guī)范的DMP(數(shù)字媒體播放器)。
(根據(jù)本實(shí)施例的信息處理裝置的配置) 圖18是示出根據(jù)本實(shí)施例的信息處理裝置1800的配置的框圖。如圖18所示,根據(jù)本實(shí)施例的信息處理裝置1800主要包括參數(shù)調(diào)節(jié)部分1801、信號(hào)處理部分1803和存儲(chǔ)部分1805。在根據(jù)本實(shí)施例的信息處理裝置1800中,音頻信號(hào)和代表回放速度變量因子的第一參數(shù)R被輸入,并且其回放速度變量因子受第一參數(shù)R控制的音頻信號(hào)被作為輸出信號(hào)輸出。
順便提及,在以下描述中,描述其中音頻信號(hào)從信息處理裝置1800的外部被輸入的情況。然而,本實(shí)施例并不局限于這樣的情況,并且音頻信號(hào)可以被存儲(chǔ)在信息處理裝置1800中。
參數(shù)調(diào)節(jié)部分1801例如被配置為CPU(中央處理單元)、ROM(只讀存儲(chǔ)器)、RAM(隨機(jī)存取存儲(chǔ)器)等,并且根據(jù)從外部輸入的第一參數(shù)R來調(diào)節(jié)第二參數(shù)Rs和第三參數(shù)Rp。隨后將詳細(xì)描述根據(jù)第一參數(shù)R來設(shè)定第二參數(shù)Rs和第三參數(shù)Rp的方法。參數(shù)調(diào)節(jié)部分1801將根據(jù)第一參數(shù)R而確定的第二參數(shù)Rs和第三參數(shù)Rp發(fā)送到隨后將描述的信號(hào)處理部分1803。
信號(hào)處理部分1803例如被配置為CPU、ROM、RAM等,并且基于所輸入的音頻信號(hào)和第一參數(shù)R以及從參數(shù)調(diào)節(jié)部分1801發(fā)送來的第二參數(shù)Rs和第三參數(shù)Rp,來調(diào)節(jié)音頻信號(hào)的語速和聲音音高。此外,信號(hào)處理部分1803將被調(diào)節(jié)了語速和聲音音高的音頻信號(hào)作為輸出音頻信號(hào)輸出。信息處理裝置1800通過未示出的DA轉(zhuǎn)換器將這樣的輸出音頻信號(hào)轉(zhuǎn)換為模擬信號(hào),并且將該模擬信號(hào)從諸如揚(yáng)聲器之類的輸出設(shè)備輸出。
存儲(chǔ)部分1805例如被配置為RAM、存儲(chǔ)設(shè)備等,并且存儲(chǔ)在根據(jù)第一參數(shù)R來確定第二參數(shù)Rs和第三參數(shù)Rp時(shí)所使用的各種數(shù)據(jù)庫、將由信息處理裝置1800執(zhí)行的各種程序等。此外,除這些數(shù)據(jù)外,存儲(chǔ)部分1805可以視需要存儲(chǔ)當(dāng)信息處理裝置1800執(zhí)行處理、處理的中間進(jìn)程等時(shí)需要存儲(chǔ)的參數(shù)。參數(shù)調(diào)節(jié)部分1801、信號(hào)處理部分1803等可以在存儲(chǔ)部分1805中自由地執(zhí)行讀取或?qū)懭霐?shù)據(jù)。
(第一參數(shù)與第二參數(shù)以及與第三參數(shù)的關(guān)系) 隨后,通過參考圖19A和圖19B,來詳細(xì)描述根據(jù)本實(shí)施例的參數(shù)調(diào)節(jié)部分1801。圖19A是示出第一參數(shù)R和第二參數(shù)Rs之間關(guān)系的坐標(biāo)圖,并且圖19B是示出第一參數(shù)R和第三參數(shù)Rp之間關(guān)系的坐標(biāo)圖。
在如圖19A和圖19B所示的示例中,當(dāng)?shù)谝粎?shù)R是1到4時(shí),也就是,當(dāng)以1到4倍的速度進(jìn)行回放時(shí),僅執(zhí)行語速轉(zhuǎn)換(區(qū)間1901和區(qū)間1903),并且當(dāng)?shù)谝粎?shù)R大于4時(shí),也就是,當(dāng)以大于4倍的速度進(jìn)行回放時(shí),隨同對(duì)語速進(jìn)行轉(zhuǎn)換一起來升高聲音音高(區(qū)間1902和區(qū)間1904)。通過執(zhí)行這樣的處理,當(dāng)以1到4倍的速度進(jìn)行回放時(shí),說話人的語速根據(jù)回放速度逐漸加快,并且當(dāng)以大于4倍的速度進(jìn)行回放時(shí),在說話人語速加快的同時(shí)逐漸升高聲音音高。
順便提及,在圖19A中,以虛線示出區(qū)間1902,因?yàn)榈诙?shù)Rs的值根據(jù)改變聲音音高的方法而改變。當(dāng)將如圖12到14所示的方法用作改變聲音音高的方法時(shí),樣本數(shù)隨著聲音音高的升高而減少,從而導(dǎo)致區(qū)間1902的虛線。然而,當(dāng)將其中樣本數(shù)不減少的方法或者其中減少量較小的方法用作改變聲音音高的方法時(shí),將與如圖19所示的虛線不同地設(shè)定區(qū)間1902。
在圖19B的區(qū)間1903中,當(dāng)?shù)谝粎?shù)R是1到4時(shí),第三參數(shù)Rp是1并且恒定。然而,在該區(qū)間中的第三參數(shù)Rp不一定是恒定的。此外,在區(qū)間1904中第三參數(shù)Rp的上坡度并不局限于如圖所示的示例,并且它可以是任意的,只要第三參數(shù)Rp具有大于0的上坡度。此外,在圖19A和圖19B中,雖然第二參數(shù)Rs和第三參數(shù)Rp以連續(xù)的方式(模擬地)改變,但是第二參數(shù)Rs和第三參數(shù)Rp也可以以離散的方式(數(shù)字地)改變。
(參數(shù)調(diào)節(jié)部分1801) 在根據(jù)本實(shí)施例的信息處理裝置1800中,如圖19A和圖19B所示的第一參數(shù)R與第二參數(shù)Rs以及與第三參數(shù)Rp的關(guān)系的數(shù)據(jù)庫例如被存儲(chǔ)在存儲(chǔ)部分1805中,并且參數(shù)調(diào)節(jié)部分1801通過參考這樣的數(shù)據(jù)庫,根據(jù)第一參數(shù)R來確定第二參數(shù)Rs和第三參數(shù)Rp。
參數(shù)調(diào)節(jié)部分1801在如下所述的四個(gè)條件下,通過參考如圖19A和圖19B所示的的數(shù)據(jù)庫,根據(jù)第一參數(shù)R來確定第二參數(shù)Rs和第三參數(shù)Rp。
條件1當(dāng)所輸入的第一參數(shù)R存在于區(qū)間1901中時(shí),將第二參數(shù)Rs確定為與第一參數(shù)R成比例(換言之,確定第二參數(shù)Rs以使得第二參數(shù)Rs等于第一參數(shù)R)。
條件2當(dāng)所輸入的第一參數(shù)R存在于區(qū)間1903中時(shí),將第三參數(shù)Rp恒定地設(shè)定為1。
條件3當(dāng)所輸入的第一參數(shù)R存在于區(qū)間1904中時(shí),第三參數(shù)Rp隨第一參數(shù)R的增大而增大。
條件4第一參數(shù)R=第二參數(shù)Rs×樣本數(shù)的增長(zhǎng)率Rd。
在此,區(qū)間1901和區(qū)間1903對(duì)應(yīng)于第一參數(shù)R的第一范圍,并且區(qū)間1902和區(qū)間1904對(duì)應(yīng)于第一參數(shù)R的第二范圍。
此外,當(dāng)在改變聲音音高的方法中樣本數(shù)的增長(zhǎng)率是Rd時(shí),參數(shù)調(diào)節(jié)部分1801的第一范圍和第二范圍二者具有如上述條件4所指示的特性。在此,例如,當(dāng)樣本數(shù)是2倍時(shí),增長(zhǎng)率是2,并且當(dāng)樣本數(shù)被減少到一半時(shí),增長(zhǎng)率是1/2。
(根據(jù)本實(shí)施例的控制回放速度變量因子的方法) 圖20是示出根據(jù)本實(shí)施例的信息處理裝置1800的處理流程的流程圖。首先,信息處理裝置1800判斷是否存在輸入音頻信號(hào)(步驟S2001),并且當(dāng)不存在輸入音頻信號(hào)時(shí),處理終止。此外,當(dāng)輸入音頻信號(hào)存在時(shí),信息處理裝置1800的參數(shù)調(diào)節(jié)部分1801根據(jù)所輸入的第一參數(shù)R來調(diào)節(jié)第二參數(shù)Rs和第三參數(shù)Rp(步驟S2002)。以滿足上述條件1到4的方式來執(zhí)行調(diào)節(jié)。隨后,信息處理裝置1800的信號(hào)處理部分1803根據(jù)經(jīng)調(diào)節(jié)的第二參數(shù)Rs和第三參數(shù)Rp來調(diào)節(jié)輸入音頻信號(hào)的語速和聲音音高(步驟S2003)。隨后,信息處理裝置1800輸出語速和聲音音高經(jīng)過調(diào)節(jié)的音頻信號(hào)(步驟S2004)。然后,返回到步驟S2001,上述處理被重復(fù)。
通過重復(fù)這樣的處理,根據(jù)本實(shí)施例的信息處理裝置1800被使得能夠控制音頻信號(hào)的回放速度變量因子。
如參考圖18到圖20所描述的,根據(jù)本實(shí)施例的控制回放速度變量因子的方法,能夠在第一參數(shù)R的第一范圍內(nèi)僅調(diào)節(jié)語速,并且在第一參數(shù)R的第二范圍內(nèi)隨同語速一起來調(diào)節(jié)聲音音高。因此,在第一參數(shù)R的第一范圍內(nèi)解決了第一問題,并且在第一參數(shù)R的第二范圍內(nèi)解決了第二問題。
(信號(hào)處理部分1803) 隨后,通過參考圖21,來詳細(xì)描述根據(jù)本實(shí)施例的信號(hào)處理部分1803的示例。圖21是示出根據(jù)本實(shí)施例的信號(hào)處理部分1803的功能的框圖。
如圖21所示,例如,根據(jù)本實(shí)施例的信號(hào)處理部分1803主要包括擬聲聲音(onomatopoeic sound)切換判斷部分2101、語速轉(zhuǎn)換部分2103、音高調(diào)節(jié)部分2105和音頻信號(hào)輸出控制部分2107。
擬聲聲音切換判斷部分2101例如被配置為CPU、ROM、RAM等,并且基于所發(fā)送的第一參數(shù)R,判斷是對(duì)輸入音頻信號(hào)執(zhí)行諸如語速和聲音音高轉(zhuǎn)換之類的信號(hào)處理,還是將輸入音頻信號(hào)切換到擬聲聲音而不執(zhí)行信號(hào)處理。具體地,擬聲聲音切換判斷部分2101將第一參數(shù)R的等級(jí)與預(yù)定閾值進(jìn)行比較,并且當(dāng)?shù)谝粎?shù)R大于預(yù)定閾值(例如,以大于20倍的速度回放)時(shí),判斷將音頻信號(hào)切換到預(yù)定擬聲聲音而不執(zhí)行語速和聲音音高的轉(zhuǎn)換。擬聲聲音切換判斷部分2101將判斷結(jié)果發(fā)送到隨后將描述的語速轉(zhuǎn)換部分2103和音頻信號(hào)輸出控制部分2107。
語速轉(zhuǎn)換部分2103例如被配置為CPU、ROM、RAM等。輸入音頻信號(hào)和由參數(shù)調(diào)節(jié)部分1801確定的第二參數(shù)Rs被輸入到語速轉(zhuǎn)換部分2103,并且語速轉(zhuǎn)換部分2103基于第二參數(shù)Rs來轉(zhuǎn)換輸入音頻信號(hào)的語速。例如,利用如圖1到圖7所示的算法來執(zhí)行語速轉(zhuǎn)換。語速轉(zhuǎn)換部分2103將語速經(jīng)過調(diào)節(jié)的音頻信號(hào)發(fā)送到隨后將描述的音高調(diào)節(jié)部分2105。
此外,當(dāng)被擬聲聲音切換判斷部分2101通知“將音頻信號(hào)切換到擬聲聲音”的判斷結(jié)果時(shí),語速轉(zhuǎn)換部分2103不必執(zhí)行轉(zhuǎn)換語速的處理。
音高調(diào)節(jié)部分2105例如被配置為CPU、ROM、RAM等,并且基于從語速轉(zhuǎn)換部分2103發(fā)送來的、語速經(jīng)過調(diào)節(jié)的音頻信號(hào)以及從參數(shù)調(diào)節(jié)部分1801發(fā)送來的第三參數(shù)Rp,來調(diào)節(jié)音頻信號(hào)的聲音音高。音高轉(zhuǎn)換的任意方法,例如,如圖12到圖14C所示的方法,可以用于音高調(diào)節(jié)。當(dāng)完成了聲音音高調(diào)節(jié)時(shí),音高調(diào)節(jié)部分2105將語速和聲音音高經(jīng)過調(diào)節(jié)的音頻信號(hào)輸出到隨后將描述的音頻信號(hào)輸出控制部分2107。
順便提及,當(dāng)如圖12到圖14C所示的方法被音高調(diào)節(jié)部分2105使用時(shí),該方法中用于改變聲音音高的樣本數(shù)的增長(zhǎng)率Rd與聲音音高成比例,并且樣本數(shù)的增長(zhǎng)率Rd變得等于聲音音高的上升率。也就是,Rd=第三參數(shù)Rp的關(guān)系成立。
音頻信號(hào)輸出控制部分2107例如被配置為CPU、ROM、RAM等,并且當(dāng)輸出所輸入的音頻信號(hào)或者從音高調(diào)節(jié)部分2105發(fā)送來的音頻信號(hào)時(shí)控制輸出。當(dāng)被擬聲聲音切換判斷部分2101通知“將音頻信號(hào)切換到擬聲聲音”的判斷結(jié)果時(shí),音頻信號(hào)輸出控制部分2107將所輸入的音頻信號(hào)切換到例如被存儲(chǔ)在存儲(chǔ)部分1805中的預(yù)定擬聲聲音并輸出信號(hào)。此外,當(dāng)被擬聲聲音切換判斷部分2101通知“不將音頻信號(hào)切換到擬聲聲音”的判斷結(jié)果時(shí),音頻信號(hào)輸出控制部分2107輸出從音高調(diào)節(jié)部分2105發(fā)送的音頻信號(hào)。
此外,音頻信號(hào)輸出控制部分2107可以調(diào)節(jié)待輸出的音頻信號(hào)的音頻音量。通過調(diào)節(jié)指定音頻信號(hào)的信號(hào)波形的絕對(duì)值來執(zhí)行對(duì)音頻信號(hào)的音頻音量的調(diào)節(jié)。當(dāng)回放速度變量因子超過1時(shí),音頻信號(hào)輸出控制部分2107可以調(diào)小音頻信號(hào)的音頻音量。此外,音頻信號(hào)輸出控制部分2107可以獨(dú)立于回放速度來控制音頻音量。
圖22A和圖22B是示出由包括如圖21所示的信號(hào)處理部分1803的信息處理裝置1800的參數(shù)調(diào)節(jié)部分1801所執(zhí)行的參數(shù)調(diào)節(jié)方法示例的說明性示圖。圖22A是示出第一參數(shù)R和第二參數(shù)Rs之間關(guān)系的坐標(biāo)圖,并且圖22B是示出第一參數(shù)R和第三參數(shù)Rp之間關(guān)系的坐標(biāo)圖。
如圖22A所示,橫軸代表第一參數(shù)R并且縱軸代表第二參數(shù)Rs的坐標(biāo)圖被配置為具有第二參數(shù)Rs的不同上升率(換言之,坐標(biāo)圖的坡度(gradient))的至少兩個(gè)區(qū)域。類似地,如圖22B所示,橫軸代表第一參數(shù)R并且縱軸代表第三參數(shù)Rp的坐標(biāo)圖被配置為具有第三參數(shù)Rp的不同上升率的至少兩個(gè)區(qū)域。
當(dāng)信號(hào)處理部分1803的音高調(diào)節(jié)部分2105通過如圖12到圖14C所示的方法來調(diào)節(jié)音高時(shí),參數(shù)調(diào)節(jié)部分1801在下述的四個(gè)條件下,通過參考在存儲(chǔ)部分1805中存儲(chǔ)的、如圖22A和圖22B所示的數(shù)據(jù)庫,根據(jù)第一參數(shù)R來確定第二參數(shù)Rs和第三參數(shù)Rp。
條件1當(dāng)所輸入的第一參數(shù)R存在于區(qū)間2201中時(shí),將第二參數(shù)Rs確定為與第一參數(shù)R成比例(換言之,確定第二參數(shù)Rs以使得第二參數(shù)Rs等于第一參數(shù)R)。
條件2當(dāng)所輸入的第一參數(shù)R存在于區(qū)間2203中時(shí),將第三參數(shù)Rp恒定地設(shè)定為1。
條件3當(dāng)所輸入的第一參數(shù)R存在于區(qū)間2204中時(shí),第三參數(shù)Rp隨第一參數(shù)R的增大而增大。
條件4’第一參數(shù)R=第二參數(shù)Rs×第三參數(shù)Rp在第一范圍和第二范圍內(nèi)均成立。
在此,區(qū)間2201和區(qū)間2203對(duì)應(yīng)于第一參數(shù)R的第一范圍,并且區(qū)間2202和區(qū)間2204對(duì)應(yīng)于第一參數(shù)R的第二范圍。
在如圖22A和圖22B所示的示例中,當(dāng)?shù)谝粎?shù)R是1到4時(shí),即當(dāng)以1到4倍的速度回放時(shí),僅執(zhí)行語速轉(zhuǎn)換,并且當(dāng)?shù)谝粎?shù)R大于4時(shí),即當(dāng)以大于4倍的速度進(jìn)行回放時(shí),隨同對(duì)語速進(jìn)行轉(zhuǎn)換一起來升高聲音音高。通過執(zhí)行這樣的處理,當(dāng)以1到4倍的速度進(jìn)行回放時(shí),說話人的語速根據(jù)回放速度逐漸加快,并且當(dāng)以大于4倍的速度進(jìn)行回放時(shí),在說話人語速加快的同時(shí)逐漸升高聲音音高。
至此,已經(jīng)描述了根據(jù)本實(shí)施例的信息處理裝置1800的功能示例。上述結(jié)構(gòu)元件的每個(gè)可以被配置為通用組件或電路,或者可以被配置為專用于每個(gè)結(jié)構(gòu)元件的功能的硬件。此外,CPU等可以執(zhí)行所有的功能。因此,能夠根據(jù)實(shí)現(xiàn)本實(shí)施例的各種技術(shù)水平來適當(dāng)改變待使用的配置。
(根據(jù)本實(shí)施例的信號(hào)處理方法) 隨后,通過參考圖23,來詳細(xì)描述根據(jù)本實(shí)施例的信號(hào)處理方法。圖23是示出根據(jù)本實(shí)施例的信號(hào)處理方法的流程圖。
首先,信息處理裝置1800判斷是否存在輸入音頻信號(hào)(步驟S2301),并且如果沒有輸入音頻信號(hào)那么終止處理。此外,當(dāng)輸入音頻信號(hào)存在時(shí),信號(hào)處理部分1803的擬聲聲音切換判斷部分2101判斷所輸入的第一參數(shù)R是否大于預(yù)定閾值(步驟S2302)。當(dāng)?shù)谝粎?shù)R小于預(yù)定閾值時(shí),參數(shù)調(diào)節(jié)部分1801根據(jù)所輸入的第一參數(shù)R來調(diào)節(jié)第二參數(shù)Rs和第三參數(shù)Rp(步驟S2303),并且將參數(shù)發(fā)送到信號(hào)處理部分1803。信號(hào)處理部分1803的語速轉(zhuǎn)換部分2103基于所發(fā)送的第二參數(shù)Rs來調(diào)節(jié)輸入音頻信號(hào)的語速(步驟S2304),并且將語速經(jīng)過調(diào)節(jié)的音頻信號(hào)輸出到音高調(diào)節(jié)部分2105。音高調(diào)節(jié)部分2105基于所發(fā)送的第三參數(shù)Rp來調(diào)節(jié)從語速轉(zhuǎn)換部分2103發(fā)送的音頻信號(hào)的聲音音高(步驟S2305)。語速和聲音音高經(jīng)過調(diào)節(jié)的音頻信號(hào)被發(fā)送到音頻信號(hào)輸出控制部分2107,并且音頻信號(hào)輸出控制部分2107輸出語速和聲音音高經(jīng)過調(diào)節(jié)的音頻信號(hào)(步驟S2306)。然后,返回到步驟S2301,上述處理被重復(fù)。
另一方面,當(dāng)擬聲聲音切換判斷部分2101判斷第一參數(shù)R大于預(yù)定閾值時(shí),音頻信號(hào)輸出控制部分2107輸出被存儲(chǔ)在存儲(chǔ)部分1805等中的預(yù)定擬聲聲音,并且將所述擬聲聲音作為音頻信號(hào)輸出(步驟S2307)。然后,返回到步驟S2301,上述處理被重復(fù)。
通過重復(fù)這樣的處理,根據(jù)本實(shí)施例的信息處理裝置1800被使得能夠以在聽覺上可以識(shí)別轉(zhuǎn)換后的回放速度的方式來控制音頻信號(hào)的回放速度變量因子。
隨后,通過關(guān)注在待處理的音頻信號(hào)中所包括的樣本數(shù),來詳細(xì)描述由根據(jù)本實(shí)施例的信息處理裝置1800所執(zhí)行的信號(hào)處理示例。圖24A到圖24D是以樣本為單位示出由根據(jù)本實(shí)施例的信息處理裝置1800所執(zhí)行的信號(hào)處理示例的說明性示圖。
在如圖24A到圖24D所示的示例中,當(dāng)?shù)谝粎?shù)R是2.5時(shí),第二參數(shù)Rs被調(diào)節(jié)為2.0并且第三參數(shù)Rp被調(diào)節(jié)到1.25。假設(shè)在如圖24A所示的原始信號(hào)中,作為在將語速轉(zhuǎn)換的處理開始點(diǎn)P0作為開始點(diǎn)的情況下檢測(cè)到類似波形長(zhǎng)度的結(jié)果,區(qū)間2401和區(qū)間2402被選作交叉淡入淡出區(qū)間。區(qū)間2401的信號(hào)和區(qū)間2402的信號(hào)的交叉淡入淡出信號(hào)被獲得,并且被置于區(qū)間2402中。隨后,區(qū)間2402的信號(hào)被復(fù)制到區(qū)間2403的、如圖24B所示的信號(hào),并且語速轉(zhuǎn)換的處理開始位置從位置P0移至位置P1。通過將在圖24A中示出的原始信號(hào)轉(zhuǎn)換到在圖24B中示出的信號(hào),語速變?yōu)?倍速度(樣本數(shù)變?yōu)?/2倍),并且聲音音高不變。隨后,在圖24B中示出的信號(hào)的采樣頻率被變?yōu)?/5倍以獲得在圖24C中示出的信號(hào)。當(dāng)采樣頻率變?yōu)?/5倍時(shí),樣本數(shù)也變?yōu)?/5倍。通過用在圖24A中示出的原始信號(hào)的采樣頻率來替換在圖24C中示出的信號(hào)的采樣頻率,在圖24D中示出的信號(hào)被獲得。在圖24D中示出的信號(hào)樣本數(shù)是0.4=(1/2)x(4/5)倍的在圖24A中示出的原始信號(hào)的樣本數(shù),并且聲音音高是5/4倍。換言之,回放速度是2.5=2x(5/4)倍的速度并且聲音音高是1.25倍。
圖25A到圖25D是以樣本為單位示出由根據(jù)本實(shí)施例的信息處理裝置所執(zhí)行的信號(hào)處理的另一示例的說明性示圖。在如圖25A到圖25D所示的示例中,當(dāng)?shù)谝粎?shù)R是4.0時(shí),第二參數(shù)Rs被調(diào)節(jié)為2.0并且第三參數(shù)Rp被調(diào)節(jié)到2.0。假設(shè)在如圖25A所示的原始信號(hào)中,作為在將語速轉(zhuǎn)換的處理開始點(diǎn)P0作為開始點(diǎn)的情況下檢測(cè)到類似波形長(zhǎng)度的結(jié)果,區(qū)間2501和區(qū)間2502被選作交叉淡入淡出區(qū)間。區(qū)間2501的信號(hào)和區(qū)間2502的信號(hào)的交叉淡入淡出信號(hào)被獲得,并且被置于區(qū)間2502中。隨后,區(qū)間2502的信號(hào)被復(fù)制到區(qū)間2503的、如圖25B所示的信號(hào),并且語速轉(zhuǎn)換的處理開始位置從位置P0移至位置P1。通過將在圖25A中示出的原始信號(hào)轉(zhuǎn)換到在圖25B中示出的信號(hào),語速變?yōu)?倍速度(樣本數(shù)變?yōu)?/2倍),并且聲音音高不變。隨后,在圖25B中示出的信號(hào)的采樣頻率被變?yōu)?/2倍以獲得在圖25C中示出的信號(hào)。當(dāng)采樣頻率變?yōu)?/2倍時(shí),樣本數(shù)也變?yōu)?/2倍。通過用在圖25A中示出的原始信號(hào)的采樣頻率來替換在圖25C中示出的信號(hào)的采樣頻率,在圖25D中示出的信號(hào)被獲得。在圖25D中示出的信號(hào)樣本數(shù)是0.25=(1/2)×(1/2)倍的在圖25A中示出的原始信號(hào)的樣本數(shù),并且聲音音高是2倍。換言之,回放速度是4.0=2×2倍的速度并且聲音音高是2倍。
圖26A和圖26B是示出由參數(shù)調(diào)節(jié)部分1801所執(zhí)行的參數(shù)調(diào)節(jié)方法的其他示例的坐標(biāo)圖。圖26A是示出第一參數(shù)R和第二參數(shù)Rs之間關(guān)系的坐標(biāo)圖,并且圖26B是示出第一參數(shù)R和第三參數(shù)Rp之間關(guān)系的坐標(biāo)圖。
如圖26A所示,橫軸代表第一參數(shù)R并且縱軸代表第二參數(shù)Rs的坐標(biāo)圖被配置為具有第二參數(shù)Rs的不同上升率(換言之,坐標(biāo)圖的坡度)的至少兩個(gè)區(qū)域。類似地,如圖26B所示,橫軸代表第一參數(shù)R并且縱軸代表第三參數(shù)Rp的坐標(biāo)圖被配置為具有第三參數(shù)Rp的不同上升率的至少兩個(gè)區(qū)域。
在這種情況下,參數(shù)調(diào)節(jié)部分1801在下述的五個(gè)條件下,通過參考在存儲(chǔ)部分1805中存儲(chǔ)的、如圖26A和圖26B所示的數(shù)據(jù)庫,根據(jù)第一參數(shù)R來確定第二參數(shù)Rs和第三參數(shù)Rp。
條件1當(dāng)所輸入的第一參數(shù)R存在于區(qū)間2601中時(shí),將第二參數(shù)Rs確定為與第一參數(shù)R成比例(換言之,確定第二參數(shù)Rs以使得第二參數(shù)Rs等于第一參數(shù)R)。
條件2當(dāng)所輸入的第一參數(shù)R存在于區(qū)間2603中時(shí),將第三參數(shù)Rp恒定地設(shè)定為1。
條件3當(dāng)所輸入的第一參數(shù)R存在于區(qū)間2604中時(shí),第三參數(shù)Rp隨第一參數(shù)R的增大而增大。
條件4’第一參數(shù)R=第二參數(shù)Rs×第三參數(shù)Rp在第一范圍和第二范圍內(nèi)均成立。
條件5當(dāng)所輸入的第一參數(shù)R存在于區(qū)間2602中時(shí),第二參數(shù)Rs隨第一參數(shù)R的增大而增大(換言之,示出第二參數(shù)Rs變化的曲線的導(dǎo)數(shù)大于0)。
在此,區(qū)間2601和區(qū)間2603對(duì)應(yīng)于第一參數(shù)R的第一范圍,并且區(qū)間2602和區(qū)間2604對(duì)應(yīng)于第一參數(shù)R的第二范圍。
在如圖26A和圖26B所示的示例中,當(dāng)?shù)谝粎?shù)R是1到4時(shí),即當(dāng)以1到4倍的速度回放時(shí),僅執(zhí)行語速轉(zhuǎn)換,并且當(dāng)?shù)谝粎?shù)R大于4時(shí),即當(dāng)以大于4倍的速度進(jìn)行回放時(shí),隨同對(duì)語速進(jìn)行轉(zhuǎn)換一起來升高聲音音高。通過執(zhí)行這樣的處理,當(dāng)以1到4倍的速度進(jìn)行回放時(shí),說話人的語速根據(jù)回放速度逐漸加快,并且當(dāng)以大于4倍的速度進(jìn)行回放時(shí),在說話人語速加快的同時(shí)逐漸升高聲音音高。
在如圖26A和圖26B所示的示例中,與如圖22A和圖22B所示的示例不同的,第二參數(shù)Rs隨著第一參數(shù)R的增大而增大。換言之,示出第二參數(shù)Rs變化的曲線的導(dǎo)數(shù)大于0。在圖22A的區(qū)間2202中,盡管第一參數(shù)R增大,但是第二參數(shù)Rs恒定。換言之,第二參數(shù)Rs的導(dǎo)數(shù)為0。在這樣的情況下,盡管回放速度加快但是語速轉(zhuǎn)換率不變,并且關(guān)于所回放的聲音可能會(huì)感受到不適。另一方面,在圖26A中的區(qū)間2602中,因?yàn)榈诙?shù)Rs隨第一參數(shù)R的增大而增大(因?yàn)閷?dǎo)數(shù)大于0),所以可以防止盡管語速加快但是語速轉(zhuǎn)換率不變的情況,并且由所回放的聲音所導(dǎo)致的不適可以被防止。
圖27A和圖27B是示出由參數(shù)調(diào)節(jié)部分1801所執(zhí)行的參數(shù)調(diào)節(jié)方法的其他示例的坐標(biāo)圖。圖27A是示出第一參數(shù)R和第二參數(shù)Rs之間關(guān)系的坐標(biāo)圖,并且圖27B是示出第一參數(shù)R和第三參數(shù)Rp之間關(guān)系的坐標(biāo)圖。
如圖27A所示,橫軸代表第一參數(shù)R并且縱軸代表第二參數(shù)Rs的坐標(biāo)圖被配置為具有第二參數(shù)Rs的不同上升率(換言之,坐標(biāo)圖的坡度)的至少兩個(gè)區(qū)域。類似地,如圖27B所示,橫軸代表第一參數(shù)R并且縱軸代表第三參數(shù)Rp的坐標(biāo)圖被配置為具有第三參數(shù)Rp的不同上升率的至少兩個(gè)區(qū)域。
在這種情況下,參數(shù)調(diào)節(jié)部分1801在下述的五個(gè)條件下,通過參考在存儲(chǔ)部分1805中存儲(chǔ)的、如圖27A和圖27B所示的數(shù)據(jù)庫,根據(jù)第一參數(shù)R來確定第二參數(shù)Rs和第三參數(shù)Rp。
條件1當(dāng)所輸入的第一參數(shù)R存在于區(qū)間2701中時(shí),將第二參數(shù)Rs確定為與第一參數(shù)R成比例(換言之,確定第二參數(shù)Rs以使得第二參數(shù)Rs等于第一參數(shù)R)。
條件2當(dāng)所輸入的第一參數(shù)R存在于區(qū)間2703中時(shí),將第三參數(shù)Rp恒定地設(shè)定為1。
條件3當(dāng)所輸入的第一參數(shù)R存在于區(qū)間2704中時(shí),第三參數(shù)Rp隨第一參數(shù)R的增大而增大。
條件4’第一參數(shù)R=第二參數(shù)Rs×第三參數(shù)Rp在第一范圍和第二范圍內(nèi)均成立。
條件6區(qū)間2703和區(qū)間2704被平滑地連接(換言之,示出第三參數(shù)Rp變化的曲線在區(qū)間2703和區(qū)間2704的連接點(diǎn)處可微分)。
在此,區(qū)間2701和區(qū)間2703對(duì)應(yīng)于第一參數(shù)R的第一范圍,并且區(qū)間2702和區(qū)間2704對(duì)應(yīng)于第一參數(shù)R的第二范圍。
在如圖27A和圖27B所示的示例中,當(dāng)?shù)谝粎?shù)R是1到4時(shí),即當(dāng)以1到4倍的速度回放時(shí),僅執(zhí)行語速轉(zhuǎn)換,并且當(dāng)?shù)谝粎?shù)R大于4時(shí),即當(dāng)以大于4倍的速度進(jìn)行回放時(shí),隨同對(duì)語速進(jìn)行轉(zhuǎn)換一起來升高聲音音高。通過執(zhí)行這樣的處理,當(dāng)以1到4倍的速度進(jìn)行回放時(shí),說話人的語速根據(jù)回放速度逐漸加快,并且當(dāng)以大于4倍的速度進(jìn)行回放時(shí),在說話人語速加快的同時(shí)逐漸升高聲音音高。
在如圖27A和圖27B所示的示例中,與如圖22A和圖22B所示的示例不同的,在第三參數(shù)Rp中,區(qū)間2703和區(qū)間2704被平滑地連接。換言之,示出第三參數(shù)Rp變化的曲線在區(qū)間2703和區(qū)間2704的連接點(diǎn)處可微分。在如圖22A和圖22B所示的區(qū)間2203和區(qū)間2204的連接點(diǎn)不可微分的情況下,當(dāng)?shù)谝粎?shù)R逐漸增大時(shí),第三參數(shù)Rp的單位增大量(微分值)在連接點(diǎn)處激增,并且關(guān)于所回放的聲音可能會(huì)感到不適。另一方面,在如圖27B中區(qū)間2703和區(qū)間2704所示的曲線平滑連接的情況下,當(dāng)?shù)谝粎?shù)R逐漸增大時(shí),可以防止聲音音高在區(qū)間2703和區(qū)間2704的連接點(diǎn)處開始激增,并且關(guān)于所回放聲音的不適可以被防止。
圖28A和圖28B是示出由參數(shù)調(diào)節(jié)部分1801所執(zhí)行的參數(shù)調(diào)節(jié)方法的其他示例的坐標(biāo)圖。圖28A是示出第一參數(shù)R和第二參數(shù)Rs之間關(guān)系的坐標(biāo)圖,并且圖28B是示出第一參數(shù)R和第三參數(shù)Rp之間關(guān)系的坐標(biāo)圖。
如圖28A所示,橫軸代表第一參數(shù)R并且縱軸代表第二參數(shù)Rs的坐標(biāo)圖被配置為具有第二參數(shù)Rs的不同上升率(換言之,坐標(biāo)圖的坡度)的至少兩個(gè)區(qū)域。類似地,如圖28B所示,橫軸代表第一參數(shù)R并且縱軸代表第三參數(shù)Rp的坐標(biāo)圖被配置為具有第三參數(shù)Rp的不同上升率的至少兩個(gè)區(qū)域。
在這種情況下,參數(shù)調(diào)節(jié)部分1801在下述的六個(gè)條件下,通過參考在存儲(chǔ)部分1805中存儲(chǔ)的、如圖28A和圖28B所示的數(shù)據(jù)庫,根據(jù)第一參數(shù)R來確定第二參數(shù)Rs和第三參數(shù)Rp。
條件1當(dāng)所輸入的第一參數(shù)R存在于區(qū)間2801中時(shí),將第二參數(shù)Rs確定為與第一參數(shù)R成比例(換言之,確定第二參數(shù)Rs以使得第二參數(shù)Rs等于第一參數(shù)R)。
條件2當(dāng)所輸入的第一參數(shù)R存在于區(qū)間2803中時(shí),將第三參數(shù)Rp恒定地設(shè)定為1。
條件3當(dāng)所輸入的第一參數(shù)R存在于區(qū)間2804中時(shí),第三參數(shù)Rp隨第一參數(shù)R的增大而增大。
條件4’第一參數(shù)R=第二參數(shù)Rs×第三參數(shù)Rp在第一范圍和第二范圍內(nèi)均成立。
條件5當(dāng)所輸入的第一參數(shù)R存在于區(qū)間2802中時(shí),第二參數(shù)Rs隨第一參數(shù)R的增大而增大(換言之,示出第二參數(shù)Rs變化的曲線的導(dǎo)數(shù)大于0)。
條件6區(qū)間2803和區(qū)間2804被平滑地連接(換言之,示出第三參數(shù)Rp變化的曲線在區(qū)間2803和區(qū)間2804的連接點(diǎn)處可微分)。
在此,區(qū)間2801和區(qū)間2803對(duì)應(yīng)于第一參數(shù)R的第一范圍,并且區(qū)間2802和區(qū)間2804對(duì)應(yīng)于第一參數(shù)R的第二范圍。
在如圖28A和圖28B所示的示例中,當(dāng)?shù)谝粎?shù)R是1到4時(shí),即當(dāng)以1到4倍的速度回放時(shí),僅執(zhí)行語速轉(zhuǎn)換,并且當(dāng)?shù)谝粎?shù)R大于4時(shí),即當(dāng)以大于4倍的速度進(jìn)行回放時(shí),隨同對(duì)語速進(jìn)行轉(zhuǎn)換一起來升高聲音音高。通過執(zhí)行這樣的處理,當(dāng)以1到4倍的速度進(jìn)行回放時(shí),說話人的語速根據(jù)回放速度逐漸加快,并且當(dāng)以大于4倍的速度進(jìn)行回放時(shí),在說話人語速加快的同時(shí)逐漸升高聲音音高。
在如圖28A和圖28B所示的示例中,與如圖27A和圖27B所示的示例類似地,在第三參數(shù)Rp中,區(qū)間2803和區(qū)間2804被平滑地連接。換言之,示出第三參數(shù)Rp變化的曲線在區(qū)間2803和區(qū)間2804的連接點(diǎn)處可微分。另一方面,在如圖28A和圖28B所示的示例中,與如圖27A和圖27B所示的示例不同的,第二參數(shù)Rs隨第一參數(shù)R的增大而增大。換言之,示出第二參數(shù)Rs變化的曲線的導(dǎo)數(shù)大于0。在圖27A的區(qū)間2702中,盡管第一參數(shù)R增大,但是存在第二參數(shù)Rs減小的部分。換言之,存在示出第二參數(shù)Rs變化的曲線的導(dǎo)數(shù)為負(fù)的部分。在這樣的情況下,盡管回放速度加快但是語速轉(zhuǎn)換率減小,并且關(guān)于所回放的聲音可能感到不適。另一方面,在圖28A的區(qū)間2802中,因?yàn)榈诙?shù)Rs隨著第一參數(shù)R的增大而增大(因?yàn)閷?dǎo)數(shù)大于0),所以可以防止盡管語速加快但是語速轉(zhuǎn)換率減小的情況,并且關(guān)于所回放的聲音的不適可以被防止。
如上所述,通過當(dāng)轉(zhuǎn)換所輸入音頻信號(hào)的回放速度變量因子時(shí),在調(diào)節(jié)聲音音高之前轉(zhuǎn)換語速,可以在語速轉(zhuǎn)換中更精確地執(zhí)行對(duì)輸入音頻信號(hào)的類似波形長(zhǎng)度的檢測(cè),并且能夠?qū)⑤敵鲆纛l信號(hào)的聲音質(zhì)量維持在其最佳狀態(tài)。
(信號(hào)處理部分1803的修改示例) 隨后,通過參考圖29,來詳細(xì)描述根據(jù)本實(shí)施例的信號(hào)處理部分1803的修改示例。圖29是示出根據(jù)本實(shí)施例的信號(hào)處理部分1803的修改示例的框圖。
如圖29所示,例如,根據(jù)該修改示例的信號(hào)處理部分1803主要包括擬聲聲音切換判斷部分2101、音高調(diào)節(jié)部分2901、語速轉(zhuǎn)換部分2903和音頻信號(hào)輸出控制部分2107。
除了擬聲聲音切換判斷部分2101將判斷結(jié)果輸出到音高調(diào)節(jié)部分2901和音頻信號(hào)輸出控制部分2107外,擬聲聲音切換判斷部分2101具有與根據(jù)本發(fā)明第一實(shí)施例的擬聲聲音切換判斷部分相同的配置和功能,因此,省略其詳細(xì)描述。
音高調(diào)節(jié)部分2901例如被配置為CPU、ROM、RAM等,并且基于所發(fā)送的輸入音頻信號(hào)以及從參數(shù)調(diào)節(jié)部分1801發(fā)送來的第三參數(shù)Rp,來調(diào)節(jié)音頻信號(hào)的聲音音高。音高轉(zhuǎn)換的任意方法,例如,如圖12到圖14C所示的方法,可以用于音高調(diào)節(jié)。當(dāng)完成了聲音音高調(diào)節(jié)時(shí),音高調(diào)節(jié)部分2901將聲音音高經(jīng)過調(diào)節(jié)的音頻信號(hào)輸出到隨后將描述的語速轉(zhuǎn)換部分2903。
順便提及,當(dāng)如圖12到圖14C所示的方法被音高調(diào)節(jié)部分2901使用時(shí),該方法中用于改變聲音音高的樣本數(shù)的增長(zhǎng)率Rd與聲音音高成比例,并且樣本數(shù)的增長(zhǎng)率Rd變得等于聲音音高的上升率。也就是,Rd=第三參數(shù)Rp的關(guān)系成立。
此外,當(dāng)被擬聲聲音切換判斷部分2101通知“將音頻信號(hào)切換到擬聲聲音”的判斷結(jié)果時(shí),音高調(diào)節(jié)部分2901不必執(zhí)行轉(zhuǎn)換聲音音高的處理。
語速轉(zhuǎn)換部分2903例如被配置為CPU、ROM、RAM等。輸入音頻信號(hào)和由參數(shù)調(diào)節(jié)部分1801確定的第二參數(shù)Rs被輸入到語速轉(zhuǎn)換部分2903,并且語速轉(zhuǎn)換部分2903基于第二參數(shù)Rs來轉(zhuǎn)換輸入音頻信號(hào)的語速。例如,利用如圖1到圖7所示的算法來執(zhí)行語速轉(zhuǎn)換。語速轉(zhuǎn)換部分2903將語速經(jīng)過調(diào)節(jié)的音頻信號(hào)發(fā)送到隨后將描述的音頻信號(hào)輸出控制部分2107。
音頻信號(hào)輸出控制部分2107例如被配置為CPU、ROM、RAM等,并且當(dāng)輸出所輸入的音頻信號(hào)或者從音高調(diào)節(jié)部分2105發(fā)送來的音頻信號(hào)時(shí)控制輸出。當(dāng)被擬聲聲音切換判斷部分2101通知“將音頻信號(hào)切換到擬聲聲音”的判斷結(jié)果時(shí),音頻信號(hào)輸出控制部分2107將所輸入的音頻信號(hào)切換到例如被存儲(chǔ)在存儲(chǔ)部分1805中的預(yù)定擬聲聲音并輸出信號(hào)。此外,當(dāng)被擬聲聲音切換判斷部分2101通知“不將音頻信號(hào)切換到擬聲聲音”的判斷結(jié)果時(shí),音頻信號(hào)輸出控制部分2107輸出從語速轉(zhuǎn)換部分2903發(fā)送的音頻信號(hào)。
此外,音頻信號(hào)輸出控制部分2107可以調(diào)節(jié)待輸出的音頻信號(hào)的音頻音量。通過調(diào)節(jié)指定音頻信號(hào)的信號(hào)波形的絕對(duì)值來執(zhí)行對(duì)音頻信號(hào)的音頻音量的調(diào)節(jié)。當(dāng)回放速度變量因子超過1時(shí),音頻信號(hào)輸出控制部分2107可以調(diào)小音頻信號(hào)的音頻音量。此外,音頻信號(hào)輸出控制部分2107可以獨(dú)立于回放速度來控制音頻音量。
至此,已經(jīng)描述了根據(jù)修改示例的信號(hào)處理部分1803的功能示例。上述結(jié)構(gòu)元件的每個(gè)可以被配置為通用組件或電路,或者可以被配置為專用于每個(gè)結(jié)構(gòu)元件的功能的硬件。此外,CPU等可以執(zhí)行所有的功能。因此,能夠根據(jù)實(shí)現(xiàn)本實(shí)施例的各種技術(shù)水平來適當(dāng)改變待使用的配置。
(根據(jù)修改示例的信號(hào)處理方法) 隨后,通過參考圖30,來詳細(xì)描述根據(jù)修改示例的信號(hào)處理方法。圖30是示出根據(jù)修改示例的信號(hào)處理方法的流程圖。
首先,信息處理裝置1800判斷是否存在輸入音頻信號(hào)(步驟S3001),并且當(dāng)沒有輸入音頻信號(hào)時(shí)終止處理。此外,當(dāng)輸入音頻信號(hào)存在時(shí),信號(hào)處理部分1803的擬聲聲音切換判斷部分2101判斷所輸入的第一參數(shù)R是否大于預(yù)定閾值(步驟S3002)。當(dāng)?shù)谝粎?shù)R小于預(yù)定閾值時(shí),參數(shù)調(diào)節(jié)部分1801根據(jù)所輸入的第一參數(shù)R來調(diào)節(jié)第二參數(shù)Rs和第三參數(shù)Rp(步驟S3003),并且將參數(shù)發(fā)送到信號(hào)處理部分1803。信號(hào)處理部分1803的音高調(diào)節(jié)部分2901基于所發(fā)送的第三參數(shù)Rp來調(diào)節(jié)所發(fā)送的輸入音頻信號(hào)的聲音音高(步驟S3004),并且將聲音音高經(jīng)過調(diào)節(jié)的音頻信號(hào)輸出到語速轉(zhuǎn)換部分2903。語速轉(zhuǎn)換部分2903基于所發(fā)送的第二參數(shù)Rs來調(diào)節(jié)聲音音高經(jīng)過調(diào)節(jié)的音頻信號(hào)的語速(步驟S3005)。語速和聲音音高經(jīng)過調(diào)節(jié)的音頻信號(hào)被發(fā)送到音頻信號(hào)輸出控制部分2107,并且音頻信號(hào)輸出控制部分2107輸出語速和聲音音高經(jīng)過調(diào)節(jié)的音頻信號(hào)(步驟S3006)。然后,返回到步驟S3001,上述處理被重復(fù)。
另一方面,當(dāng)擬聲聲音切換判斷部分2101判斷第一參數(shù)R大于預(yù)定閾值時(shí),音頻信號(hào)輸出控制部分2107將被存儲(chǔ)在存儲(chǔ)部分1805等中的預(yù)定擬聲聲音作為音頻信號(hào)輸出(步驟S3007)。然后,返回到步驟S3001,上述處理被重復(fù)。
通過重復(fù)這樣的處理,根據(jù)修改示例的信息處理裝置1800被使得能夠以在聽覺上可以識(shí)別轉(zhuǎn)換后的回放速度的方式來控制音頻信號(hào)的回放速度變量因子。
如上所述,通過當(dāng)轉(zhuǎn)換所輸入的音頻信號(hào)的回放速度變量因子時(shí),在轉(zhuǎn)換語速之前調(diào)節(jié)聲音音高,能夠減少語速待轉(zhuǎn)換的輸入音頻信號(hào)的樣本數(shù),并且能夠減少待處理的資源,因此能夠?qū)崿F(xiàn)處理的加速。順便提及,當(dāng)轉(zhuǎn)換聲音音高經(jīng)過調(diào)節(jié)的音頻信號(hào)的語速時(shí),可以根據(jù)音高調(diào)節(jié)的程度來適當(dāng)改變執(zhí)行語速轉(zhuǎn)換的頻率范圍。
(轉(zhuǎn)換采樣率的其他方法) 圖31是示出通過不同于如圖12和圖13所示的轉(zhuǎn)換采樣率方法的方法來轉(zhuǎn)換采樣率的方法的說明性示圖。通常,在如圖12和圖13所示的方法中,處理量很大,因此例如在諸如便攜式回放裝置之類的不期望高處理性能的回放裝置中很難實(shí)現(xiàn)它們。在這樣的情況下,如圖31所示的轉(zhuǎn)換采樣率的方法證明是有用的。圖31是示出這樣的情況的說明性示圖,其中當(dāng)采樣點(diǎn)n0、n1、n2、n3、...存在于轉(zhuǎn)換前的信號(hào)中時(shí),新的采樣點(diǎn)m0、m1、m2、...通過線性插值被獲得。例如,關(guān)于m1的采樣值,線性插值通過計(jì)算比值p1∶1-p1來獲得在采樣點(diǎn)n1和采樣點(diǎn)n2之間的采樣點(diǎn)m1的位置,并且根據(jù)該比值,根據(jù)n1的采樣值和n2的采樣值來獲得m1的采樣值。
如此,在本實(shí)施例中,調(diào)節(jié)聲音音高的方法并不限于如圖12和圖13所示的那些方法,并且可以使用任意的方法,例如在圖31中示出的方法,以及滿足根據(jù)本實(shí)施例的信息處理裝置的條件的那些方法。
(回放速度變量因子的漸變) 隨后,通過參考圖32,來描述連續(xù)改變代表回放速度變量因子的第一參數(shù)R的情況。圖32是示意性地示出回放速度變量因子隨時(shí)間的變化的說明性示圖。
與代表回放速度變量因子的第一參數(shù)R被設(shè)定為R1并且輸出音頻信號(hào)的信息處理裝置1800相對(duì)地,當(dāng)在時(shí)間點(diǎn)t1輸入用于將第一參數(shù)R變到R2的信號(hào)時(shí),例如,如圖32所示,根據(jù)本實(shí)施例的信息處理裝置1800并不立即數(shù)字地切換第一參數(shù)R,而是可以控制第二參數(shù)和第三參數(shù)從而使得第一參數(shù)逐漸從R1切換到R2。
在這樣的情況下,參數(shù)調(diào)節(jié)部分1801使第一參數(shù)R連續(xù)地從R1變到R2,并且針對(duì)漸變中的每個(gè)參數(shù)R來設(shè)定第二參數(shù)Rs和第三參數(shù)Rp。通過執(zhí)行這樣的處理,即使在改變音頻信號(hào)的語速和聲音音高期間,音頻信號(hào)的收聽者也可以聽到音頻信號(hào)而不會(huì)感覺到不適。
如上所述,通過根據(jù)本實(shí)施例的控制回放速度變量因子的方法,當(dāng)以近似正常的速度進(jìn)行回放時(shí),回放速度改變?nèi)欢曇粢舾卟蛔?,并且容易理解說話人的語音內(nèi)容或者容易識(shí)別說話人。此外,在高速回放/低速回放的情況下,當(dāng)回放速度改變時(shí),因此可以在聽覺上感覺到此時(shí)的回放速度,并且可操作性可以得到改進(jìn)。
(第二實(shí)施例) 隨后,通過參考圖33到圖46,來詳細(xì)描述根據(jù)本發(fā)明第二實(shí)施例的信息處理裝置3300。
當(dāng)所謂的內(nèi)容回放裝置回放內(nèi)容時(shí),裝置從內(nèi)容回放裝置的諸如硬盤驅(qū)動(dòng)器、DVD驅(qū)動(dòng)器和藍(lán)光驅(qū)動(dòng)器之類的記錄介質(zhì)回放裝置獲得音頻信號(hào)。但是,這樣的記錄介質(zhì)回放裝置的數(shù)據(jù)讀取速度存在上限。換言之,每單位時(shí)間可以從記錄介質(zhì)中讀取的數(shù)據(jù)量存在上限。因此,即使能夠獲得足夠以10倍速度回放內(nèi)容的數(shù)據(jù)量,也不一定能夠獲得足夠以20倍速度回放內(nèi)容的數(shù)據(jù)量。還存在其他類似情況。例如,近年來,內(nèi)容數(shù)據(jù)通常以MPEG等進(jìn)行編碼,并且當(dāng)回放經(jīng)編碼的內(nèi)容時(shí),首先,它必須被解碼。因此,即使諸如硬盤驅(qū)動(dòng)器、DVD驅(qū)動(dòng)器和藍(lán)光驅(qū)動(dòng)器之類的記錄介質(zhì)回放裝置的數(shù)據(jù)讀取速度足夠快,如果解碼設(shè)備的計(jì)算能力不夠,那么解碼處理也不能繼續(xù)。當(dāng)連接諸如硬盤驅(qū)動(dòng)器、DVD驅(qū)動(dòng)器和藍(lán)光驅(qū)動(dòng)器之類的記錄介質(zhì)回放裝置,以及CPU或存儲(chǔ)器的總線帶寬不夠時(shí),也會(huì)出現(xiàn)類似情況。
因此,構(gòu)成內(nèi)容回放裝置的每個(gè)結(jié)構(gòu)元件都有其處理能力限制,并且當(dāng)以變速回放時(shí),整個(gè)裝置的處理能力限制由處理能力限制最低的結(jié)構(gòu)元件來決定。存在這樣的問題,即存在由于該處理能力限制而無法實(shí)現(xiàn)期望回放速度的情況。在下文中,這個(gè)問題被稱作第三問題。
因此,本發(fā)明的發(fā)明人就上述問題進(jìn)行了認(rèn)真研究,并且實(shí)現(xiàn)了一種變速回放方法,該方法通過在第一范圍內(nèi)的變速回放使能夠容易領(lǐng)會(huì)語音內(nèi)容或者指定說話人,此外,通過在第二范圍內(nèi)的變速回放使能夠在聽覺上感受到回放速度,并且此外,實(shí)現(xiàn)回放速度的更高上限。換言之,根據(jù)本實(shí)施例的變速回放方法是能夠同時(shí)解決第一、第二和第三問題的變速回放方法。
(根據(jù)本實(shí)施例的信息處理裝置的配置) 首先,通過參考圖33,來詳細(xì)描述根據(jù)本實(shí)施例的信息處理裝置3300的配置。圖33是示出根據(jù)本實(shí)施例的信息處理裝置3300的功能的框圖。
如圖33所示,根據(jù)本實(shí)施例的信息處理裝置3300例如主要包括參數(shù)調(diào)節(jié)部分3301、內(nèi)容管理部分3303、內(nèi)容存儲(chǔ)部分3305、信號(hào)處理部分3307和存儲(chǔ)部分3309。
參數(shù)調(diào)節(jié)部分3301例如被配置為CPU、ROM、RAM等,并且根據(jù)從外部輸入的第一參數(shù)R來調(diào)節(jié)第二參數(shù)Rs、第三參數(shù)Rp和第四參數(shù)Rt。隨后將詳細(xì)描述根據(jù)第一參數(shù)R來設(shè)定第二參數(shù)Rs、第三參數(shù)Rp和第四參數(shù)Rt的方法。參數(shù)調(diào)節(jié)部分3301將根據(jù)第一參數(shù)R確定的第四參數(shù)Rt發(fā)送到隨后將描述的內(nèi)容管理部分3303,并且將第二參數(shù)Rs和第三參數(shù)Rp發(fā)送到隨后將描述的信號(hào)處理部分3307。
內(nèi)容管理部分3303例如被配置為CPU、ROM、RAM等,并且管理包括可以被根據(jù)本實(shí)施例的信息處理裝置3300所回放的音頻信號(hào)的內(nèi)容。在隨后將描述的內(nèi)容存儲(chǔ)部分3305中,內(nèi)容管理部分3303例如與內(nèi)容標(biāo)題、內(nèi)容ID和屬性信息等相關(guān)聯(lián)地來記錄包括音頻信號(hào)的內(nèi)容。內(nèi)容管理部分3303根據(jù)對(duì)從信息處理裝置3300外部輸入的內(nèi)容的回放指令,從內(nèi)容存儲(chǔ)部分3305中獲得內(nèi)容,并且將所述內(nèi)容輸出到隨后將描述的信號(hào)處理部分3307。當(dāng)將內(nèi)容輸出到信號(hào)處理部分3307時(shí),基于從參數(shù)調(diào)節(jié)部分3301發(fā)送的第四參數(shù)Rt來確定待發(fā)送的數(shù)據(jù)量。此外,當(dāng)從內(nèi)容存儲(chǔ)部分3305讀取的內(nèi)容數(shù)據(jù)是經(jīng)編碼的數(shù)據(jù)時(shí),內(nèi)容管理部分3303通過未示出的解碼器對(duì)所述內(nèi)容數(shù)據(jù)進(jìn)行解碼,并將所述內(nèi)容數(shù)據(jù)輸出到信號(hào)處理部分3307。
此外,內(nèi)容管理部分3303可以經(jīng)由諸如因特網(wǎng)和家用網(wǎng)絡(luò)之類的網(wǎng)絡(luò)1702來獲得包括待回放的音頻信號(hào)的內(nèi)容。內(nèi)容管理部分3303可以將經(jīng)由網(wǎng)絡(luò)1702而獲得的內(nèi)容記錄在內(nèi)容存儲(chǔ)部分3305中。
內(nèi)容存儲(chǔ)部分3305例如被配置為諸如硬盤驅(qū)動(dòng)器、DVD驅(qū)動(dòng)器和藍(lán)光驅(qū)動(dòng)器之類的記錄介質(zhì),并且與內(nèi)容的標(biāo)題、ID、屬性信息等相關(guān)聯(lián)地存儲(chǔ)包括音頻信號(hào)的內(nèi)容。此外,包括構(gòu)成內(nèi)容存儲(chǔ)部分3305的各種記錄介質(zhì)的讀取速度上限值的控制信息等可以作為數(shù)據(jù)庫被存儲(chǔ)在內(nèi)容存儲(chǔ)部分3305中。
信號(hào)處理部分3307例如被配置為CPU、ROM、RAM等,并且基于從內(nèi)容管理部分3303發(fā)送的音頻信號(hào)、第一參數(shù)R以及從參數(shù)調(diào)節(jié)部分3301發(fā)送的第二參數(shù)Rs和第三參數(shù)Rp,來調(diào)節(jié)音頻信號(hào)的語速和聲音音高。此外,信號(hào)處理部分3307將語速和聲音音高經(jīng)過調(diào)節(jié)的音頻信號(hào)作為輸出音頻信號(hào)輸出。信息處理裝置3300通過未示出的DA轉(zhuǎn)換器將這樣的輸出音頻信號(hào)轉(zhuǎn)換為模擬信號(hào),并且將所述模擬信號(hào)從諸如揚(yáng)聲器之類的輸出設(shè)備輸出。
存儲(chǔ)部分3309例如被配置為RAM、存儲(chǔ)設(shè)備等,并且存儲(chǔ)在根據(jù)第一參數(shù)來確定第二參數(shù)Rs、第三參數(shù)Rp和第四參數(shù)Rt時(shí)所使用的各種數(shù)據(jù)庫,將由信息處理裝置3300執(zhí)行的各種程序等。此外,除了這些數(shù)據(jù)外,存儲(chǔ)部分3309還可以根據(jù)需要存儲(chǔ)當(dāng)信息處理裝置3300執(zhí)行處理、處理的中間進(jìn)程等時(shí)需要被存儲(chǔ)的各種參數(shù)。參數(shù)調(diào)節(jié)部分3301、內(nèi)容管理部分3303、信號(hào)處理部分3307等可以在存儲(chǔ)部分3309中自由地執(zhí)行對(duì)數(shù)據(jù)的讀取或?qū)懭搿?br>
(第一參數(shù)和第四參數(shù)之間的關(guān)系) 隨后,通過參考圖34A和圖34B,來詳細(xì)描述根據(jù)本實(shí)施例的通過參數(shù)調(diào)節(jié)部分3301來調(diào)節(jié)第四參數(shù)的方法。圖34A是示出第一參數(shù)R和第四參數(shù)Rt之間關(guān)系的坐標(biāo)圖,并且圖34B是示出第一參數(shù)R和將被輸入到信號(hào)處理部分3307的音頻信號(hào)數(shù)據(jù)量之間關(guān)系的坐標(biāo)圖。
如圖34A所示,其中橫軸代表第一參數(shù)R并且縱軸代表第四參數(shù)Rt的坐標(biāo)圖被配置為具有第四參數(shù)Rt的不同上升率(也就是說,坐標(biāo)圖的坡度)的兩個(gè)區(qū)域。
參數(shù)調(diào)節(jié)部分3301在下述情況下調(diào)節(jié)第四參數(shù)Rt。在此,將在內(nèi)容管理部分3303從內(nèi)容存儲(chǔ)部分3305讀取內(nèi)容數(shù)據(jù)并將所述內(nèi)容數(shù)據(jù)發(fā)送到信號(hào)處理部分3307時(shí)的數(shù)據(jù)讀取速度的上限簡(jiǎn)寫為Sm。順便提及,在以下描述中,數(shù)據(jù)讀取速度是這樣的速度,其包括內(nèi)容管理部分3303從內(nèi)容存儲(chǔ)部分3305讀取預(yù)定內(nèi)容數(shù)據(jù)的數(shù)據(jù)讀取速度和當(dāng)將從內(nèi)容管理部分3303讀取的內(nèi)容數(shù)據(jù)發(fā)送到信號(hào)處理部分3307時(shí)所需要的速度。
條件A當(dāng)所輸入的第一參數(shù)R存在于區(qū)間3405中時(shí),第四參數(shù)Rt恒定地為1.0。
條件B當(dāng)所輸入的第一參數(shù)R存在于區(qū)間3406中時(shí),上限速度Sm=第一參數(shù)R×第四參數(shù)Rt成立。
上限速度Sm是根據(jù)內(nèi)容管理部分3303和內(nèi)容存儲(chǔ)部分3305的處理能力而確定的恒定值,因此,在區(qū)間3406中,隨著第一參數(shù)R的值變大,第四參數(shù)Rt變小。
圖34B示出每單位時(shí)間輸入到信號(hào)處理部分3307的音頻信號(hào)量與數(shù)據(jù)讀取速度上限Sm的比值。在區(qū)間3407,數(shù)據(jù)量比值與第一參數(shù)R成比例。但是,在區(qū)間3408,數(shù)據(jù)量比值恒定地為1.0。這是因?yàn)閿?shù)據(jù)讀取速度根據(jù)第四參數(shù)Rt被調(diào)節(jié),所以數(shù)據(jù)讀取速度沒有超過其上限Sm。因此,可以說第四參數(shù)Rt是在從內(nèi)容存儲(chǔ)部分3305讀取內(nèi)容數(shù)據(jù)以及將所述內(nèi)容數(shù)據(jù)發(fā)送到信號(hào)處理部分3307時(shí)數(shù)據(jù)的間隔剔除率。
(根據(jù)第四參數(shù)對(duì)數(shù)據(jù)讀取速度的調(diào)節(jié)) 例如,通過如圖35A到圖37C所示的方法來執(zhí)行根據(jù)第四參數(shù)對(duì)數(shù)據(jù)讀取速度的調(diào)節(jié)。圖35A到圖37C是示出根據(jù)本實(shí)施例的調(diào)節(jié)數(shù)據(jù)讀取速度的方法示例的說明性示圖。
在如圖35A和圖35B所示的示例中,諸如區(qū)間3501、區(qū)間3502和區(qū)間3503之類的原始信號(hào)的片段從在圖35A中示出的、被記錄在記錄介質(zhì)中的原始信號(hào)中被選出。在圖35B中示出的信號(hào)代表所讀取的信號(hào),并且區(qū)間3504、區(qū)間3505和區(qū)間3506分別對(duì)應(yīng)于在圖35A中示出的原始信號(hào)的區(qū)間3501、區(qū)間3502和區(qū)間3503。從內(nèi)容存儲(chǔ)部分3305中讀取并被輸出到信號(hào)處理部分3307的信號(hào)是由相連接的、在圖35B中示出的信號(hào)的區(qū)間3504、區(qū)間3505和區(qū)間3506構(gòu)成的信號(hào)。在此,當(dāng)連接每個(gè)區(qū)間時(shí),每個(gè)區(qū)間的信號(hào)可以被淡入或淡出以進(jìn)行平滑連接。此外,每個(gè)區(qū)間可以被略微拉長(zhǎng)以通過交叉淡入淡出來進(jìn)行連接。在圖35B中示出的信號(hào)被信號(hào)處理部分3307處理以在變速回放時(shí)形成回放聲音。
在如圖35A和圖35B所示的示例中,關(guān)于在圖35A中示出的原始信號(hào),讀取區(qū)間長(zhǎng)度和跳過區(qū)間長(zhǎng)度彼此相等(也就是,區(qū)間3501的長(zhǎng)度和介于區(qū)間3501和區(qū)間3502之間的水平區(qū)段長(zhǎng)度彼此相等),因此,第四參數(shù)Rt等于1/2。另一方面,圖36A和圖36B示出這樣的示例,其中第四參數(shù)Rt的值不同于如圖35A和圖35B所示的示例。在如圖36A和圖36B所示的示例中,關(guān)于在圖36A中示出的原始信號(hào),讀取區(qū)間長(zhǎng)度與跳過區(qū)間長(zhǎng)度的比值是3∶4,因此第四參數(shù)Rt等于3/7。
圖37A到圖37C示出類似于如圖35A到圖36B所示的示例,但區(qū)別在于,記錄在記錄介質(zhì)中的內(nèi)容數(shù)據(jù)經(jīng)過編碼。在許多情況下,雖然隨編解碼器的不同,名稱可能有變化,但是通常以一致的單位來管理經(jīng)編碼的數(shù)據(jù)。例如,就MPEG而言,以諸如包或數(shù)據(jù)包之類的單位P來管理經(jīng)編碼的數(shù)據(jù)。
在如圖37A到圖37C所示的示例中,諸如區(qū)間3701、區(qū)間3702和區(qū)間3703之類的流數(shù)據(jù)片段從在圖37A中示出的、記錄在記錄介質(zhì)中的流數(shù)據(jù)(經(jīng)編碼數(shù)據(jù))中被讀取。在圖37B中示出的、所讀取的流數(shù)據(jù)的區(qū)間3704、區(qū)間3705和區(qū)間3706分別對(duì)應(yīng)于在圖37A中示出的流數(shù)據(jù)的區(qū)間3701、區(qū)間3702和區(qū)間3703。從如圖37B所示的流數(shù)據(jù)中讀取的區(qū)間3704、區(qū)間3705和區(qū)間3706分別被解碼器解碼,從而變?yōu)樵趫D37C中示出的音頻信號(hào)的區(qū)間3707、區(qū)間3708和區(qū)間3709。在此,當(dāng)連接每個(gè)區(qū)間時(shí),每個(gè)區(qū)間的信號(hào)可以被淡入或淡出以進(jìn)行平滑連接。此外,每個(gè)區(qū)間可以被略微拉長(zhǎng)以通過交叉淡入淡出來進(jìn)行連接。在圖37C中示出的音頻信號(hào)被信號(hào)處理部分3307處理以在變速回放時(shí)形成回放聲音。
在如圖37A到圖37C所示的示例中,關(guān)于在圖37A中示出的流數(shù)據(jù),讀取區(qū)間長(zhǎng)度和跳過區(qū)間長(zhǎng)度彼此相等,因此,第四參數(shù)Rt等于1/2。然而,在經(jīng)編碼信號(hào)的情況下,每個(gè)管理單位P在進(jìn)行編碼前可能在音頻數(shù)據(jù)中具有交疊區(qū)間。在這種情況下,可能必須根據(jù)交疊區(qū)間來讀取在圖37A中示出的流數(shù)據(jù)中的額外讀取區(qū)間。此外,根據(jù)編解碼器,管理信息被添加到每個(gè)管理單位,并且管理信息必須被讀取該以讀取下一個(gè)管理單位。在這種情況下,即使在跳過區(qū)間,也至少必須讀取管理信息。因此,當(dāng)處理流數(shù)據(jù)時(shí),雖然必須添加取決于編解碼器的處理,但是基本處理與在圖35A到圖36B中示出的處理是相同的。
在以下描述中,對(duì)應(yīng)于其中第四參數(shù)Rt是1.0的區(qū)間的第一參數(shù)R的范圍(例如圖34A中的區(qū)間3405)被稱作第三范圍,并且對(duì)應(yīng)于其中第四參數(shù)Rt受上限速度Sm影響的區(qū)間的第一參數(shù)R的范圍(例如圖34A中的區(qū)間3406)被稱作第四范圍。
(第一參數(shù)與第二參數(shù)以及與第三參數(shù)的關(guān)系) 圖38A和圖38B詳細(xì)描述根據(jù)本實(shí)施例的參數(shù)調(diào)節(jié)部分3301的參數(shù)調(diào)節(jié)方法示例。圖38A是示出第一參數(shù)R和第二參數(shù)Rs之間關(guān)系的坐標(biāo)圖,并且圖38B是示出第一參數(shù)R和第三參數(shù)Rp之間關(guān)系的坐標(biāo)圖。
在根據(jù)本實(shí)施例的信息處理裝置3300中,如圖38A和圖38B所示的、示出第一參數(shù)R與第二參數(shù)Rs以及與第三參數(shù)Rp關(guān)系的數(shù)據(jù)庫,和如圖34A中所示的、示出第一參數(shù)R和第四參數(shù)Rt之間關(guān)系的數(shù)據(jù)庫例如被存儲(chǔ)在存儲(chǔ)部分3309中,并且參數(shù)調(diào)節(jié)部分3301通過參考這些數(shù)據(jù)庫,根據(jù)第一參數(shù)R來確定第二參數(shù)Rs、第三參數(shù)Rp和第四參數(shù)Rt。
在此,參數(shù)調(diào)節(jié)部分3301在下述的四個(gè)條件下,通過參考在存儲(chǔ)部分3309中存儲(chǔ)的、如圖38A和圖38B所示的數(shù)據(jù)庫,根據(jù)第一參數(shù)R來確定第二參數(shù)Rs和第三參數(shù)Rp。
條件1當(dāng)所輸入的第一參數(shù)R存在于區(qū)間3801中時(shí),將第二參數(shù)Rs確定為與第一參數(shù)R成比例(換言之,確定第二參數(shù)Rs以使得第二參數(shù)Rs等于第一參數(shù)R)。
條件2當(dāng)所輸入的第一參數(shù)R存在于區(qū)間3803中時(shí),將第三參數(shù)Rp恒定地設(shè)定為1。
條件3當(dāng)所輸入的第一參數(shù)R存在于區(qū)間3804中時(shí),第三參數(shù)Rp隨第一參數(shù)R的增大而增大。
條件4第一參數(shù)R×第四參數(shù)Rt=第二參數(shù)Rs×樣本數(shù)的增長(zhǎng)率Rd。
在此,在圖38A的區(qū)間3809中,因?yàn)槭苌鲜鰲l件B的影響所以第二參數(shù)Rs減小。順便提及,從圖38A和圖38B中顯然可見,Rt影響第二參數(shù)Rs,但是不影響第三參數(shù)Rp。換言之,當(dāng)被發(fā)送到信號(hào)處理部分3307的音頻信號(hào)的數(shù)據(jù)量減小時(shí),數(shù)據(jù)量的減小影響語速轉(zhuǎn)換的程度,然而不影響對(duì)聲音音高的調(diào)節(jié)。
此外,區(qū)間3801和區(qū)間3803對(duì)應(yīng)于第一參數(shù)R的第一范圍,并且區(qū)間3802,區(qū)間3809和區(qū)間3804對(duì)應(yīng)于第一參數(shù)R的第二范圍。此外,區(qū)間3801和區(qū)間3802對(duì)應(yīng)于第一參數(shù)R的第三范圍,并且區(qū)間3809對(duì)應(yīng)于第一參數(shù)R的第四范圍。
在如圖38A和圖38B所示的示例中,當(dāng)?shù)谝粎?shù)R是1到4時(shí),即當(dāng)以1到4倍的速度回放時(shí),僅執(zhí)行語速轉(zhuǎn)換,并且當(dāng)?shù)谝粎?shù)R大于4時(shí),即當(dāng)以大于4倍的速度進(jìn)行回放時(shí),隨同對(duì)語速進(jìn)行轉(zhuǎn)換一起來升高聲音音高。通過執(zhí)行這樣的處理,當(dāng)以1到4倍的速度進(jìn)行回放時(shí),說話人的語速根據(jù)回放速度逐漸加快,并且當(dāng)以大于4倍的速度進(jìn)行回放時(shí),在說話人語速加快的同時(shí)逐漸升高聲音音高。
此外,當(dāng)?shù)谝粎?shù)R是1到20時(shí),即當(dāng)以1到20倍的速度回放時(shí),信號(hào)被連續(xù)讀取,并且當(dāng)?shù)谝粎?shù)R大于20時(shí),即當(dāng)以大于20倍的速度回放時(shí),信號(hào)被斷續(xù)讀取。通過執(zhí)行這樣的處理,可以實(shí)現(xiàn)超過20倍速度的回放速度,20倍的速度被認(rèn)為是連續(xù)讀取信號(hào)情況下的回放上限。
順便提及,在圖38A中,周期3802和周期3809以虛線被示出,因?yàn)榈诙?shù)Rs的值隨改變聲音音高的方法而改變。當(dāng)將如圖12到圖14所示的方法用作改變聲音音高的方法時(shí),樣本數(shù)隨聲音音高的升高而減少,因此,用虛線示出區(qū)間3802和區(qū)間3809的線條。然而,當(dāng)將樣本數(shù)不減少的方法或者減少量很小的方法用作改變聲音音高的方法時(shí),將不同于如圖38A所示的虛線來設(shè)定區(qū)間3802和區(qū)間3809。
此外,當(dāng)方法中用于改變聲音音高的樣本數(shù)的增長(zhǎng)率是Rd時(shí),參數(shù)調(diào)節(jié)部分3301具有如上述條件4所指示的特性。在此,例如,當(dāng)樣本數(shù)是2倍時(shí),增長(zhǎng)率是2,并且當(dāng)樣本數(shù)被減少到一半時(shí),增長(zhǎng)率是1/2。
(根據(jù)本實(shí)施例的控制回放速度變量因子的方法) 圖39是示出根據(jù)本實(shí)施例的信息處理裝置3300的處理流程的流程圖。首先,信息處理裝置3300判斷是否存在輸入音頻信號(hào)(步驟S3901),并且當(dāng)不存在輸入音頻信號(hào)時(shí),處理終止。此外,當(dāng)輸入音頻信號(hào)存在時(shí),信息處理裝置3300的參數(shù)調(diào)節(jié)部分3301根據(jù)所輸入的第一參數(shù)R來調(diào)節(jié)第二參數(shù)Rs、第三參數(shù)Rp和第四參數(shù)Rt(步驟S3902)。以滿足上述條件1到4以及條件A和B的方式來執(zhí)行調(diào)節(jié)。隨后,信息處理裝置3300的信號(hào)處理部分3307根據(jù)經(jīng)調(diào)節(jié)的第二參數(shù)Rs和第三參數(shù)Rp來調(diào)節(jié)從內(nèi)容管理部分3303發(fā)送來的音頻信號(hào)的語速和聲音音高(步驟S3903)。隨后,信息處理裝置3300輸出語速和聲音音高經(jīng)過調(diào)節(jié)的音頻信號(hào)(步驟S3304)。然后,返回到步驟S3901,上述處理被重復(fù)。
通過重復(fù)這樣的處理,根據(jù)本實(shí)施例的信息處理裝置3300被使得能夠控制音頻信號(hào)的回放速度變量因子。
如參考圖33到圖39所描述的,根據(jù)本實(shí)施例的控制回放速度變量因子的方法,能夠在第一參數(shù)R的第一范圍內(nèi)僅調(diào)節(jié)語速,并且在第一參數(shù)R的第二范圍內(nèi)隨同語速一起來調(diào)節(jié)聲音音高。因此,在第一參數(shù)R的第一范圍內(nèi)解決了第一問題,并且在第一參數(shù)R的第二范圍內(nèi)解決了第二問題。此外,在第一參數(shù)R的第三范圍內(nèi),信號(hào)可以被連續(xù)讀取,并且在第一參數(shù)R的第四范圍內(nèi),信號(hào)可以被斷續(xù)讀取。因此,第三問題可以在第四范圍內(nèi)被補(bǔ)救,并且第四范圍可以擴(kuò)展進(jìn)而回放速度的上限可以提高。
(信號(hào)處理部分3307) 隨后,通過參考圖40,來詳細(xì)描述根據(jù)本實(shí)施例的信號(hào)處理部分3307的示例。圖40是示出根據(jù)本實(shí)施例的信號(hào)處理部分3307的功能的框圖。
如圖40所示,例如,根據(jù)本實(shí)施例的信號(hào)處理部分3307主要包括擬聲聲音切換判斷部分4001、語速轉(zhuǎn)換部分4003、音高調(diào)節(jié)部分4005和音頻信號(hào)輸出控制部分4007。
根據(jù)本實(shí)施例的擬聲聲音切換判斷部分4001、語速轉(zhuǎn)換部分4003、音高調(diào)節(jié)部分4005和音頻信號(hào)輸出控制部分4007分別與根據(jù)本發(fā)明第一實(shí)施例的擬聲聲音切換判斷部分2101、語速轉(zhuǎn)換部分2103、音高調(diào)節(jié)部分2105和音頻信號(hào)輸出控制部分2107具有幾乎相同的配置,并且實(shí)現(xiàn)類似的效果,因此,省略其詳細(xì)描述。
圖41A和圖41B是示出由具有如圖40所示的信號(hào)處理部分3307的信息處理裝置3300的參數(shù)調(diào)節(jié)部分3301所執(zhí)行的參數(shù)調(diào)節(jié)方法示例的說明性示圖。
參數(shù)調(diào)節(jié)部分3301包括上述的條件A和條件B二者。圖41A是示出第一參數(shù)R和第二參數(shù)Rs之間關(guān)系的坐標(biāo)圖,并且圖41B是示出第一參數(shù)R和第三參數(shù)Rp之間關(guān)系的坐標(biāo)圖。
如圖41A所示,橫軸代表第一參數(shù)R并且縱軸代表第二參數(shù)Rs的坐標(biāo)圖被配置為具有第二參數(shù)Rs的不同上升率(換言之,坐標(biāo)圖的坡度)的多于三個(gè)的區(qū)域。類似地,如圖41B所示,橫軸代表第一參數(shù)R并且縱軸代表第三參數(shù)Rp的坐標(biāo)圖被配置為具有第三參數(shù)Rp的不同上升率的至少兩個(gè)區(qū)域。
當(dāng)信號(hào)處理部分3307的音高調(diào)節(jié)部分4005通過如圖12到圖14C所示的方法來調(diào)節(jié)音高時(shí),參數(shù)調(diào)節(jié)部分3301在下述的四個(gè)條件下,通過參考在存儲(chǔ)部分3309中存儲(chǔ)的、如圖41A和圖41B所示的數(shù)據(jù)庫,根據(jù)第一參數(shù)R來確定第二參數(shù)Rs和第三參數(shù)Rp。
條件1當(dāng)所輸入的第一參數(shù)R存在于區(qū)間4101中時(shí),將第二參數(shù)Rs確定為與第一參數(shù)R成比例(換言之,確定第二參數(shù)Rs以使得第二參數(shù)Rs等于第一參數(shù)R)。
條件2當(dāng)所輸入的第一參數(shù)R存在于區(qū)間4103中時(shí),將第三參數(shù)Rp恒定地設(shè)定為1。
條件3當(dāng)所輸入的第一參數(shù)R存在于區(qū)間4104中時(shí),第三參數(shù)Rp隨第一參數(shù)R的增大而增大。
條件4’第一參數(shù)R×第四參數(shù)Rt=第二參數(shù)Rs×第三參數(shù)Rp在第一范圍和第二范圍(第三范圍和第四范圍)內(nèi)成立。
在此,在區(qū)間4109中,因?yàn)槭苌鲜鰲l件B的影響所以第二參數(shù)Rs減小。順便提及,如從圖41A和圖41B中顯然可見的,第四參數(shù)Rt影響第二參數(shù)Rs,但是不影響第三參數(shù)Rp。換言之,當(dāng)被發(fā)送到信號(hào)處理部分3307的音頻信號(hào)的數(shù)據(jù)量減小時(shí),數(shù)據(jù)量的減小影響語速轉(zhuǎn)換的程度,但是不影響對(duì)聲音音高的調(diào)節(jié)。
此外,區(qū)間4101和區(qū)間4103對(duì)應(yīng)于第一參數(shù)R的第一范圍,并且區(qū)間4102、區(qū)間4109和區(qū)間4104對(duì)應(yīng)于第一參數(shù)R的第二范圍。此外,區(qū)間4101和區(qū)間4102對(duì)應(yīng)于第一參數(shù)R的第三范圍,并且區(qū)間4109對(duì)應(yīng)于第一參數(shù)R的第四范圍。
在如圖41A和圖41B所示的示例中,當(dāng)?shù)谝粎?shù)R是1到4時(shí),即當(dāng)以1到4倍的速度回放時(shí),僅執(zhí)行語速轉(zhuǎn)換,并且當(dāng)?shù)谝粎?shù)R大于4時(shí),即當(dāng)以大于4倍的速度進(jìn)行回放時(shí),隨同對(duì)語速進(jìn)行轉(zhuǎn)換一起來升高聲音音高。通過執(zhí)行這樣的處理,當(dāng)以1到4倍的速度進(jìn)行回放時(shí),說話人的語速根據(jù)回放速度逐漸加快,并且當(dāng)以大于4倍的速度進(jìn)行回放時(shí),在說話人語速加快的同時(shí)逐漸升高聲音音高。
此外,當(dāng)?shù)谝粎?shù)R是1到20時(shí),即當(dāng)以1到20倍的速度回放時(shí),信號(hào)被連續(xù)讀取,并且當(dāng)?shù)谝粎?shù)R大于20時(shí),即當(dāng)以大于20倍的速度回放時(shí),信號(hào)被斷續(xù)讀取。通過執(zhí)行這樣的處理,可以實(shí)現(xiàn)超過20倍速度的回放速度,20倍的速度被認(rèn)為是當(dāng)沒有執(zhí)行間隔(thinned)回放時(shí)的回放上限。
至此,已經(jīng)描述了根據(jù)本實(shí)施例的信息處理裝置3300的功能示例。上述結(jié)構(gòu)元件的每個(gè)可以被配置為通用組件或電路,或者可以被配置為專用于每個(gè)結(jié)構(gòu)元件的功能的硬件。此外,CPU等可以執(zhí)行所有的功能。因此,能夠根據(jù)實(shí)現(xiàn)本實(shí)施例的各種技術(shù)水平來適當(dāng)改變待使用的配置。
(根據(jù)本實(shí)施例的信號(hào)處理方法) 隨后,通過參考圖42,來詳細(xì)描述根據(jù)本實(shí)施例的信號(hào)處理方法。圖42是示出根據(jù)本實(shí)施例的信號(hào)處理方法的流程圖。
首先,信息處理裝置3300的信號(hào)處理部分3307判斷是否存在從內(nèi)容管理部分3303發(fā)送的音頻信號(hào)(步驟S4201),并且如果沒有從內(nèi)容管理部分3303發(fā)送的音頻信號(hào)那么終止處理。此外,當(dāng)從內(nèi)容管理部分3303發(fā)送的音頻信號(hào)存在時(shí),信號(hào)處理部分3307的擬聲聲音切換判斷部分4001判斷所輸入的第一參數(shù)R是否大于預(yù)定閾值(步驟S4202)。當(dāng)?shù)谝粎?shù)R小于預(yù)定閾值時(shí),參數(shù)調(diào)節(jié)部分3301根據(jù)所輸入的第一參數(shù)R來調(diào)節(jié)第二參數(shù)Rs、第三參數(shù)Rp和第四參數(shù)Rt(步驟S4203),并且將參數(shù)發(fā)送到信號(hào)處理部分3307。信號(hào)處理部分3307的語速轉(zhuǎn)換部分4003基于所發(fā)送的第二參數(shù)Rs來調(diào)節(jié)輸入音頻信號(hào)的語速(步驟S4204),并且將語速經(jīng)過調(diào)節(jié)的音頻信號(hào)輸出到音高調(diào)節(jié)部分4005。音高調(diào)節(jié)部分4005基于所發(fā)送的第三參數(shù)Rp來調(diào)節(jié)從語速轉(zhuǎn)換部分4003發(fā)送的音頻信號(hào)的聲音音高(步驟S4205)。語速和聲音音高經(jīng)過調(diào)節(jié)的音頻信號(hào)被發(fā)送到音頻信號(hào)輸出控制部分4007,并且音頻信號(hào)輸出控制部分4007輸出語速和聲音音高經(jīng)過調(diào)節(jié)的音頻信號(hào)(步驟S4206)。然后,返回到步驟S4201,上述處理被重復(fù)。
另一方面,當(dāng)擬聲聲音切換判斷部分4001判斷第一參數(shù)R大于預(yù)定閾值時(shí),音頻信號(hào)輸出控制部分4007將被存儲(chǔ)在存儲(chǔ)部分3309等中的預(yù)定擬聲聲音作為音頻信號(hào)輸出(步驟S4207)。然后,返回到步驟S4201,上述處理被重復(fù)。
通過重復(fù)這樣的處理,根據(jù)本實(shí)施例的信息處理裝置3300被使得能夠以在聽覺上可以識(shí)別轉(zhuǎn)換后的回放速度的方式來控制音頻信號(hào)的回放速度變量因子。
(第二實(shí)施例的第一修改示例) 隨后,通過參考圖43,來詳細(xì)描述根據(jù)本發(fā)明第二實(shí)施例的第一修改示例的信息處理裝置4300的配置。圖43是示出根據(jù)本修改實(shí)施例的信息處理裝置4300的功能的框圖。
如圖43所示的修改示例是其中內(nèi)容管理部分4303設(shè)定第四參數(shù)Rt的示例。例如,當(dāng)根據(jù)本修改示例的信息處理裝置4300被用作視頻記錄/回放裝置時(shí),存在這樣的情況,其中對(duì)內(nèi)容的回放和對(duì)另一節(jié)目的視頻記錄同時(shí)被執(zhí)行。在這樣的情況下,視頻記錄/回放裝置必須同時(shí)執(zhí)行回放和記錄,并且與僅執(zhí)行回放的情況相比,可以分配給回放處理的處理量減少。因此,因?yàn)榛胤盘幚淼奶幚砹靠赡茈S情況的不同而改變,所以應(yīng)該根據(jù)能夠備用于回放處理的處理量來確定間隔率(thinning rate)。根據(jù)本修改示例的信息處理裝置4300通過包括如下所述的內(nèi)容管理部分4303來實(shí)現(xiàn)這樣的處理。
如圖43所示,根據(jù)本修改示例的信息處理裝置4300例如主要包括參數(shù)調(diào)節(jié)部分4301、內(nèi)容管理部分4303、內(nèi)容存儲(chǔ)部分4305、信號(hào)處理部分4307和存儲(chǔ)部分4309。
在此,內(nèi)容存儲(chǔ)部分4305、信號(hào)處理部分4307和存儲(chǔ)部分4309分別與根據(jù)本發(fā)明第二實(shí)施例的內(nèi)容存儲(chǔ)部分3305、信號(hào)處理部分3307和存儲(chǔ)部分3309具有幾乎相同的配置,并且實(shí)現(xiàn)類似的效果,因此省略其詳細(xì)描述。
參數(shù)調(diào)節(jié)部分4301例如被配置為CPU、ROM、RAM等,并且根據(jù)從外部輸入的第一參數(shù)R和從隨后將描述的內(nèi)容管理部分4303發(fā)送的第四參數(shù)Rt,來調(diào)節(jié)第二參數(shù)Rs和第三參數(shù)Rp。如在本發(fā)明第二實(shí)施例中所描述的,通過參考在存儲(chǔ)部分4309中所存儲(chǔ)的、示出第一參數(shù)R與第二參數(shù)Rs以及與第三參數(shù)Rp的關(guān)系的數(shù)據(jù)庫,來確定第二參數(shù)Rs和第三參數(shù)Rp的設(shè)定以滿足如在第二實(shí)施例中所描述的條件。參數(shù)調(diào)節(jié)部分4301將所確定的第二參數(shù)Rs和第三參數(shù)Rp發(fā)送到信號(hào)處理部分4307。
內(nèi)容管理部分4303例如被配置為CPU、ROM、RAM等,并且管理包括可以被根據(jù)本實(shí)施例的信息處理裝置4300所回放的音頻信號(hào)的內(nèi)容。在內(nèi)容存儲(chǔ)部分4305中,內(nèi)容管理部分4303例如與內(nèi)容標(biāo)題、內(nèi)容ID和屬性信息等相關(guān)聯(lián)地來記錄包括音頻信號(hào)的內(nèi)容。內(nèi)容管理部分4303根據(jù)對(duì)從信息處理裝置4300外部輸入的內(nèi)容的回放指令,從內(nèi)容存儲(chǔ)部分4305中獲得內(nèi)容,并且將所述內(nèi)容輸出到信號(hào)處理部分4307。當(dāng)將內(nèi)容輸出到信號(hào)處理部分4307時(shí),內(nèi)容管理部分4303根據(jù)可用于內(nèi)容輸出的資源量來確定對(duì)應(yīng)于數(shù)據(jù)間隔率的第四參數(shù)Rt,并且根據(jù)第四參數(shù)Rt來確定待發(fā)送的數(shù)據(jù)量。此外,內(nèi)容管理部分4303將所確定的第四參數(shù)Rt發(fā)送到參數(shù)調(diào)節(jié)部分4301。順便提及,當(dāng)從內(nèi)容存儲(chǔ)部分4305讀取的內(nèi)容數(shù)據(jù)是經(jīng)編碼的數(shù)據(jù)時(shí),內(nèi)容管理部分4303通過未示出的解碼器對(duì)數(shù)據(jù)進(jìn)行解碼,并將所述數(shù)據(jù)輸出到信號(hào)處理部分4307。
此外,內(nèi)容管理部分4303可以經(jīng)由諸如因特網(wǎng)和家用網(wǎng)絡(luò)之類的網(wǎng)絡(luò)1702來獲得包括待回放的音頻信號(hào)的內(nèi)容。內(nèi)容管理部分4303可以將經(jīng)由網(wǎng)絡(luò)1702而獲得的內(nèi)容記錄在內(nèi)容存儲(chǔ)部分4305中。
內(nèi)容存儲(chǔ)部分4305例如被配置為諸如硬盤驅(qū)動(dòng)器、DVD驅(qū)動(dòng)器和藍(lán)光驅(qū)動(dòng)器之類的記錄介質(zhì),并且與內(nèi)容的標(biāo)題、ID、屬性信息等相關(guān)聯(lián)地存儲(chǔ)包括音頻信號(hào)的內(nèi)容。此外,包括構(gòu)成內(nèi)容存儲(chǔ)部分4305的各種記錄介質(zhì)的讀取速度上限值的控制信息等可以作為數(shù)據(jù)庫被存儲(chǔ)在內(nèi)容存儲(chǔ)部分4305中。
至此,已經(jīng)描述了根據(jù)本修改示例的信息處理裝置4300的功能示例。上述結(jié)構(gòu)元件的每個(gè)可以被配置為通用組件或電路,或者可以被配置為專用于每個(gè)結(jié)構(gòu)元件的功能的硬件。此外,CPU等可以執(zhí)行所有的功能。因此,能夠根據(jù)實(shí)現(xiàn)本修改示例的各種技術(shù)水平來適當(dāng)改變待使用的配置。
(根據(jù)本修改示例的信號(hào)處理方法) 隨后,通過參考圖44,來詳細(xì)描述根據(jù)本修改示例的信號(hào)處理方法。圖44是示出根據(jù)本修改示例的信號(hào)處理方法的流程圖。
首先,信息處理裝置4300的信號(hào)處理部分4307判斷是否存在從內(nèi)容管理部分4303發(fā)送的音頻信號(hào)(步驟S4401),并且當(dāng)沒有從內(nèi)容管理部分4303發(fā)送的音頻信號(hào)終止處理。此外,當(dāng)從內(nèi)容管理部分4303發(fā)送的音頻信號(hào)存在時(shí),信號(hào)處理部分4307的擬聲聲音切換判斷部分判斷所輸入的第一參數(shù)R是否大于預(yù)定閾值(步驟S4402)。當(dāng)?shù)谝粎?shù)R小于預(yù)定閾值時(shí),參數(shù)調(diào)節(jié)部分4301根據(jù)所輸入的第一參數(shù)R和從內(nèi)容管理部分4303發(fā)送的第四參數(shù)Rt來調(diào)節(jié)第二參數(shù)Rs和第三參數(shù)Rp(步驟S4403),并且將參數(shù)發(fā)送到信號(hào)處理部分4307。信號(hào)處理部分4307基于所發(fā)送的第二參數(shù)Rs和第三參數(shù)Rp來調(diào)節(jié)輸入音頻信號(hào)的語速和聲音音高(步驟S4404)。語速和聲音音高經(jīng)過調(diào)節(jié)的音頻信號(hào)被發(fā)送到音頻信號(hào)輸出控制部分,并且音頻信號(hào)輸出控制部分輸出語速和聲音音高經(jīng)過調(diào)節(jié)的音頻信號(hào)(步驟S4405)。然后,返回到步驟S4401,上述處理被重復(fù)。
另一方面,當(dāng)擬聲聲音切換判斷部分判斷第一參數(shù)R大于預(yù)定閾值時(shí),音頻信號(hào)輸出控制部分將被存儲(chǔ)在存儲(chǔ)部分4309等中的預(yù)定擬聲聲音作為音頻信號(hào)輸出(步驟S4406)。然后,返回到步驟S4401,上述處理被重復(fù)。
通過重復(fù)這樣的處理,根據(jù)本修改示例的信息處理裝置4300被使得能夠以在聽覺上可以識(shí)別轉(zhuǎn)換后的回放速度的方式來控制音頻信號(hào)的回放速度變量因子。
(信號(hào)處理部分3307、4307的修改示例) 隨后,通過參考圖45,來描述根據(jù)本實(shí)施例的以及根據(jù)本修改示例的信號(hào)處理部分3307、4307的修改示例。圖45是示出信號(hào)處理部分3307、4307的修改示例的框圖。
如圖45所示,根據(jù)本修改示例的信號(hào)處理部分主要包括擬聲聲音切換判斷部分4001、音高調(diào)節(jié)部分4501、語速轉(zhuǎn)換部分4503和音頻信號(hào)輸出控制部分4007。
根據(jù)本修改示例的擬聲聲音切換判斷部分4001、音高調(diào)節(jié)部分4501、語速轉(zhuǎn)換部分4503和音頻信號(hào)輸出控制部分4007分別與根據(jù)本發(fā)明第一實(shí)施例的第一修改示例的擬聲聲音切換判斷部分2101、音高調(diào)節(jié)部分2901、語速轉(zhuǎn)換部分2903和音頻信號(hào)輸出控制部分2107具有幾乎相同的配置,并且實(shí)現(xiàn)類似的效果,因此,省略其詳細(xì)描述。
(根據(jù)本修改示例的信號(hào)處理方法) 隨后,通過參考圖46,來詳細(xì)描述根據(jù)本修改示例的信號(hào)處理方法。圖46是示出根據(jù)本修改示例的信號(hào)處理方法的流程圖。
首先,信息處理裝置4300判斷是否存在輸入音頻信號(hào)(步驟S4601),并且當(dāng)沒有輸入音頻信號(hào)時(shí)終止處理。此外,當(dāng)輸入音頻信號(hào)存在時(shí),信號(hào)處理部分4307的擬聲聲音切換判斷部分4001判斷所輸入的第一參數(shù)R是否大于預(yù)定閾值(步驟S4602)。當(dāng)?shù)谝粎?shù)R小于預(yù)定閾值時(shí),參數(shù)調(diào)節(jié)部分4301根據(jù)所輸入的第一參數(shù)R和從內(nèi)容管理部分4303發(fā)送的第四參數(shù)Rt來調(diào)節(jié)第二參數(shù)Rs和第三參數(shù)Rp(步驟S4603),并且將參數(shù)發(fā)送到信號(hào)處理部分4307。信號(hào)處理部分4307的音高調(diào)節(jié)部分4501基于所發(fā)送的第三參數(shù)Rp來調(diào)節(jié)所發(fā)送的輸入音頻信號(hào)的聲音音高(步驟S4604),并且將聲音音高經(jīng)過調(diào)節(jié)的音頻信號(hào)輸出到語速轉(zhuǎn)換部分4503。語速轉(zhuǎn)換部分4503基于所發(fā)送的第二參數(shù)Rs來調(diào)節(jié)聲音音高經(jīng)過調(diào)節(jié)的音頻信號(hào)的語速(步驟S4605)。語速和聲音音高經(jīng)過調(diào)節(jié)的音頻信號(hào)被發(fā)送到音頻信號(hào)輸出控制部分4007,并且音頻信號(hào)輸出控制部分4007輸出語速和聲音音高經(jīng)過調(diào)節(jié)的音頻信號(hào)(步驟S4606)。然后,返回到步驟S4601,上述處理被重復(fù)。
另一方面,當(dāng)擬聲聲音切換判斷部分4001判斷第一參數(shù)R大于預(yù)定閾值時(shí),音頻信號(hào)輸出控制部分4007將被存儲(chǔ)在存儲(chǔ)部分3309等中的預(yù)定擬聲聲音作為音頻信號(hào)輸出(步驟S4607)。然后,返回到步驟S4601,上述處理被重復(fù)。
通過重復(fù)這樣的處理,根據(jù)本修改示例的信息處理裝置4300被使得能夠以在聽覺上可以識(shí)別轉(zhuǎn)換后的回放速度的方式來控制音頻信號(hào)的回放速度變量因子。
如上所述,通過根據(jù)第二實(shí)施例和根據(jù)本發(fā)明的每個(gè)修改示例的信息處理裝置,能夠確定音頻信號(hào)的語速轉(zhuǎn)換率和聲音音高轉(zhuǎn)換率,同時(shí)通過在發(fā)送音頻信號(hào)時(shí)進(jìn)行間隔剔除來實(shí)現(xiàn)構(gòu)成音頻數(shù)據(jù)的樣本數(shù)的減少。通過使用這樣的裝置,當(dāng)以近似正常速度進(jìn)行回放時(shí),回放速度改變?nèi)欢曇粢舾卟蛔?,因而很容易理解說話人的語音內(nèi)容或者很容易指定說話人。同時(shí),在高速/低速回放的情況下,當(dāng)轉(zhuǎn)換回放速度時(shí)還改變聲音音高,因此可以從聽覺上感受到此時(shí)的回放速度,并且此外,通過調(diào)節(jié)例如連續(xù)讀取和斷續(xù)讀取,在高速回放時(shí)的回放速度上限可以顯著提高。因此,通過根據(jù)本實(shí)施例的信息處理裝置,可操作性能夠得到改進(jìn)。
(信息處理裝置的硬件配置) 隨后,通過參考圖47,來詳細(xì)描述根據(jù)本發(fā)明每個(gè)實(shí)施例的信息處理裝置的硬件配置。圖47是示出根據(jù)本發(fā)明每個(gè)實(shí)施例的信息處理裝置的硬件配置的框圖。
信息處理裝置1800、3300和4300主要包括CPU 4701、ROM 4703、RAM 4705、主機(jī)總線4707、電橋(bridge)4709、外部總線4711、接口4713、輸入設(shè)備4715、輸出設(shè)備4717、存儲(chǔ)設(shè)備4719、驅(qū)動(dòng)器4721、連接端口4723和通信設(shè)備4725。
CPU 4701用作算術(shù)處理設(shè)備和控制設(shè)備,并且根據(jù)在ROM 4703、RAM 4705、存儲(chǔ)設(shè)備4719或可移動(dòng)記錄介質(zhì)4727中存儲(chǔ)的各種程序,來控制信息處理裝置1800、3300和4300的整個(gè)操作或部分操作。RAM4705臨時(shí)存儲(chǔ)將在CPU 4701的執(zhí)行期間所使用的程序、在執(zhí)行期間根據(jù)需要而變化的參數(shù)等。這些組件通過主機(jī)總線4707來彼此連接,通過諸如CPU總線之類的內(nèi)部總線來配置主機(jī)總線4707。
主機(jī)總線4707經(jīng)由電橋4709連接到諸如PCI(外圍組件互連/接口)總線之類的外部總線4711。
輸入設(shè)備4715例如是將由使用者來操作的諸如鼠標(biāo)、鍵盤、觸摸面板、按鈕、開關(guān)和控制桿之類的操作裝置。此外,輸入設(shè)備4715可以是利用紅外線或其他無線電波的遙控裝置(所謂的遙控器),或者它可以是諸如與信息處理裝置1800、3300和4300的操作相關(guān)聯(lián)的蜂窩式電話、PDA等之類的外部連接裝置4729。此外,輸入設(shè)備4715基于由使用者例如利用上述操作裝置而輸入的信息來生成輸入信號(hào)。信息處理裝置1800、3300和4300的使用者可以將各種數(shù)據(jù)輸入到信息處理裝置1800、3300和4300,或者可以通過在輸入設(shè)備4715上進(jìn)行操作來指示處理操作。
通過能夠在視覺上或者在聽覺上將所獲得的信息通知給使用者的設(shè)備來配置輸出設(shè)備4717,例如諸如CRT顯示器、液晶顯示器、等離子顯示器、EL顯示器和燈之類的顯示設(shè)備,諸如揚(yáng)聲器和頭戴式耳機(jī)之類的音頻輸出設(shè)備,打印設(shè)備,蜂窩式電話,或者傳真。4717例如輸出通過由信息處理裝置1800、3300和4300所執(zhí)行的各種處理而獲得的結(jié)果。具體地,顯示設(shè)備將通過由信息處理裝置1800、3300和4300所執(zhí)行的各種處理而獲得的結(jié)果顯示為文本或圖像。另一方面,音頻輸出設(shè)備將所回放的音頻數(shù)據(jù)的音頻信號(hào)、聲響數(shù)據(jù)等轉(zhuǎn)換為模擬信號(hào)并且將所述模擬信號(hào)輸出。
存儲(chǔ)設(shè)備4719是作為信息處理裝置1800、3300和4300的存儲(chǔ)部分而配置的用于存儲(chǔ)數(shù)據(jù)的設(shè)備,并且例如被配置為諸如HDD(硬盤驅(qū)動(dòng)器)之類的磁存儲(chǔ)設(shè)備、半導(dǎo)體存儲(chǔ)設(shè)備、光存儲(chǔ)設(shè)備和磁光存儲(chǔ)設(shè)備。存儲(chǔ)設(shè)備4719存儲(chǔ)將由CPU 4701執(zhí)行的程序以及各種數(shù)據(jù),從外部獲得的聲響信號(hào)數(shù)據(jù)和圖像信號(hào)數(shù)據(jù)等。
驅(qū)動(dòng)器4721是與記錄介質(zhì)結(jié)合使用的讀取器/寫入器,并且被嵌入信息處理裝置1800、3300和4300中或者被配置為外圍驅(qū)動(dòng)器。驅(qū)動(dòng)器4721讀取在裝載于其中的諸如磁盤、光盤、磁光盤或半導(dǎo)體存儲(chǔ)器之類的可移動(dòng)記錄介質(zhì)4727中所記錄的信息,并且將所述信息輸出到RAM 4705。此外,驅(qū)動(dòng)器4721可以將記錄寫入裝載于其中的諸如磁盤、光盤、磁光盤或半導(dǎo)體存儲(chǔ)器之類的可移動(dòng)記錄介質(zhì)4727中??梢苿?dòng)記錄介質(zhì)4727是DVD介質(zhì)、HD-DVD介質(zhì)、藍(lán)光介質(zhì)、緊湊式閃存(CF)(注冊(cè)商標(biāo))、存儲(chǔ)棒、SD(安全數(shù)字)存儲(chǔ)卡等。此外,可移動(dòng)記錄介質(zhì)4727例如可以是其中嵌入了非接觸型IC芯片的IC卡(集成電路卡)或者電子設(shè)備。
連接端口4723是這樣的端口,例如USB(通用串行總線)端口、諸如i.Link之類的IEEE 1394端口、SCSI(小型計(jì)算機(jī)系統(tǒng)接口)端口、RS-232C端口、光音頻終端和用于直接將設(shè)備連接到信息處理裝置1800、3300和4300的HDMI(高清多媒體接口)端口。通過將外部連接裝置4729連接到連接端口4723,信息處理裝置1800、3300和4300直接從外部連接裝置4729獲得聲響信號(hào)數(shù)據(jù)或圖像信號(hào)數(shù)據(jù),或者為外部連接裝置4729提供聲響信號(hào)數(shù)據(jù)或圖像信號(hào)數(shù)據(jù)。
通信設(shè)備4725例如是被配置為連接到網(wǎng)絡(luò)1702的通信設(shè)備等的通信接口。通信設(shè)備4725例如是用于有線或無線LAN(局域網(wǎng))的通信卡,藍(lán)牙或WUSB(無線USB),用于光通信的路由器,用于ADSL(不對(duì)稱數(shù)字用戶線)的路由器,或者用于各種通信的調(diào)制解調(diào)器。通信設(shè)備4725例如可以向/從因特網(wǎng)和其他通信設(shè)備發(fā)送/接收聲響信號(hào)等。此外,將被連接到通信設(shè)備4725的網(wǎng)絡(luò)1702被配置為以有線或無線的方式連接的網(wǎng)絡(luò)等,并且它可以是因特網(wǎng)、家用LAN、紅外通信、無線電波通信、衛(wèi)星通信等。
通過如上所述的配置,信息處理裝置1800、3300和4300可以從各種信息資源獲得與聲響信號(hào)等有關(guān)的信息,并且可以將與聲響信號(hào)等有關(guān)的信息發(fā)送到與連接端口4723或網(wǎng)絡(luò)1702相連接的外部連接裝置4729、內(nèi)容服務(wù)器1703和客戶端裝置1704,并且此外,信息處理裝置1800、3300和4300可以從外部連接裝置4729、內(nèi)容服務(wù)器1703和客戶端裝置1704接收與聲響信號(hào)有關(guān)的信息,并且獲得外部連接裝置4729、內(nèi)容服務(wù)器1703和客戶端裝置1704中的與聲響信號(hào)有關(guān)的信息。此外,信息處理裝置1800、3300和4300可以通過使用可移動(dòng)記錄介質(zhì)4727來取出與聲響信號(hào)等有關(guān)的信息。
至此,已經(jīng)描述了可以實(shí)現(xiàn)根據(jù)本發(fā)明每個(gè)實(shí)施例的信息處理裝置1800、3300和4300的功能的硬件配置示例。上述結(jié)構(gòu)元件的每個(gè)可以被配置為通用組件,或者可以被配置為專用于每個(gè)結(jié)構(gòu)元件的功能的硬件。因此,能夠根據(jù)實(shí)現(xiàn)本實(shí)施例的各種技術(shù)水平來適當(dāng)改變待使用的配置。
本領(lǐng)域中的技術(shù)人員應(yīng)理解,根據(jù)設(shè)計(jì)需求和其他因素,可以想到各種修改、組合、子組合和變更,只要它們落入隨附權(quán)利要求書或其等價(jià)物的范圍內(nèi)。
例如,在上述的每個(gè)實(shí)施例中,對(duì)這樣的情況進(jìn)行了說明,其中在第一范圍內(nèi),第一參數(shù)R是1到4。然而,第一范圍并不局限于此,并且第一參數(shù)可以具有不同的值。例如,在慢節(jié)奏的語音和音樂中,第一參數(shù)R的第一范圍可以是1到6左右。相反,在快節(jié)奏的語音和音樂的情況下,其可以是1到2左右。
此外,在如上所述的第二實(shí)施例中,對(duì)這樣的情況進(jìn)行了說明,其中在第三范圍內(nèi),第一參數(shù)R是1到20。然而,第三范圍并不局限于此,并且它可以具有不同的值。
此外,在上述的每個(gè)實(shí)施例中,PICOLA被用作語速轉(zhuǎn)換的算法。然而,本發(fā)明的語速轉(zhuǎn)換算法并不局限于此,并且可以使用任意算法而無論時(shí)間軸和頻率軸如何,只要語速轉(zhuǎn)換可以被執(zhí)行。
順便提及,在上述的每個(gè)實(shí)施例中,對(duì)回放速度比正常速度更快的變速回放示例進(jìn)行了說明,然而相同的事情可以被視為以小于正常速度的速度進(jìn)行回放的情況。也就是,例如,0.5到1.0倍的速度對(duì)應(yīng)于第一范圍,并且0.0到0.5倍的速度對(duì)應(yīng)于第二范圍。在0.5到1.0倍速度的范圍內(nèi)僅轉(zhuǎn)換語速,并且在0.0到0.5倍速度的范圍內(nèi),在轉(zhuǎn)換語速的同時(shí)隨著回放速度的減緩來降低聲音音高,這是可能的。
本發(fā)明包含與2007年9月19日遞交到日本專利局的日本專利申請(qǐng)JP2007-241681相關(guān)的主題,該日本專利申請(qǐng)的全部?jī)?nèi)容通過引用被結(jié)合于此。
權(quán)利要求
1.一種信息處理裝置,包括
參數(shù)調(diào)節(jié)部分,其根據(jù)指示所輸入的回放速度變量因子的第一參數(shù)來設(shè)定第二參數(shù)和第三參數(shù);以及
信號(hào)處理部分,其基于所述第二參數(shù)和所述第三參數(shù),調(diào)節(jié)音頻信號(hào)的回放速度和聲音音高中的至少一個(gè),其中
所述信號(hào)處理部分在所輸入的回放速度變量因子小于預(yù)定閾值時(shí)調(diào)節(jié)所述音頻信號(hào)的所述回放速度,并且在所輸入的回放速度變量因子在所述預(yù)定閾值以上時(shí)調(diào)節(jié)所述音頻信號(hào)的所述回放速度和所述聲音音高。
2.如權(quán)利要求1所述的信息處理裝置,其中
所述信號(hào)處理部分包括
回放速度轉(zhuǎn)換部分,其轉(zhuǎn)換所述音頻信號(hào)的所述回放速度;以及
音高調(diào)節(jié)部分,其調(diào)節(jié)所述音頻信號(hào)的所述聲音音高,其中
所述回放速度轉(zhuǎn)換部分基于所述第二參數(shù)來轉(zhuǎn)換所述音頻信號(hào)的所述回放速度,并且
所述音高調(diào)節(jié)部分基于所述第三參數(shù)來調(diào)節(jié)所述音頻信號(hào)的所述聲音音高。
3.如權(quán)利要求1所述的信息處理裝置,其中
所述第一參數(shù)約等于所述第二參數(shù)和所述第三參數(shù)的乘積。
4.如權(quán)利要求1所述的信息處理裝置,其中
所述信號(hào)處理部分還包括
音頻信號(hào)輸出控制部分,其控制將從所述信號(hào)處理部分輸出的、已被執(zhí)行了預(yù)定信號(hào)處理的音頻信號(hào)的輸出,其中
當(dāng)回放速度和聲音音高均經(jīng)過調(diào)節(jié)的音頻信號(hào)被從所述信號(hào)處理部分輸出時(shí),所述音頻信號(hào)輸出控制部分降低所述回放速度和聲音音高均經(jīng)過調(diào)節(jié)的音頻信號(hào)的音頻音量。
5.如權(quán)利要求4所述的信息處理裝置,其中
所述信號(hào)處理部分還包括
擬聲聲音切換判斷部分,其根據(jù)所述第一參數(shù),判斷是調(diào)節(jié)所述音頻信號(hào)的所述回放速度和所述聲音音高中的至少一個(gè),還是將所述音頻信號(hào)切換到指示正在執(zhí)行高速回放的預(yù)定擬聲聲音,其中
當(dāng)所述第一參數(shù)在所述預(yù)定閾值以上時(shí),所述擬聲聲音切換判斷部分判斷將所述音頻信號(hào)切換到所述預(yù)定擬聲聲音;并且
當(dāng)所述擬聲聲音切換判斷部分判斷將所述音頻信號(hào)切換到所述預(yù)定擬聲聲音時(shí),所述音頻信號(hào)輸出控制部分在將所述音頻信號(hào)切換到所述預(yù)定擬聲聲音之后輸出所述音頻信號(hào)。
6.如權(quán)利要求1所述的信息處理裝置,還包括
內(nèi)容管理部分,其管理包括所述音頻信號(hào)的內(nèi)容,其中
所述參數(shù)調(diào)節(jié)部分根據(jù)所輸入的所述第一參數(shù)來確定第四參數(shù),所述第四參數(shù)對(duì)將從所述內(nèi)容管理部分輸出到所述信號(hào)處理部分的所述音頻信號(hào)的數(shù)據(jù)量進(jìn)行調(diào)節(jié)。
7.如權(quán)利要求6所述的信息處理裝置,其中
當(dāng)所述第一參數(shù)在預(yù)定閾值以上時(shí),所述參數(shù)調(diào)節(jié)部分減小所述第四參數(shù)以減小將從所述內(nèi)容管理部分輸出到所述信號(hào)處理部分的所述內(nèi)容的數(shù)據(jù)量。
8.如權(quán)利要求6所述的信息處理裝置,其中
所述第一參數(shù)和所述第四參數(shù)的乘積約等于所述第二參數(shù)和所述第三參數(shù)的乘積。
9.如權(quán)利要求1所述的信息處理裝置,還包括
內(nèi)容管理部分,其管理包括所述音頻信號(hào)的內(nèi)容,其中
所述參數(shù)調(diào)節(jié)部分基于對(duì)將從所述內(nèi)容管理部分輸出到所述信號(hào)處理部分的所述音頻數(shù)據(jù)的數(shù)據(jù)量進(jìn)行調(diào)節(jié)的第四參數(shù)和所輸入的所述第一參數(shù),來確定所述第二參數(shù)和所述第三參數(shù)。
10.如權(quán)利要求9所述的信息處理裝置,其中
當(dāng)所述第一參數(shù)在預(yù)定閾值以上時(shí),所述內(nèi)容管理部分減小所述第四參數(shù)以減小將從所述內(nèi)容管理部分輸出到所述信號(hào)處理部分的所述內(nèi)容的數(shù)據(jù)量。
11.如權(quán)利要求9所述的信息處理裝置,其中
所述第一參數(shù)和所述第四參數(shù)的乘積約等于所述第二參數(shù)和所述第三參數(shù)的乘積。
12.如權(quán)利要求1所述的信息處理裝置,還包括
存儲(chǔ)數(shù)據(jù)庫的存儲(chǔ)部分,在所述數(shù)據(jù)庫中,所輸入的所述第一參數(shù)與所述第二參數(shù)和所述第三參數(shù)相互相關(guān),其中
所述參數(shù)調(diào)節(jié)部分通過參考存儲(chǔ)在所述存儲(chǔ)部分中的所述數(shù)據(jù)庫來確定所述第二參數(shù)和所述第三參數(shù)。
13.如權(quán)利要求12所述的信息處理裝置,其中
當(dāng)所述第一參數(shù)在預(yù)定閾值以上時(shí),所述參數(shù)調(diào)節(jié)部分根據(jù)所述第一參數(shù)與所述預(yù)定閾值之差來增大所述第二參數(shù)。
14.如權(quán)利要求12所述的信息處理裝置,其中
所述數(shù)據(jù)庫被存儲(chǔ)為指示所述第二參數(shù)和所述第三參數(shù)隨所述第一參數(shù)的變化的曲線,并且
指示所述第三參數(shù)的變化的所述曲線在所述預(yù)定閾值之前和之后具有平滑的形狀。
15.如權(quán)利要求6所述的信息處理裝置,還包括
存儲(chǔ)數(shù)據(jù)庫的存儲(chǔ)部分,在所述數(shù)據(jù)庫中,所輸入的所述第一參數(shù)與所述第二參數(shù)、所述第三參數(shù)和所述第四參數(shù)相互相關(guān),其中
所述參數(shù)調(diào)節(jié)部分通過參考存儲(chǔ)在所述存儲(chǔ)部分中的所述數(shù)據(jù)庫來確定所述第二參數(shù)、所述第三參數(shù)和所述第四參數(shù)。
16.如權(quán)利要求1所述的信息處理裝置,其中
當(dāng)所述第一參數(shù)在預(yù)定閾值以上時(shí),所述參數(shù)調(diào)節(jié)部分根據(jù)所述第一參數(shù)與所述預(yù)定閾值之差來增大所述第二參數(shù)。
17.一種信息處理方法,包括
參數(shù)調(diào)節(jié)步驟,其根據(jù)指示所輸入的回放速度變量因子的第一參數(shù)來設(shè)定第二參數(shù)和第三參數(shù);以及
信號(hào)處理步驟,其基于所述第二參數(shù)和所述第三參數(shù),調(diào)節(jié)音頻信號(hào)的回放速度和聲音音高中的至少一個(gè),其中
所述信號(hào)處理步驟在所輸入的回放速度變量因子小于預(yù)定閾值時(shí),基于所述第二參數(shù)來調(diào)節(jié)所述音頻信號(hào)的所述回放速度,并且在所輸入的回放速度變量因子在所述預(yù)定閾值以上時(shí),基于所述第二參數(shù)和所述第三參數(shù)來調(diào)節(jié)所述音頻信號(hào)的所述回放速度和所述聲音音高。
18.如權(quán)利要求17所述的信息處理方法,其中
在所述參數(shù)調(diào)節(jié)步驟中,確定所述第二參數(shù)和所述第三參數(shù)以使得所述第一參數(shù)可以約等于所述第二參數(shù)和所述第三參數(shù)的乘積。
19.如權(quán)利要求17所述的信息處理方法,其中
在所述信號(hào)處理步驟中,對(duì)所述音頻信號(hào)的信號(hào)波形的振幅進(jìn)行控制以使得當(dāng)所述音頻信號(hào)的所述回放速度和所述聲音音高均被調(diào)節(jié)時(shí),所述音頻信號(hào)的音頻音量可以較小。
20.如權(quán)利要求17所述的信息處理方法,其中
在所述信號(hào)處理步驟中,當(dāng)所述第一參數(shù)在所述預(yù)定閾值以上時(shí),所述音頻信號(hào)被切換到指示正在執(zhí)行高速回放的預(yù)定擬聲聲音。
21.如權(quán)利要求17所述的信息處理方法,其中
在所述參數(shù)調(diào)節(jié)步驟中,還根據(jù)所述第一參數(shù)確定了第四參數(shù),所述第四參數(shù)對(duì)在所述信號(hào)處理步驟中被處理的所述音頻信號(hào)的數(shù)據(jù)量進(jìn)行調(diào)節(jié)。
22.如權(quán)利要求21所述的信息處理方法,其中
在所述參數(shù)調(diào)節(jié)步驟中,確定所述第二參數(shù)、所述第三參數(shù)和所述第四參數(shù)以使得所述第一參數(shù)和所述第四參數(shù)的乘積可以約等于所述第二參數(shù)和所述第三參數(shù)的乘積。
23.如權(quán)利要求21所述的信息處理方法,其中
在所述參數(shù)調(diào)節(jié)步驟中,當(dāng)所述第一參數(shù)在預(yù)定閾值以上時(shí),所述第四參數(shù)被減小以減小所述音頻信號(hào)的數(shù)據(jù)量。
24.如權(quán)利要求17所述的信息處理方法,其中
在所述參數(shù)調(diào)節(jié)步驟中,根據(jù)對(duì)將在所述信號(hào)處理步驟中被處理的所述音頻信號(hào)的數(shù)據(jù)量進(jìn)行調(diào)節(jié)的第四參數(shù)和所述第一參數(shù)來確定所述第二參數(shù)和所述第三參數(shù)。
25.如權(quán)利要求24所述的信息處理方法,其中
在所述參數(shù)調(diào)節(jié)步驟中,確定所述第二參數(shù)和所述第三參數(shù)以使得所述第一參數(shù)和所述第四參數(shù)的乘積可以約等于所述第二參數(shù)和所述第三參數(shù)的乘積。
26.一種在計(jì)算機(jī)中實(shí)現(xiàn)的程序
參數(shù)調(diào)節(jié)功能,其根據(jù)指示所輸入的回放速度變量因子的第一參數(shù)來設(shè)定第二參數(shù)和第三參數(shù);以及
信號(hào)處理功能,其基于所述第二參數(shù)和所述第三參數(shù)來調(diào)節(jié)音頻信號(hào)的回放速度和聲音音高中的至少一個(gè)。
全文摘要
本發(fā)明提供了一種信息處理裝置、信息處理方法和程序。根據(jù)本發(fā)明,提供了參數(shù)調(diào)節(jié)部分,其根據(jù)指示所輸入的回放速度變量因子的第一參數(shù)來設(shè)定第二參數(shù)和第三參數(shù),以及信號(hào)處理部分,其基于第二參數(shù)和第三參數(shù)來調(diào)節(jié)音頻信號(hào)的回放速度和聲音音高中的至少一個(gè),其中信號(hào)處理部分在所輸入的回放速度變量因子小于預(yù)定閾值時(shí)調(diào)節(jié)音頻信號(hào)的回放速度,并且在所輸入的回放速度變量因子大于預(yù)定閾值時(shí)調(diào)節(jié)音頻信號(hào)的回放速度和聲音音高。
文檔編號(hào)G11B20/00GK101393745SQ20081017473
公開日2009年3月25日 申請(qǐng)日期2008年9月19日 優(yōu)先權(quán)日2007年9月19日
發(fā)明者中村理, 安部素嗣 申請(qǐng)人:索尼株式會(huì)社