聲音處理裝置、聲音處理方法、程序、記錄介質(zhì)、服務(wù)器裝置、聲音再現(xiàn)裝置以及聲音處理系統(tǒng)的制作方法
【專利摘要】本發(fā)明使得可以有利地識(shí)別與輸入的聲音信號(hào)相對(duì)應(yīng)的歌曲。將連續(xù)輸入的聲音信號(hào)轉(zhuǎn)換成預(yù)定特征量序列。在特征量序列累積了預(yù)定量時(shí)按順序地執(zhí)行特征量序列與歌曲信息之間的核對(duì)處理,并且最終識(shí)別匹配程度大于閾值的歌曲。在此情況下,并行地執(zhí)行連續(xù)輸入的聲音信號(hào)到預(yù)定特征量序列的轉(zhuǎn)換和特征量序列與歌曲信息之間的核對(duì)處理。因此,可以實(shí)現(xiàn)具有優(yōu)良的實(shí)時(shí)特性的歌曲識(shí)別。
【專利說明】聲音處理裝置、聲音處理方法、程序、記錄介質(zhì)、服務(wù)器裝置、聲音再現(xiàn)裝置以及聲音處理系統(tǒng)
【技術(shù)領(lǐng)域】
[0001]本技術(shù)涉及一種聲音處理裝置、聲音處理方法、程序、記錄介質(zhì)、服務(wù)器裝置、聲音再現(xiàn)裝置以及聲音處理系統(tǒng),并且更具體地涉及一種用于優(yōu)選地識(shí)別與輸入聲音信號(hào)相對(duì)應(yīng)的音樂片段的聲音處理裝置等。
【背景技術(shù)】
[0002]針對(duì)用戶從大量音樂片段中再現(xiàn)音樂片段的情況,作為用于容易地搜索音樂片段的方法,已經(jīng)提議了歌唱和哼唱搜索(例如,參見專利文獻(xiàn)I)。
[0003]引用列表
[0004]專利文獻(xiàn)
[0005]專利文獻(xiàn)1:日本專利申請(qǐng)公開第2000-356996號(hào)
【發(fā)明內(nèi)容】
[0006]發(fā)明要解決的問題
[0007]根據(jù)專利文獻(xiàn)I中所描述的搜索系統(tǒng),在用戶歌唱(或哼唱)之后開始搜索處理。因此,系統(tǒng)缺乏實(shí)時(shí)能力。
[0008]本技術(shù)的目的是使得能夠優(yōu)選地識(shí)別與輸入聲音信號(hào)相對(duì)應(yīng)的音樂片段。
[0009]問題的解決方案
[0010]本技術(shù)的一個(gè)方面是一種聲音處理裝置,包括:
[0011]轉(zhuǎn)換單元,配置成將連續(xù)輸入的聲音信號(hào)轉(zhuǎn)換成預(yù)定特征量序列;以及
[0012]音樂識(shí)別單元,配置成在累積了預(yù)定量的預(yù)定特征量序列時(shí),按順序地執(zhí)行特征量序列相對(duì)于音樂信息的核對(duì)處理,并且配置成識(shí)別具有大于第一閾值的匹配程度的音樂片段。
[0013]關(guān)于本技術(shù),轉(zhuǎn)換單元將連續(xù)輸入的聲音信號(hào)轉(zhuǎn)換成預(yù)定特征量序列。例如,通過經(jīng)由麥克風(fēng)輸入用戶的歌唱語音(包括哼唱)、環(huán)境聲音等獲得連續(xù)輸入的聲音信號(hào)。特征量序列被描述為例如音高序列,但是特征量序列可以是其他序列,諸如音韻序列等。
[0014]音樂識(shí)別單元在累積了預(yù)定量的預(yù)定特征量序列時(shí),按順序地執(zhí)行特征量序列相對(duì)于音樂信息的核對(duì)處理。之后,音樂識(shí)別單元識(shí)別具有大于第一閾值的匹配程度的音樂片段。例如,在每個(gè)排定的時(shí)間或每當(dāng)之前的核對(duì)處理結(jié)束時(shí)執(zhí)行核對(duì)處理。
[0015]以這種方式,關(guān)于本技術(shù),并行地執(zhí)行連續(xù)輸入的聲音信號(hào)到預(yù)定特征量序列的轉(zhuǎn)換和特征量序列相對(duì)于音樂信息的核對(duì)處理的執(zhí)行。這使得能夠進(jìn)行具有良好實(shí)時(shí)能力的音樂識(shí)別。
[0016]在此,關(guān)于本技術(shù),例如,音樂識(shí)別單元可以從核對(duì)處理的對(duì)象中移除在之前的核對(duì)處理中具有小于第二閾值的匹配程度的音樂片段,第二閾值設(shè)置為小于第一閾值。在這種情況下,隨著時(shí)間經(jīng)過可以按順序地縮減核對(duì)處理的對(duì)象,并且可以更高效地執(zhí)行音樂識(shí)別。
[0017]此外,關(guān)于本技術(shù),例如,隨著時(shí)間經(jīng)過,音樂識(shí)別單元可以將第一閾值和/或第二閾值改變?yōu)楦?。在這種情況下,可以精確地識(shí)別音樂片段,而無需從核對(duì)處理的對(duì)象中移除與連續(xù)輸入的聲音信號(hào)相對(duì)應(yīng)的音樂片段。
[0018]此外,例如,本技術(shù)還可以包括音樂再現(xiàn)單元,該音樂再現(xiàn)單元配置成基于關(guān)于音樂片段和正在被歌唱的音樂部分的信息,與連續(xù)輸入的聲音信號(hào)同步地對(duì)所識(shí)別出的音樂片段進(jìn)行再現(xiàn)。在這種情況下,例如,可以提供有效的應(yīng)用,使得用戶可以舒服地跟著所再現(xiàn)的音樂片段繼續(xù)歌唱。在這種情況下,例如,音樂再現(xiàn)單元可以根據(jù)連續(xù)輸入的聲音信號(hào)的音高和節(jié)奏,改變所再現(xiàn)的音樂片段的音高和節(jié)奏。
[0019]此外,例如,本技術(shù)還可以包括顯示控制單元,該顯示控制單元配置成基于核對(duì)處理的信息和音樂識(shí)別的信息,對(duì)音樂識(shí)別進(jìn)展?fàn)顟B(tài)的顯示進(jìn)行控制。在這種情況下,用戶可以容易地發(fā)現(xiàn)音樂識(shí)別進(jìn)展?fàn)顟B(tài)。例如,顯示控制單元可以進(jìn)行控制,以基于處理結(jié)果按匹配程度的降序顯示作為核對(duì)處理的對(duì)象的音樂片段。用戶可以容易地辨識(shí)出哪個(gè)音樂片段要被識(shí)別。
[0020]在這種情況下,還可以包括音樂再現(xiàn)單元,該音樂再現(xiàn)單元配置成基于關(guān)于音樂片段和正在被歌唱的音樂部分的信息,與連續(xù)輸入的聲音信號(hào)同步地對(duì)從所顯示的音樂片段中所選擇的音樂片段進(jìn)行再現(xiàn)。
[0021]在這種情況下,用戶可以選擇與用戶的歌唱相對(duì)應(yīng)的音樂片段,并且可以立即地同步地對(duì)該音樂片段進(jìn)行再現(xiàn)。
[0022]此外,例如,本技術(shù)還可以包括音樂縮減單元,該音樂縮減單元配置成從對(duì)其執(zhí)行了預(yù)定分類的多個(gè)音樂片段中選擇一些音樂片段,并且音樂識(shí)別單元可以將在音樂縮減單元中所選擇的一些音樂片段作為核對(duì)處理中的對(duì)象。例如,預(yù)定分類可以是,根據(jù)類別和藝術(shù)家進(jìn)行的分類,根據(jù)收聽頻率進(jìn)行的分類,或根據(jù)用戶是否喜愛該音樂進(jìn)行的分類等。在這種情況下,可以縮減核對(duì)處理的對(duì)象,并且可以改進(jìn)音樂識(shí)別的精度。此外,因?yàn)榭梢允÷圆槐匾暮藢?duì)處理,所以縮短了識(shí)別音樂所需要的時(shí)間。
[0023]另外,本技術(shù)的另一個(gè)方面是一種聲音處理系統(tǒng),包括經(jīng)由網(wǎng)絡(luò)所連接的聲音再現(xiàn)裝置和服務(wù)器裝置,其中
[0024]聲音再現(xiàn)裝置包括:
[0025]轉(zhuǎn)換單元,配置成將連續(xù)輸入的聲音信號(hào)轉(zhuǎn)換成預(yù)定特征量序列;
[0026]傳送單元,配置成將預(yù)定特征量序列傳送至服務(wù)器裝置;
[0027]接收單元,配置成從服務(wù)器裝置接收音樂識(shí)別信息;和
[0028]音樂再現(xiàn)單元,配置成基于音樂識(shí)別信息,與連續(xù)輸入的聲音信號(hào)同步地對(duì)所識(shí)別出的音樂片段進(jìn)行再現(xiàn),以及
[0029]服務(wù)器裝置包括:
[0030]接收單元,配置成從聲音再現(xiàn)裝置接收預(yù)定特征量序列;
[0031]音樂識(shí)別單元,配置成在累積了預(yù)定量的預(yù)定特征量序列時(shí),按順序地執(zhí)行特征量序列相對(duì)于音樂信息的核對(duì)處理,并且配置成識(shí)別具有大于閾值的匹配程度的音樂片段;和
[0032]傳送單元,配置成將音樂識(shí)別信息傳送至聲音再現(xiàn)裝置。[0033]本技術(shù)是下述聲音處理系統(tǒng):在該聲音處理系統(tǒng)中,聲音再現(xiàn)裝置和服務(wù)器裝置經(jīng)由網(wǎng)絡(luò)連接。在聲音再現(xiàn)裝置中,轉(zhuǎn)換單元將連續(xù)輸入的聲音信號(hào)轉(zhuǎn)換成預(yù)定特征量序列,并且傳送單元將預(yù)定特征量序列傳送至服務(wù)器裝置。
[0034]在服務(wù)器裝置中,接收單元從聲音再現(xiàn)裝置接收預(yù)定特征量序列;音樂識(shí)別單元在累積了預(yù)定量的預(yù)定特征量序列時(shí),按順序執(zhí)行特征量序列相對(duì)于音樂信息的核對(duì)處理并且識(shí)別具有大于閾值的匹配程度的音樂片段;以及傳送單元將音樂識(shí)別信息傳送至聲音再現(xiàn)裝置。
[0035]然后,在聲音再現(xiàn)裝置中,接收單元從服務(wù)器裝置接收音樂識(shí)別信息,并且音樂再現(xiàn)單元基于音樂識(shí)別信息,與連續(xù)輸入的聲音信號(hào)同步地對(duì)所識(shí)別出的音樂片段進(jìn)行再現(xiàn)。
[0036]以這種方式,關(guān)于本技術(shù),因?yàn)椴⑿械貓?zhí)行連續(xù)輸入的聲音信號(hào)到預(yù)定特征量序列的轉(zhuǎn)換和特征量序列相對(duì)于音樂信息的核對(duì)處理的執(zhí)行,所以可以執(zhí)行具有良好實(shí)時(shí)能力的音樂識(shí)別。此外,關(guān)于本技術(shù),基于用戶的歌唱(包括哼唱),可以同步地對(duì)與該歌唱相對(duì)應(yīng)的音樂片段進(jìn)行再現(xiàn),并且聲音再現(xiàn)裝置的用戶可以舒服地跟著所再現(xiàn)的音樂片段繼續(xù)歌唱。此外,根據(jù)本技術(shù),因?yàn)榉?wù)器裝置執(zhí)行包括核對(duì)處理的音樂識(shí)別處理,所以可以降低聲音再現(xiàn)裝置的處理負(fù)荷。
[0037]發(fā)明的效果
[0038]本技術(shù)使得能夠優(yōu)選的識(shí)別與輸入聲音信號(hào)相對(duì)應(yīng)的音樂片段。
【專利附圖】
【附圖說明】
[0039]圖1是示出了作為第一實(shí)施例的聲音處理裝置的配置示例的框圖。
[0040]圖2是示出了在當(dāng)之前的核對(duì)處理結(jié)束時(shí)執(zhí)行核對(duì)處理的情況下的音高檢測(cè)處理和核對(duì)處理的定時(shí)的定時(shí)圖。
[0041]圖3是示出了在每個(gè)排定的時(shí)間執(zhí)行核對(duì)處理的情況下的音高檢測(cè)處理和核對(duì)處理的定時(shí)的定時(shí)圖。
[0042]圖4是用于說明閾值Thh和閾值Thl隨著時(shí)間經(jīng)過變得更大的配置的圖。
[0043]圖5是示出了顯示單元上的顯示轉(zhuǎn)變的示例的圖。
[0044]圖6是用于說明在每當(dāng)之前的核對(duì)處理結(jié)束時(shí)執(zhí)行核對(duì)處理的情況下的聲音處理裝置的操作的流程圖。
[0045]圖7是用于說明在每個(gè)排定的時(shí)間執(zhí)行核對(duì)處理的情況下的聲音處理裝置的操作的流程圖。
[0046]圖8是用于說明包括能夠使得用戶選擇音樂片段的功能的聲音處理裝置的操作的流程圖。
[0047]圖9是示出了作為第二實(shí)施例的聲音處理系統(tǒng)的配置示例的框圖。
[0048]圖10是示出了聲音處理系統(tǒng)中檢測(cè)音高、傳送、接收、以及核對(duì)的各個(gè)處理的定時(shí)的定時(shí)圖。
【具體實(shí)施方式】
[0049]將說明用于實(shí)現(xiàn)本發(fā)明的配置(在下文中,稱為“實(shí)施例”)。在此,將按照下面的順序進(jìn)行說明。
[0050]1.第一實(shí)施例
[0051]2.第二實(shí)施例
[0052]3.修改例
[0053]〈1.第一實(shí)施例>
[0054][聲音處理裝置的配置示例]
[0055]圖1示出了作為第一實(shí)施例的聲音處理裝置100的配置示例。更詳細(xì)地,聲音處理裝置100是具有麥克風(fēng)的便攜式音樂播放器、移動(dòng)電話等。聲音處理裝置100具有輸入單元101、音高檢測(cè)單元102、匹配處理單元103、存儲(chǔ)單元104、顯示單元105、再現(xiàn)控制單元106、存儲(chǔ)單元107以及輸出單元108。
[0056]輸入單元101輸入用戶的歌唱語音(包括哼唱),并輸出與該歌唱語音對(duì)應(yīng)的輸入聲音信號(hào)(語音信號(hào))。輸入單兀101由例如麥克風(fēng)等構(gòu)成。音高檢測(cè)單兀102對(duì)輸入聲音信號(hào)的頻率進(jìn)行分析,并且通過在每個(gè)分析時(shí)間估計(jì)基頻來檢測(cè)音高。
[0057]存儲(chǔ)單元107存儲(chǔ)預(yù)定數(shù)量的音樂片段的數(shù)據(jù)并且構(gòu)成音樂數(shù)據(jù)庫。存儲(chǔ)單元104存儲(chǔ)與在存儲(chǔ)單元107中所存儲(chǔ)的音樂對(duì)應(yīng)的旋律數(shù)據(jù),并且構(gòu)成旋律數(shù)據(jù)庫。在此,旋律數(shù)據(jù)不總是必須與音樂數(shù)據(jù)一一對(duì)應(yīng),而音樂片段中的多個(gè)部分的旋律數(shù)據(jù)可以存儲(chǔ)為單獨(dú)數(shù)據(jù)。例如,一個(gè)音樂片段的旋律數(shù)據(jù)可以存儲(chǔ)為三個(gè)分割的旋律數(shù)據(jù),包括旋律A、旋律B以及主旋律。
[0058]匹配處理單元103執(zhí)行在音高檢測(cè)單元102中所檢測(cè)到的音高序列關(guān)于在存儲(chǔ)單元104中所存儲(chǔ)的各個(gè)音樂片段的旋律數(shù)據(jù)的核對(duì)處理(匹配處理),并且計(jì)算音高序列與各個(gè)音樂片段的旋律數(shù)據(jù)之間的匹配程度。例如,匹配處理單元103將音高序列規(guī)范化為音高線,提取之前的序列中聲音的音高差異,以及使用旋律數(shù)據(jù)的序列和動(dòng)態(tài)編程執(zhí)行核對(duì)處理(匹配處理)。然而,匹配處理單元103中的核對(duì)處理不限于此方法。
[0059]匹配處理單元103在累積了預(yù)定量的音高序列時(shí)執(zhí)行此核對(duì)處理,并且最后識(shí)別出具有最大的并且大于預(yù)定閾值(第一閾值)Thh的匹配程度的音樂片段。在此情況下,匹配處理單元103從核對(duì)處理的對(duì)象中移除在之前的核對(duì)處理中匹配程度小于閾值(第二閾值)Thl的音樂片段。在此,閾值Thl是下述值:該值被設(shè)置為低于閾值Thh,并且該值之前被設(shè)置為與足夠小的匹配程度相對(duì)應(yīng)的值。在此情況下,因?yàn)殡S著時(shí)間經(jīng)過按順序地縮減核對(duì)處理的對(duì)象,所以改進(jìn)了識(shí)別音樂的效率。
[0060]匹配處理單元103重復(fù)如上所述的核對(duì)處理。例如,匹配處理單元103每當(dāng)之前的核對(duì)處理結(jié)束時(shí)執(zhí)行核對(duì)處理。在此情況下,因?yàn)榘错樞虻貓?zhí)行核對(duì)處理,所以期望縮短了識(shí)別音樂所需要的時(shí)間。
[0061]圖2示出了以上情況的定時(shí)圖。在音高檢測(cè)單元102中,從開始時(shí)間按順序執(zhí)行輸入聲音信號(hào)的音高檢測(cè)。在時(shí)間Tl,在匹配處理單元103中,第一核對(duì)處理開始。在第一核對(duì)處理中,基于從開始時(shí)間至?xí)r間Tl所累積的音高序列執(zhí)行核對(duì)處理。
[0062]在第一核對(duì)處理結(jié)束的時(shí)間T2,在匹配處理單元103中,第二核對(duì)處理立即開始。在此第二核對(duì)處理中,基于從時(shí)間Tl至?xí)r間T2所累積的音高序列執(zhí)行核對(duì)處理。此外,在第二核對(duì)處理結(jié)束的時(shí)間T3,在匹配處理單元103中,第三核對(duì)處理立即開始。在此第三核對(duì)處理中,基于從時(shí)間T2至?xí)r間T3所累積的音高序列執(zhí)行核對(duì)處理。[0063]在下文中,以相同的方式重復(fù)核對(duì)處理。在此,如上所述,因?yàn)閺暮藢?duì)處理的對(duì)象中移除在之前的核對(duì)處理中具有小于閾值(第二閾值)Thl的匹配程度的音樂片段,所以每當(dāng)執(zhí)行核對(duì)處理時(shí)縮短了核對(duì)處理所需要的時(shí)間,如圖所示。
[0064]此外,例如,匹配處理單元103在每個(gè)排定的時(shí)間執(zhí)行核對(duì)處理。在此情況下,因?yàn)榕c在之前的核對(duì)處理中需要的時(shí)間無關(guān)、基于足夠的長(zhǎng)度中的音高序列執(zhí)行核對(duì)處理,所以期望有效地執(zhí)行每個(gè)核對(duì)處理。
[0065]圖3示出了以上情況的定時(shí)圖。在音高檢測(cè)單元102中,從開始時(shí)間連續(xù)執(zhí)行輸入聲音信號(hào)的音高檢測(cè)。在時(shí)間T11,在匹配處理單元103中,第一核對(duì)處理開始。在此第一核對(duì)處理中,基于從開始時(shí)間至?xí)r間Tll所累積的音高序列執(zhí)行核對(duì)處理。
[0066]在第一核對(duì)處理結(jié)束之后的時(shí)間T12,在匹配處理單元103中,第二核對(duì)處理開始。在此第二核對(duì)處理中,基于從時(shí)間Tll至?xí)r間T12所累積的音高序列執(zhí)行核對(duì)處理。此夕卜,在第二核對(duì)處理結(jié)束之后的時(shí)間T13,在匹配處理單元103中,第三核對(duì)處理開始。在此第三核對(duì)處理中,基于從時(shí)間T12至?xí)r間T13所累積的音高序列執(zhí)行核對(duì)處理。
[0067]之后,以相同的方式重復(fù)核對(duì)處理。在此,如上所述,因?yàn)閺暮藢?duì)處理的對(duì)象中移除在之前的核對(duì)處理中具有小于閾值(第二閾值)Thl的匹配程度的音樂片段,所以每當(dāng)執(zhí)行核對(duì)處理時(shí)縮短了核對(duì)處理所需要的時(shí)間,如圖所示。
[0068]閾值Thh和閾值Th I可以是固定值,或其中之一或其兩者可以隨著時(shí)間經(jīng)過變大,如圖4所示。當(dāng)以此方式改變閾值時(shí),變得可以精確地識(shí)別與輸入聲音信號(hào)相對(duì)應(yīng)的音樂片段而無需將其從核對(duì)處理的對(duì)象中移除。此外,例如,可以基于另一個(gè)音樂片段的匹配程度設(shè)置閾值Thh,諸如一定值與第二最大匹配程度相加的值。
[0069]此外,在核對(duì)處理中,匹配處理單元103可以從開始起將在存儲(chǔ)單元107中所存儲(chǔ)的所有音樂片段作為核對(duì)處理中的對(duì)象,或可以將對(duì)其執(zhí)行了預(yù)定分類(分類)的音樂片段作為核對(duì)處理中的對(duì)象,該音樂片段例如是預(yù)先通過用戶操作等所選擇的一些音樂片段。在此情況下,由于可以縮減核對(duì)處理的對(duì)象,所以可以改進(jìn)音樂識(shí)別的精度。此外,因?yàn)椴槐貓?zhí)行無用的核對(duì)處理,所以可以縮短識(shí)別音樂片段的時(shí)間。
[0070]在此,可以考慮適應(yīng)于用戶品味的分類。例如,可以存在根據(jù)類別和藝術(shù)家進(jìn)行的分類。此外,可以存在根據(jù)收聽頻率進(jìn)行的分類、基于用戶是否喜愛該音樂進(jìn)行的分類等。在此,關(guān)于對(duì)音樂片段的一部分的選擇,除了通過用戶的操作的情況之外,例如,在根據(jù)頻繁收聽的音樂片段進(jìn)行的分類的情況下,還可以自動(dòng)地選擇預(yù)定數(shù)量的在前的音樂片段作為核對(duì)處理的對(duì)象。此外,可以使得用戶能夠預(yù)先選擇是將所有音樂片段作為核對(duì)處理中的對(duì)象,還是將所選擇的音樂片段作為核對(duì)處理中的對(duì)象。
[0071]顯示單元105基于匹配處理單元103中的核對(duì)處理信息和音樂識(shí)別信息顯示音樂識(shí)別進(jìn)展?fàn)顟B(tài)。顯示單元105例如按匹配程度的降序顯示作為核對(duì)處理的對(duì)象的音樂片段。因?yàn)楹藢?duì)處理的對(duì)象隨著如上所述地重復(fù)核對(duì)處理而減少,所以顯示單元105的顯示相應(yīng)地改變。然后,當(dāng)在匹配處理單元103中識(shí)別出音樂片段時(shí),在顯示單元105上顯示該音樂片段的信息。
[0072]圖5示出了顯示單元105上的顯示的轉(zhuǎn)變的示例。圖5(a)示出了在開始時(shí)間的顯示示例。因?yàn)樵诖硕〞r(shí)未縮減作為核對(duì)處理的對(duì)象的音樂片段,所以顯示了許多音樂片段。圖5(b)示出了歌唱期間的顯示示例。因?yàn)樵诖硕〞r(shí)縮減了作為核對(duì)處理的對(duì)象的音樂片段,所以減少了所顯示的音樂片段的數(shù)量。在此情況下,按匹配程度的降序?qū)ζ溥M(jìn)行顯示。在附圖所示的示例中,“3.CCC”具有最大匹配程度。在此,此時(shí),尚不存在具有大于閾值Thh的匹配程度的音樂片段。圖5(c)是在最后識(shí)別出音樂片段的結(jié)束時(shí)的顯示示例。在此情況下,識(shí)別出音樂片段“16.PPP”。
[0073]當(dāng)在匹配處理單元103中識(shí)別出音樂片段時(shí),再現(xiàn)控制單元106基于關(guān)于音樂片段和正在被歌唱的音樂部分的信息,通過使用在存儲(chǔ)單元107中所存儲(chǔ)的音樂數(shù)據(jù),與輸入聲音信號(hào)同步地對(duì)所識(shí)別出的音樂片段進(jìn)行再現(xiàn)。換言之,再現(xiàn)控制單元106與由用戶正在歌唱的音樂部分同步地對(duì)所識(shí)別出的音樂片段進(jìn)行再現(xiàn)。因?yàn)樵撏皆佻F(xiàn),用戶可以舒服地跟著所再現(xiàn)的音樂片段繼續(xù)歌唱。
[0074]在此,代替簡(jiǎn)單地對(duì)所識(shí)別出的音樂片段進(jìn)行再現(xiàn),再現(xiàn)控制單元106可以根據(jù)輸入的聲音信號(hào)的音高和節(jié)奏(即,用戶歌唱的音高和節(jié)奏)改變所再現(xiàn)的音樂片段的音高和節(jié)奏。
[0075]輸出單元108是與在再現(xiàn)控制單元106中所獲得的音樂片段的再現(xiàn)語音信號(hào)的輸出相關(guān)的部分。輸出單兀108可以如同揚(yáng)聲器一樣自身輸出聲音,可以是要連接至耳機(jī)的端子,或可以是用于與外部揚(yáng)聲器通信的通信單元。
[0076]接下來,將說明圖1中所示的聲音處理裝置100的操作。首先,參照?qǐng)D6中的流程圖,將對(duì)每當(dāng)之前的核對(duì)處理結(jié)束時(shí)執(zhí)行核對(duì)處理的情況進(jìn)行描述。聲音處理裝置100在步驟STl中開始處理,并且繼續(xù)到步驟ST2中的處理。在步驟ST2中,在聲音處理裝置100中,音高檢測(cè)單元102執(zhí)行對(duì)來自輸入單元101的輸入的聲音信號(hào)的頻率分析,以及在每個(gè)分析時(shí)間開始估計(jì)基頻并且檢測(cè)音高。
[0077]接下來,在步驟ST3中,聲音處理裝置100在匹配處理單元103中執(zhí)行核對(duì)處理。在此情況下,聲音處理裝置100執(zhí)行在音高檢測(cè)單元102中所檢測(cè)到的音高序列相對(duì)于在存儲(chǔ)單元104中所存儲(chǔ)的每個(gè)音樂片段的旋律數(shù)據(jù)的核對(duì)處理(匹配處理),并且計(jì)算音高序列與每個(gè)音樂片段的旋律數(shù)據(jù)之間的匹配程度。
[0078]接下來,在步驟ST4中,聲音處理裝置100基于由匹配處理單元103進(jìn)行的核對(duì)處理信息的信息按匹配程度的降序在顯示單元105上顯示作為核對(duì)處理的對(duì)象的音樂片段。接下來,在步驟ST5中,聲音處理裝置100確定最大匹配程度是否大于閾值Thh。當(dāng)最大匹配程度不大于閾值Thh時(shí),聲音處理裝置100繼續(xù)到步驟ST6中的處理。
[0079]在步驟ST6中,聲音處理裝置100確定是否滿足結(jié)束條件。此結(jié)束條件是,例如,在用戶開始歌唱(包括哼唱)之后是否已經(jīng)經(jīng)過了預(yù)定時(shí)間段等。當(dāng)不滿足結(jié)束條件時(shí),聲音處理裝置100繼續(xù)到步驟ST7中的處理。
[0080]在步驟ST7中,聲音處理裝置100從下一個(gè)核對(duì)處理的對(duì)象中移除具有小于閾值Thl的匹配程度的音樂片段。然后,聲音處理裝置100在步驟ST7中的處理之后立即地返回至步驟ST3中的處理,并且重復(fù)上述相同處理。
[0081]此外,在步驟ST5中,在音樂片段之中最大匹配程度大于閾值Thh時(shí),聲音處理裝置100確定具有最大匹配程度的音樂片段是要被識(shí)別的音樂片段。然后,在步驟ST8中,聲音處理裝置100在再現(xiàn)控制單元106中開始基于關(guān)于音樂片段和正在被歌唱的音樂部分的信息,與輸入的聲音信號(hào)同步地對(duì)所識(shí)別出的音樂片段進(jìn)行再現(xiàn)。在步驟ST8中的處理之后,聲音處理裝置100在步驟ST9中結(jié)束處理。[0082]此外,在步驟ST6中,在滿足結(jié)束條件時(shí),當(dāng)在步驟STlO中將再現(xiàn)失敗顯示在顯示單元105上以通知用戶之后,聲音處理裝置100在步驟ST9中結(jié)束處理。
[0083]接下來,參照?qǐng)D7中的流程圖,將對(duì)在每個(gè)排定的時(shí)間執(zhí)行核對(duì)處理的情況進(jìn)行說明。聲音處理裝置100在步驟ST3中的處理之前執(zhí)行步驟STll中的處理。換言之,在步驟ST2中的處理和步驟ST7中的處理之后,聲音處理裝置100繼續(xù)到步驟STll中的處理。
[0084]在步驟STll中,聲音處理裝置100確定從開始時(shí)間起是否已經(jīng)經(jīng)過了指定時(shí)間段。當(dāng)未開始第一核對(duì)處理時(shí),指定時(shí)間段是直到開始第一核對(duì)處理的時(shí)間段,并且在第二核對(duì)處理和后續(xù)核對(duì)處理的情況下該指定時(shí)間段同樣如此。當(dāng)經(jīng)過了指定時(shí)間段時(shí),聲音處理裝置100繼續(xù)到步驟ST3中的處理。盡管省略了詳細(xì)說明,但是圖7的流程圖中的其他步驟與圖6的流程圖中的其他步驟相同。
[0085]如上所述,在圖1所示的聲音處理裝置100中,并行地執(zhí)行連續(xù)輸入的聲音信號(hào)到音高序列的轉(zhuǎn)換和音高序列相對(duì)于與音樂片段相對(duì)應(yīng)的旋律數(shù)據(jù)的核對(duì)處理的執(zhí)行。這使得能夠進(jìn)行具有良好實(shí)時(shí)能力的音樂識(shí)別。換言之,當(dāng)用戶正在歌唱(包括哼唱)時(shí),可以快速地識(shí)別出與該歌唱對(duì)應(yīng)的音樂片段。通過此配置下,用戶不必歌唱長(zhǎng)于最小時(shí)間段。
[0086]此外,在圖1所示的聲音處理裝置100中,當(dāng)重復(fù)音高序列相對(duì)于與音樂片段相對(duì)應(yīng)的旋律數(shù)據(jù)的核對(duì)處理直到最大匹配程度變得大于閾值Thh為止時(shí),從核對(duì)處理的對(duì)象中移除在之前的核對(duì)處理中具有小于閾值Thl的匹配程度的音樂片段。從而,隨著時(shí)間經(jīng)過可以按順序縮減核對(duì)處理的對(duì)象,并且可以高效地執(zhí)行音樂識(shí)別。
[0087]此外,在圖1所示的聲音處理裝置100中,基于關(guān)于信息片段和正在被歌唱的音樂部分的信息,與連續(xù)輸入的聲音信號(hào)同步地對(duì)所識(shí)別出的音樂片段進(jìn)行再現(xiàn)。因?yàn)檫@使得用戶能夠舒服地跟著所再現(xiàn)的音樂片段繼續(xù)歌唱,所以可以提供有效的應(yīng)用。
[0088]此外,在圖1所示的聲音處理裝置100中,基于匹配處理單元103中的核對(duì)處理信息和音樂識(shí)別信息在顯示單元105上顯示音樂識(shí)別進(jìn)展?fàn)顟B(tài)。例如,基于處理結(jié)果按匹配程度的降序顯示作為核對(duì)處理的對(duì)象的音樂片段。從而,用戶可以容易地看到音樂識(shí)別進(jìn)展?fàn)顟B(tài),并且可以容易地發(fā)現(xiàn)哪個(gè)音樂片段要被識(shí)別出。
[0089]在此,根據(jù)以上描述,在核對(duì)處理之后,當(dāng)最大匹配程度大于閾值Thh時(shí),具有該匹配程度的音樂片段被確定為要被識(shí)別出的音樂片段,并且該處理繼續(xù)到對(duì)音樂片段的再現(xiàn)。換言之,該描述是關(guān)于下述情況的:該情況是在識(shí)別出一個(gè)音樂片段之后,處理繼續(xù)到對(duì)音樂片段的再現(xiàn)。然而,用戶可以在按匹配程度的降序顯示在顯示單元105上的音樂片段中發(fā)現(xiàn)用戶正在歌唱的音樂。因此,可以考慮到使得用戶能夠在顯示單元105的顯示器上任意選擇音樂片段,并且該處理立即繼續(xù)到對(duì)選擇的音樂片段的再現(xiàn)。
[0090]圖8的流程圖示出了聲音處理裝置100在以上情況下的操作的示例。在圖8的流程圖中,與圖6的流程圖中的步驟相對(duì)應(yīng)的步驟用相同附圖標(biāo)記來指明,并且將適當(dāng)?shù)厥÷栽敿?xì)描述。在圖8的流程圖中,在步驟ST5中,當(dāng)最大匹配程度不大于閾值Thh時(shí),聲音處理裝置100繼續(xù)到步驟ST12中的處理。
[0091]在步驟ST12中,聲音處理裝置100確定在顯示單元105上所顯示的音樂片段之一是否已經(jīng)被用戶選擇。當(dāng)作出了選擇時(shí),聲音處理裝置100繼續(xù)到步驟ST8中的處理,并且開始在再現(xiàn)控制單元106中基于關(guān)于音樂片段和正在被歌唱的音樂部分的信息與輸入聲音信號(hào)同步地對(duì)所選擇的音樂片段進(jìn)行再現(xiàn)。另一方面,在步驟ST12中當(dāng)未作出選擇時(shí),聲音處理裝置100繼續(xù)到步驟ST6中的處理。盡管省略了詳細(xì)說明,但是圖8的此流程圖中的其他步驟與圖6的流程圖中的其他步驟相同。
[0092]<2.第二實(shí)施例>
[0093][聲音處理系統(tǒng)的配置不例]
[0094]圖9不出了作為第二實(shí)施例的聲音處理系統(tǒng)200的配置不例。聲音處理系統(tǒng)200由經(jīng)由網(wǎng)絡(luò)230所連接的聲音再現(xiàn)裝置210和服務(wù)器裝置220構(gòu)成。具體地,聲音再現(xiàn)裝置210包括網(wǎng)絡(luò)連接功能,并且是包括麥克風(fēng)的便攜式音樂播放器、移動(dòng)電話等。在圖9中,相同附圖標(biāo)記被施加給與圖1中的部分對(duì)應(yīng)的部分,并且任意地省略對(duì)該部分的詳細(xì)描述。
[0095]聲音再現(xiàn)裝置210包括輸入單元101、音高檢測(cè)單元202、壓縮處理單元211、傳送單元212、接收單元213、顯示單元105、再現(xiàn)控制單元106、存儲(chǔ)單元107以及輸出單元108。
[0096]輸入單元101輸入用戶的歌唱語音(包括哼唱),并且輸出與該歌唱語音相對(duì)應(yīng)的輸入聲音信號(hào)(語音信號(hào))。輸入單兀101由例如麥克風(fēng)等構(gòu)成。音高檢測(cè)單兀102執(zhí)行對(duì)輸入聲音信號(hào)的頻率分析,在每個(gè)分析時(shí)間估計(jì)基頻,以及檢測(cè)音高。
[0097]壓縮處理單元211執(zhí)行數(shù)據(jù)壓縮處理等以將在音高檢測(cè)單元102中所檢測(cè)到的音高序列傳送至服務(wù)器裝置220。傳送單元212將對(duì)其執(zhí)行了數(shù)據(jù)壓縮處理等的音高序列經(jīng)由網(wǎng)絡(luò)230傳送至服務(wù)器裝置220。接收單元213接收經(jīng)由網(wǎng)絡(luò)230從服務(wù)器裝置220所傳送的核對(duì)處理信息和音樂識(shí)別信息。音樂識(shí)別信息包括關(guān)于音樂片段和正在被歌唱的音樂部分的信息。
[0098]顯示單元105基于所接收到的核對(duì)處理信息和音樂識(shí)別信息顯示音樂識(shí)別進(jìn)展?fàn)顟B(tài)。在顯示單元105上,例如按匹配程度的降序顯示作為核對(duì)處理的對(duì)象的音樂片段。再現(xiàn)控制單元106基于在所接收到的音樂識(shí)別信息中所包括的關(guān)于音樂片段和正在被歌唱的音樂部分的信息、通過使用在存儲(chǔ)單元107中所存儲(chǔ)的音樂數(shù)據(jù)與輸入聲音信號(hào)同步地對(duì)所識(shí)別出的音樂片段進(jìn)行再現(xiàn)。換言之,再現(xiàn)控制單元106跟著由用戶正在歌唱的音樂部分對(duì)所識(shí)別出的音樂片段進(jìn)行再現(xiàn)。
[0099]輸出單元108是與在再現(xiàn)控制單元106中所獲得的音樂片段的再現(xiàn)語音信號(hào)的輸出相關(guān)的部分。輸出單元108可以如同揚(yáng)聲器一樣自身輸出聲音,或可以是要連接至耳機(jī)的端子,或可以是用于與外部揚(yáng)聲器通信的通信單元。
[0100]服務(wù)器裝置220包括接收單元221、匹配處理單元103、存儲(chǔ)單元104以及傳送單元222。接收單元221經(jīng)由網(wǎng)絡(luò)230從聲音再現(xiàn)裝置210接收對(duì)其執(zhí)行了壓縮處理等的音高序列,并且執(zhí)行解壓縮處理等以獲得與在聲音再現(xiàn)裝置210的音高檢測(cè)單元102中所獲得的首聞序列相同的首聞序列。
[0101]匹配處理單元103執(zhí)行所接收到的音高序列相對(duì)于在存儲(chǔ)單元104中所存儲(chǔ)的每個(gè)音樂片段的旋律數(shù)據(jù)的核對(duì)處理(匹配處理),并且計(jì)算音高序列與每個(gè)片段的旋律數(shù)據(jù)之間的匹配程度。此外,匹配處理單元103針對(duì)間歇地從聲音再現(xiàn)裝置210所接收的每個(gè)預(yù)定量的累積音高序列按順序地執(zhí)行此核對(duì)處理,并且最后識(shí)別具有大于預(yù)定閾值Thh的最大匹配程度的音樂片段。
[0102]傳送單元222將匹配處理單元103中的核對(duì)處理信息和音樂識(shí)別信息經(jīng)由網(wǎng)絡(luò)230傳送至聲音再現(xiàn)裝置210。在此,音樂識(shí)別信息包括關(guān)于音樂片段和正在被歌唱的音樂部分的信息。[0103]將說明圖9中示出的聲音處理系統(tǒng)200的操作。將用戶的歌唱語音(包括哼唱)輸入至輸入單元101,并且從輸入單元101獲得與歌唱語音對(duì)應(yīng)的輸入聲音信號(hào)(語音信號(hào))。將輸入語音信號(hào)提供至音高檢測(cè)單兀102。在音高檢測(cè)單兀102中,對(duì)輸入聲音信號(hào)執(zhí)行頻率分析,在每個(gè)分析時(shí)間估計(jì)基頻,以及檢測(cè)音高。
[0104]將在音高檢測(cè)單元102中所獲得的音高序列提供至壓縮處理單元211。在壓縮處理單元211中,在累積了預(yù)定量的音高序列時(shí),按順序地執(zhí)行數(shù)據(jù)壓縮,并且然后傳送單元212經(jīng)由網(wǎng)絡(luò)230將數(shù)據(jù)傳送至服務(wù)器裝置220。
[0105]在服務(wù)器裝置220中,接收單元221接收從聲音再現(xiàn)裝置210所傳送的音高序列。將音高序列提供至匹配處理單元103。
[0106]在匹配處理單元103中,執(zhí)行所接收到的音高序列相對(duì)于在存儲(chǔ)單元104中所存儲(chǔ)的每個(gè)音樂片段的音高序列的核對(duì)處理(匹配處理),并且計(jì)算音高序列與每個(gè)音樂片段的旋律數(shù)據(jù)之間的匹配程度。在匹配處理單元103中,針對(duì)從聲音再現(xiàn)裝置210間歇地接收的并且累積的每個(gè)預(yù)定量的音高序列按順序地執(zhí)行核對(duì)處理。然后,在匹配處理單元103中,最后識(shí)別具有大于預(yù)定閾值Thh的最大匹配程度的音樂片段。
[0107]由傳送單元222將在匹配處理單元103中所獲得的核對(duì)處理信息和音樂識(shí)別信息經(jīng)由網(wǎng)絡(luò)230傳送至聲音再現(xiàn)裝置210。在聲音再現(xiàn)裝置210中,接收單元213從服務(wù)器裝置220接收新近的核對(duì)處理信息和音樂識(shí)別信息。
[0108]在顯示單元105上,基于所接收到的核對(duì)處理信息和音樂識(shí)別信息顯示音樂識(shí)別進(jìn)展?fàn)顟B(tài)(參見圖5)。此外,在再現(xiàn)控制單元106中,基于在所接收到的音樂識(shí)別信息中所包括的關(guān)于音樂片段和正在被歌唱的音樂部分的信息,通過使用在存儲(chǔ)單元107中所存儲(chǔ)的音樂數(shù)據(jù),與輸入聲音信號(hào)同步地對(duì)所識(shí)別出的音樂片段進(jìn)行再現(xiàn)。換言之,在再現(xiàn)控制單元106中,與用戶正在歌唱的音樂部分同步地對(duì)所識(shí)別出的音樂片段進(jìn)行再現(xiàn)。將在再現(xiàn)控制單元106中所獲得的音樂片段的再現(xiàn)語音信號(hào)提供至輸出單元108。
[0109]圖10的定時(shí)圖示出了圖9的聲音處理系統(tǒng)200中的檢測(cè)音高、傳送、接收以及核對(duì)的處理的定時(shí)圖。在聲音再現(xiàn)裝置210的音高檢測(cè)單元102中,從開始時(shí)間起按順序地執(zhí)行對(duì)輸入聲音信號(hào)的音高檢測(cè)。在開始時(shí)間之后經(jīng)過了預(yù)定時(shí)間段的時(shí)間T21,對(duì)從開始時(shí)間至?xí)r間T21的音高序列執(zhí)行數(shù)據(jù)壓縮,并且將數(shù)據(jù)從傳送單元212傳送至服務(wù)器裝置220。
[0110]在服務(wù)器裝置220中,匹配處理單元103在從聲音再現(xiàn)裝置210接收到音高序列之后的時(shí)間T22開始第一核對(duì)處理?;趶拈_始時(shí)間至?xí)r間T21所累積的音高序列執(zhí)行第一核對(duì)處理。在此核對(duì)處理結(jié)束之后,在時(shí)間T23將核對(duì)處理信息從傳送單元222傳送至聲音再現(xiàn)裝置210。
[0111]此外,在聲音再現(xiàn)裝置210中,在從服務(wù)器裝置220接收到核對(duì)處理信息之后的時(shí)間T24,對(duì)從時(shí)間T21至?xí)r間T24的音高序列執(zhí)行數(shù)據(jù)壓縮,并且將數(shù)據(jù)從傳送單元212傳送至服務(wù)器裝置220。
[0112]在服務(wù)器裝置220中,在從聲音再現(xiàn)裝置210接收到音高序列之后的時(shí)間T25,匹配處理單元103開始第二核對(duì)處理?;趶臅r(shí)間T21至?xí)r間T24所累積的音高序列執(zhí)行第二核對(duì)處理。在此核對(duì)處理結(jié)束之后,在時(shí)間T26,將核對(duì)處理信息從傳送單元222傳送至聲音再現(xiàn)裝置210。[0113]此外,在聲音再現(xiàn)裝置210中,在從服務(wù)器裝置220接收到核對(duì)處理信息之后的時(shí)間T27,對(duì)從時(shí)間T24至?xí)r間T27的音高序列執(zhí)行數(shù)據(jù)壓縮,并且將數(shù)據(jù)從傳送單元212傳送至服務(wù)器裝置220。在服務(wù)器裝置220中,在從聲音再現(xiàn)裝置210接收到音高序列之后的時(shí)間T28,匹配處理單元103開始第三核對(duì)處理。之后,以相同的方式重復(fù)各個(gè)處理。
[0114]如上所述,盡管匹配處理單元103設(shè)置在服務(wù)器裝置220中,但是圖9所示的聲音處理系統(tǒng)200與圖1所示的聲音處理裝置100通常具有相同的配置。因此,可以提供與圖1所示的聲音處理裝置100相同的效果。
[0115]此外,在圖9所示的聲音處理系統(tǒng)200中,匹配處理單元103設(shè)置在服務(wù)器220中,并且在可以改進(jìn)處理能力的服務(wù)器裝置220中執(zhí)行核對(duì)處理(匹配處理)??梢越档吐曇粼佻F(xiàn)裝置210的處理負(fù)荷,并且還可以縮短核對(duì)處理時(shí)間。
[0116]在此,在圖9所示的聲音處理系統(tǒng)200中,音高檢測(cè)單元102設(shè)置在聲音再現(xiàn)裝置210中;然而,音高檢測(cè)單元102還可以設(shè)置在服務(wù)器裝置220中。在此情況下,將輸入聲音信號(hào)從聲音再現(xiàn)裝置210傳送至服務(wù)器裝置220。
[0117]此外,在圖9所示的聲音處理系統(tǒng)200中,再現(xiàn)控制單元106設(shè)置在聲音再現(xiàn)裝置210中;然而,可以考慮將再現(xiàn)控制單元106和存儲(chǔ)單元107設(shè)置在服務(wù)器裝置220中。在此情況下,將所識(shí)別出的音樂片段的再現(xiàn)語音信號(hào)從服務(wù)器裝置220傳送至聲音信號(hào)再現(xiàn)裝置210。
[0118]〈3.修改例〉
[0119]在此,在上述實(shí)施例中,已說明了將用戶的歌唱語音(包括哼唱)輸入至輸入單元101。然而,可以將環(huán)境聲音輸入至輸入單元101。在此,環(huán)境聲音是,例如,街道中播放的音樂片段等。在此情況下,還可以識(shí)別與環(huán)境聲音相對(duì)應(yīng)的音樂片段,并且可以與環(huán)境聲音同步地對(duì)所識(shí)別出的環(huán)境聲音進(jìn)行再現(xiàn)。
[0120]此外,在上述實(shí)施例中,作為預(yù)定特征量序列的示例描述了音高序列;然而,本技術(shù)不限于此示例。該預(yù)定特征量序列可以是其他的特征量序列,諸如音韻序列等。
[0121]此外,本技術(shù)還可以具有下面的配置。
[0122](I) 一種聲音處理裝置,包括:
[0123]轉(zhuǎn)換單元,配置成將連續(xù)輸入的聲音信號(hào)轉(zhuǎn)換成預(yù)定特征量序列;以及
[0124]音樂識(shí)別單元,配置成在累積了預(yù)定量的所述預(yù)定特征量序列時(shí),按順序地執(zhí)行特征量序列相對(duì)于音樂信息的核對(duì)處理,并且配置成識(shí)別具有大于第一閾值的匹配程度的音樂片段。
[0125](2)根據(jù)(I)所述的聲音處理裝置,還包括音樂再現(xiàn)單元,所述音樂再現(xiàn)單元配置成基于關(guān)于所述音樂片段和正在被歌唱的音樂部分的信息,與所述連續(xù)輸入的聲音信號(hào)同步地對(duì)所識(shí)別出的音樂片段進(jìn)行再現(xiàn)。
[0126](3)根據(jù)(I)或(2)所述的聲音處理裝置,其中,所述音樂識(shí)別單元從所述核對(duì)處理的對(duì)象中移除在之前的核對(duì)處理中具有小于第二閾值的匹配程度的音樂片段,所述第二閾值設(shè)置為低于所述第一閾值。
[0127](4)根據(jù)(3)所述的聲音處理裝置,其中,隨著時(shí)間經(jīng)過,所述音樂識(shí)別單元將所述第一閾值和/或所述第二閾值改變?yōu)楦蟆?br>
[0128](5)根據(jù)(2)所述的聲音處理裝置,其中,所述音樂再現(xiàn)單元根據(jù)所述連續(xù)輸入的聲音信號(hào)的音高和節(jié)奏改變所再現(xiàn)的音樂片段的音高和節(jié)奏。
[0129](6)根據(jù)(I)至(5)中任一項(xiàng)所述的聲音處理裝置,還包括顯示控制單元,所述顯示控制單元配置成基于所述核對(duì)處理的信息和音樂識(shí)別的信息,對(duì)音樂識(shí)別進(jìn)展?fàn)顟B(tài)的顯示進(jìn)行控制。
[0130](7)根據(jù)(6)所述的聲音處理裝置,其中,所述顯示控制單元進(jìn)行控制,以基于處理結(jié)果按所述匹配程度的降序顯示作為所述核對(duì)處理的對(duì)象的音樂片段。
[0131](8)根據(jù)(7)所述的聲音處理裝置,還包括音樂再現(xiàn)單元,所述音樂再現(xiàn)單元配置成基于關(guān)于所述音樂片段和正在被歌唱的音樂部分的信息,與所述連續(xù)輸入的聲音信號(hào)同步地對(duì)從所顯示的音樂片段中所選擇的音樂片段進(jìn)行再現(xiàn)。
[0132](9)根據(jù)(I)至(8)中任一項(xiàng)所述的聲音處理裝置,其中,所述音樂識(shí)別單元在每個(gè)排定的時(shí)間執(zhí)行所述核對(duì)處理。
[0133](10)根據(jù)(I)至(8)所述的聲音處理裝置,其中,所述音樂識(shí)別單元在每當(dāng)之前的核對(duì)處理結(jié)束時(shí)執(zhí)行所述核對(duì)處理。
[0134](11)根據(jù)(I)至(10)中任一項(xiàng)所述的聲音處理裝置,還包括音樂縮減單元,所述音樂縮減單元配置成從對(duì)其執(zhí)行了預(yù)定分類的多個(gè)音樂片段中選擇一些音樂片段,
[0135]其中,所述音樂識(shí)別單元將在所述音樂縮減單元中所選擇的一些音樂片段作為所述核對(duì)處理中的對(duì)象。
[0136](12)根據(jù)(11)所述的聲音處理裝置,其中,所述預(yù)定分類是與用戶的偏好相對(duì)應(yīng)的分類。
[0137](13) —種聲音處理方法,包括:
[0138]將連續(xù)輸入的聲音信號(hào)轉(zhuǎn)換成預(yù)定特征量序列;以及
[0139]在累積了預(yù)定量的所述預(yù)定特征量序列時(shí),按順序地執(zhí)行特征量序列相對(duì)于音樂信息的核對(duì)處理,并且識(shí)別具有大于閾值的匹配程度的音樂片段。
[0140](14) 一種使得計(jì)算機(jī)執(zhí)行聲音處理方法的程序,所述聲音處理方法包括:
[0141]將連續(xù)輸入的聲音信號(hào)轉(zhuǎn)換成預(yù)定特征量序列;以及
[0142]在累積了預(yù)定量的所述預(yù)定特征量序列時(shí),按順序地執(zhí)行特征量序列相對(duì)于音樂信息的核對(duì)處理,并且識(shí)別具有大于閾值的匹配程度的音樂片段。
[0143](15) 一種計(jì)算機(jī)可讀的并且存儲(chǔ)有使得計(jì)算機(jī)執(zhí)行聲音處理方法的記錄介質(zhì),所述聲音處理方法包括:
[0144]將連續(xù)輸入的聲音信號(hào)轉(zhuǎn)換成預(yù)定特征量序列;以及
[0145]在累積了預(yù)定量的所述預(yù)定特征量序列時(shí),按順序地執(zhí)行特征量序列相對(duì)于音樂信息的核對(duì)處理,并且識(shí)別具有大于閾值的匹配程度的音樂片段。
[0146](16) 一種服務(wù)器裝置,包括:
[0147]接收單元,配置成從外部裝置接收通過對(duì)連續(xù)輸入的聲音信號(hào)進(jìn)行轉(zhuǎn)換所獲得的預(yù)定特征量序列;
[0148]音樂識(shí)別單元,配置成在累積了預(yù)定量的所述預(yù)定特征量序列時(shí),按順序地執(zhí)行特征量序列相對(duì)于音樂信息的核對(duì)處理,并且配置成識(shí)別具有大于閾值的匹配程度的音樂片段;以及
[0149]傳送單元,配置成將音樂識(shí)別信息的信息傳送至所述外部裝置。[0150](17) 一種聲音再現(xiàn)裝置,包括:
[0151]轉(zhuǎn)換單元,配置成將連續(xù)輸入的聲音信號(hào)轉(zhuǎn)換成預(yù)定特征量序列;
[0152]傳送單元,配置成將所述預(yù)定特征量序列傳送至外部裝置;
[0153]接收單元,配置成從所述外部裝置接收音樂識(shí)別信息,所述音樂識(shí)別信息是通過在累積了預(yù)定量的所述預(yù)定特征量序列時(shí)按順序地執(zhí)行特征量序列相對(duì)于音樂信息的核對(duì)處理并且識(shí)別具有大于閾值的匹配程度的音樂片段所獲得的;以及
[0154]音樂再現(xiàn)單元,配置成基于所述音樂識(shí)別信息,與所述連續(xù)輸入的聲音信號(hào)同步地對(duì)所識(shí)別出的音樂片段進(jìn)行再現(xiàn)。
[0155](18) 一種聲音處理系統(tǒng),包括經(jīng)由網(wǎng)絡(luò)所連接的聲音再現(xiàn)裝置和服務(wù)器裝置,其中
[0156]所述聲音再現(xiàn)裝置包括:
[0157]轉(zhuǎn)換單元,配置成將連續(xù)輸入的聲音信號(hào)轉(zhuǎn)換成預(yù)定特征量序列;
[0158]傳送單元,配置成將所述預(yù)定特征量序列傳送至所述服務(wù)器裝置;
[0159]接收單元,配置成從所述服務(wù)器裝置接收音樂識(shí)別信息;和
[0160]音樂再現(xiàn)單元,配置成基于所述音樂識(shí)別信息,與所述連續(xù)輸入的聲音信號(hào)同步地對(duì)所識(shí)別出的音樂片段進(jìn)行再現(xiàn),以及
[0161]所述服務(wù)器裝置包括:
[0162]接收單元,配置成從所述聲音再現(xiàn)裝置接收所述預(yù)定特征量序列;
[0163]音樂識(shí)別單元,配置成在累積了預(yù)定量的所述預(yù)定特征量序列時(shí),按順序地執(zhí)行特征量序列相對(duì)于音樂信息的核對(duì)處理,并且配置成識(shí)別具有大于閾值的匹配程度的音樂片段;和
[0164]傳送單元,配置成將所述音樂識(shí)別信息傳送至所述聲音再現(xiàn)裝置。
[0165](19) 一種聲音處理裝置,包括:
[0166]轉(zhuǎn)換單元,配置成將連續(xù)輸入的聲音信號(hào)轉(zhuǎn)換成預(yù)定特征量序列;
[0167]音樂識(shí)別單元,配置成在累積了預(yù)定量的所述預(yù)定特征量序列時(shí),按順序地執(zhí)行特征量序列相對(duì)于音樂信息的核對(duì)處理,并且配置成識(shí)別具有大于閾值的匹配程度的音樂片段;以及
[0168]音樂再現(xiàn)單元,配置成基于關(guān)于所述音樂片段和正在被歌唱的音樂部分的信息,與所述連續(xù)輸入的聲音信號(hào)同步地對(duì)所識(shí)別出的音樂片段進(jìn)行再現(xiàn)。
[0169]附圖標(biāo)記列表
[0170]100聲音處理裝置
[0171]101輸入單元
[0172]102音高檢測(cè)單元
[0173]103匹配處理單元
[0174]104、107 存儲(chǔ)單元
[0175]105 顯示單元
[0176]106再現(xiàn)控制單元
[0177]108輸出單元
[0178]200聲音處理系統(tǒng)[0179]210聲音再現(xiàn)裝置
[0180]211壓縮處理單元
[0181]212傳送單元
[0182]213接收單元
[0183]220服務(wù)器裝置
[0184]221接收單元
[0185]222傳送單元
[0186]230 網(wǎng)絡(luò)
【權(quán)利要求】
1.一種聲音處理裝置,包括: 轉(zhuǎn)換單元,配置成將連續(xù)輸入的聲音信號(hào)轉(zhuǎn)換成預(yù)定特征量序列;以及 音樂識(shí)別單元,配置成在累積了預(yù)定量的所述預(yù)定特征量序列時(shí),按順序地執(zhí)行特征量序列相對(duì)于音樂信息的核對(duì)處理,并且配置成識(shí)別具有大于第一閾值的匹配程度的音樂片段。
2.根據(jù)權(quán)利要求1所述的聲音處理裝置,還包括音樂再現(xiàn)單元,所述音樂再現(xiàn)單元配置成基于關(guān)于所述音樂片段和正在被歌唱的音樂部分的信息,與所述連續(xù)輸入的聲音信號(hào)同步地對(duì)所識(shí)別出的音樂片段進(jìn)行再現(xiàn)。
3.根據(jù)權(quán)利要求1所述的聲音處理裝置,其中,所述音樂識(shí)別單元從所述核對(duì)處理的對(duì)象中移除在之前的核對(duì)處理中具有小于第二閾值的匹配程度的音樂片段,所述第二閾值設(shè)置為低于所述第一閾值。
4.根據(jù)權(quán)利要求3所述的聲音處理裝置,其中,隨著時(shí)間經(jīng)過,所述音樂識(shí)別單元將所述第一閾值和/或所述第二閾值改變?yōu)楦蟆?br>
5.根據(jù)權(quán)利要求2所述的聲音處理裝置,其中,所述音樂再現(xiàn)單元根據(jù)所述連續(xù)輸入的聲音信號(hào)的音高和節(jié)奏,改變所再現(xiàn)的音樂片段的音高和節(jié)奏。
6.根據(jù)權(quán)利要求1所述的聲音處理裝置,還包括顯示控制單元,所述顯示控制單元配置成基于所述核對(duì)處理的信息和音樂識(shí)別的信息,對(duì)音樂識(shí)別進(jìn)展?fàn)顟B(tài)的顯示進(jìn)行控制。
7.根據(jù)權(quán)利要求6所述的聲音處理裝置,其中,所述顯示控制單元進(jìn)行控制,以基于處理結(jié)果按所述匹配程度的降序顯示作為所述核對(duì)處理的對(duì)象的音樂片段。
8.根據(jù)權(quán)利要求7所述的聲音處理裝置,還包括音樂再現(xiàn)單元,所述音樂再現(xiàn)單元配置成基于關(guān)于所述音樂片段和正在被歌唱的音樂部分的信息,與所述連續(xù)輸入的聲音信號(hào)同步地對(duì)從所顯示的音樂片段中所選擇的音樂片段進(jìn)行再現(xiàn)。
9.根據(jù)權(quán)利要求1所述的聲音處理裝置,其中,所述音樂識(shí)別單元在每個(gè)排定的時(shí)間執(zhí)行所述核對(duì)處理。
10.根據(jù)權(quán)利要求1所述的聲音處理裝置,其中,所述音樂識(shí)別單元在每當(dāng)之前的核對(duì)處理結(jié)束時(shí)執(zhí)行所述核對(duì)處理。
11.根據(jù)權(quán)利要求1所述的聲音處理裝置,還包括音樂縮減單元,所述音樂縮減單元配置成從對(duì)其執(zhí)行了預(yù)定分類的多個(gè)音樂片段中選擇一些音樂片段, 其中,所述音樂識(shí)別單元將在所述音樂縮減單元中所選擇的一些音樂片段作為所述核對(duì)處理中的對(duì)象。
12.根據(jù)權(quán)利要求11所述的聲音處理裝置,其中,所述預(yù)定分類是與用戶的偏好相對(duì)應(yīng)的分類。
13.一種聲音處理方法,包括: 將連續(xù)輸入的聲音信號(hào)轉(zhuǎn)換成預(yù)定特征量序列;以及 在累積了預(yù)定量的所述預(yù)定特征量序列時(shí),按順序地執(zhí)行特征量序列相對(duì)于音樂信息的核對(duì)處理,并且識(shí)別具有大于閾值的匹配程度的音樂片段。
14.一種使得計(jì)算機(jī)執(zhí)行聲音處理方法的程序,所述聲音處理方法包括: 將連續(xù)輸入的聲音信號(hào)轉(zhuǎn)換成預(yù)定特征量序列;以及 在累積了預(yù)定量的所述預(yù)定特征量序列時(shí),按順序地執(zhí)行特征量序列相對(duì)于音樂信息的核對(duì)處理,并且識(shí)別具有大于閾值的匹配程度的音樂片段。
15.一種計(jì)算機(jī)可讀的并且存儲(chǔ)有使得計(jì)算機(jī)執(zhí)行聲音處理方法的記錄介質(zhì),所述聲音處理方法包括: 將連續(xù)輸入的聲音信號(hào)轉(zhuǎn)換成預(yù)定特征量序列;以及 在累積了預(yù)定量的所述預(yù)定特征量序列時(shí),按順序地執(zhí)行特征量序列相對(duì)于音樂信息的核對(duì)處理,并且識(shí)別具有大于閾值的匹配程度的音樂片段。
16.一種服務(wù)器裝置,包括: 接收單元,配置成從外部裝置接收通過對(duì)連續(xù)輸入的聲音信號(hào)進(jìn)行轉(zhuǎn)換所獲得的預(yù)定特征量序列; 音樂識(shí)別單元,配置成在累積了預(yù)定量的所述預(yù)定特征量序列時(shí),按順序地執(zhí)行特征量序列相對(duì)于音樂信息的核對(duì)處理,并且配置成識(shí)別具有大于閾值的匹配程度的音樂片段;以及 傳送單元,配置成將音樂識(shí)別信息的信息傳送至所述外部裝置。
17.一種聲音再現(xiàn)裝置,包括: 轉(zhuǎn)換單元,配置成將連續(xù)輸入的聲音信號(hào)轉(zhuǎn)換成預(yù)定特征量序列; 傳送單元,配置成將所述預(yù)定特征量序列傳送至外部裝置; 接收單元,配置成從所述外部裝置接收音樂識(shí)別信息,所述音樂識(shí)別信息是通過在累積了預(yù)定量的所述預(yù)定特征量序列時(shí)按順序地執(zhí)行特征量序列相對(duì)于音樂信息的核對(duì)處理并且識(shí)別具有大于閾值的匹配程度的音樂片段所獲得的;以及 音樂再現(xiàn)單元,配置成基于所述音樂識(shí)別信息,與所述連續(xù)輸入的聲音信號(hào)同步地對(duì)所識(shí)別出的音樂片段進(jìn)行再現(xiàn)。
18.一種聲音處理系統(tǒng),包括經(jīng)由網(wǎng)絡(luò)所連接的聲音再現(xiàn)裝置和服務(wù)器裝置,其中 所述聲音再現(xiàn)裝置包括: 轉(zhuǎn)換單元,配置成將連續(xù)輸入的聲音信號(hào)轉(zhuǎn)換成預(yù)定特征量序列; 傳送單元,配置成將所述預(yù)定特征量序列傳送至所述服務(wù)器裝置; 接收單元,配置成從所述服務(wù)器裝置接收音樂識(shí)別信息;和 音樂再現(xiàn)單元,配置成基于所述音樂識(shí)別信息,與所述連續(xù)輸入的聲音信號(hào)同步地對(duì)所識(shí)別出的音樂片段進(jìn)行再現(xiàn),以及所述服務(wù)器裝置包括: 接收單元,配置成從所述聲音再現(xiàn)裝置接收所述預(yù)定特征量序列; 音樂識(shí)別單元,配置成在累積了預(yù)定量的所述預(yù)定特征量序列時(shí),按順序地執(zhí)行特征量序列相對(duì)于音樂信息的核對(duì)處理,并且配置成識(shí)別具有大于閾值的匹配程度的音樂片段;和 傳送單元,配置成將所述音樂識(shí)別信息傳送至所述聲音再現(xiàn)裝置。
19.一種聲音處理裝置,包括: 轉(zhuǎn)換單元,配置成將連續(xù)輸入的聲音信號(hào)轉(zhuǎn)換成預(yù)定特征量序列; 音樂識(shí)別單元,配置成在累積了預(yù)定量的所述預(yù)定特征量序列時(shí),按順序地執(zhí)行特征量序列相對(duì)于音樂信息的核對(duì)處理,并且配置成識(shí)別具有大于閾值的匹配程度的音樂片段;以及音樂再現(xiàn)單元,配置成基于關(guān)于所述音樂片段和正在被歌唱的音樂部分的信息,與所述連續(xù)輸入的聲音 信號(hào)同步地對(duì)所識(shí)別出的音樂片段進(jìn)行再現(xiàn)。
【文檔編號(hào)】G10H1/00GK103988256SQ201280058754
【公開日】2014年8月13日 申請(qǐng)日期:2012年11月28日 優(yōu)先權(quán)日:2011年12月5日
【發(fā)明者】角尾衣未留, 井上晃 申請(qǐng)人:索尼公司