專利名稱:音樂詞匯文件索引建立方法及其裝置、音樂詞匯搜索方法及其系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及音樂搜索,尤其涉及一種音樂詞匯文件索引建立方法及其裝置、音樂詞匯搜索方法及其系統(tǒng)。
背景技術(shù):
目前在音樂搜索領(lǐng)域中,傳統(tǒng)搜索引擎一般以用戶輸入的詞匯作為搜索關(guān)鍵字, 在索引引擎中直接搜索該詞匯的索引文件,然后返回相關(guān)結(jié)果。對于搜索關(guān)鍵字,就音樂詞匯詞性層面而言,其一般具有多重詞性,如,“棉花糖” 一詞既具有單曲詞性,也具有藝人詞性,即“棉花糖”既可代表某單曲,又可指代某藝人。如果用戶輸入詞匯“棉花糖”,那么返回結(jié)果存在兩方面的問題,一是結(jié)果不夠準確,它既包含意為單曲的“棉花糖”,又包括指代藝人的“棉花糖” ;二是結(jié)果排序不合理,指代不同語義的“棉花糖”結(jié)果數(shù)據(jù)是無序的。而實際上,如果在某段特定時間內(nèi),“棉花糖”是一首比較流行的歌曲,那么大多數(shù)用戶在搜索時,最希望首先搜索出“棉花糖”這首單曲,而不太會關(guān)注“棉花糖”這個藝人,反之亦然。因此這種搜索方式在搜索時就不能針對用戶的需求進行個性化的語義搜索。此外,在網(wǎng)絡(luò)限制和搜索終端限制的領(lǐng)域內(nèi),如移動終端,如果不能針對性地進行搜索,大量的搜索結(jié)果會降低移動終端的搜索性能,同時也影響用戶及時快速地獲得自己所需要的搜索結(jié)果。
發(fā)明內(nèi)容
為了解決上述問題,本發(fā)明的一種目的是提供一種音樂詞匯文件索引建立方法及其裝置,以使音樂詞匯文件索引能夠以用戶的需求來個性化并準確性地將合適的音樂詞匯詞性快速簡單地調(diào)用出來,從而能夠進行后續(xù)相應(yīng)的音樂實體調(diào)用。為了實現(xiàn)上述目的,本發(fā)明提供了一種音樂詞匯文件索引建立方法,所述方法適用于具有搜索服務(wù)的搜索系統(tǒng)中,包括以下步驟Sl 根據(jù)所述搜索系統(tǒng)中用戶對某一音樂詞匯的搜索日志,將所述音樂詞匯劃分為不同的詞性,并根據(jù)搜索熱度和/或所述不同詞性的流行趨勢對所述音樂詞匯的不同詞性設(shè)置優(yōu)先級策略;S2:將所述音樂詞匯的不同詞性及其優(yōu)先級策略更新或增加在所述搜索系統(tǒng)中所設(shè)置的音樂詞匯字典中;S3 將所述音樂詞匯字典中的數(shù)據(jù)實時同步到所述搜索系統(tǒng)的數(shù)據(jù)庫中;S4:以所述搜索系統(tǒng)數(shù)據(jù)庫中的詞性信息為輸入,通過所述搜索系統(tǒng)中的索引引擎生成音樂詞匯文件索引。根據(jù)本發(fā)明的一個實施例,其中所述優(yōu)先級策略為分別對所述音樂詞匯的不同詞性設(shè)置由高到低的優(yōu)先級,或?qū)⑺鲆魳吩~匯中具有最高搜索熱度和/或最流行的詞性設(shè)置為最高優(yōu)先級。
根據(jù)本發(fā)明的一個實施例,其中所述音樂詞匯的詞性包括單曲、專輯以及藝人中的至少兩種。相應(yīng)地,本發(fā)明還提供一種音樂詞匯文件索引建立裝置,所述裝置設(shè)置在具有搜索服務(wù)的搜索系統(tǒng)中,所述裝置包括詞性信息設(shè)置模塊,用于根據(jù)所述搜索系統(tǒng)中用戶對某一音樂詞匯的搜索日志, 將所述音樂詞匯劃分為不同的詞性,并根據(jù)搜索熱度和/或所述不同詞性的流行趨勢對所述音樂詞匯的不同詞性設(shè)置優(yōu)先級策略;存儲模塊,用于將所述音樂詞匯的不同詞性及其優(yōu)先級策略更新或增加在所述搜索系統(tǒng)中所設(shè)置的音樂詞匯字典中;同步模塊,用于所述音樂詞匯字典中的數(shù)據(jù)實時同步到所述搜索系統(tǒng)的數(shù)據(jù)庫中;索引生成模塊,用于以所述搜索系統(tǒng)數(shù)據(jù)庫中的詞性信息為輸入,通過所述搜索系統(tǒng)中的索引引擎生成音樂詞匯文件索引。根據(jù)本發(fā)明的一個實施例,其中所述詞性信息設(shè)置模塊還包括優(yōu)先級策略設(shè)置模塊,用于分別對所述音樂詞匯的不同詞性設(shè)置由高到低的優(yōu)先級,或?qū)⑺鲆魳吩~匯中具有最高搜索熱度和/或最流行的詞性設(shè)置為最高優(yōu)先級。本發(fā)明的另一目的是提供一種音樂搜索方法,以使能夠針對性快速地獲得用戶所需要的搜索結(jié)果。為了實現(xiàn)上述目的本發(fā)明提供一種音樂詞匯搜索方法,包括以下步驟Sll 接收用戶輸入的音樂詞匯關(guān)鍵字;S12:通過上述的音樂詞匯文件索引建立裝置所建立的文件索引,對所述音樂詞匯關(guān)鍵字進行搜索,獲得所述音樂詞匯關(guān)鍵字的詞性信息,其中所述詞性信息包括所述音樂詞匯關(guān)鍵字的不同詞性及其優(yōu)先級策略;S13 根據(jù)所述獲得詞性信息中的優(yōu)先級策略,調(diào)用相應(yīng)的音樂實體;S14 將結(jié)果返回給用戶。根據(jù)本發(fā)明的一個實施例,其中所述優(yōu)先級策略為分別對所述音樂詞匯關(guān)鍵字的不同詞性設(shè)置由高到低的優(yōu)先級,或?qū)⑺鲆魳吩~匯關(guān)鍵字中具有最高搜索熱度和/或最流行的詞性設(shè)置為最高優(yōu)先級。根據(jù)本發(fā)明的一個實施例,其中所述步驟S13具體為根據(jù)所述音樂詞匯關(guān)鍵字中不同詞性的由高到低的優(yōu)先級,調(diào)用其相應(yīng)的音樂實體;或調(diào)用所述音樂詞匯關(guān)鍵字中具有最高優(yōu)先級詞性的相應(yīng)音樂實體。本發(fā)明還提供一種音樂詞匯搜索系統(tǒng),包括上述音樂詞匯文件索引生成裝置;音樂詞匯字典,用于存儲所述音樂詞匯文件索引生成裝置中的詞性信息;數(shù)據(jù)庫,與所述音樂詞匯字典同步,用于存儲音樂實體以及與所述音樂詞匯字典同步的詞性信息數(shù)據(jù);索引引擎,用于以所述數(shù)據(jù)庫中的詞性信息數(shù)據(jù)為輸入生成所述文件索引,并在接收到用戶輸入的音樂詞匯關(guān)鍵字時通過所述文件索引獲得所述關(guān)鍵字的詞性信息;搜索引擎,用于根據(jù)所述索引引擎獲得所述關(guān)鍵字的詞性信息,在所述數(shù)據(jù)庫中調(diào)用相應(yīng)的音樂實體。
由上述技術(shù)方案可知,本發(fā)明通過對用戶的搜索日志統(tǒng)計(即用戶對搜索結(jié)果列表中的某一條結(jié)果的點擊次數(shù)統(tǒng)計),同時結(jié)合當下的音樂流行趨勢,對于音樂詞匯進行詞性劃分及其優(yōu)先級設(shè)置(如一個詞匯具有多重詞性時)。這樣,詞性作為基礎(chǔ)信息被存儲, 豐富了音樂基礎(chǔ)信息的完整性,為今后的其他服務(wù)提供了良好的數(shù)據(jù)支持。并且詞性隨當下的音樂流行趨勢而確定,使得搜索更加具有針對性,搜索結(jié)果更加合理。
圖1為本發(fā)明的建立音樂詞匯文件索引的方法示意圖;圖2為本發(fā)明的一種音樂詞匯文件索引建立方法的流程圖;圖3為本發(fā)明的一種音樂詞匯文件索引建立裝置的結(jié)構(gòu)框圖;圖4為本發(fā)明的一種音樂詞匯搜索方法的流程圖;圖5為本發(fā)明的搜索音樂詞匯一種實施例的示意圖。
具體實施例方式下面將詳細描述本發(fā)明的具體實施例。應(yīng)當注意,這里描述的實施例只用于舉例說明,并不用于限制本發(fā)明。本發(fā)明適用于具有一般搜索服務(wù)的搜索系統(tǒng),該搜索系統(tǒng)中包括有索引引擎、搜索引擎以及存儲有所搜索數(shù)據(jù)的數(shù)據(jù)庫,本發(fā)明的主要構(gòu)思在于,通過對搜索系統(tǒng)中用戶的搜索日志進行統(tǒng)計分析,獲得某一音樂詞匯的詞性信息,從而建立基于詞性信息的音樂詞匯文件索引,然后在搜索時根據(jù)該文件索引,快速地判斷出用戶所需要的音樂詞性,并進而根據(jù)該詞性,搜索出相應(yīng)的音樂實體。如上所述,在本發(fā)明在提供搜索服務(wù)之前,需要預(yù)先建立好音樂詞匯的文件索引, 而該文件索引是基于音樂詞匯的詞性信息所生成的,這樣本發(fā)明所建立的文件索引,能夠以用戶的需求來個性化并準確地將合適的音樂詞匯詞性快速簡單地調(diào)用出來,從而能夠進行后續(xù)相應(yīng)的音樂實體調(diào)用。具體地,本發(fā)明提供一種音樂詞匯文件索引建立方法,如圖1和圖2所示,包括以下步驟步驟Sl 根據(jù)搜索系統(tǒng)中用戶對某一音樂詞匯的搜索日志,將所述音樂詞匯劃分為不同的詞性,并根據(jù)搜索熱度和/或所述不同詞性的流行趨勢對所述音樂詞匯的不同詞性設(shè)置優(yōu)先級策略;一般音樂詞匯會具有“單曲”、“專輯”以及“藝人”等不同詞性,比如,“棉花糖”在用戶的搜索日志或者在當前音樂信息中具有兩種詞性,單曲詞性和藝人詞性,也就是說,用戶在搜索“棉花糖”時,可能會獲得兩種結(jié)果,一種是“棉花糖”作為單曲時的搜索結(jié)果,另一種則是作為“棉花糖”這個藝人的搜索結(jié)果;而在用戶搜索日志中對這兩種詞性搜索結(jié)果分析表明,“棉花糖”作為單曲詞性的搜索點擊次數(shù)要遠遠高于其作為藝人詞性的點擊次數(shù), 因此,本發(fā)明先根據(jù)搜索系統(tǒng)中的用戶搜索日志,獲得音樂詞匯所具有的不同詞性,然后根據(jù)這些詞性的搜索熱度進行搜索優(yōu)先級的策略設(shè)置。對于上述詞性的劃分及其優(yōu)先級策略的設(shè)置,也可根據(jù)音樂詞匯不同詞性的流行趨勢,由音樂專家對所述音樂詞匯進行更加專業(yè)化的劃分,進一步提高所劃分的詞性的準確性,或者對于某些音樂詞匯,在用戶的搜索日志中暫時沒有分析出所具有的詞性,由音樂專家根據(jù)這些音樂詞匯當前各種詞性的流行度,人工設(shè)置這些音樂詞匯的不同詞性及其優(yōu)先級策略。在設(shè)置優(yōu)先級策略時,可對搜索熱度高的詞性設(shè)置高的優(yōu)先級,對搜索熱度低的詞性設(shè)置低的優(yōu)先級,或者將搜索熱度最高的詞性設(shè)置為最優(yōu)先,如表1中,將音樂詞匯的不同詞性通過二進制標示出來,在設(shè)置優(yōu)先級時直接將搜索度最高的詞性相應(yīng)的二進制數(shù)設(shè)置為最高優(yōu)先級調(diào)用出來,比如,“棉花糖”具有單曲和藝人兩種詞性,其單曲詞性標示為 001,其藝人詞性標示為100,由于棉花糖的單曲詞性比其藝人詞性的搜索熱度高,因此,將棉花糖的單曲詞性標示為最高優(yōu)先級,也即將其詞性優(yōu)先級策略設(shè)置為1,同樣,比如,劉德華具有單曲、專輯以及藝人三種詞性,其單曲詞性表示為001,其專輯詞性標示為010,其藝人詞性標示為100,而在劉德華的用戶搜索日志中分析可知,劉德華作為藝人詞性的搜索熱度最高,因此將劉德華的藝人詞性標示為最高優(yōu)先級,也即將其詞性優(yōu)先級設(shè)置為4 (對應(yīng)二進制數(shù)100),如表1所示表 權(quán)利要求
1.一種音樂詞匯文件索引建立方法,所述方法適用于具有搜索服務(wù)的搜索系統(tǒng)中,其特征在于,所述方法包括以下步驟Sl 根據(jù)所述搜索系統(tǒng)中用戶對音樂詞匯的搜索日志,將所述音樂詞匯劃分為不同的詞性,并根據(jù)搜索熱度和/或所述不同詞性的流行趨勢對所述音樂詞匯的不同詞性設(shè)置優(yōu)先級策略;S2:將包括有所述音樂詞匯、所述音樂詞匯的不同詞性及其優(yōu)先級策略的詞性信息存儲在所述搜索系統(tǒng)中所設(shè)置的音樂詞匯字典中;53將所述音樂詞匯字典中的詞性信息實時同步到所述搜索系統(tǒng)的數(shù)據(jù)庫中;54以所述搜索系統(tǒng)數(shù)據(jù)庫中的詞性信息為輸入,通過所述搜索系統(tǒng)中的索引引擎生成音樂詞匯文件索引。
2.根據(jù)權(quán)利要求1所述的音樂詞匯文件索引建立方法,其特征在于,所述設(shè)置優(yōu)先級策略為分別對所述音樂詞匯的不同詞性設(shè)置由高到低的優(yōu)先級,或?qū)⑺鲆魳吩~匯中具有最高搜索熱度和/或最流行的詞性設(shè)置為最高優(yōu)先級。
3.根據(jù)權(quán)利要求1或2所述的音樂詞匯文件索引建立方法,其特征在于,所述音樂詞匯的詞性包括單曲、專輯以及藝人中的至少兩種。
4.一種音樂詞匯文件索引建立裝置,所述裝置設(shè)置在具有搜索服務(wù)的搜索系統(tǒng)中,其特征在于,所述裝置包括詞性信息設(shè)置模塊,用于根據(jù)所述搜索系統(tǒng)中用戶對音樂詞匯的搜索日志,將所述音樂詞匯劃分為不同的詞性,并根據(jù)搜索熱度和/或所述不同詞性的流行趨勢對所述音樂詞匯的不同詞性設(shè)置優(yōu)先級策略;存儲模塊,用于將包括有所述音樂詞匯、所述音樂詞匯的不同詞性及其優(yōu)先級策略的詞性信息存儲在所述搜索系統(tǒng)中所設(shè)置的音樂詞匯字典中;同步模塊,用于所述音樂詞匯字典中的詞性信息實時同步到所述搜索系統(tǒng)的數(shù)據(jù)庫中;索引生成模塊,用于以所述搜索系統(tǒng)的數(shù)據(jù)庫中的詞性信息為輸入,通過所述搜索系統(tǒng)中的索引引擎生成音樂詞匯文件索引。
5.根據(jù)權(quán)利要求4所述的音樂詞匯文件索引建立裝置,其特征在于,所述詞性信息設(shè)置模塊還包括優(yōu)先級策略設(shè)置模塊,用于分別對所述音樂詞匯的不同詞性設(shè)置由高到低的優(yōu)先級,或?qū)⑺鲆魳吩~匯中具有最高搜索熱度和/或最流行的詞性設(shè)置為最高優(yōu)先級。
6.一種音樂詞匯搜索方法,其特征在于,所述方法包括以下步驟511接收用戶輸入的音樂詞匯關(guān)鍵字;512通過權(quán)利要求4所述的音樂詞匯文件索引建立裝置所建立的文件索引,對所述音樂詞匯關(guān)鍵字進行搜索,獲得所述音樂詞匯關(guān)鍵字的詞性信息,其中所述詞性信息包括所述音樂詞匯關(guān)鍵字的不同詞性及其優(yōu)先級策略;513根據(jù)所述獲得詞性信息中的詞性及其優(yōu)先級策略,調(diào)用相應(yīng)的音樂實體;S14:將結(jié)果返回給用戶。
7.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述步驟S12中所述優(yōu)先級策略為所述音樂詞匯關(guān)鍵字的不同詞性具有由高到低的優(yōu)先級,或所述音樂詞匯關(guān)鍵字中具有最高搜索熱度和/或最流行的詞性具有最高優(yōu)先級。
8.根據(jù)權(quán)利要求7所述的方法,其特征在于,所述步驟S13具體為根據(jù)所述音樂詞匯關(guān)鍵字中不同詞性的由高到低的優(yōu)先級,調(diào)用其相應(yīng)的音樂實體; 或調(diào)用所述音樂詞匯關(guān)鍵字中具有最高優(yōu)先級詞性的相應(yīng)音樂實體。
9.一種音樂詞匯搜索系統(tǒng),其特征在于,所述系統(tǒng)包括 權(quán)利要求4所述的音樂詞匯文件索引生成裝置;音樂詞匯字典,用于存儲所述音樂詞匯文件索引生成裝置中的詞性信息; 數(shù)據(jù)庫,與所述音樂詞匯字典同步,用于存儲音樂實體以及與所述音樂詞匯字典同步的詞性信息數(shù)據(jù);索引引擎,用于以所述數(shù)據(jù)庫中的詞性信息數(shù)據(jù)為輸入生成所述文件索引,并在接收到用戶輸入的音樂詞匯關(guān)鍵字時通過所述文件索引獲得所述關(guān)鍵字的詞性信息;搜索引擎,用于根據(jù)所述索引引擎獲得所述關(guān)鍵字的詞性信息,在所述數(shù)據(jù)庫中調(diào)用相應(yīng)的音樂實體。
全文摘要
本發(fā)明公開了音樂詞匯文件索引建立方法及其裝置、音樂詞匯搜索方法及其系統(tǒng),其中音樂詞匯文件索引建立方法包括以下步驟S1根據(jù)所述搜索系統(tǒng)中用戶對音樂詞匯的搜索日志,將所述音樂詞匯劃分為不同的詞性,并根據(jù)搜索熱度和/或所述不同詞性的流行趨勢對所述音樂詞匯的不同詞性設(shè)置優(yōu)先級策略;S2將包括有所述音樂詞匯、所述音樂詞匯的不同詞性及其優(yōu)先級策略的詞性信息存儲在所述搜索系統(tǒng)中所設(shè)置的音樂詞匯字典中;S3將所述音樂詞匯字典中的詞性信息實時同步到所述搜索系統(tǒng)的數(shù)據(jù)庫中;S4以所述搜索系統(tǒng)數(shù)據(jù)庫中的詞性信息為輸入,通過所述搜索系統(tǒng)中的索引引擎生成音樂詞匯文件索引。本發(fā)明的搜索方法能夠快速地獲得用戶所需要的搜索結(jié)果。
文檔編號G06F17/30GK102591865SQ20111000186
公開日2012年7月18日 申請日期2011年1月6日 優(yōu)先權(quán)日2011年1月6日
發(fā)明者賈海祿 申請人:北京瑞信在線系統(tǒng)技術(shù)有限公司