專利名稱:用于對資源項進(jìn)行排序的方法、裝置和設(shè)備的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及計算機技術(shù)領(lǐng)域,尤其涉及用于對資源項進(jìn)行排序的方法、裝置和設(shè)備。
背景技術(shù):
現(xiàn)有技術(shù)中,往往因為某些突發(fā)事件而產(chǎn)生與該等突發(fā)事件相關(guān)的突發(fā)檢索需求。這種需求具有不可預(yù)期、短時間爆發(fā)、檢索需求集中的特點,故現(xiàn)有技術(shù)中尚缺乏能夠根據(jù)突發(fā)檢索需求來向用戶提供時效性排序結(jié)果的方案。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種用于對資源項進(jìn)行排序的方法、裝置和設(shè)備。根據(jù)本發(fā)明的一個方面,提供一種用于對資源項進(jìn)行排序的方法,其中,該方法包括以下步驟a根據(jù)來自用戶的輸入序列來獲取與該輸入序列相關(guān)的時效信息;b根據(jù)所述時效信息是否滿足預(yù)定條件,判斷所述輸入序列是否具有時效性;其中,該方法還包括以下步驟X當(dāng)判斷所述輸入序列具有時效性時,對基于所述輸入序列進(jìn)行檢索來獲得的資源項進(jìn)行時效性排序,以將排序后的資源項提供給所述用戶。根據(jù)本發(fā)明的另一個方面,還提供了一種用于對資源項進(jìn)行排序的排序裝置,其中,該排序裝置包括時效信息獲取裝置,用于根據(jù)來自用戶的輸入序列來獲取與該輸入序列相關(guān)的時效信息;第一判斷裝置,用于根據(jù)所述時效信息是否滿足預(yù)定條件,判斷所述輸入序列是否具有時效性;時效排序裝置,用于當(dāng)判斷所述輸入序列具有時效性時,對基于所述輸入序列進(jìn)行檢索來獲得的資源項進(jìn)行時效性排序,以將排序后的資源項提供給所述用戶。與現(xiàn)有技術(shù)相比,本發(fā)明具有以下優(yōu)點1)能夠識別具有時效性的輸入序列,并能夠針對基于該具有時效性的輸入序列進(jìn)行檢索所得的資源項進(jìn)行時效性排序,以將可能與該輸入序列的時效性相關(guān)的資源項排序提前,更好地滿足了用戶的突發(fā)檢索需求;2)根據(jù)資源項的新鮮度來執(zhí)行時效性排序,從而獲得更好的時效性排序結(jié)果。
通過閱讀參照以下附圖所作的對非限制性實施例所作的詳細(xì)描述,本發(fā)明的其它特征、目的和優(yōu)點將會變得更明顯圖I為本發(fā)明一個方面的用于對資源項進(jìn)行排序的方法流程圖;圖2為本發(fā)明一個優(yōu)選實施例的用于對資源項進(jìn)行排序的方法流程圖3為本發(fā)明一個方面的用于對資源項進(jìn)行排序的排序裝置結(jié)構(gòu)示意圖;圖4為本發(fā)明一個優(yōu)選實施例的用于對資源項進(jìn)行排序的排序裝置結(jié)構(gòu)示意圖。附圖中相同或相似的附圖標(biāo)記代表相同或相似的部件。
具體實施例方式下面結(jié)合附圖對本發(fā)明作進(jìn)一步詳細(xì)描述。圖I為本發(fā)明一個方面的用于對資源項進(jìn)行排序的 方法流程圖。其中,根據(jù)本發(fā)明的方法主要通過計算機設(shè)備中的排序裝置來完成,該排序裝置包括但不限于安裝在計算機設(shè)備中且能夠?qū)崿F(xiàn)本發(fā)明方案的諸如應(yīng)用模塊、操作系統(tǒng)、處理控制器等的裝置。其中,該計算機設(shè)備包括但不限于1)用戶設(shè)備;2)網(wǎng)絡(luò)設(shè)備。所述用戶設(shè)備包括但不限于計算機、智能手機、PDA等;所述網(wǎng)絡(luò)設(shè)備包括但不限于單個網(wǎng)絡(luò)服務(wù)器、多個網(wǎng)絡(luò)服務(wù)器組成的服務(wù)器組或基于云計算(Cloud Computing)的由大量計算機或網(wǎng)絡(luò)服務(wù)器構(gòu)成的云,其中,云計算是分布式計算的一種,由一群松散耦合的計算機集組成的一個超級虛擬計算機。在步驟SI中,排序裝置根據(jù)來自用戶的輸入序列來獲取與該輸入序列相關(guān)的時效信息。具體地,排序裝置獲取其他裝置或設(shè)備提供的輸入序列,或者,實時獲取來自用戶的輸入序列,并根據(jù)該輸入序列來獲取與該輸入序列相關(guān)的時效信息。其中,排序裝置獲取與該輸入序列相關(guān)的時效信息的方式包括但不限于I)排序裝置根據(jù)該輸入序列來在預(yù)建立的用戶需求突增關(guān)鍵詞庫中進(jìn)行查詢,并將查詢所得的查詢結(jié)果作為所述時效信息。其中,該查詢結(jié)果中包括以下任一項a)用于表示能夠在用戶需求突增關(guān)鍵詞庫查詢獲得該輸入序列或該輸入序列包含的關(guān)鍵詞的標(biāo)識信息,例如,等;b)用于表示未能夠在用戶需求突增關(guān)鍵詞庫查詢獲得該輸入序列或該輸入序列包含的關(guān)鍵詞的標(biāo)識信息,例如,“N”、“0”等。優(yōu)選地,該查詢結(jié)果中還包括以下至少一項a)在用戶需求突增關(guān)鍵詞庫查詢所得的該用戶需求突增關(guān)鍵詞庫中的突增關(guān)鍵詞;b)與查詢所得的突增關(guān)鍵詞相關(guān)的信息,例如,輸入序列或關(guān)鍵詞的用戶需求變化強度等。2)排序裝置根據(jù)所述輸入序列來獲取與該輸入序列相關(guān)的時效特征信息,以作為所述時效信息。其中,所述時效特征信息包括能夠用于與該輸入序列相關(guān)且能夠用于判斷該輸入序列是否為具有時效性的輸入序列的特征信息。優(yōu)選地,所述時效特征信息包括但不限于以下至少下一項a)基于輸入序列進(jìn)行檢索來獲得的資源項數(shù)量隨時間的變化信息;例如,該資源項數(shù)量隨時間的變化信息包括如下信息基于所述輸入序列進(jìn)行檢索來獲得的資源項中包含50個在前96至前120小時內(nèi)建立的資源項、48個在前72至前96小時內(nèi)建立的資源項、127個在前48小時至前72小時內(nèi)建立的資源項、309個在前24至前48小時內(nèi)建立的資源項以及1045個在24小時內(nèi)建立的資源項;又例如,進(jìn)行檢索所得的資源項數(shù)量隨時間的變化信息包括各個預(yù)定時間段內(nèi)建立的資源信息數(shù)量的相對其相鄰時間段內(nèi)建立的資源信息數(shù)量的變化值等。優(yōu)選地,排序裝置通過對基于輸入序列進(jìn)行檢索所得的資源項的建立或更新時間進(jìn)行統(tǒng)計分析,來獲得該資源項數(shù)量隨時間的變化信息。b)輸入序列和/或輸入序列包含的關(guān)鍵詞的被檢索次數(shù)隨時間的變化信息;例如,在各個預(yù)定時間段內(nèi)或預(yù)定時間點上,輸入序列或輸入序列包含的關(guān)鍵詞的被檢索次數(shù);又例如,各個預(yù)定時間段或預(yù)定時間點相對其相鄰時間段或時間點的輸入序列或關(guān)鍵詞的被檢索次數(shù)的差值等。優(yōu)選地,排序裝置基于輸入序列或輸入序列包含的關(guān)鍵詞來在本地存儲設(shè)備中進(jìn)行查詢,以獲得預(yù)存儲的與輸入序列或輸入序列包含的關(guān)鍵詞對應(yīng)的被檢索次數(shù)隨時間的變化信息;或者,排序裝置向其他裝置或設(shè)備發(fā)出請求,以獲得與輸入序列或輸入序列包含的關(guān)鍵詞對應(yīng)的被檢索次數(shù)隨時間的變化信息;或者,排序裝置通過在預(yù)定時間段內(nèi)對輸入序列或輸入序列包含的關(guān)鍵詞的被檢索次數(shù)進(jìn)行監(jiān)控及統(tǒng)計,來獲得該被檢索次數(shù)隨時間的變化信息。
c)基于對所述輸入序列進(jìn)行語義分析來獲得的該輸入序列的突發(fā)語義特征信息。其中,突發(fā)語義特征信息包括突發(fā)特征關(guān)鍵詞和/或突發(fā)特征語義結(jié)構(gòu)。例如,突發(fā)語義特征信息包括諸如“最新、今天、本周、最近、某年某月某日”等時間關(guān)鍵詞,或者包括諸如“地震、車禍、逝世、著火、砍人事件、自殺門”等突發(fā)事件關(guān)鍵詞;又例如,突發(fā)語義特征結(jié)構(gòu)包括諸如專有名詞+普通名詞等結(jié)構(gòu);再例如,突發(fā)語義特征信息包括諸如“福島地震”等同時包含突發(fā)特征關(guān)鍵詞以及突發(fā)特征語義結(jié)構(gòu)的語義特征信息。優(yōu)選地,優(yōu)選地,排序裝置基于輸入序列來在本地存儲設(shè)備中進(jìn)行查詢,以獲得預(yù)存儲的與輸入序列對應(yīng)的突發(fā)語義特征信息;或者,排序裝置向其他裝置或設(shè)備發(fā)出請求,以獲得與輸入序列對應(yīng)的突發(fā)語義特征信息;或者,排序裝置對該輸入序列進(jìn)行語義分析,來獲得該輸入序列的突發(fā)語義特征信息。3)排序裝置先根據(jù)所述輸入序列在預(yù)建立的用戶需求突增關(guān)鍵詞庫中查詢與該輸入序列有關(guān)的突增關(guān)鍵詞;當(dāng)查詢到與該輸入序列有關(guān)的突增關(guān)鍵詞時,將查詢結(jié)果作為所述時效信息;當(dāng)未能查詢到與該輸入序列有關(guān)的突增關(guān)鍵詞時,排序裝置根據(jù)所述輸入序列來獲取與該輸入序列相關(guān)的時效特征信息,以作為所述時效信息的步驟。其中,排序裝置根據(jù)所述輸入序列來獲取與該輸入序列相關(guān)的時效特征信息的方式與前述2)中排序裝置獲取時效特征信息方式相同或相似,在此不再贅述。需要說明的是,上述舉例僅為更好地說明本發(fā)明的技術(shù)方案,而非對本發(fā)明的限制,本領(lǐng)域技術(shù)人員應(yīng)該理解,任何根據(jù)來自用戶的輸入序列來獲取與該輸入序列相關(guān)的時效信息的實現(xiàn)方式,均應(yīng)包含在本發(fā)明的范圍內(nèi)。接著,在步驟S2中,排序裝置根據(jù)時效信息是否滿足預(yù)定條件,判斷輸入序列是否具有時效性。其中,所述預(yù)定條件包括基于能夠被確定為具有時效性的輸入序列來獲得的時效信息所需要滿足的條件;例如,當(dāng)時效信息包括在預(yù)建立的用戶需求突增關(guān)鍵詞庫中進(jìn)行查詢所得的查詢結(jié)果時,預(yù)定條件包括查詢結(jié)果中包含“Y”或“ I ”等標(biāo)識信息,當(dāng)時效信息包括時效特征信息時,預(yù)定條件包括時效特征信息所需要滿足的條件等,優(yōu)選地,基于輸入序列進(jìn)行檢索來獲得的資源項數(shù)量隨時間的增長越快、輸入序列或輸入序列包含的關(guān)鍵詞的被檢索次數(shù)隨時間的增長越快、突發(fā)語義特征信息中包含的突發(fā)語義特征越強,則排序裝置將輸入序列判斷為具有時效性的輸入序列的可能性越高。例如,預(yù)定條件包括查詢結(jié)果中包含標(biāo)識信息“Y”或“1”,在步驟SI中,排序裝置基于輸入序列獲得的時效信息包括包含標(biāo)識信息“Y”的查詢結(jié)果;則排序裝置根據(jù)該時效信息滿足預(yù)定條件,判斷輸入序列具有時效性。又例如,預(yù)定條件包括任一時間段中建立的資源項數(shù)量相對其前一時間段中建立的資源項數(shù)量的增長率超過50% ;在步驟SI中,排序裝置獲得的基于輸入序列進(jìn)行檢索來獲得的資源項數(shù)量隨時間的變化信息包括如下信息基于所述輸入序列進(jìn)行檢索來獲得的資源項中包含50個在前96至前120小時內(nèi)建立的資源項、48個在前72至前96小時內(nèi)建立的資源項、127個在前48小時至前72小時內(nèi)建立的資源項、309個在前24至前48小時內(nèi)建立的資源項以及1045個在24小時內(nèi)建立的資源項;則排序裝置分析資源項數(shù)量隨時間的變化信息,確定各個時間段中建立的資源項數(shù)量相對其前一時間段中建立的資源項數(shù)量的增長率,并根據(jù)在前48小時至前72小時內(nèi)建立的資源項數(shù)量相對前72至前96小時內(nèi)建立的資源項數(shù)量的增長率62. 2%大于第一預(yù)定增長閾值50%,判斷輸入序列具有時效性。再例如,預(yù)定條件包括以下兩項條件i)包括輸入序列中包含突發(fā)語義特征關(guān)鍵詞;ii)輸入序列和其包含的關(guān)鍵詞的被檢索次數(shù)在任意兩個時間段中隨時間的增長率均超過100%;在步驟SI中,排序裝置獲得輸入序列“地震門”中包含突發(fā)特征關(guān)鍵詞“地震”,并獲得輸入序列“地震門”以及輸入序列包含的關(guān)鍵詞“地震”的被檢索次數(shù)隨時間的變化信息如下表I所示
_輸入序列“地震門”__輸入序列包含的關(guān)鍵詞“地震”
時間段__被檢索次數(shù)__時間段__被檢索次數(shù)
5 月 30 日__324__5 月 30 日__5243
5 月 25 日__235__5 月 25 日__4657
5 月 20 日__375__5 月 20 日__6078
5 月 15 日__206__5 月 15 日__4981
5 月 10 曰3095 月 10 曰5043表I則排序裝置對輸入序列“地震門”以及輸入序列包含的關(guān)鍵詞“地震”的被檢索次數(shù)隨時間的變化信息進(jìn)行分析,確定輸入序列和其包含的關(guān)鍵詞的被檢索次數(shù)在任意兩個時間段中隨時間的增長率均小于100%;則排序裝置判斷輸入序列“地震門”不具有時效性。需要說明的是,上述舉例僅為更好地說明本發(fā)明的技術(shù)方案,而非對本發(fā)明的限制,本領(lǐng)域技術(shù)人員應(yīng)該理解,任何根據(jù)時效信息是否滿足預(yù)定條件來判斷輸入序列是否具有時效性的實現(xiàn)方式,均應(yīng)包含在本發(fā)明的范圍內(nèi)。在步驟S3中,當(dāng)判斷所述輸入序列具有時效性時,排序裝置對基于所述輸入序列進(jìn)行檢索來獲得的資源項進(jìn)行時效性排序,以將排序后的資源項提供給所述用戶。其中,排序裝置對基于所述輸入序列進(jìn)行檢索來獲得的資源項進(jìn)行時效性排序,以將排序后的資源項提供給用戶的方式包括但不限于I)排序裝置由基于所述輸入序列進(jìn)行檢索來獲得的多個資源項中選擇一部分資源項,并將所選擇的資源項置于預(yù)定的排序位置,再對未選擇的資源項進(jìn)行排序;接著,排序裝置將排序后的資源項提供給用戶。其中,排序裝置能夠根據(jù)諸如資源項的建立或更新時間、資源項的點擊率、預(yù)確定的資源項的質(zhì)量、資源項與輸入序列的匹配度等多種因素來選擇前述一部分資源項。例如,預(yù)定的排序位置為前三位排序位置,排序裝置基于所述輸入序列進(jìn)行檢索來獲得多個資源項,并由該多個資源項中選擇建立時間短于24小時且與輸入序列的匹配度大于預(yù)定匹配度閾值的資源項,接著,排序裝置進(jìn)一步由所選擇的資源項中選擇點擊率前三位的資源項,并將該點擊率前三位的資源項按照點擊率由高至低的順序置于前三位排序位置;接著,排序裝置采用現(xiàn)有技術(shù)來對其余資源項進(jìn)行排序,并將所確定的前三位資源項以及排序后的其他資源項提供給用戶。2)排序裝置由基于所述輸入序列進(jìn)行檢索來獲得的多個資源項中選擇一部分資源項,并對所選擇的資源項進(jìn)行加權(quán)處理,以根據(jù)加權(quán)處理后的處理結(jié)果來進(jìn)行排序,并將排序后的資源項提供給用戶。該通過加權(quán)處理來進(jìn)行排序的方式將在參照圖2所示實施例中予以詳述,在此不予贅述?!?br>
需要說明的是,上述舉例僅為更好地說明本發(fā)明的技術(shù)方案,而非對本發(fā)明的限制,本領(lǐng)域技術(shù)人員應(yīng)該理解,任何當(dāng)判斷所述輸入序列具有時效性時,對基于所述輸入序列進(jìn)行檢索來獲得的資源項進(jìn)行時效性排序,以將排序后的資源項提供給所述用戶的實現(xiàn)方式,均應(yīng)包含在本發(fā)明的范圍內(nèi)。需要進(jìn)一步說明的是,當(dāng)判斷所述輸入序列具有時效性時,排序裝置或其他裝置對基于所述輸入序列進(jìn)行檢索來獲得的資源項進(jìn)行現(xiàn)有技術(shù)的排序處理,以將排序后的資源項提供給所述用戶;或者,當(dāng)判斷所述輸入序列具有時效性時,排序裝置不執(zhí)行任何操作。作為優(yōu)選方式之一,排序裝置根據(jù)所需要展現(xiàn)的資源項數(shù)量以及所需要展現(xiàn)的資源項排序位置,確定該需要展現(xiàn)的資源項排序位置所對應(yīng)的資源項。例如,用戶設(shè)備向搜索引擎發(fā)送用于進(jìn)行查詢的輸入序列,則搜索引擎中的排序裝置根據(jù)該用戶設(shè)備一次性所能夠呈現(xiàn)的資源項數(shù)量為10,由基于該輸入序列來獲得的資源項中選擇進(jìn)行選擇,并確定前10位排序位置對應(yīng)的資源項來反饋給用戶設(shè)備,以使用戶設(shè)備將排序前10位的資源項提供給用戶;接著,當(dāng)用戶設(shè)備向搜索引擎發(fā)送翻頁請求,搜索引擎再次由基于該輸入序列來獲得的資源項中進(jìn)行選擇,并確定排序11至20位對應(yīng)的資源項來反饋給用戶設(shè)備,以使用戶設(shè)備將該排序11至20位的資源項提供給用戶。作為優(yōu)選方式之一,排序裝置對基于輸入序列來獲得的資源項進(jìn)行排序后,根據(jù)需要展現(xiàn)給用戶的資源項排序位置,來選擇部分排序位置的資源項提供給用戶。例如,用戶設(shè)備向搜索引擎發(fā)送用于進(jìn)行查詢的輸入序列,則搜索引擎中的排序裝置對基于輸入序列來獲得的資源項進(jìn)行排序后,基于默認(rèn)的一次提供10個排序后的資源項的規(guī)則,將排序前10位的資源項提供給用戶設(shè)備,以使用戶設(shè)備將排序前10位的資源項提供給用戶;接著,當(dāng)用戶設(shè)備項搜索引擎發(fā)送提供第3頁資源項的請求,則搜索引擎根據(jù)第3頁對應(yīng)的資源項為21至30位資源項,來將排序第21至30位的資源項提供給用戶設(shè)備,以使用戶設(shè)備將排序第21至30位的資源項的資源項提供給用戶。作為本發(fā)明的優(yōu)選方案之一,在本發(fā)明中對包含于預(yù)建立的用戶需求突增關(guān)鍵詞庫中的至少一個突增關(guān)鍵詞分別執(zhí)行以下步驟S41 (圖未示)、步驟S42 (圖未示)以及步驟S43(圖未示)。
在步驟S41中,排序裝置獲取一個或多個用戶對基于當(dāng)前處理的突增關(guān)鍵詞或包含該當(dāng)前處理的突增關(guān)鍵詞的輸入序列來獲得的排序后的資源項的點擊信息。優(yōu)選地,該點擊信息中包括基于當(dāng)前處理的突增關(guān)鍵詞或包含該當(dāng)前處理的突增關(guān)鍵詞的輸入序列來獲得的排序后的各個資源項的點擊量和/或點擊率。具體地,排序裝置獲取其他裝置提供的點擊信息;或者,排序裝置通過在預(yù)定時間段內(nèi)對用戶基于前述排序后的資源項的點擊行為進(jìn)行監(jiān)控并統(tǒng)計,來獲得點擊信息。接著,在步驟S42中,排序裝置根據(jù)前述步驟S41中所得的點擊信息,判斷該突增關(guān)鍵詞是否時效性已過。其中,排序裝置判斷突增關(guān)鍵詞是否時效性已過的方式包括但不限于
I)排序裝置根據(jù)前述步驟S3中被指定至預(yù)定排序位置或者被選擇進(jìn)行加權(quán)處理的資源項的點擊率或點擊量,并結(jié)合其他資源項的點擊率或點擊量間,來獲得判斷評價值;并根據(jù)該判斷評價值是否大于或小于第一預(yù)定判斷閾值,來判斷當(dāng)前處理的突增關(guān)鍵詞是否時效性已過。例如,排序裝置在步驟S41中獲得的用戶對基于突增關(guān)鍵詞“5月CPI”進(jìn)行檢索所得的7個資源項的點擊量如下表2所示
資源項點擊量 資源項A1230 資源項B234 資源項C123 資源項D467 資源項E986 資源項F209 資源項G78表 2其中,資源項A和E為被指定至預(yù)定排序位置的資源項,資源項D為被選擇進(jìn)行加權(quán)處理的資源項,則排序裝置將資源項A、D和E的點擊量平均值與資源項B、C、F和G的點擊量平均值的差值733作為判斷評價值,并根據(jù)判斷評價值大于第一預(yù)定判斷閾值500,判斷當(dāng)前處理的突增關(guān)鍵詞時效性未過。2)排序裝置根據(jù)各個資源項中建立或更新時間短于第一預(yù)定時間閾值的資源項的點擊信息,并結(jié)合各個資源項中建立或更新時間長于第二預(yù)定時間閾值的資源項的點擊信息,來獲得判斷評價值;并根據(jù)該判斷評價值是否大于或小于第二預(yù)定判斷閾值,來判斷當(dāng)前處理的突增關(guān)鍵詞是否時效性已過。例如,排序裝置將各個資源項中建立或更新時間短于3天的資源項的點擊信息與建立或更新時間長于90天的資源項的點擊信息的比值作為判斷評價值,并根據(jù)該判斷評價值是否大于或小于第二預(yù)定判斷閾值,來判斷當(dāng)前處理的突增關(guān)鍵詞是否時效性已過。需要說明的是,上述舉例僅為更好地說明本發(fā)明的技術(shù)方案,而非對本發(fā)明的限制,本領(lǐng)域技術(shù)人員應(yīng)該理解,任何根據(jù)點擊信息,判斷突增關(guān)鍵詞是否時效性已過的實現(xiàn)方式,均應(yīng)包含在本發(fā)明的范圍內(nèi)。在步驟S43中,當(dāng)判斷該突增關(guān)鍵詞時效性已過,排序裝置在所述用戶需求突增關(guān)鍵詞庫中刪除該突增關(guān)鍵詞。優(yōu)選地,當(dāng)判斷該突增關(guān)鍵詞時效性未過,排序裝置不對該突增關(guān)鍵詞執(zhí)行操作。 作為本實施例的優(yōu)選方案之一,所述步驟S2進(jìn)一步包括步驟S21(圖未示)以及步驟S22(圖未示)。在步驟S21中,排序裝置根據(jù)所述時效特征信息是否滿足預(yù)定條件,判斷所述輸入序列是否具有時效性。其中,排序裝置根據(jù)時效特征信息是否滿足預(yù)定條件來判斷輸入序列是否具有時效性的步驟已在前述步驟S2中予以詳述,在此不再贅述。在步驟S22中,當(dāng)判斷所述輸入序列具有時效性時,排序裝置將所述輸入序列和/或所述輸入序列中的關(guān)鍵詞加入所述用戶需求突增關(guān)鍵詞庫中。優(yōu)選地,排序裝置還將與輸入序列對應(yīng)的時效特征信息加入所述用戶需求突增關(guān)鍵詞庫中;更優(yōu)選地,排序裝置還將基于時效特征信息來獲得的信息,例如,資源項數(shù)量或輸入序列的被檢索次數(shù)隨時間的增長率等,加入所述用戶需求突增關(guān)鍵詞庫中。根據(jù)本發(fā)明的方法能夠識別具有時效性的輸入序列,并能夠針對基于該具有時效性的輸入序列進(jìn)行檢索所得的資源項進(jìn)行時效性排序,以將可能與該輸入序列的時效性相關(guān)的資源項排序提前,更好地滿足了用戶的突發(fā)檢索需求。圖2為本發(fā)明一個優(yōu)選實施例的用于對資源項進(jìn)行排序的方法流程圖。根據(jù)本實施例的方法包括步驟SI、步驟S2以及步驟S3。其中,步驟S3進(jìn)一步包括時效性排序步驟S31。步驟SI以及步驟S2已在參照圖I所示實施例中予以詳述,并以引用的方式包含于此,不再贅述。接著,在步驟S3中,當(dāng)判斷所述輸入序列具有時效性時,排序裝置對基于所述輸入序列進(jìn)行檢索來獲得的資源項進(jìn)行時效性排序,以將排序后的資源項提供給所述用戶。本實施例中,步驟S3中的時效性排序步驟S31包括根據(jù)所述各個資源項的新鮮度相關(guān)信息,由其中選擇至少一個資源項,并對所選擇的至少一個資源項進(jìn)行加權(quán)處理,以根據(jù)該加權(quán)處理后的處理結(jié)果來進(jìn)行排序的步驟。其中,所述新鮮度相關(guān)信息包括能夠用于確定各個資源項的建立或更新時間是否屬于輸入序列的時效期間的相關(guān)信息。優(yōu)選地,新鮮度相關(guān)信息包括以下至少一項I)資源項的建立或更新時間以及預(yù)確定的輸入序列的用戶需求突增時間。其中,排序裝置能夠獲取預(yù)存儲的各個資源項的建立或更新時間,例如,排序裝置或其他裝置在抓取各個資源項的同時,存儲各個資源項的建立或更新時間,以供后續(xù)使用;其中,該建立或更新時間可為各個資源項在其網(wǎng)絡(luò)中的建立或更新時間,也可為排序裝置或其他裝置抓取并存儲或更新各個資源項的時間。其中,在步驟S31前,所述預(yù)確定的輸入序列的用戶需求突增時間能夠由排序裝置或其他裝置根據(jù)以下至少一項因素來確定a)基于輸入序列進(jìn)行檢索來獲得的資源項數(shù)量隨時間的變化信息,該資源項數(shù)量隨時間的變化信息已在參照圖I所示實施例中對時效特征信息進(jìn)行說明的部分予以詳述,在此不再贅述;排序裝置或其他裝置通過根據(jù)前述資源項數(shù)量隨時間的變化信息來確定資源項數(shù)量隨時間的增長強度,以確定用戶需求突增時間,例如,排序裝置或其他裝置將資源項數(shù)量隨時間的增長強度第一次超過第二預(yù)定增長閾值的時間段的起始時間點作為用戶需求突增時間;b)輸入序列和/或輸入序列包含的關(guān)鍵詞的被檢索次數(shù)隨時間的變化信息,該被檢索次數(shù)隨時間的變化信息已在參照圖I所示實施例中對時效特征信息進(jìn)行說明的部分予以詳述,在此不再贅述;排序裝置或其他裝置通過根據(jù)前述被檢索次數(shù)隨時間的變化信息來確定被檢索次數(shù)隨時間的增長強度,以確定用戶需求突增時間。具體地,排序裝置由基于輸入序列進(jìn)行檢索來獲得的各個資源項中選擇建立或更新時間晚于用戶需求突增時間的資源項,并對所選擇的資源項進(jìn)行加權(quán)處理, 以根據(jù)該加權(quán)處理后的處理結(jié)果來進(jìn)行排序。例如,預(yù)確定的用戶需求突增時間為5月12日,則排序裝置由由基于輸入序列進(jìn)行檢索來獲得的各個資源項中選擇建立時間晚于5月12日的資源項,并根據(jù)預(yù)定的加權(quán)值來對所選擇的各個資源項進(jìn)行加權(quán)處理,以根據(jù)該加權(quán)處理后的處理結(jié)果來進(jìn)行排序。2)所述輸入序列的歷史檢索記錄中包含的資源項。具體地,排序裝置由基于輸入序列進(jìn)行檢索來獲得的資源項中選擇未包含于該輸入序列的歷史檢索記錄中的資源項,并對所選擇的資源項進(jìn)行加權(quán)處理,以根據(jù)該加權(quán)處理后的處理結(jié)果來進(jìn)行排序。由于所選擇的資源項未包含于數(shù)據(jù)序列的歷史檢索記錄中,因此,可認(rèn)為所選擇的資源項的建立時間晚于歷史檢索記錄的最后更新時間,故基于歷史檢索記錄來選擇的資源項的建立或更新時間應(yīng)處于輸入序列的時效期間。需要說明的是,上述舉例僅為更好地說明本發(fā)明的技術(shù)方案,而非對本發(fā)明的限制,本領(lǐng)域技術(shù)人員應(yīng)該理解,任何根據(jù)所述各個資源項的新鮮度相關(guān)信息,由其中選擇至少一個資源項,并對所選擇的至少一個資源項進(jìn)行加權(quán)處理,以根據(jù)該加權(quán)處理后的處理結(jié)果來進(jìn)行排序的實現(xiàn)方式,均應(yīng)包含在本發(fā)明的范圍內(nèi)。需要進(jìn)一步說明的是,排序裝置可先選擇需要所有加權(quán)處理的資源項并進(jìn)行加權(quán)處理,然后再對所有進(jìn)過加權(quán)處理以及未經(jīng)過加權(quán)處理的資源項進(jìn)行排序;或者,排序裝置每獲得一個需要加權(quán)處理的資源項,即對該資源項進(jìn)行加權(quán)處理,并將該資源項插入已排序資源項中。作為本實施例的優(yōu)選方案之一,本實施例的方法還包括步驟S5以及步驟S6,前述步驟S31中的加權(quán)處理步驟進(jìn)一步包括根據(jù)加權(quán)值,對所選擇的需要進(jìn)行加權(quán)處理的資源項進(jìn)行加權(quán)處理的步驟。在步驟S2之后執(zhí)行的步驟S5中,排序裝置根據(jù)步驟SI中獲得的時效信息,確定輸入序列的用戶需求變化強度。具體地,排序裝置確定輸入序列的用戶需求變化強度的方式包括但不限于I)當(dāng)時效信息中包括排序裝置在用戶需求突增關(guān)鍵詞庫中查詢所得的查詢結(jié)果,且該查詢結(jié)果包含查詢所得的突增關(guān)鍵詞的用戶需求變化強度時,排序裝置根據(jù)查詢結(jié)果中的突增關(guān)鍵詞的用戶需求變化強度來確定輸入序列的用戶需求變化強度。例如,輸入序列為“福島地震怎么樣了”,在步驟SI中,排序裝置獲得的查詢結(jié)果中包含突增關(guān)鍵詞“福島地震”對應(yīng)的用戶需求變化強度為3級,則排序裝置直接將突增關(guān)鍵詞“福島地震”對應(yīng)的用戶需求變化強度作為輸入序列“福島地震怎么樣了”的用戶需求變化強度。又例如,輸入序列為“福島地震核電站”,在步驟SI中,排序裝置獲得的查詢結(jié)果中包含突增關(guān)鍵詞“福島地震”對應(yīng)的用戶需求變化強度為4. 76,突增關(guān)鍵詞“核電站”對應(yīng)的用戶需求變化強度為2. 35,則排序裝置將突增關(guān)鍵詞對應(yīng)的用戶需求變化強度之和
7.11作為輸入序列“福島地震核電站”的用戶需求變化強度。2)當(dāng)時效信息中包括時效特征信息,則排序裝置根據(jù)時效特征信息來確定輸入序列的用戶需求變化強度。 例如,時效特征信息包括基于輸入序列進(jìn)行檢索來獲得的資源項數(shù)量隨時間的變化信息,則排序裝置根據(jù)預(yù)確定的諸如支持向量機、貝葉斯模型、最大熵模型等機器學(xué)習(xí)模型來確定輸入序列的用戶需求變化強度。其中,可通過將大量已確定用戶需求變化強度以及已獲得資源項數(shù)量隨時間的變化信息的輸入序列對機器學(xué)習(xí)模型進(jìn)行訓(xùn)練,來獲得用于確定用戶需求變化強度的機器學(xué)習(xí)模型。又例如,在步驟SI中,排序裝置基于輸入序列“福島地震”獲得的時效特征信息包括以下兩項1)包含突發(fā)特征關(guān)鍵詞“地震”以及突發(fā)特征語義結(jié)構(gòu)“專有名詞+普通名詞”的突發(fā)語義特征信息;2)輸入序列“福島地震”的被檢索次數(shù)隨時間的變化信息,該變化信息如下表3所示
權(quán)利要求
1.一種計算機實現(xiàn)的用于對資源項進(jìn)行排序的方法,其中,該方法包括以下步驟 a根據(jù)來自用戶的輸入序列來獲取與該輸入序列相關(guān)的時效信息; b根據(jù)所述時效信息是否滿足預(yù)定條件,判斷所述輸入序列是否具有時效性; 其中,該方法還包括以下步驟 X當(dāng)判斷所述輸入序列具有時效性時,對基于所述輸入序列進(jìn)行檢索來獲得的資源項進(jìn)行時效性排序,以將排序后的資源項提供給所述用戶。
2.根據(jù)權(quán)利要求I所述的方法,其中,所述步驟a包括以下步驟 -根據(jù)所述輸入序列來獲取與該輸入序列相關(guān)的時效特征信息,以作為所述時效信息。
3.根據(jù)權(quán)利要求I所述的方法,其中,所述步驟a包括以下步驟 -根據(jù)所述輸入序列在預(yù)建立的用戶需求突增關(guān)鍵詞庫中查詢與該輸入序列有關(guān)的關(guān)鍵詞; -當(dāng)查詢到與該輸入序列有關(guān)的關(guān)鍵詞時,將查詢結(jié)果作為所述時效信息。
4.根據(jù)權(quán)利要求3所述的方法,其中,所述步驟a還包括以下步驟 -當(dāng)未能查詢到與該輸入序列有關(guān)的關(guān)鍵詞時,根據(jù)所述輸入序列來獲取與該輸入序列相關(guān)的時效特征信息,以作為所述時效信息。
5.根據(jù)權(quán)利要求2或4所述的方法,其中,所述時效特征信息包括以下至少一項 -基于所述輸入序列進(jìn)行檢索來獲得的資源項數(shù)量隨時間的變化信息; -所述輸入序列和/或所述輸入序列包含的關(guān)鍵詞的被檢索次數(shù)隨時間的變化信息; -基于對所述輸入序列進(jìn)行語義分析來獲得的該輸入序列的突發(fā)語義特征信息。
6.根據(jù)權(quán)利要求5所述的方法,其中,該方法還包括以下 -對包含于所述用戶需求突增關(guān)鍵詞庫中的至少一個突增關(guān)鍵詞分別執(zhí)行以下步驟-獲取一個或多個用戶對基于該突增關(guān)鍵詞或包含該突增關(guān)鍵詞的輸入序列來獲得的排序后的資源項的點擊信息; -根據(jù)所述點擊信息,判斷該突增關(guān)鍵詞是否時效性已過; -當(dāng)判斷該突增關(guān)鍵詞時效性已過,在所述用戶需求突增關(guān)鍵 詞庫中刪除該突增關(guān)鍵詞。
7.根據(jù)權(quán)利要求2、4、5或6所述的方法,其中,所述步驟b包括以下步驟 -根據(jù)所述時效特征信息是否滿足預(yù)定條件,判斷所述輸入序列是否具有時效性; -當(dāng)判斷所述輸入序列具有時效性時,將所述輸入序列和/或所述輸入序列中的關(guān)鍵詞加入所述用戶需求突增關(guān)鍵詞庫中。
8.根據(jù)權(quán)利要求I至7中任一項所述的方法,其中,所述步驟X中的時效性排序步驟包括 -根據(jù)所述各個資源項的新鮮度相關(guān)信息,由其中選擇至少一個資源項,并對所選擇的至少一個資源項進(jìn)行加權(quán)處理,以根據(jù)該加權(quán)處理后的處理結(jié)果來進(jìn)行排序。
9.根據(jù)權(quán)利要求8所述的方法,其中,該方法還包括以下步驟 -根據(jù)所述時效信息,確定所述輸入序列的用戶需求變化強度; -根據(jù)該用戶需求變化強度,確定加權(quán)值; 其中,所述加權(quán)處理步驟包括 -根據(jù)所述加權(quán)值,對所述至少一個資源項進(jìn)行所述加權(quán)處理。
10.根據(jù)權(quán)利要求9所述的方法,其中,所述加權(quán)處理步驟還包括 -根據(jù)所述加權(quán)值,并結(jié)合所述至少一個資源項中每個資源項的建立或更新時間,對所述至少一個資源項進(jìn)行所述加權(quán)處理。
11.根據(jù)權(quán)利要求8至10中任一項所述的方法,其中,所述新鮮度相關(guān)信息包括以下至少一項 -資源項的建立或更新時間以及預(yù)確定的所述輸入序列的用戶需求突增時間; -所述輸入序列的歷史檢索記錄中包含的資源項。
12.一種用于對資源項進(jìn)行排序的排序裝置,其中,該排序裝置包括 時效信息獲取裝置,用于根據(jù)來自用戶的輸入序列來獲取與該輸入序列相關(guān)的時效信息; 第一判斷裝置,用于根據(jù)所述時效信息是否滿足預(yù)定條件,判斷所述輸入序列是否具有時效性; 時效排序裝置,用于當(dāng)判斷所述輸入序列具有時效性時,對基于所述輸入序列進(jìn)行檢索來獲得的資源項進(jìn)行時效性排序,以將排序后的資源項提供給所述用戶。
13.根據(jù)權(quán)利要求12所述的排序裝置,其中,所述時效信息獲取裝置包括 第一子獲取裝置,用于根據(jù)所述輸入序列來獲取與該輸入序列相關(guān)的時效特征信息,以作為所述時效信息。
14.根據(jù)權(quán)利要求12所述的排序裝置,其中,所述時效信息獲取裝置包括 查詢裝置,用于根據(jù)所述輸入序列在預(yù)建立的用戶需求突增關(guān)鍵詞庫中查詢與該輸入序列有關(guān)的關(guān)鍵詞; 定義裝置,用于當(dāng)查詢到與該輸入序列有關(guān)的關(guān)鍵詞時,將查詢結(jié)果作為所述時效信肩、O
15.根據(jù)權(quán)利要求14所述的排序裝置,其中,所述時效信息獲取裝置還包括 第二子獲取裝置,用于當(dāng)未能查詢到與該輸入序列有關(guān)的關(guān)鍵詞時,根據(jù)所述輸入序列來獲取與該輸入序列相關(guān)的時效特征信息,以作為所述時效信息。
16.根據(jù)權(quán)利要求13或15所述的排序裝置,其中,所述時效特征信息包括以下至少一項 -基于所述輸入序列進(jìn)行檢索來獲得的資源項數(shù)量隨時間的變化信息; -所述輸入序列和/或所述輸入序列包含的關(guān)鍵詞的被檢索次數(shù)隨時間的變化信息; -基于對所述輸入序列進(jìn)行語義分析來獲得的該輸入序列的突發(fā)語義特征信息。
17.根據(jù)權(quán)利要求16所述的排序裝置,其中,該排序裝置還包括 更新裝置,用于對包含于所述用戶需求突增關(guān)鍵詞庫中的至少一個突增關(guān)鍵詞分別執(zhí)行操作,其中,該更新裝置包括 點擊信息獲取裝置,用于獲取一個或多個用戶對基于該突增關(guān)鍵詞或包含該突增關(guān)鍵詞的輸入序列來獲得的排序后的資源項的點擊信息; 第二判斷裝置,用于根據(jù)所述點擊信息,判斷該突增關(guān)鍵詞是否時效性已過; 刪除裝置,用于當(dāng)判斷該突增關(guān)鍵詞時效性已過,在所述用戶需求突增關(guān)鍵詞庫中刪除該突增關(guān)鍵詞。
18.根據(jù)權(quán)利要求13、15、16或17所述的排序裝置,其中,所述第一判斷裝置包括子判斷裝置,用于根據(jù)所述時效特征信息是否滿足預(yù)定條件,判斷所述輸入序列是否具有時效性; 添加裝置,用于當(dāng)判斷所述輸入序列具有時效性時,將所述輸入序列和/或所述輸入序列中的關(guān)鍵詞加入所述用戶需求突增關(guān)鍵詞庫中。
19.根據(jù)權(quán)利要求12至18中任一項所述的排序裝置,其中,所述時效排序裝置包括 子排序裝置,用于根據(jù)所述各個資源項的新鮮度相關(guān)信息,由其中選擇至少一個資源項,并對所選擇的至少一個資源項進(jìn)行加權(quán)處理,以根據(jù)該加權(quán)處理后的處理結(jié)果來進(jìn)行排序。
20.根據(jù)權(quán)利要求19所述的排序裝置,其中,該排序裝置還包括 強度確定裝置,用于根據(jù)所述時效信息,確定所述輸入序列的用戶需求變化強度; 加權(quán)值確定裝置,用于根據(jù)該用戶需求變化強度,確定加權(quán)值; 其中,所述子排序裝置包括 加權(quán)處理裝置,用于根據(jù)所述加權(quán)值,對所述至少一個資源項進(jìn)行所述加權(quán)處理。
21.根據(jù)權(quán)利要求20所述的排序裝置,其中,所述加權(quán)處理裝置還包括 子加權(quán)處理裝置,用于根據(jù)所述加權(quán)值,并結(jié)合所述至少一個資源項中每個資源項的建立或更新時間,對所述至少一個資源項進(jìn)行所述加權(quán)處理。
22.根據(jù)權(quán)利要求19至21中任一項所述的排序裝置,其中,所述新鮮度相關(guān)信息包括以下至少一項 -資源項的建立或更新時間以及預(yù)確定的所述輸入序列的用戶需求突增時間; -所述輸入序列的歷史檢索記錄中包含的資源項。
23.一種計算機設(shè)備,包括如權(quán)利要求12至22中至少一項所述的排序裝置。
全文摘要
本發(fā)明提供一種用于對資源項進(jìn)行排序的方法、裝置和設(shè)備,根據(jù)本發(fā)明的方案根據(jù)來自用戶的輸入序列來獲取與該輸入序列相關(guān)的時效信息;并根據(jù)所述時效信息是否滿足預(yù)定條件,判斷所述輸入序列是否具有時效性;并當(dāng)判斷所述輸入序列具有時效性時,對基于所述輸入序列進(jìn)行檢索來獲得的資源項進(jìn)行時效性排序,以將排序后的資源項提供給所述用戶。與現(xiàn)有技術(shù)相比,本發(fā)明具有以下優(yōu)點1)針對基于具有時效性的輸入序列進(jìn)行檢索所得的資源項進(jìn)行時效性排序,以將可能與該輸入序列的時效性相關(guān)的資源項排序提前,更好地滿足了用戶的突發(fā)檢索需求;2)根據(jù)資源項的新鮮度來執(zhí)行時效性排序,從而獲得更好的時效性排序結(jié)果。
文檔編號G06F17/30GK102955829SQ20111025412
公開日2013年3月6日 申請日期2011年8月30日 優(yōu)先權(quán)日2011年8月30日
發(fā)明者刁士涵, 辜斯繆 申請人:北京百度網(wǎng)訊科技有限公司