專利名稱:熱點(diǎn)事件與實(shí)時(shí)評(píng)論的獲取方法及裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及信息檢索領(lǐng)域,尤其涉及一種熱點(diǎn)事件與實(shí)時(shí)評(píng)論的獲取方法及裝置。
背景技術(shù):
通過(guò)搜索門(mén)戶的搜索,可以獲取到時(shí)事類網(wǎng)站的熱點(diǎn)事件與實(shí)時(shí)評(píng)論等相關(guān)時(shí)事類內(nèi)容;但是目前國(guó)內(nèi)包括世界的時(shí)事類內(nèi)容的發(fā)現(xiàn)與追蹤,基本上還依賴于傳統(tǒng)的人工整理的方法,該人工整理的方法獲取的時(shí)事類內(nèi)容準(zhǔn)確,但無(wú)法快速發(fā)現(xiàn)并獲取當(dāng)前的熱點(diǎn)事件與實(shí)時(shí)評(píng)論。
發(fā)明內(nèi)容
本發(fā)明的實(shí)施例提供一種熱點(diǎn)事件與實(shí)時(shí)評(píng)論的獲取方法及裝置,能夠快速發(fā)現(xiàn)并獲取當(dāng)前的熱點(diǎn)事件與實(shí)時(shí)評(píng)論。為達(dá)到上述目的,本發(fā)明的實(shí)施例采用如下技術(shù)方案一種熱點(diǎn)事件與實(shí)時(shí)評(píng)論的獲取方法,包括實(shí)時(shí)獲取各個(gè)時(shí)事評(píng)論網(wǎng)站用戶發(fā)布的最新熱點(diǎn)事件與實(shí)時(shí)評(píng)論的相關(guān)信息;為所述最新熱點(diǎn)事件與實(shí)時(shí)評(píng)論的相關(guān)信息建立實(shí)時(shí)索引;根據(jù)用戶輸入的查詢關(guān)鍵字和查詢參數(shù)查詢所述實(shí)時(shí)索引,獲取與所述查詢關(guān)鍵字和查詢參數(shù)對(duì)應(yīng)的熱點(diǎn)事件與實(shí)時(shí)評(píng)論的相關(guān)內(nèi)容;將與所述查詢關(guān)鍵字和查詢參數(shù)對(duì)應(yīng)的熱點(diǎn)事件與實(shí)時(shí)評(píng)論的相關(guān)內(nèi)容顯示。一種熱點(diǎn)事件與實(shí)時(shí)評(píng)論的獲取裝置,包括第一獲取單元,用于實(shí)時(shí)獲取各個(gè)時(shí)事評(píng)論網(wǎng)站用戶發(fā)布的最新熱點(diǎn)事件與實(shí)時(shí)評(píng)論的相關(guān)信息;索引建立單元,用于為所述第一獲取單元獲取的最新熱點(diǎn)事件與實(shí)時(shí)評(píng)論的相關(guān)信息建立實(shí)時(shí)索引;第二獲取單元,用于根據(jù)用戶輸入的查詢關(guān)鍵字和查詢參數(shù)查詢所述實(shí)時(shí)索引, 獲取與所述查詢關(guān)鍵字和查詢參數(shù)對(duì)應(yīng)的熱點(diǎn)事件與實(shí)時(shí)評(píng)論的相關(guān)內(nèi)容;顯示單元,用于將所述第二獲取單元獲取的與所述檢索關(guān)鍵字對(duì)應(yīng)的熱點(diǎn)事件與實(shí)時(shí)評(píng)論的相關(guān)內(nèi)容顯示。本發(fā)明實(shí)施例提供的方法及裝置,用戶在獲取與查詢關(guān)鍵字和查詢參數(shù)對(duì)應(yīng)的點(diǎn)事件與實(shí)時(shí)評(píng)論的相關(guān)信息時(shí),是查詢從各個(gè)時(shí)事評(píng)論網(wǎng)站用戶發(fā)布的最新熱點(diǎn)事件與實(shí)時(shí)評(píng)論的相關(guān)信息的實(shí)時(shí)索引獲取的,所以檢測(cè)到的與該查詢關(guān)鍵字和查詢參數(shù)對(duì)應(yīng)的熱點(diǎn)事件與實(shí)時(shí)評(píng)論的相關(guān)內(nèi)容比比較快速,與現(xiàn)有技術(shù)中依賴于傳統(tǒng)的人工整理的方法相比,實(shí)現(xiàn)了快速發(fā)現(xiàn)并獲取當(dāng)前的熱點(diǎn)事件與實(shí)時(shí)評(píng)論的目的。
為了更清楚地說(shuō)明本發(fā)明實(shí)施例,下面將對(duì)實(shí)施例描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見(jiàn)地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。圖1為本發(fā)明實(shí)施例中一種熱點(diǎn)事件與實(shí)時(shí)評(píng)論的獲取方法流程圖;圖2為本發(fā)明實(shí)施例中一種實(shí)時(shí)獲取各個(gè)時(shí)事評(píng)論網(wǎng)站用戶發(fā)布的最新熱點(diǎn)事件與實(shí)時(shí)評(píng)論的相關(guān)信息的方法流程圖;圖3為本發(fā)明實(shí)施例中當(dāng)使用爬蟲(chóng)系統(tǒng)在按照社會(huì)化信息實(shí)時(shí)獲取各個(gè)時(shí)事評(píng)論網(wǎng)站用戶的基本信息的方法流程圖;圖4為本發(fā)明實(shí)施例中通過(guò)搜索門(mén)戶和索引系統(tǒng)的交互實(shí)現(xiàn)獲取與所述查詢關(guān)鍵字和查詢參數(shù)對(duì)應(yīng)的熱點(diǎn)事件與實(shí)時(shí)評(píng)論的相關(guān)內(nèi)容的方法流程圖;圖5為本發(fā)明實(shí)施例中根據(jù)用戶輸入的查詢關(guān)鍵字和查詢參數(shù)查詢所述實(shí)時(shí)索引,獲取與所述查詢關(guān)鍵字和查詢參數(shù)對(duì)應(yīng)的熱點(diǎn)事件與實(shí)時(shí)評(píng)論的相關(guān)內(nèi)容的方法流程圖;圖6為本發(fā)明實(shí)施例中一種熱點(diǎn)事件與實(shí)時(shí)評(píng)論的獲取裝置的組成框圖;圖7為本發(fā)明實(shí)施例中另一種熱點(diǎn)事件與實(shí)時(shí)評(píng)論的獲取裝置的組成框圖;圖8為本發(fā)明實(shí)施例中另一種熱點(diǎn)事件與實(shí)時(shí)評(píng)論的獲取裝置的組成框圖;圖9為本發(fā)明實(shí)施例中另一種熱點(diǎn)事件與實(shí)時(shí)評(píng)論的獲取裝置的組成框圖;圖10為本發(fā)明實(shí)施例中另一種熱點(diǎn)事件與實(shí)時(shí)評(píng)論的獲取裝置的組成框圖。
具體實(shí)施例方式下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。本發(fā)明的實(shí)施例提供一種熱點(diǎn)事件與實(shí)時(shí)評(píng)論的獲取方法,如圖1所示,該方法包括101、實(shí)時(shí)獲取各個(gè)時(shí)事評(píng)論網(wǎng)站用戶發(fā)布的最新熱點(diǎn)事件與實(shí)時(shí)評(píng)論的相關(guān)信
肩、ο其中,所述實(shí)時(shí)獲取各個(gè)時(shí)事評(píng)論網(wǎng)站用戶發(fā)布的最新熱點(diǎn)事件與實(shí)時(shí)評(píng)論的相關(guān)信息,可以通過(guò)但不局限于以下的方法實(shí)現(xiàn),如圖2所示,包括1011、按照社會(huì)化信息實(shí)時(shí)獲取各個(gè)時(shí)事評(píng)論網(wǎng)站用戶的基本信息,所述用戶的基本信息包含用戶的統(tǒng)一資源定位符(Uniform/Universal Resource Locator,Url)信息, 所述社會(huì)化信息包括用戶的粉絲列表和/或關(guān)注列表;另外,該用戶的基本信息除了 Url信息外,還保護(hù)用戶標(biāo)識(shí)、用戶昵稱等其他信息,本發(fā)明實(shí)施例對(duì)此不進(jìn)行具體的限制。其中,按照社會(huì)化信息實(shí)時(shí)獲取各個(gè)時(shí)事評(píng)論網(wǎng)站用戶的基本信息,可以通過(guò)實(shí)時(shí)爬蟲(chóng)系統(tǒng)實(shí)現(xiàn),但本發(fā)明實(shí)施例對(duì)此并不進(jìn)行限制,任何可以實(shí)時(shí)獲取各個(gè)時(shí)事評(píng)論網(wǎng)站用戶的基本信息的方法,都屬于本發(fā)明實(shí)施例保護(hù)的范圍。另外,需要說(shuō)明的是,當(dāng)使用爬蟲(chóng)系統(tǒng)在按照社會(huì)化信息實(shí)時(shí)獲取各個(gè)時(shí)事評(píng)論網(wǎng)站用戶的基本信息時(shí),可以通過(guò)觸發(fā)并調(diào)度已存儲(chǔ)的用戶基本信息庫(kù)來(lái)實(shí)現(xiàn),具體如圖3所示為首先,調(diào)度模塊接收發(fā)現(xiàn)模塊提交的發(fā)現(xiàn)各個(gè)時(shí)事評(píng)論網(wǎng)站用戶的基本信息發(fā)現(xiàn)請(qǐng)求;其次,調(diào)度模塊按照社會(huì)化信息從用戶基本信息庫(kù)(用戶種子庫(kù))獲取各個(gè)時(shí)事評(píng)論網(wǎng)站用戶的基本信息(用戶種子信息),并將用戶的基本信息返回給發(fā)現(xiàn)模塊,發(fā)現(xiàn)模塊便獲取了各個(gè)時(shí)事評(píng)論網(wǎng)站用戶的基本信息。1012、根據(jù)所述tol信息下載對(duì)應(yīng)網(wǎng)頁(yè)內(nèi)容。另外,為了能夠以最快的方式獲取最新,最熱,最及時(shí)的時(shí)事評(píng)論信息,在根據(jù)所述tol信息下載所述用戶發(fā)布的評(píng)論內(nèi)容時(shí),可以通過(guò)多線程并采用異步的方式,根據(jù)所述tol信息下載所述用戶發(fā)布的評(píng)論信息。需要說(shuō)明的是,當(dāng)步驟1011中將獲取的鏈接暫存時(shí),在執(zhí)行步驟1012之前,需要調(diào)度模塊調(diào)度出該鏈接。另外,需要說(shuō)明的是,在獲取了所述用戶的tol信息之后,可以直接執(zhí)行步驟1013 的操作,也可以將該獲取鏈接暫存,等待調(diào)度模塊的調(diào)度之后再執(zhí)行步驟1013的操作,本發(fā)明實(shí)施例對(duì)此不進(jìn)行限制。當(dāng)將該用戶的Url信息暫存時(shí),可以為該用戶的Url信息設(shè)置一個(gè)緩存隊(duì)列,將該用戶的Url信息暫存到存儲(chǔ)隊(duì)列中,當(dāng)被調(diào)度模塊調(diào)用時(shí),按照隊(duì)列先進(jìn)先出的原則,將先緩存的用戶的tol信息調(diào)出,以保證獲取的熱點(diǎn)事件與實(shí)時(shí)評(píng)論的相關(guān)信息實(shí)時(shí)性;但本發(fā)明實(shí)施例對(duì)此也不進(jìn)行具體限制,任何可以暫存該用戶的Url信息的存儲(chǔ)方式,都屬于本發(fā)明實(shí)施例保護(hù)的范圍,考慮到隊(duì)列先進(jìn)先出的特性,優(yōu)選隊(duì)列暫存。1013、解析所述網(wǎng)頁(yè)內(nèi)容,獲取所述用戶發(fā)布的最新熱點(diǎn)事件與實(shí)時(shí)評(píng)論的相關(guān)
fn息ο102、為所述最新熱點(diǎn)事件與實(shí)時(shí)評(píng)論的相關(guān)信息建立實(shí)時(shí)索引。其中,所述實(shí)時(shí)索引包括內(nèi)存索引和磁盤(pán)索引;為所述最新熱點(diǎn)事件與實(shí)時(shí)評(píng)論的相關(guān)信息建立實(shí)時(shí)索引包括通過(guò)索引接口為所述最新熱點(diǎn)事件與實(shí)時(shí)評(píng)論的相關(guān)信息建立內(nèi)存索引;當(dāng)所述內(nèi)存索引超過(guò)預(yù)定大小后,將所述內(nèi)存索引合并到磁盤(pán)索引。103、根據(jù)用戶輸入的查詢關(guān)鍵字和查詢參數(shù)查詢所述實(shí)時(shí)索引,獲取與所述查詢關(guān)鍵字和查詢參數(shù)對(duì)應(yīng)的熱點(diǎn)事件與實(shí)時(shí)評(píng)論的相關(guān)內(nèi)容。在具體實(shí)施該步驟時(shí),該通過(guò)搜索門(mén)戶和索引系統(tǒng)的交互實(shí)現(xiàn),具體的如圖4所示,包括首先,用戶通過(guò)搜索門(mén)戶輸入查詢關(guān)鍵字和查詢參數(shù);其次,索引系統(tǒng)在接收到用戶輸入的查詢關(guān)鍵字和查詢參數(shù)后,根據(jù)用戶輸入的查詢關(guān)鍵字和查詢參數(shù)查詢所述實(shí)時(shí)索引,獲取與所述查詢關(guān)鍵字和查詢參數(shù)對(duì)應(yīng)的熱點(diǎn)事件與實(shí)時(shí)評(píng)論的相關(guān)內(nèi)容;再次, 索引系統(tǒng)將獲取與所述查詢關(guān)鍵字和查詢參數(shù)對(duì)應(yīng)的熱點(diǎn)事件與實(shí)時(shí)評(píng)論的相關(guān)內(nèi)容返回給搜索門(mén)戶。其中,在根據(jù)用戶輸入的查詢關(guān)鍵字和查詢參數(shù)查詢所述實(shí)時(shí)索引,獲取與所述查詢關(guān)鍵字和查詢參數(shù)對(duì)應(yīng)的熱點(diǎn)事件與實(shí)時(shí)評(píng)論的相關(guān)內(nèi)容時(shí),可以通過(guò)但不局限于以下的方法實(shí)現(xiàn),具體如圖5所示,該方法包括1031、對(duì)所述查詢關(guān)鍵字進(jìn)行分詞處理,并根據(jù)所述查詢參數(shù)拼裝查詢邏輯。1032、根據(jù)分詞處理后的查詢關(guān)鍵字和所述查詢邏輯查詢所述實(shí)時(shí)索引,得到查詢結(jié)果。1033、對(duì)所述查詢結(jié)果進(jìn)行歸并、二次排序以及過(guò)濾操作,得到與所述查詢關(guān)鍵字
6和查詢參數(shù)對(duì)應(yīng)的熱點(diǎn)事件與實(shí)時(shí)評(píng)論的相關(guān)內(nèi)容。104、將與所述查詢關(guān)鍵字和查詢參數(shù)對(duì)應(yīng)的熱點(diǎn)事件與實(shí)時(shí)評(píng)論的相關(guān)內(nèi)容顯示。
其中,在將與所述查詢關(guān)鍵字和查詢參數(shù)對(duì)應(yīng)的熱點(diǎn)事件與實(shí)時(shí)評(píng)論的相關(guān)內(nèi)容顯示時(shí),可以根據(jù)用戶具體的需求,將該與所述查詢關(guān)鍵字和查詢參數(shù)對(duì)應(yīng)的熱點(diǎn)事件與實(shí)時(shí)評(píng)論的相關(guān)內(nèi)容,以圖文并茂的方式重組,并將重組后的以圖文并茂與所述查詢關(guān)鍵字和查詢參數(shù)對(duì)應(yīng)的熱點(diǎn)事件與實(shí)時(shí)評(píng)論的相關(guān)內(nèi)容顯示給檢索用戶,達(dá)到界面友好的目的,但本發(fā)明實(shí)施例對(duì)此不進(jìn)行限制,任何顯示該與所述查詢關(guān)鍵字和查詢參數(shù)對(duì)應(yīng)的熱點(diǎn)事件與實(shí)時(shí)評(píng)論的相關(guān)內(nèi)容的顯示方法,都屬于本發(fā)明實(shí)施例保護(hù)的范圍之內(nèi)。進(jìn)一步的,在按照社會(huì)化信息實(shí)時(shí)獲取各個(gè)時(shí)事評(píng)論網(wǎng)站用戶的基本信息之后, 還可以將所述用戶的基本信息保存到基本信息數(shù)據(jù)庫(kù),以便查詢用戶在查詢時(shí)的再次使用。進(jìn)一步的,為了方便實(shí)時(shí)評(píng)論信息在數(shù)據(jù)庫(kù)中的存儲(chǔ),本發(fā)明實(shí)施例在數(shù)據(jù)庫(kù)中分別預(yù)定義了用戶信息表、評(píng)論內(nèi)容信息表和用戶表;其中,所述用戶信息表用戶存儲(chǔ)時(shí)事評(píng)論用戶的基本信息;所述評(píng)論內(nèi)容信息表用戶存儲(chǔ)評(píng)論內(nèi)容;所述用戶表用于存儲(chǔ)用戶的標(biāo)識(shí)和用戶的Url信息。在根據(jù)所述Url信息下載所述用戶發(fā)布的最新熱點(diǎn)事件與實(shí)時(shí)評(píng)論的相關(guān)信息之后,根據(jù)所述Url信息和下載的所述用戶發(fā)布的最新熱點(diǎn)事件與實(shí)時(shí)評(píng)論的相關(guān)信息,更新數(shù)據(jù)庫(kù)中預(yù)定義的評(píng)論內(nèi)容信息表和用戶表。其中,更新用戶信息表的操作具體操作包括在根據(jù)所述鏈接獲取所述用戶的基本信息之后,查詢存儲(chǔ)在數(shù)據(jù)庫(kù)中的預(yù)定義的用戶信息表,確定所述用戶信息表中是否存在所述用戶的基本信息;若所述用戶信息表中不存在所述用戶的基本信息,則將用戶的基本信息存儲(chǔ)在所述用戶信息表中;若所述用戶信息表中存在所述用戶的基本信息,則在所述用戶信息表中更新所述用戶的基本信息。其中,更新評(píng)論內(nèi)容信息表和用戶表的操作具體包括在根據(jù)所述tol信息下載所述用戶發(fā)布的評(píng)論內(nèi)容之后,根據(jù)所述tol信息和下載的所述用戶發(fā)布的評(píng)論內(nèi)容,更新數(shù)據(jù)庫(kù)中預(yù)定義的評(píng)論內(nèi)容信息表和用戶表。需要說(shuō)明的是,本發(fā)明實(shí)施例中的數(shù)據(jù)庫(kù)可以為分布式數(shù)據(jù)庫(kù),但本發(fā)明實(shí)施例對(duì)此不進(jìn)行限制。本發(fā)明實(shí)施例中,用戶在獲取與查詢關(guān)鍵字和查詢參數(shù)對(duì)應(yīng)的點(diǎn)事件與實(shí)時(shí)評(píng)論的相關(guān)信息時(shí),是查詢從各個(gè)時(shí)事評(píng)論網(wǎng)站用戶發(fā)布的最新熱點(diǎn)事件與實(shí)時(shí)評(píng)論的相關(guān)信息的實(shí)時(shí)索引獲取的,所以檢測(cè)到的與該查詢關(guān)鍵字和查詢參數(shù)對(duì)應(yīng)的熱點(diǎn)事件與實(shí)時(shí)評(píng)論的相關(guān)內(nèi)容比比較快速,與現(xiàn)有技術(shù)中依賴于傳統(tǒng)的人工整理的方法相比,實(shí)現(xiàn)了快速發(fā)現(xiàn)并獲取當(dāng)前的熱點(diǎn)事件與實(shí)時(shí)評(píng)論的目的。并且,本發(fā)明實(shí)施例中,在根據(jù)所述tol信息下載所述用戶發(fā)布的評(píng)論信息時(shí),可以通過(guò)多線程并采用異步的方式,根據(jù)所述tol信息下載所述用戶發(fā)布的評(píng)論信息,能夠以最快的方式獲取最新,最熱,最及時(shí)的時(shí)事評(píng)論信息。本發(fā)明的實(shí)施例還提供一種熱點(diǎn)事件與實(shí)時(shí)評(píng)論的獲取裝置,如圖6所示,包括 第一獲取單元21、索引建立單元22、第二獲取單元23、顯示單元對(duì)。第一獲取單元21,用于實(shí)時(shí)獲取各個(gè)時(shí)事評(píng)論網(wǎng)站用戶發(fā)布的最新熱點(diǎn)事件與實(shí)時(shí)評(píng)論的相關(guān)信息。索引建立單元22,用于為所述第一獲取單元獲取的最新熱點(diǎn)事件與實(shí)時(shí)評(píng)論的相關(guān)信息建立實(shí)時(shí)索引。第二獲取單元23,用于根據(jù)用戶輸入的查詢關(guān)鍵字和查詢參數(shù)查詢所述實(shí)時(shí)索引,獲取與所述查詢關(guān)鍵字和查詢參數(shù)對(duì)應(yīng)的熱點(diǎn)事件與實(shí)時(shí)評(píng)論的相關(guān)內(nèi)容。顯示單元M,用于將所述第二獲取單元獲取的與所述查詢關(guān)鍵字和查詢參數(shù)對(duì)應(yīng)的熱點(diǎn)事件與實(shí)時(shí)評(píng)論的相關(guān)內(nèi)容顯示。其中,在所述顯示單元M將所述與所述查詢關(guān)鍵字和查詢參數(shù)對(duì)應(yīng)的熱點(diǎn)事件與實(shí)時(shí)評(píng)論的相關(guān)內(nèi)容顯示時(shí),可以根據(jù)用戶具體的需求, 將該與所述查詢關(guān)鍵字和查詢參數(shù)對(duì)應(yīng)的熱點(diǎn)事件與實(shí)時(shí)評(píng)論的相關(guān)內(nèi)容,以圖文并茂的方式重組,并將重組后的以圖文并茂與所述查詢關(guān)鍵字和查詢參數(shù)對(duì)應(yīng)的熱點(diǎn)事件與實(shí)時(shí)評(píng)論的相關(guān)內(nèi)容顯示給檢索用戶,達(dá)到界面友好的目的,但本發(fā)明實(shí)施例對(duì)此不進(jìn)行限制, 任何顯示該與所述查詢關(guān)鍵字和查詢參數(shù)對(duì)應(yīng)的熱點(diǎn)事件與實(shí)時(shí)評(píng)論的相關(guān)內(nèi)容的顯示方法,都屬于本發(fā)明實(shí)施例保護(hù)的范圍之內(nèi)。進(jìn)一步,如圖7所示,所述第一獲取單元21包括第一獲取模塊211、下載模塊 212、解析獲取模塊213。第一獲取模塊211,用于按照社會(huì)化信息實(shí)時(shí)獲取各個(gè)時(shí)事評(píng)論網(wǎng)站用戶的基本信息,所述用戶的基本信息包含用戶的Url信息,所述社會(huì)化信息包括用戶的粉絲列表和/ 或關(guān)注列表;另外,該用戶的基本信息除了 Url信息外,還保護(hù)用戶標(biāo)識(shí)、用戶昵稱等其他信息;其中,所述第一獲模塊211按照社會(huì)化信息實(shí)時(shí)獲取各個(gè)時(shí)事評(píng)論網(wǎng)站用戶的基本信息,可以通過(guò)實(shí)時(shí)爬蟲(chóng)系統(tǒng)實(shí)現(xiàn),但本發(fā)明實(shí)施例對(duì)此并不進(jìn)行限制,任何可以獲取各個(gè)時(shí)事評(píng)論網(wǎng)站用戶用戶的基本信息的方法,都屬于本發(fā)明實(shí)施例保護(hù)的范圍。下載模塊212,用于根據(jù)所述tol信息下載對(duì)應(yīng)網(wǎng)頁(yè)內(nèi)容;其中,所述下載模塊213 根據(jù)所述tol信息下載對(duì)應(yīng)網(wǎng)頁(yè)內(nèi)容時(shí),可以通過(guò)多線程并采用異步的方式進(jìn)行,但本發(fā)明實(shí)施例對(duì)此不進(jìn)行限制。解析獲取模塊214,用于解析所述網(wǎng)頁(yè)內(nèi)容,獲取所述用戶發(fā)布的最新熱點(diǎn)事件與實(shí)時(shí)評(píng)論的相關(guān)信息。進(jìn)一步可選的,如圖8所示,該熱點(diǎn)事件與實(shí)時(shí)評(píng)論的獲取裝置還包括數(shù)據(jù)保存單元25。數(shù)據(jù)保存單元25,用于在按照社會(huì)化信息實(shí)時(shí)獲取各個(gè)時(shí)事評(píng)論網(wǎng)站用戶的基本信息之后,將所述用戶的基本信息保存到數(shù)據(jù)庫(kù)。進(jìn)一步可選的,所述實(shí)時(shí)索引包括內(nèi)存索引和磁盤(pán)索引;如圖9所示,所述索引建立單元22包括索引建立模塊221和索引合并模塊222。索引建立模塊221,用于通過(guò)索引接口為所述最新熱點(diǎn)事件與實(shí)時(shí)評(píng)論的相關(guān)信息建立內(nèi)存索引。索引合并模塊222,用于當(dāng)所述內(nèi)存索引超過(guò)預(yù)定大小后,將所述內(nèi)存索引合并到磁盤(pán)索引。進(jìn)一步可選的,如圖10所示,所述第二獲取單元23包括分詞處理模塊231、拼裝模塊232、查詢模塊233、獲取模塊234。分詞處理模塊231,用于對(duì)所述查詢關(guān)鍵字進(jìn)行分詞處理;
8
拼裝模塊232,用于根據(jù)所述查詢參數(shù)拼裝查詢邏輯;查詢模塊233,用于根據(jù)分詞處理后的查詢關(guān)鍵字和所述查詢邏輯查詢所述實(shí)時(shí)索引,得到查詢結(jié)果;獲取模塊234,用于對(duì)所述查詢結(jié)果進(jìn)行歸并、二次排序以及過(guò)濾操作,得到與所述查詢關(guān)鍵字和查詢參數(shù)對(duì)應(yīng)的熱點(diǎn)事件與實(shí)時(shí)評(píng)論的相關(guān)內(nèi)容。需要說(shuō)明的是,本發(fā)明實(shí)施例所包含各功能模塊的其他描述,可以參考圖1至圖5 對(duì)應(yīng)的描述,本發(fā)明實(shí)施例此處將不再贅述。本發(fā)明實(shí)施例中,用戶在獲取與查詢關(guān)鍵字和查詢參數(shù)對(duì)應(yīng)的點(diǎn)事件與實(shí)時(shí)評(píng)論的相關(guān)信息時(shí),是查詢從各個(gè)時(shí)事評(píng)論網(wǎng)站用戶發(fā)布的最新熱點(diǎn)事件與實(shí)時(shí)評(píng)論的相關(guān)信息的實(shí)時(shí)索引獲取的,所以檢測(cè)到的與該查詢關(guān)鍵字和查詢參數(shù)對(duì)應(yīng)的熱點(diǎn)事件與實(shí)時(shí)評(píng)論的相關(guān)內(nèi)容比比較快速,與現(xiàn)有技術(shù)中依賴于傳統(tǒng)的人工整理的方法相比,實(shí)現(xiàn)了快速發(fā)現(xiàn)并獲取當(dāng)前的熱點(diǎn)事件與實(shí)時(shí)評(píng)論的目的。并且,本發(fā)明實(shí)施例中,在根據(jù)所述tol信息下載所述用戶發(fā)布的評(píng)論信息時(shí),可以通過(guò)多線程并采用異步的方式,根據(jù)所述tol信息下載所述用戶發(fā)布的評(píng)論信息,能夠以最快的方式獲取最新,最熱,最及時(shí)的時(shí)事評(píng)論信息通過(guò)以上的實(shí)施方式的描述,所屬領(lǐng)域的技術(shù)人員可以清楚地了解到本發(fā)明可借助軟件加必需的通用硬件的方式來(lái)實(shí)現(xiàn),當(dāng)然也可以通過(guò)硬件,但很多情況下前者是更佳的實(shí)施方式?;谶@樣的理解,本發(fā)明的技術(shù)方案本質(zhì)上或者說(shuō)對(duì)現(xiàn)有技術(shù)做出貢獻(xiàn)的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來(lái),該計(jì)算機(jī)軟件產(chǎn)品存儲(chǔ)在可讀取的存儲(chǔ)介質(zhì)中,如計(jì)算機(jī)的軟盤(pán),硬盤(pán)或光盤(pán)等,包括若干指令用以使得一臺(tái)計(jì)算機(jī)設(shè)備(可以是個(gè)人計(jì)算機(jī), 服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個(gè)實(shí)施例所述的方法。以上所述,僅為本發(fā)明的具體實(shí)施方式
,但本發(fā)明的保護(hù)范圍并不局限于此,任何熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi),可輕易想到變化或替換,都應(yīng)涵蓋在本發(fā)明的保護(hù)范圍之內(nèi)。因此,本發(fā)明的保護(hù)范圍應(yīng)以所述權(quán)利要求的保護(hù)范圍為準(zhǔn)。
權(quán)利要求
1.一種熱點(diǎn)事件與實(shí)時(shí)評(píng)論的獲取方法,其特征在于,包括實(shí)時(shí)獲取各個(gè)時(shí)事評(píng)論網(wǎng)站用戶發(fā)布的最新熱點(diǎn)事件與實(shí)時(shí)評(píng)論的相關(guān)信息;為所述最新熱點(diǎn)事件與實(shí)時(shí)評(píng)論的相關(guān)信息建立實(shí)時(shí)索引;根據(jù)用戶輸入的查詢關(guān)鍵字和查詢參數(shù)查詢所述實(shí)時(shí)索引,獲取與所述查詢關(guān)鍵字和查詢參數(shù)對(duì)應(yīng)的熱點(diǎn)事件與實(shí)時(shí)評(píng)論的相關(guān)內(nèi)容;將與所述查詢關(guān)鍵字和查詢參數(shù)對(duì)應(yīng)的熱點(diǎn)事件與實(shí)時(shí)評(píng)論的相關(guān)內(nèi)容顯示。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述實(shí)時(shí)獲取各個(gè)時(shí)事評(píng)論網(wǎng)站用戶發(fā)布的最新熱點(diǎn)事件與實(shí)時(shí)評(píng)論的相關(guān)信息,包括按照社會(huì)化信息實(shí)時(shí)獲取各個(gè)時(shí)事評(píng)論網(wǎng)站用戶的基本信息,所述用戶的基本信息包含用戶的統(tǒng)一資源定位符Url信息,所述社會(huì)化信息包括用戶的粉絲列表和/或關(guān)注列表;根據(jù)所述Url信息下載對(duì)應(yīng)網(wǎng)頁(yè)內(nèi)容;解析所述網(wǎng)頁(yè)內(nèi)容,獲取所述用戶發(fā)布的最新熱點(diǎn)事件與實(shí)時(shí)評(píng)論的相關(guān)信息。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,在按照社會(huì)化信息實(shí)時(shí)獲取各個(gè)時(shí)事評(píng)論網(wǎng)站用戶的基本信息之后,還包括將所述用戶的基本信息保存到基本信息數(shù)據(jù)庫(kù)。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述實(shí)時(shí)索引包括內(nèi)存索引和磁盤(pán)索引; 為所述最新熱點(diǎn)事件與實(shí)時(shí)評(píng)論的相關(guān)信息建立實(shí)時(shí)索引包括通過(guò)索引接口為所述最新熱點(diǎn)事件與實(shí)時(shí)評(píng)論的相關(guān)信息建立內(nèi)存索引;當(dāng)所述內(nèi)存索引超過(guò)預(yù)定大小后,將所述內(nèi)存索引合并到磁盤(pán)索引。
5.根據(jù)權(quán)利要求1-4任一項(xiàng)所述的方法,其特征在于,所述根據(jù)用戶輸入的查詢關(guān)鍵字和查詢參數(shù)查詢所述實(shí)時(shí)索引,獲取與所述查詢關(guān)鍵字和查詢參數(shù)對(duì)應(yīng)的熱點(diǎn)事件與實(shí)時(shí)評(píng)論的相關(guān)內(nèi)容包括對(duì)所述查詢關(guān)鍵字進(jìn)行分詞處理,并根據(jù)所述查詢參數(shù)拼裝查詢邏輯;根據(jù)分詞處理后的查詢關(guān)鍵字和所述查詢邏輯查詢所述實(shí)時(shí)索引,得到查詢結(jié)果;對(duì)所述查詢結(jié)果進(jìn)行歸并、二次排序以及過(guò)濾操作,得到與所述查詢關(guān)鍵字和查詢參數(shù)對(duì)應(yīng)的熱點(diǎn)事件與實(shí)時(shí)評(píng)論的相關(guān)內(nèi)容。
6.一種熱點(diǎn)事件與實(shí)時(shí)評(píng)論的獲取裝置,其特征在于,包括第一獲取單元,用于實(shí)時(shí)獲取各個(gè)時(shí)事評(píng)論網(wǎng)站用戶發(fā)布的最新熱點(diǎn)事件與實(shí)時(shí)評(píng)論的相關(guān)信息;索引建立單元,用于為所述第一獲取單元獲取的最新熱點(diǎn)事件與實(shí)時(shí)評(píng)論的相關(guān)信息建立實(shí)時(shí)索引;第二獲取單元,用于根據(jù)用戶輸入的查詢關(guān)鍵字和查詢參數(shù)查詢所述實(shí)時(shí)索引,獲取與所述查詢關(guān)鍵字和查詢參數(shù)對(duì)應(yīng)的熱點(diǎn)事件與實(shí)時(shí)評(píng)論的相關(guān)內(nèi)容;顯示單元,用于將所述第二獲取單元獲取的與所述查詢關(guān)鍵字和查詢參數(shù)對(duì)應(yīng)的熱點(diǎn)事件與實(shí)時(shí)評(píng)論的相關(guān)內(nèi)容顯示。
7.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述第一獲取單元包括第一獲取模塊,用于按照社會(huì)化信息實(shí)時(shí)獲取各個(gè)時(shí)事評(píng)論網(wǎng)站用戶的基本信息,所述用戶的基本信息包含用戶的統(tǒng)一資源定位符Url信息,所述社會(huì)化信息包括用戶的粉絲列表和/或關(guān)注列表;下載模塊,用于根據(jù)所述Url信息下載對(duì)應(yīng)網(wǎng)頁(yè)內(nèi)容;解析獲取模塊,用于解析所述網(wǎng)頁(yè)內(nèi)容,獲取所述用戶發(fā)布的最新熱點(diǎn)事件與實(shí)時(shí)評(píng)論的相關(guān)信息。
8.根據(jù)權(quán)利要求7所述的裝置,其特征在于,還包括數(shù)據(jù)保存單元,用于在按照社會(huì)化信息實(shí)時(shí)獲取各個(gè)時(shí)事評(píng)論網(wǎng)站用戶的基本信息之后,將所述用戶的基本信息保存到數(shù)據(jù)庫(kù)。
9.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述實(shí)時(shí)索引包括內(nèi)存索引和磁盤(pán)索引; 所述索引建立單元包括索引建立模塊,用于通過(guò)索引接口為所述最新熱點(diǎn)事件與實(shí)時(shí)評(píng)論的相關(guān)信息建立內(nèi)存索引;索引合并模塊,用于當(dāng)所述內(nèi)存索引超過(guò)預(yù)定大小后,將所述內(nèi)存索引合并到磁盤(pán)索引。
10.根據(jù)權(quán)利要求6-9任一項(xiàng)所述的裝置,所述第二獲取單元包括 分詞處理模塊,用于對(duì)所述查詢關(guān)鍵字進(jìn)行分詞處理;拼裝模塊,用于根據(jù)所述查詢參數(shù)拼裝查詢邏輯;查詢模塊,用于根據(jù)分詞處理后的查詢關(guān)鍵字和所述查詢邏輯查詢所述實(shí)時(shí)索引,得到查詢結(jié)果;獲取模塊,用于對(duì)所述查詢結(jié)果進(jìn)行歸并、二次排序以及過(guò)濾操作,得到與所述查詢關(guān)鍵字和查詢參數(shù)對(duì)應(yīng)的熱點(diǎn)事件與實(shí)時(shí)評(píng)論的相關(guān)內(nèi)容。
全文摘要
本發(fā)明實(shí)施例公開(kāi)了一種熱點(diǎn)事件與實(shí)時(shí)評(píng)論的獲取方法及裝置,涉及信息檢索領(lǐng)域,能夠快速發(fā)現(xiàn)并獲取當(dāng)前的熱點(diǎn)事件與實(shí)時(shí)評(píng)論。本發(fā)明的方法包括實(shí)時(shí)獲取各個(gè)時(shí)事評(píng)論網(wǎng)站用戶發(fā)布的最新熱點(diǎn)事件與實(shí)時(shí)評(píng)論的相關(guān)信息;為所述最新熱點(diǎn)事件與實(shí)時(shí)評(píng)論的相關(guān)信息建立實(shí)時(shí)索引;根據(jù)用戶輸入的查詢關(guān)鍵字和查詢參數(shù)查詢所述實(shí)時(shí)索引,獲取與所述查詢關(guān)鍵字和查詢參數(shù)對(duì)應(yīng)的熱點(diǎn)事件與實(shí)時(shí)評(píng)論的相關(guān)內(nèi)容;將與所述查詢關(guān)鍵字和查詢參數(shù)對(duì)應(yīng)的熱點(diǎn)事件與實(shí)時(shí)評(píng)論的相關(guān)內(nèi)容顯示。本發(fā)明的實(shí)施例主要用于熱點(diǎn)事件與實(shí)時(shí)評(píng)論的獲取過(guò)程中。
文檔編號(hào)G06F17/30GK102508884SQ20111031730
公開(kāi)日2012年6月20日 申請(qǐng)日期2011年10月18日 優(yōu)先權(quán)日2011年10月18日
發(fā)明者劉坤, 劉飛, 王澤輝, 羅鑫平, 陳遠(yuǎn)翔 申請(qǐng)人:盤(pán)古文化傳播有限公司