專利名稱:微博內(nèi)容監(jiān)測(cè)方法及監(jiān)測(cè)系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及互聯(lián)網(wǎng)領(lǐng)域,尤其涉及一種微博內(nèi)容監(jiān)測(cè)方法和微博內(nèi)容監(jiān)測(cè)系統(tǒng)。
背景技術(shù):
微博以其短小快速的獨(dú)特魅力迅速吸引了大量用戶,引發(fā)了微博議事的浪潮。跟其他信息傳播方式相比,微博有其獨(dú)到之處。首先,它能更快速地發(fā)布和傳播信息。由于字?jǐn)?shù)的限制,微博發(fā)布的內(nèi)容短小精悍,100多字的文本相當(dāng)于兩三條短信,不用像寫博客一樣花很多精力去構(gòu)思,內(nèi)容迅速生成。第二,微博可以允許任何人或指定人群閱讀、回復(fù)、轉(zhuǎn)發(fā),實(shí)現(xiàn)了一對(duì)多、多對(duì)多的N級(jí)傳播。第三,微博的傳播效果更為顯著。短小精悍的信息在到達(dá)受眾層面時(shí),不會(huì)耗費(fèi)太多的時(shí)間去理解,內(nèi)容的簡(jiǎn)易使其更容易被接受。第四,微博具有實(shí)時(shí)交互式傳播的特性。當(dāng)前,很多信息都是從微博上第一時(shí)間先被發(fā)布的。由于微博具有裂變性、主動(dòng)性、即時(shí)性等特點(diǎn),越來越多的網(wǎng)民樂意通過這種渠道來獲取信息、表達(dá)觀點(diǎn)和傳播思想。微博的傳播方式和影響力在急劇增大?;谖⒉┑墓δ芴匦?,也衍生出了微博用戶特有的行為特征和內(nèi)容的特型,形成兩種形式的傳播路徑。但是,微博是一柄雙刃劍。它既方便了信息的傳播,同時(shí)也加大了危機(jī)爆發(fā)的頻率和破壞力。本發(fā)明的發(fā)明人對(duì)微博監(jiān)控相關(guān)技術(shù)進(jìn)行了研究,發(fā)現(xiàn)現(xiàn)有的與微博有關(guān)的技術(shù)都是偏向于發(fā)布方式和瀏覽終端的設(shè)備等方面,缺乏針對(duì)內(nèi)容的主動(dòng)監(jiān)管與后續(xù)跟蹤處理的技術(shù)。由于缺少針對(duì)微博的實(shí)時(shí)監(jiān)測(cè)方法,在出現(xiàn)突發(fā)事件或敏感事件的第一時(shí)間,有可能產(chǎn)生誤導(dǎo)廣大群眾的負(fù)面言論。而上述與微博有關(guān)的技術(shù)不能使各政企機(jī)構(gòu)及時(shí)監(jiān)控微博內(nèi)容。
發(fā)明內(nèi)容
本發(fā)明的發(fā)明人發(fā)現(xiàn)上述現(xiàn)有技術(shù)中對(duì)微博缺乏實(shí)時(shí)監(jiān)測(cè)等問題,并因此針對(duì)該問題提出了一種新的技術(shù)方案。本發(fā)明的一個(gè)目的是提供一種微博內(nèi)容監(jiān)測(cè)方法,用于使用戶能夠及時(shí)準(zhǔn)確地監(jiān)測(cè)微博。根據(jù)本發(fā)明的第一方面,提供了一種微博內(nèi)容監(jiān)測(cè)方法。首先,根據(jù)關(guān)鍵詞對(duì)微博網(wǎng)站進(jìn)行檢索,以采集包含所述關(guān)鍵詞的微博。然后,對(duì)所采集的微博進(jìn)行分類處理和評(píng)級(jí)處理。其中,分類處理是根據(jù)微博所包含的關(guān)鍵詞的類別對(duì)所述微博進(jìn)行分類。評(píng)級(jí)處理是計(jì)算微博的重要性指數(shù),并根據(jù)所述重要性指數(shù)和級(jí)別閾值得出微博的級(jí)別。最后,根據(jù)微博的級(jí)別生成監(jiān)測(cè)信息,并將監(jiān)測(cè)信息發(fā)送至與微博的類別相應(yīng)的接收終端。優(yōu)選地,對(duì)微博網(wǎng)站進(jìn)行檢索是采用垂直搜索技術(shù)或通過微博網(wǎng)站的API接口進(jìn)行檢索。該檢索可以是周期性進(jìn)行的,并可將所采集的微博內(nèi)容存入信息數(shù)據(jù)庫(kù)中。優(yōu)選地,在對(duì)微博網(wǎng)站進(jìn)行檢索之后,還可包括對(duì)所采集的微博進(jìn)行解析,并將解析結(jié)果存入所述信息數(shù)據(jù)庫(kù)。該解析結(jié)果可包括微博內(nèi)容、發(fā)布人、轉(zhuǎn)發(fā)數(shù)、評(píng)論數(shù)和發(fā)布時(shí)間。
優(yōu)選地,該微博內(nèi)容監(jiān)測(cè)方法還可包括記錄所采集的微博中的熱點(diǎn)詞匯,以作為下次檢索的關(guān)鍵詞。優(yōu)選地,該評(píng)級(jí)處理可包括利用索引從信息數(shù)據(jù)庫(kù)中提取所述解析結(jié)果;通過對(duì)所述微博內(nèi)容的解析結(jié)果進(jìn)行計(jì)算得到所述微博的重要性指數(shù);將所述重要性指數(shù)與所述級(jí)別閾值進(jìn)行比較,以得出所述微博的評(píng)級(jí)處理結(jié)果。優(yōu)選地,該微博內(nèi)容監(jiān)測(cè)方法還可包括對(duì)所述接收終端的反饋結(jié)果進(jìn)行統(tǒng)計(jì)分析。本發(fā)明還公開了一種微博內(nèi)容監(jiān)測(cè)系統(tǒng)。該系統(tǒng)可包括檢索單元、分類處理單元、 評(píng)級(jí)處理單元和監(jiān)測(cè)信息單元。其中,檢索單元用于根據(jù)關(guān)鍵詞對(duì)微博網(wǎng)站進(jìn)行檢索,以采集包含所述關(guān)鍵詞的微博。分類處理單元用于根據(jù)微博所包含的關(guān)鍵詞的類別對(duì)所述微博進(jìn)行分類。評(píng)級(jí)處理單元用于計(jì)算微博的重要性指數(shù),并根據(jù)所述重要性指數(shù)和級(jí)別閾值得出所述微博的級(jí)別。監(jiān)測(cè)信息單元用于根據(jù)微博的級(jí)別生成監(jiān)測(cè)信息,并將所述監(jiān)測(cè)信息發(fā)送至與所述微博的類別相應(yīng)的接收終端。優(yōu)選地,檢索單元采用垂直搜索技術(shù)或通過微博網(wǎng)站的API接口進(jìn)行檢索。對(duì)微博網(wǎng)站所進(jìn)行的檢索是周期性進(jìn)行的,并可將所采集的微博內(nèi)容存入信息數(shù)據(jù)庫(kù)中。優(yōu)選地,微博內(nèi)容監(jiān)測(cè)系統(tǒng)還可包括解析單元。該解析單元可用于對(duì)所采集的微博進(jìn)行解析,并將解析結(jié)果存入所述信息數(shù)據(jù)庫(kù)。該解析結(jié)果可包括微博內(nèi)容、發(fā)布人、轉(zhuǎn)發(fā)數(shù)、評(píng)論數(shù)和發(fā)布時(shí)間。優(yōu)選地,評(píng)級(jí)處理單元可利用索引從信息數(shù)據(jù)庫(kù)中提取所述解析結(jié)果。然后,對(duì)該解析結(jié)果進(jìn)行計(jì)算以得出微博的重要性指數(shù),并將所述重要性指數(shù)與所述級(jí)別閾值進(jìn)行比較,從而得出所述微博的評(píng)級(jí)處理結(jié)果。優(yōu)選地,微博內(nèi)容監(jiān)測(cè)系統(tǒng)還可包括統(tǒng)計(jì)分析單元。該統(tǒng)計(jì)分析單元可用于對(duì)反饋結(jié)果進(jìn)行統(tǒng)計(jì)分析。優(yōu)選地,檢索單元還可用于記錄所采集的微博中的熱點(diǎn)詞匯,以作為下次檢索的關(guān)鍵詞。本發(fā)明的一個(gè)優(yōu)點(diǎn)在于,采用本發(fā)明的技術(shù)方案,可以方便地從微博上獲取相關(guān)信息,并對(duì)所獲取的微博信息進(jìn)行分類處理和評(píng)級(jí)處理。從而根據(jù)微博的級(jí)別生成監(jiān)測(cè)信息,并將該監(jiān)測(cè)信息發(fā)送至相應(yīng)的接收終端。采用本發(fā)明能夠?qū)ξ⒉﹥?nèi)容進(jìn)行實(shí)時(shí)監(jiān)測(cè),有利于相關(guān)部門對(duì)微博信息進(jìn)行有效跟蹤和及時(shí)管理。通過以下參照附圖對(duì)本發(fā)明的示例性實(shí)施例的詳細(xì)描述,本發(fā)明的其它特征及其優(yōu)點(diǎn)將會(huì)變得清楚。
構(gòu)成說明書的一部分的附圖描述了本發(fā)明的實(shí)施例,并且連同說明書一起用于解釋本發(fā)明的原理。參照附圖,根據(jù)下面的詳細(xì)描述,可以更加清楚地理解本發(fā)明,其中圖I為本發(fā)明的一個(gè)實(shí)施例的微博內(nèi)容監(jiān)測(cè)方法的流程圖;圖2為本發(fā)明的另一個(gè)實(shí)施例的微博內(nèi)容監(jiān)測(cè)方法的流程圖3為本發(fā)明的一個(gè)實(shí)施例的微博內(nèi)容監(jiān)測(cè)系統(tǒng)的結(jié)構(gòu)示意圖;圖4為本發(fā)明的另一個(gè)實(shí)施例的微博內(nèi)容監(jiān)測(cè)系統(tǒng)的結(jié)構(gòu)示意圖。
具體實(shí)施例方式現(xiàn)在將參照附圖來詳細(xì)描述本發(fā)明的各種示例性實(shí)施例。應(yīng)注意到除非另外具體說明,否則在這些實(shí)施例中闡述的部件和步驟的相對(duì)布置、數(shù)字表達(dá)式和數(shù)值不限制本發(fā)明的范圍。同時(shí),應(yīng)當(dāng)明白,為了便于描述,附圖中所示出的各個(gè)部分的尺寸并不是按照實(shí)際的比例關(guān)系繪制的。以下對(duì)至少一個(gè)示例性實(shí)施例的描述實(shí)際上僅僅是說明性的,決不作為對(duì)本發(fā)明及其應(yīng)用或使用的任何限制。對(duì)于相關(guān)領(lǐng)域普通技術(shù)人員已知的技術(shù)、方法和設(shè)備可能不作詳細(xì)討論,但在適當(dāng)情況下,所述技術(shù)、方法和設(shè)備應(yīng)當(dāng)被視為授權(quán)說明書的一部分。在這里示出和討論的所有示例中,任何具體值應(yīng)被解釋為僅僅是示例性的,而不是作為限制。因此,示例性實(shí)施例的其它示例可以具有不同的值。應(yīng)注意到相似的標(biāo)號(hào)和字母在下面的附圖中表示類似項(xiàng),因此,一旦某一項(xiàng)在一個(gè)附圖中被定義,則在隨后的附圖中不需要對(duì)其進(jìn)行進(jìn)一步討論。圖I示出了根據(jù)本發(fā)明的一個(gè)實(shí)施例的微博內(nèi)容監(jiān)測(cè)方法。如圖I所示,在步驟SlOl中,根據(jù)關(guān)鍵詞對(duì)微博網(wǎng)站進(jìn)行檢索。在該步驟中,關(guān)鍵詞是預(yù)先設(shè)定的,并可根據(jù)需要進(jìn)行調(diào)整。例如,可首先設(shè)置多個(gè)類別,然后在每個(gè)類別中設(shè)置多個(gè)關(guān)鍵詞。關(guān)鍵詞可以是該類別的熱點(diǎn)詞匯、敏感詞匯, 并可根據(jù)需要進(jìn)行調(diào)整。在該步驟中,可以預(yù)先設(shè)定微博網(wǎng)站的訪問地址和采集規(guī)則。可以利用垂直搜索技術(shù)或通過微博網(wǎng)站的API接口進(jìn)行檢索。上述采集規(guī)則的設(shè)定可以包括如下內(nèi)容第一、明確采集方式。即明確是采用垂直搜索技術(shù)進(jìn)行采集還是通過微博網(wǎng)站的 API方式進(jìn)行米集。第二、明確采集的具體信息。例如,選擇微博內(nèi)容、轉(zhuǎn)發(fā)數(shù)、評(píng)價(jià)數(shù)、發(fā)布時(shí)間等內(nèi)容的一項(xiàng)或者多項(xiàng)進(jìn)行采集。第三、明確采集的周期。例如,每隔10分鐘采集一次或者每隔I個(gè)小時(shí)采集一次。在步驟S102中,對(duì)所采集的微博進(jìn)行分類處理和評(píng)級(jí)處理。在進(jìn)行分類處理中,可根據(jù)微博所包含的關(guān)鍵詞的類別對(duì)微博進(jìn)行分類,以得出該微博的類別結(jié)果。用于分類的關(guān)鍵詞可與用于檢索的關(guān)鍵詞相同,也可不同。在對(duì)微博進(jìn)行評(píng)級(jí)處理時(shí),可以計(jì)算該微博的重要性指數(shù),并將該重要性指數(shù)與級(jí)別閾值進(jìn)行比較,以得出該微博的級(jí)別結(jié)果??梢愿鶕?jù)實(shí)際需要設(shè)置級(jí)別的數(shù)目,并調(diào)整級(jí)別的判斷閾值。在步驟S103中,生成微博的監(jiān)測(cè)信息并進(jìn)行發(fā)送。在該步驟中,可以根據(jù)微博的級(jí)別生成監(jiān)測(cè)信息。例如,對(duì)于高級(jí)別的微博,可生成紅色預(yù)警信息。然后,根據(jù)微博的類別,將該紅色預(yù)警信息發(fā)送至與其類別對(duì)應(yīng)的接收終端。例如,若微博屬于交通類別,可將該微博的監(jiān)測(cè)信息發(fā)送至交通部門的接收終端和/或相關(guān)人員的手機(jī)。需要說明的是,與微博的類別相對(duì)應(yīng)的接收終端不限于一個(gè)。當(dāng)與微博類別對(duì)應(yīng)有多個(gè)接收終端時(shí),可以將該監(jiān)測(cè)信息發(fā)送至多個(gè)接收終端。采用本發(fā)明的技術(shù)方案,可以方便地從微博上獲取相關(guān)信息,并對(duì)所獲取的微博信息進(jìn)行分類處理和評(píng)級(jí)處理。從而根據(jù)微博的級(jí)別生成監(jiān)測(cè)信息,并將該監(jiān)測(cè)信息發(fā)送至相應(yīng)的接收終端。采用本發(fā)明能夠?qū)ξ⒉﹥?nèi)容進(jìn)行實(shí)時(shí)監(jiān)測(cè),有利于相關(guān)部門對(duì)微博信息進(jìn)行有效跟蹤和及時(shí)管理。圖2示出了根據(jù)本發(fā)明的另一個(gè)實(shí)施例的微博內(nèi)容監(jiān)測(cè)方法。如圖2所示,在步驟S201中,根據(jù)關(guān)鍵詞對(duì)微博網(wǎng)站進(jìn)行檢索,從而采集包含該關(guān)鍵詞的微博。針對(duì)不同的接收終端,對(duì)用于檢索的關(guān)鍵詞可以先分為若干大類,每一大類中設(shè)有多個(gè)關(guān)鍵詞。例如,針對(duì)政府機(jī)構(gòu)的接收終端,可以分為衛(wèi)生、環(huán)衛(wèi)、消防、公安、城管、交通等多個(gè)類別。其中,在交通類別中,可設(shè)置“脫軌”、“相撞”、“追尾”、“擦撞”、“動(dòng)車”、“汽車”等多個(gè)關(guān)鍵詞。在本實(shí)施例中,除了預(yù)先設(shè)定檢索關(guān)鍵詞外,還可通過自動(dòng)記錄微博的熱點(diǎn)詞匯, 作為之后的檢索關(guān)鍵詞。在進(jìn)行檢索時(shí),可采用垂直搜索技術(shù)或者通過微博網(wǎng)站提供的API接口周期性地獲取微博內(nèi)容??梢詫?duì)特定的微博網(wǎng)站配置網(wǎng)站地址和采集規(guī)則。每個(gè)微博網(wǎng)站的信息提取規(guī)則可分別進(jìn)行配置。上述垂直搜索技術(shù)是針對(duì)某一行業(yè)的專業(yè)搜索引擎,是搜索引擎的細(xì)分和延伸, 定向分字段抽取出需要的數(shù)據(jù)進(jìn)行處理后再以某種形式記錄到信息數(shù)據(jù)庫(kù)中。上述的微博網(wǎng)站的API接口,是根據(jù)各微博網(wǎng)站自行發(fā)布的接口,進(jìn)行更加精確的信息采集,采集到的信息也是分字段記錄到信息數(shù)據(jù)庫(kù)中。在步驟S202中,可以對(duì)所檢索的微博進(jìn)行解析,并將解析結(jié)果存入信息數(shù)據(jù)庫(kù)中。所解析的結(jié)果可包括發(fā)布人、轉(zhuǎn)發(fā)數(shù)、評(píng)論數(shù)和發(fā)布時(shí)間等信息。需要說明的是, 所解析的項(xiàng)目不限于上述內(nèi)容,可根據(jù)需要增加或減少解析項(xiàng)目。需要說明的是,既可以選擇僅將該微博的解析結(jié)果存儲(chǔ)到信息數(shù)據(jù)庫(kù)中,也可以選擇將所采集的微博內(nèi)容和解析結(jié)果均存入信息數(shù)據(jù)庫(kù)中。在步驟S203中,對(duì)所解析的內(nèi)容進(jìn)行分類處理和評(píng)級(jí)處理??梢允紫壤盟饕龔男畔?shù)據(jù)庫(kù)中提取解析結(jié)果,之后進(jìn)行分類處理和評(píng)級(jí)處理。在分類處理中,可根據(jù)微博所包含的關(guān)鍵詞的類別對(duì)微博進(jìn)行分類。例如,當(dāng)通過關(guān)鍵詞“脫軌”檢索到名稱為《動(dòng)車溫州段脫軌事件》的微博時(shí),由于 “脫軌”一詞屬于交通類別,因此可將該微博的類別設(shè)定為交通類。這樣,在后續(xù)步驟中,可將監(jiān)測(cè)信息發(fā)送至與交通類別相應(yīng)的接收終端。當(dāng)微博包含多個(gè)關(guān)鍵詞,該多個(gè)關(guān)鍵詞分屬于不同的類別時(shí),可將該微博的類別設(shè)定為多個(gè)類別,或者設(shè)定為包含關(guān)鍵詞最多的一個(gè)類別。例如《溫州動(dòng)車脫軌事》微博中包含了“脫軌”、“動(dòng)車”、“交通事故”三個(gè)關(guān)鍵詞,其中“脫軌”、“動(dòng)車”兩個(gè)關(guān)鍵詞在“交通” 分類下,“安全”關(guān)鍵詞在“消防”分類下,因此可將此《溫州動(dòng)車脫軌事》分類定義為“交通” 類,或者將該微博的類別設(shè)為“消防”和“交通”類。在本發(fā)明的技術(shù)方案中,可以設(shè)置多個(gè)級(jí)別,例如,可設(shè)置“高級(jí)別”、“中級(jí)別”和 “低級(jí)別”三個(gè)級(jí)別。級(jí)別的區(qū)分可通過計(jì)算微博的重要性指數(shù),并將重要性指數(shù)與級(jí)別閾值進(jìn)行比較得到。可以計(jì)算微博的解析結(jié)果以得到重要性指數(shù)。例如,可通過如下公式進(jìn)行計(jì)算Vi= (Count1(i) X 60% +Count2 (i) X 40% )其中,Vi為每條微博的重要性數(shù)值,數(shù)值越大表示越重要,優(yōu)先級(jí)越高。Countiw 為微博信息的轉(zhuǎn)發(fā)數(shù),Count2ω為微博信息的評(píng)論數(shù)。需要說明的是,本發(fā)明中的重要性指數(shù)不限于通過轉(zhuǎn)發(fā)數(shù)和評(píng)論數(shù)進(jìn)行計(jì)算,也可采用其他的解析結(jié)果和計(jì)算公式進(jìn)行計(jì)算。其中,“高級(jí)別”可表示微博的受關(guān)注程度高,負(fù)面意見多,危害性可能大,需要緊急處理。“中級(jí)別”可表示微博受關(guān)注程度較高,有可能爆發(fā)負(fù)面信息,需要進(jìn)行引導(dǎo)。“低級(jí)別”可表示微博的參與人員不多,需要進(jìn)行關(guān)注。高中低三個(gè)級(jí)別的閾值可分別為30000、 15000 和 5000。在本實(shí)施例中,所檢索的名為《動(dòng)車溫州段脫軌事件》的微博的轉(zhuǎn)發(fā)數(shù)為56000,評(píng)論數(shù)為11000,經(jīng)計(jì)算其重要性指數(shù)為37000。因此,該微博屬于高級(jí)別??蛇x地,當(dāng)用于檢索的關(guān)鍵詞出現(xiàn)在微博的特定位置,可將該微博的級(jí)別提升。例如,檢索詞“脫軌”出現(xiàn)在微博的名稱或者微博自身的關(guān)鍵詞序列中時(shí),可直接將該微博的級(jí)別設(shè)為高級(jí)別,或者將該微博的級(jí)別提升一級(jí)。在步驟S204中,根據(jù)分類結(jié)果和評(píng)級(jí)結(jié)果生成監(jiān)測(cè)信息并進(jìn)行發(fā)送??梢圆捎枚绦判问胶?或工單派發(fā)形式將監(jiān)測(cè)信息發(fā)送至接收終端。例如,對(duì)于高級(jí)別的微博,可將包含預(yù)警內(nèi)容的監(jiān)測(cè)信息通過短信和工單派發(fā)兩種方式發(fā)送至相關(guān)部門的接收終端、領(lǐng)導(dǎo)及辦事人員的手機(jī)。對(duì)于中級(jí)別的微博,可通過工單派發(fā)方式將監(jiān)測(cè)信息發(fā)送至相關(guān)部門的領(lǐng)導(dǎo)的手機(jī),并通過工單派發(fā)方式和短信方式發(fā)送至該部門的辦事人員的手機(jī)。對(duì)于低級(jí)別的微博,可通過工單派發(fā)方式和短信方式發(fā)送至該部門的辦事人員的手機(jī),而不派發(fā)至該部門領(lǐng)導(dǎo)的手機(jī)。上述監(jiān)測(cè)信息的發(fā)送方式只是示例性的,對(duì)監(jiān)測(cè)信息的發(fā)送不限于以上方式,可以根據(jù)實(shí)際需要采用其他方式進(jìn)行發(fā)送。在該步驟完成后,還可包括對(duì)終端的反饋信息進(jìn)行統(tǒng)計(jì)分析的步驟。該反饋信息可包括相關(guān)部門的工作完成信息和核實(shí)信息。具體地,在收到相關(guān)部門的完成信息后,向另一接收終端發(fā)送現(xiàn)場(chǎng)核實(shí)指令。例如,通知檢索部門對(duì)工作任務(wù)的辦理情況進(jìn)行現(xiàn)場(chǎng)核實(shí),并接收現(xiàn)場(chǎng)核實(shí)反饋信息。之后, 對(duì)工作完成信息和核實(shí)信息進(jìn)行統(tǒng)計(jì)分析。通過該統(tǒng)計(jì)分析結(jié)果,能夠客觀真實(shí)地反映微博內(nèi)容監(jiān)測(cè)與預(yù)警團(tuán)隊(duì)的運(yùn)行和問題現(xiàn)狀,為領(lǐng)導(dǎo)決策提供有效的輔助工具。本發(fā)明還公開了一種微博內(nèi)容監(jiān)測(cè)系統(tǒng)。圖3示出了根據(jù)本發(fā)明的一個(gè)實(shí)施例的微博內(nèi)容監(jiān)測(cè)系統(tǒng)。
如圖3所示,微博內(nèi)容監(jiān)測(cè)系統(tǒng)可包括檢索單元31、分類處理單元32、評(píng)級(jí)處理單元33和監(jiān)測(cè)信息單元34。其中,檢索單元31可根據(jù)關(guān)鍵詞對(duì)微博網(wǎng)站進(jìn)行檢索,從而采集包含該關(guān)鍵詞的微博。檢索單元31可以采用垂直搜索技術(shù)或通過微博網(wǎng)站的API接口進(jìn)行檢索。該檢索可以是周期性進(jìn)行,從而能夠及時(shí)地獲得微博內(nèi)容。分類處理單元32和評(píng)級(jí)處理單元33可以對(duì)檢索單元31所采集的微博進(jìn)行分類和評(píng)級(jí)處理。其中,分類處理單元32可根據(jù)微博中所包含的關(guān)鍵詞的類別對(duì)微博進(jìn)行分類。評(píng)級(jí)處理單元可以計(jì)算所采集的微博的重要性指數(shù),然后將該重要性指數(shù)與預(yù)先設(shè)定的級(jí)別閾值進(jìn)行判斷,從而得出該微博的級(jí)別。在一種實(shí)施方式中,該重要性指數(shù)可以根據(jù)微博的轉(zhuǎn)發(fā)數(shù)和評(píng)論數(shù)進(jìn)行計(jì)算。監(jiān)測(cè)信息單元34可以根據(jù)微博的級(jí)別生成監(jiān)測(cè)信息。然后,將該監(jiān)測(cè)信息發(fā)送至與微博的類別結(jié)果相對(duì)應(yīng)的接收終端。該接收終端不限于一個(gè)。發(fā)送方式可以是工單派發(fā)方式和/或短信方式,可根據(jù)需要發(fā)送至相關(guān)部門的領(lǐng)導(dǎo)的手機(jī)和/或辦事人員的手機(jī)。圖4是根據(jù)本發(fā)明另一個(gè)實(shí)施例的的微博內(nèi)容監(jiān)測(cè)系統(tǒng)。如圖4所示,微博內(nèi)容監(jiān)測(cè)系統(tǒng)可包括檢索單元41、解析單元45、信息數(shù)據(jù)庫(kù)46、分類處理單元42、評(píng)級(jí)處理單元 43、監(jiān)測(cè)信息單元44和統(tǒng)計(jì)分析單元47。在該系統(tǒng)中,檢索單元41、分類處理單元42、評(píng)級(jí)處理單元43和監(jiān)測(cè)信息單元44 可以與上一實(shí)施例中的檢索單元31、分類處理單元32、評(píng)級(jí)處理單元33和監(jiān)測(cè)信息單元34 相同。與上一實(shí)施例的區(qū)別在于增設(shè)了解析單元45、數(shù)據(jù)庫(kù)46和統(tǒng)計(jì)分析單元47。其中,解析單元45可對(duì)所采集的微博進(jìn)行解析,并將解析結(jié)果存入信息數(shù)據(jù)庫(kù)46 中。信息數(shù)據(jù)庫(kù)46不限于存儲(chǔ)解析結(jié)果,還可存儲(chǔ)檢索單元41所采集的微博內(nèi)容。上述解析結(jié)果可包括但不限于發(fā)布人、轉(zhuǎn)發(fā)數(shù)、評(píng)論數(shù)和發(fā)布時(shí)間等內(nèi)容。可以根據(jù)索引從信息數(shù)據(jù)庫(kù)46中提取解析結(jié)果,以供分類處理單元42和評(píng)級(jí)處理單元43進(jìn)行處理。當(dāng)監(jiān)測(cè)信息單元44將監(jiān)測(cè)信息發(fā)送至接收終端后,統(tǒng)計(jì)分析單元47可對(duì)反饋結(jié)果進(jìn)行統(tǒng)計(jì)分析。 具體地,在收到相關(guān)部門的完成信息后,可由統(tǒng)計(jì)分析單元47接收終端發(fā)送現(xiàn)現(xiàn)場(chǎng)核實(shí)指令。例如,通知檢索部門對(duì)工作任務(wù)的辦理情況進(jìn)行現(xiàn)場(chǎng)核實(shí),并接收現(xiàn)場(chǎng)核實(shí)反饋信息。 之后,對(duì)工作完成信息和核實(shí)信息進(jìn)行統(tǒng)計(jì)分析。采用本發(fā)明的微博內(nèi)容監(jiān)測(cè)方法和監(jiān)測(cè)系統(tǒng)至少具有以下優(yōu)點(diǎn)第一、與傳統(tǒng)的互聯(lián)網(wǎng)搜索服務(wù)相比,在搜索微博內(nèi)容上速度更快,目的性更加明確。第二、由于本發(fā)明采用垂直搜索技術(shù),對(duì)微博網(wǎng)站的搜索具有實(shí)時(shí)性強(qiáng),搜索全面的特點(diǎn)。第三、本發(fā)明的技術(shù)方案與現(xiàn)有技術(shù)相比,實(shí)用性更強(qiáng)。政企用戶可以通過互聯(lián)網(wǎng)根據(jù)自己的需求輕松的在系統(tǒng)中自由定制多個(gè)監(jiān)測(cè)任務(wù),對(duì)所需微博進(jìn)行跟蹤監(jiān)測(cè)。系統(tǒng)能夠自動(dòng)從微博中實(shí)時(shí)收集滿足用戶需求的微博,并推送給用戶終端進(jìn)行處理分析。而當(dāng)突發(fā)事件或公關(guān)危機(jī)出現(xiàn)后,系統(tǒng)的實(shí)時(shí)監(jiān)測(cè)可以使用戶第一時(shí)間獲得微博。監(jiān)控部門能夠及時(shí)做出反應(yīng)及處理,以便引導(dǎo)輿論走向,避免出現(xiàn)大量謠言。雖然已經(jīng)通過示例對(duì)本發(fā)明的一些特定實(shí)施例進(jìn)行了詳細(xì)說明,但是本領(lǐng)域的技術(shù)人員應(yīng)該理解,以上示例僅是為了進(jìn)行說明,而不是為了限制本發(fā)明的范圍。本領(lǐng)域的技術(shù)人員應(yīng)該理解,可在不脫離本發(fā)明的范圍和精神的情況下,對(duì)以上實(shí)施例進(jìn)行修改。本發(fā)明的范圍由所附權(quán)利要求來限定。
權(quán)利要求
1.一種微博內(nèi)容監(jiān)測(cè)方法,其特征在于,包括根據(jù)關(guān)鍵詞對(duì)微博網(wǎng)站進(jìn)行檢索,以采集包含所述關(guān)鍵詞的微博;對(duì)所采集的微博進(jìn)行分類處理和評(píng)級(jí)處理,其中,所述分類處理是根據(jù)微博所包含的關(guān)鍵詞的類別對(duì)所述微博進(jìn)行分類;所述評(píng)級(jí)處理是計(jì)算微博的重要性指數(shù),并根據(jù)所述重要性指數(shù)和級(jí)別閾值得出微博的級(jí)別;根據(jù)所述微博的級(jí)別生成監(jiān)測(cè)信息,并將所述監(jiān)測(cè)信息發(fā)送至與所述微博的類別相應(yīng)的接收終端。
2.如權(quán)利要求I所述的方法,其特征在于,所述對(duì)微博網(wǎng)站進(jìn)行檢索是采用垂直搜索技術(shù)或通過微博網(wǎng)站的API接口進(jìn)行檢索,所述檢索是周期性進(jìn)行的,并將所采集的微博內(nèi)容存入信息數(shù)據(jù)庫(kù)中。
3.如權(quán)利要求2所述的方法,其特征在于,在對(duì)微博網(wǎng)站進(jìn)行檢索之后,還包括對(duì)所采集的微博進(jìn)行解析,并將解析結(jié)果存入所述信息數(shù)據(jù)庫(kù),所述解析結(jié)果包括微博內(nèi)容、發(fā)布人、轉(zhuǎn)發(fā)數(shù)、評(píng)論數(shù)和發(fā)布時(shí)間。
4.如權(quán)利要求I所述的方法,其特征在于,所述方法還包括記錄所采集的微博中的熱點(diǎn)詞匯,以作為下次檢索的關(guān)鍵詞。
5.如權(quán)利要求3所述的方法,其特征在于,所述評(píng)級(jí)處理包括利用索引從信息數(shù)據(jù)庫(kù)中提取所述解析結(jié)果;通過對(duì)所述微博內(nèi)容的解析結(jié)果進(jìn)行計(jì)算得到所述微博的重要性指數(shù);將所述重要性指數(shù)與所述級(jí)別閾值進(jìn)行比較,以得出所述微博的評(píng)級(jí)處理結(jié)果。
6.如權(quán)利要求I所述的方法,其特征在于,所述方法還包括對(duì)所述接收終端的反饋結(jié)果進(jìn)行統(tǒng)計(jì)分析。
7.一種微博內(nèi)容監(jiān)測(cè)系統(tǒng),其特征在于,包括檢索單元,用于根據(jù)關(guān)鍵詞對(duì)微博網(wǎng)站進(jìn)行檢索,以采集包含所述關(guān)鍵詞的微博; 分類處理單元,用于根據(jù)微博所包含的關(guān)鍵詞的類別對(duì)所述微博進(jìn)行分類;評(píng)級(jí)處理單元,用于計(jì)算微博的重要性指數(shù),并根據(jù)所述重要性指數(shù)和級(jí)別閾值得出所述微博的級(jí)別;監(jiān)測(cè)信息單元,用于根據(jù)微博的級(jí)別生成監(jiān)測(cè)信息,并將所述監(jiān)測(cè)信息發(fā)送至與所述微博的類別相應(yīng)的接收終端。
8.如權(quán)利要求7所述的系統(tǒng),其特征在于,所述檢索單元采用垂直搜索技術(shù)或通過微博網(wǎng)站的API接口進(jìn)行檢索,所述對(duì)微博網(wǎng)站進(jìn)行的檢索是周期性進(jìn)行的,并將所采集的微博內(nèi)容存入信息數(shù)據(jù)庫(kù)中。
9.如權(quán)利要求8所述的系統(tǒng),其特征在于,所述微博內(nèi)容監(jiān)測(cè)系統(tǒng)還包括解析單元,所述解析單元用于對(duì)所采集的微博進(jìn)行解析,并將解析結(jié)果存入所述信息數(shù)據(jù)庫(kù),所述解析結(jié)果包括微博內(nèi)容、發(fā)布人、轉(zhuǎn)發(fā)數(shù)、評(píng)論數(shù)和發(fā)布時(shí)間。
10.如權(quán)利要求9所述的系統(tǒng),其特征在于,所述評(píng)級(jí)處理單元利用索引從所述信息數(shù)據(jù)庫(kù)中提取所述解析結(jié)果,對(duì)所述解析結(jié)果進(jìn)行計(jì)算以得出微博的重要性指數(shù),并將所述重要性指數(shù)與所述級(jí)別閾值進(jìn)行比較,以得出所述微博的評(píng)級(jí)處理結(jié)果。
11.如權(quán)利要求7所述的系統(tǒng),其特征在于,所述微博內(nèi)容監(jiān)測(cè)系統(tǒng)還包括統(tǒng)計(jì)分析單元,用于對(duì)反饋結(jié)果進(jìn)行統(tǒng)計(jì)分析。
12.如權(quán)利要求7所述的系統(tǒng),其特征在于,所述檢索單元還用于記錄所采集的微博中的熱點(diǎn)詞匯,以作為下次檢索的關(guān)鍵詞。
全文摘要
本發(fā)明公開了一種微博內(nèi)容監(jiān)測(cè)方法和微博內(nèi)容監(jiān)測(cè)系統(tǒng)。該方法包括首先根據(jù)關(guān)鍵詞對(duì)微博網(wǎng)站進(jìn)行檢索;然后,對(duì)所采集的微博進(jìn)行分類處理和評(píng)級(jí)處理;最后,根據(jù)所述微博的級(jí)別生成監(jiān)測(cè)信息,并將監(jiān)測(cè)信息發(fā)送至接收終端。采用本發(fā)明能夠快速方便地對(duì)微博內(nèi)容進(jìn)行監(jiān)測(cè),有利于相關(guān)部門對(duì)微博信息進(jìn)行有效跟蹤和及時(shí)管理。
文檔編號(hào)G06F17/30GK102609475SQ20121001686
公開日2012年7月25日 申請(qǐng)日期2012年1月19日 優(yōu)先權(quán)日2012年1月19日
發(fā)明者盧會(huì)春, 葉小衛(wèi), 唐浩, 林靜, 沈麗倩, 韋海強(qiáng) 申請(qǐng)人:浙江省公眾信息產(chǎn)業(yè)有限公司