一種檢測網(wǎng)絡(luò)中內(nèi)容的方法和系統(tǒng)的制作方法
【專利摘要】本發(fā)明公開一種檢測網(wǎng)絡(luò)中內(nèi)容的方法和系統(tǒng),方法包括接收應(yīng)用平臺發(fā)送的網(wǎng)絡(luò)中發(fā)布的內(nèi)容,以及所述內(nèi)容對應(yīng)的指示是否進行重新檢測的指示標識;判斷接收的所述指示標識是否指示對所述內(nèi)容進行重新檢測;在所述指示標識沒有指示對所述內(nèi)容進行重新檢測時,根據(jù)檢測結(jié)果列表對所述內(nèi)容進行檢測,返回檢測結(jié)果;在所述指示標識指示對所述內(nèi)容進行重新檢測時,接收審核指令,根據(jù)所述審核指令對所述內(nèi)容進行檢測,返回檢測結(jié)果。本發(fā)明解決了將危險內(nèi)容誤判為通過的技術(shù)問題,取得了節(jié)約人力成本,避免危險內(nèi)容危害網(wǎng)絡(luò)的技術(shù)效果。
【專利說明】一種檢測網(wǎng)絡(luò)中內(nèi)容的方法和系統(tǒng)
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及計算機網(wǎng)絡(luò)領(lǐng)域,特別涉及檢測網(wǎng)絡(luò)中內(nèi)容的方法和系統(tǒng)。
【背景技術(shù)】
[0002]隨著互聯(lián)網(wǎng)應(yīng)用的發(fā)展,網(wǎng)絡(luò)中發(fā)布的內(nèi)容越來越多,這些內(nèi)容中經(jīng)常包括垃圾信息或者惡意攻擊信息等,因此需要對網(wǎng)絡(luò)中內(nèi)容進行檢測,以保證網(wǎng)絡(luò)環(huán)境的安全和潔凈。
[0003]現(xiàn)有技術(shù)中檢測網(wǎng)絡(luò)中內(nèi)容的技術(shù)方案主要包括敏感詞檢測和人工檢測。其中,人工檢測的準確性高,能夠精確判斷內(nèi)容是否適當。但是,因為網(wǎng)絡(luò)中內(nèi)容量的急劇猛增,使得對所有內(nèi)容都進行人工檢測,會增加巨額的人力成本,而且人工檢測的效率也相對較低。
[0004]敏感詞檢測為將網(wǎng)絡(luò)中內(nèi)容與敏感詞庫中敏感詞進行匹配,如果匹配成功,則該內(nèi)容命中了敏感詞庫中的敏感詞,由此判斷出該內(nèi)容存在風險,之后對該內(nèi)容進行人工檢測。如果內(nèi)容沒有命中敏感詞庫中的敏感詞,則認為該內(nèi)容安全,通過檢測。在該技術(shù)方案中,敏感詞庫中敏感詞的維護經(jīng)常滯后于網(wǎng)絡(luò)中內(nèi)容的發(fā)展,經(jīng)常是內(nèi)容中某個敏感詞出現(xiàn)一段時間后才會被發(fā)現(xiàn)。因此,導致部分危險內(nèi)容不應(yīng)被檢測通過卻被誤判為通過,因此對網(wǎng)絡(luò)環(huán)境造成了危害,使得內(nèi)容檢測率降低。在現(xiàn)實統(tǒng)計結(jié)果中也表明未命中敏感詞的內(nèi)容同樣存在大量垃圾信息,特別是各種廣告信息。
【發(fā)明內(nèi)容】
[0005]本發(fā)明提供了檢測網(wǎng)絡(luò)中內(nèi)容的方法和系統(tǒng),以解決將危險內(nèi)容誤判為通過,內(nèi)容檢測率降低的技術(shù)問題。
[0006]本發(fā)明公開了一種檢測網(wǎng)絡(luò)中內(nèi)容的方法,所述方法包括:
[0007]接收應(yīng)用平臺發(fā)送的網(wǎng)絡(luò)中發(fā)布的內(nèi)容,以及所述內(nèi)容對應(yīng)的指示是否進行重新檢測的指示標識;其中當所述內(nèi)容對應(yīng)的配置參量的值達到預(yù)設(shè)的參量閥值時,所述指示標識指示對所述內(nèi)容進行重新檢測,所述配置參量用于表征所述內(nèi)容被關(guān)注的程度,所述配置參量的值越大,則所述內(nèi)容被關(guān)注的程度越高;
[0008]判斷接收的所述指示標識是否指示對所述內(nèi)容進行重新檢測;
[0009]在所述指示標識沒有指示對所述內(nèi)容進行重新檢測時,根據(jù)檢測結(jié)果列表對所述內(nèi)容進行檢測,返回檢測結(jié)果;所述檢測結(jié)果列表中保存內(nèi)容的檢測結(jié)果;
[0010]在所述指示標識指示對所述內(nèi)容進行重新檢測時,接收審核指令,根據(jù)所述審核指令對所述內(nèi)容進行檢測,返回檢測結(jié)果。
[0011]其中,所述配置參量至少包括下列參量中的一種:
[0012]內(nèi)容被評論的次數(shù);
[0013]內(nèi)容被瀏覽的次數(shù);
[0014]內(nèi)容被轉(zhuǎn)發(fā)的次數(shù);
[0015]內(nèi)容在頁面中停留的時長。
[0016]其中,所述接收應(yīng)用平臺發(fā)送的網(wǎng)絡(luò)中發(fā)布的內(nèi)容后包括:
[0017]對所述內(nèi)容進行哈希運算,獲得所述內(nèi)容對應(yīng)的哈希值;
[0018]所述檢測結(jié)果列表中對應(yīng)地保存內(nèi)容的哈希值和內(nèi)容的檢測結(jié)果;
[0019]所述根據(jù)檢測結(jié)果列表對所述內(nèi)容進行檢測具體包括:
[0020]判斷所述檢測結(jié)果列表中是否包括所述哈希值,如果不包括,則根據(jù)已接收的與所述內(nèi)容相同和/或相似內(nèi)容的數(shù)量對所述內(nèi)容進行檢測;如果包括,則獲取所述哈希值在所述檢測結(jié)果列表中對應(yīng)的檢測結(jié)果。
[0021]其中,所述對所述內(nèi)容進行哈希運算,獲得所述內(nèi)容對應(yīng)的哈希值具體包括:
[0022]除去所述內(nèi)容中冗余信息,對除去冗余信息的所述內(nèi)容進行哈希運算,獲得所述內(nèi)容對應(yīng)的指紋哈希值。
[0023]其中,所述獲得所述內(nèi)容對應(yīng)的指紋哈希值后還包括:
[0024]將所述指紋哈希值對應(yīng)的計數(shù)值加I ;
[0025]所述根據(jù)已接收的與所述內(nèi)容相同和/或相似內(nèi)容的數(shù)量對所述內(nèi)容進行檢測具體包括:
[0026]判斷所述指紋哈希值對應(yīng)的計數(shù)值是否大于預(yù)設(shè)的計數(shù)值閥值,
[0027]如果大于,則接收審核指令,根據(jù)所述審核指令對所述內(nèi)容進行檢測;
[0028]否則,確定檢測結(jié)果為所述內(nèi)容通過檢測。
[0029]其中,所述如果大于,則接收審核指令,根據(jù)所述審核指令對所述內(nèi)容進行檢測后還包括:
[0030]在所述檢測結(jié)果列表中對應(yīng)地保存所述哈希值和根據(jù)所述審核指令對所述內(nèi)容進行檢測所得的檢測結(jié)果。
[0031]其中,所述根據(jù)已接收的與所述內(nèi)容相同和/或相似內(nèi)容的數(shù)量對所述內(nèi)容進行檢測之前還包括:
[0032]判斷所述內(nèi)容是否命中敏感詞庫中的敏感詞;
[0033]如果是,則接收審核指令,根據(jù)所述審核指令對所述內(nèi)容進行檢測,獲取檢測結(jié)果;
[0034]所述返回檢測結(jié)果之后還包括:在所述檢測結(jié)果列表中對應(yīng)地保存所述內(nèi)容的哈希值和所得的根據(jù)所述審核指令對所述內(nèi)容進行檢測所得的檢測結(jié)果;
[0035]如果否,進行所述根據(jù)已接收的與所述內(nèi)容相同和/或相似內(nèi)容的數(shù)量對所述內(nèi)容進行檢測的步驟。
[0036]其中,所述在所述指示標識指示對所述內(nèi)容進行重新檢測時,接收審核指令,根據(jù)所述審核指令對所述內(nèi)容進行檢測,返回檢測結(jié)果后還包括:
[0037]在所述檢測結(jié)果列表中更新所述內(nèi)容的檢測結(jié)果為根據(jù)所述審核指令對所述內(nèi)容進行檢測所得的檢測結(jié)果。
[0038]根據(jù)本發(fā)明的另一方面,公開了一種檢測網(wǎng)絡(luò)中內(nèi)容的系統(tǒng),包括:
[0039]接收單元,用于接收應(yīng)用平臺發(fā)送的網(wǎng)絡(luò)中發(fā)布的內(nèi)容,以及所述內(nèi)容對應(yīng)的指示是否進行重新檢測的指示標識;其中當所述內(nèi)容對應(yīng)的配置參量的值達到預(yù)設(shè)的參量閥值時,所述指示標識指示對所述內(nèi)容進行重新檢測,所述配置參量用于表征所述內(nèi)容被關(guān)注的程度,所述配置參量的值越大,則所述內(nèi)容被關(guān)注的程度越高;
[0040]判斷單元,用于判斷接收的所述指示標識是否指示對所述內(nèi)容進行重新檢測;
[0041]第一檢測單元,用于在所述指示標識沒有指示對所述內(nèi)容進行重新檢測時,根據(jù)檢測結(jié)果列表對所述內(nèi)容進行檢測,返回檢測結(jié)果;所述檢測結(jié)果列表中保存內(nèi)容的檢測結(jié)果;
[0042]第二檢測單元,用于在所述指示標識指示對所述內(nèi)容進行重新檢測時,接收審核指令,根據(jù)所述審核指令對所述內(nèi)容進行檢測,返回檢測結(jié)果。
[0043]其中,所述系統(tǒng)還包括:哈希值計算單元;
[0044]所述哈希值計算單元,用于在所述接收單元接收到應(yīng)用平臺發(fā)送的網(wǎng)絡(luò)中發(fā)布的內(nèi)容后,對所述內(nèi)容進行哈希運算,獲得所述內(nèi)容對應(yīng)的哈希值;
[0045]所述檢測結(jié)果列表中對應(yīng)地保存內(nèi)容的哈希值和內(nèi)容的檢測結(jié)果;
[0046]所述根據(jù)檢測結(jié)果列表對所述內(nèi)容進行檢測具體包括:
[0047]所述第一檢測單元,具體用于判斷所述檢測結(jié)果列表中是否包括所述哈希值,如果不包括,則根據(jù)已接收的與所述內(nèi)容相同和/或相似內(nèi)容的數(shù)量對所述內(nèi)容進行檢測;如果包括,則獲取所述哈希值在所述檢測結(jié)果列表中對應(yīng)的檢測結(jié)果。
[0048]本發(fā)明的有益效果是:通過本發(fā)明中技術(shù)方案,一方面,對于檢測結(jié)果進行保存,可以應(yīng)用保存的檢測結(jié)果對重復內(nèi)容進行檢測,另一方面,由于危險內(nèi)容的危害性與該內(nèi)容被關(guān)注的程度有關(guān),因此,當內(nèi)容被關(guān)注的程度達到預(yù)設(shè)閥值后,對該內(nèi)容進行精確的人工檢測。由此,既可以避免對每個內(nèi)容都進行人工檢測,又能夠在危險內(nèi)容造成危害前,糾正對該危險內(nèi)容的誤判,解決了將危險內(nèi)容誤判為通過的技術(shù)問題。因為,能夠避免對每個內(nèi)容都進行人工檢測,所以取得了節(jié)約人力成本、提高檢測效率的技術(shù)效果,同時因為能夠在危險內(nèi)容造成危害前,糾正對該危險內(nèi)容的誤判,取得了提高檢測正確率,避免危險內(nèi)容危害網(wǎng)絡(luò)的技術(shù)效果。
【專利附圖】
【附圖說明】
[0049]圖1為根據(jù)本發(fā)明一實施例的檢測網(wǎng)絡(luò)中內(nèi)容的方法的流程圖;
[0050]圖2為根據(jù)本發(fā)明一實施例的根據(jù)檢測結(jié)果列表對內(nèi)容進行檢測的流程圖;
[0051]圖3為根據(jù)本發(fā)明一實施例的步驟S146中操作的流程圖;
[0052]圖4為根據(jù)本發(fā)明另一實施例的檢測網(wǎng)絡(luò)中內(nèi)容的方法的流程圖;
[0053]圖5為根據(jù)本發(fā)明一實施例的檢測網(wǎng)絡(luò)中內(nèi)容的系統(tǒng)的結(jié)構(gòu)圖;
[0054]圖6為根據(jù)本發(fā)明另一實施例的檢測網(wǎng)絡(luò)中內(nèi)容的系統(tǒng)的結(jié)構(gòu)圖。
【具體實施方式】
[0055]為使本發(fā)明的目的、技術(shù)方案和優(yōu)點更加清楚,下面將結(jié)合附圖對本發(fā)明實施方式作進一步地詳細描述。
[0056]參見圖1,為根據(jù)本發(fā)明一實施例的檢測網(wǎng)絡(luò)中內(nèi)容的方法的流程圖。如圖1所示,該方法包括如下流程。
[0057]步驟S110,接收應(yīng)用平臺發(fā)送的網(wǎng)絡(luò)中發(fā)布的內(nèi)容,以及內(nèi)容對應(yīng)的指示是否進行重新檢測的指示標識。
[0058]在內(nèi)容對應(yīng)的配置參量的值達到預(yù)設(shè)的參量閥值時,應(yīng)用平臺發(fā)送的指示標識指示對所述內(nèi)容進行重新檢測。
[0059]在內(nèi)容對應(yīng)的配置參量的值未達到預(yù)設(shè)的參量閥值時,應(yīng)用平臺發(fā)送的指示標識指示不對所述內(nèi)容進行重新檢測。
[0060]配置參量用于表征內(nèi)容被關(guān)注的程度,配置參量的值越大,則對應(yīng)的內(nèi)容被關(guān)注的程度越高。
[0061]因為各個內(nèi)容所屬的業(yè)務(wù)不同,則內(nèi)容的配置參量可以對應(yīng)不同。
[0062]配置參量可以至少包括下列參量中的一種,但不局限于此:
[0063]內(nèi)容被評論的次數(shù);
[0064]內(nèi)容被瀏覽的次數(shù);
[0065]內(nèi)容被轉(zhuǎn)發(fā)的次數(shù);
[0066]內(nèi)容在頁面中停留的時長。
[0067]當配置參量的值大于參量閥值后,可以確定該配置參量對應(yīng)的內(nèi)容的被關(guān)注程度達到設(shè)置標準,需要對該內(nèi)容進行精細的外部檢測。
[0068]此外,當配置參量的值大于參量閥值時,可以對該內(nèi)容進行高危險標識,以使得該內(nèi)容可以在人工檢測中被優(yōu)先處理。
[0069]通過上述操作,能夠在危險內(nèi)容造成危害前,糾正對該危險內(nèi)容的誤判,取得了提高檢測正確率,避免危險內(nèi)容危害網(wǎng)絡(luò)的效果。
[0070]步驟S120,判斷接收的重新檢測的指示標識是否指示進行重新檢測,如果是,則執(zhí)行步驟S130,否則,執(zhí)行步驟S140。
[0071]舉例而言,指示標識可以為:1時,表示進行重新檢測,O時,表示不進行重新檢測。
[0072]步驟S130,接收審核指令,根據(jù)審核指令對接收的網(wǎng)絡(luò)中發(fā)布的該內(nèi)容進行檢測,返回檢測結(jié)果。
[0073]此處,接收審核指令,根據(jù)審核指令對內(nèi)容進行檢測可以是精細的人工檢測,或其他的根據(jù)外部指令進行精細檢測的方式。
[0074]較佳地,在執(zhí)行完步驟S130后還可以在檢測結(jié)果列表中更新該內(nèi)容的檢測結(jié)果為該根據(jù)審核指令對內(nèi)容進行檢測所得的檢測結(jié)果。
[0075]檢測結(jié)果列表中對應(yīng)地保存內(nèi)容的哈希值和內(nèi)容的檢測結(jié)果。
[0076]步驟S140,根據(jù)檢測結(jié)果列表對接收的網(wǎng)絡(luò)中發(fā)布的該內(nèi)容進行檢測,返回檢測結(jié)果。
[0077]該檢測結(jié)果列表中檢測結(jié)果可以是外部配置,也可以是檢測過程中所得檢查結(jié)果的記錄,并隨著檢測中結(jié)果的變化而實時更新。
[0078]由此,可以直接應(yīng)用已有的檢測結(jié)果對內(nèi)容進行檢測,提高了檢測效率。
[0079]具體而言,在步驟SllO和步驟S120間還可以包括步驟S120’,對接收的內(nèi)容進行哈希運算,獲得該內(nèi)容對應(yīng)的哈希值;其中步驟S120’的執(zhí)行順序并不局限于此。
[0080]哈希值的計算可以有多種方法。
[0081]舉例而言,對于接收的內(nèi)容計算MD5哈希值。該哈希值與內(nèi)容中全部信息對應(yīng),此時,包含信息相同的兩個內(nèi)容的哈希值相同。
[0082]也可以,將內(nèi)容中冗余信息除去后,對除冗余后的內(nèi)容進行哈希運算,該所得哈希值與內(nèi)容中的有用信息對應(yīng)。本發(fā)明中將對除冗余后的內(nèi)容進行哈希運算所得哈希值稱為內(nèi)容的指紋哈希值。包含信息相同或相似的兩個內(nèi)容的指紋哈希值相同。
[0083]舉例而言,計算指紋哈希值的具體方式為:去掉內(nèi)容中無關(guān)的字符,例如各種控制字符、全角半角標點符號;對內(nèi)容進行切詞分析,濾除對文義沒有影響的信息,例如,將標點符號、空格、對文意沒有影響的“啊、的”等字詞去除。之后,對操作后保留的信息計算哈希值。
[0084]例如,兩條內(nèi)容
[0085]“親們、還在#無聊么網(wǎng)絡(luò)Y%兼*職日結(jié)非誠6勿擾”
[0086]“Α親們、還在@Β無聊么網(wǎng)絡(luò)KD兼(職日結(jié)非誠GR勿擾”
[0087]該兩條內(nèi)容除去掉冗余后信息為“親們、還在無聊么網(wǎng)絡(luò)兼職日結(jié)非誠勿擾”,兩者除去冗余后的部分相同,兩者為相似內(nèi)容,兩者的指紋哈希值相同。
[0088]本發(fā)明中也可以將內(nèi)容進行區(qū)分,對不同內(nèi)容計算不同哈希值。例如,對于長度在預(yù)設(shè)最大和最小閥值內(nèi)的內(nèi)容進行去冗余操作,計算指紋哈希值;對于長度小于最小閥值和長度大于最大閥值的內(nèi)容整體計算哈希值。
[0089]如圖2所示,步驟S140包括如下步驟。
[0090]步驟S142,判斷檢測結(jié)果列表中是否包括接收的網(wǎng)絡(luò)中發(fā)布的該內(nèi)容的哈希值,如果不包括,則執(zhí)行步驟S146,如果包括,則執(zhí)行步驟S144。
[0091]步驟S144,返回所述哈希值在所述檢測結(jié)果列表中對應(yīng)的檢測結(jié)果。
[0092]步驟S146,根據(jù)已接收的與上述內(nèi)容相同和/或相似內(nèi)容的數(shù)量對上述內(nèi)容進行檢測。
[0093]相似內(nèi)容是指除冗余的無意義信息外與接收的內(nèi)容相同的內(nèi)容。
[0094]較佳的,在根據(jù)與接收的內(nèi)容相同和/或相似內(nèi)容的數(shù)量對接收的內(nèi)容進行檢測之前,判斷接收的內(nèi)容是否命中敏感詞庫中的敏感詞;如果是,則接收審核指令,根據(jù)所述審核指令對所述內(nèi)容進行檢測,獲取檢測結(jié)果,返回檢測結(jié)果,在檢測結(jié)果列表中對應(yīng)地保存內(nèi)容的哈希值和所得的根據(jù)審核指令對內(nèi)容進行檢測所得的檢測結(jié)果;如果否,進行所述根據(jù)已接收的與所述內(nèi)容相同和/或相似內(nèi)容的數(shù)量對所述內(nèi)容進行檢測的步驟。
[0095]舉例而言,如圖3所示,步驟S146中包括如下步驟。在該舉例中,根據(jù)之前已經(jīng)接收的、與步驟SllO中接收的內(nèi)容相同和相似內(nèi)容的數(shù)量,對步驟SI 10中接收的內(nèi)容進行檢測。在步驟S120’中,除去接收的內(nèi)容中冗余信息,對除去冗余信息的內(nèi)容進行哈希運算,獲得該內(nèi)容對應(yīng)的指紋哈希值,并將該指紋哈希值對應(yīng)的計數(shù)值加I。由此用計數(shù)值表示獲取已接收的與上述內(nèi)容相同和/或相似內(nèi)容的數(shù)量。
[0096]步驟S1462,判斷該指紋哈希值對應(yīng)的計數(shù)值是否大于預(yù)設(shè)的計數(shù)值閥值,如果是,則執(zhí)行步驟S1464,否則,執(zhí)行步驟S1466。
[0097]其中,具有相同指紋哈希值的內(nèi)容為相同或相似內(nèi)容,指紋哈希值的計數(shù)值表示已經(jīng)接收的內(nèi)容中,與步驟SllO中接收的內(nèi)容相同或相似的內(nèi)容數(shù)量。因為,在網(wǎng)絡(luò)中垃圾信息多為廣告,其特點為反復重復出現(xiàn),內(nèi)容相同或相似。由此,通過計算接收的相同的指紋哈希值的累計數(shù)量,能夠檢測出此類垃圾信息。指紋哈希值的計數(shù)值達到預(yù)設(shè)的計數(shù)值閥值,則表示某一內(nèi)容反復在網(wǎng)絡(luò)中發(fā)布,其很可能為垃圾信息,具有高危險性。
[0098]步驟S1464,接收審核指令,根據(jù)該審核指令對接收的網(wǎng)絡(luò)中發(fā)布的該內(nèi)容進行檢測,檢測結(jié)果列表中對應(yīng)地保存該哈希值和根據(jù)審核指令對內(nèi)容進行檢測檢測所得的檢測結(jié)果。
[0099]步驟S1466,確定檢測結(jié)果為接收的內(nèi)容通過檢測。
[0100]本實施例能夠避免對每個內(nèi)容都進行人工檢測,所以取得了節(jié)約人力成本、提高檢測效率的技術(shù)效果,同時因為能夠在危險內(nèi)容造成危害前,糾正對該危險內(nèi)容的誤判,取得了提高檢測正確率,避免危險內(nèi)容危害網(wǎng)絡(luò)的技術(shù)效果。
[0101]參見圖4,為根據(jù)本發(fā)明另一實施例的檢測網(wǎng)絡(luò)中內(nèi)容的方法的流程圖。在該實施例中綜合應(yīng)用敏感詞檢測和相似內(nèi)容檢測,并在檢測結(jié)果列表中對檢測結(jié)果做記錄,以在后續(xù)中應(yīng)用該檢測結(jié)果。具體方法包括如下步驟。
[0102]步驟S4010,接收應(yīng)用平臺發(fā)送的網(wǎng)絡(luò)中發(fā)布的內(nèi)容,以及該內(nèi)容對應(yīng)的指示是否進行重新檢測的指示標識。
[0103]步驟S4020,除去內(nèi)容中冗余信息,對除去冗余信息的內(nèi)容進行哈希運算,獲得內(nèi)容對應(yīng)的指紋哈希值,將該指紋哈希值對應(yīng)的計數(shù)值加I。
[0104]步驟S4030,判斷接收的內(nèi)容對應(yīng)的指示標識是否指示進行重新檢測,如果否,則執(zhí)行步驟S4050,如果是,執(zhí)行步驟S4040。
[0105]步驟S4040,接收審核指令,根據(jù)該審核指令對網(wǎng)絡(luò)中發(fā)布的該內(nèi)容進行檢測,返回檢測結(jié)果,在該檢測結(jié)果列表中更新接收的內(nèi)容的指紋哈希值對應(yīng)的檢測結(jié)果為根據(jù)該審核指令對內(nèi)容進行檢測所得的檢測結(jié)果。
[0106]步驟S4050,判斷檢測結(jié)果列表中是否包括接收的內(nèi)容的指紋哈希值,如果不包括,則執(zhí)行步驟S4070,如果包括,則執(zhí)行步驟S4060。
[0107]步驟S4060,返回內(nèi)容對應(yīng)的指紋哈希值在檢測結(jié)果列表中對應(yīng)的檢測結(jié)果。
[0108]步驟S4070,判斷接收的內(nèi)容是否命中敏感詞庫中的敏感詞,如果是,則執(zhí)行步驟S4080 ;否則,執(zhí)行步驟S4090。
[0109]步驟S4080,接收審核指令,根據(jù)該審核指令對網(wǎng)絡(luò)中發(fā)布的該內(nèi)容進行檢測,返回檢測結(jié)果,在檢測結(jié)果列表中對應(yīng)地保存該內(nèi)容的指紋哈希值和所得檢測結(jié)果。
[0110]步驟S4090,判斷指紋哈希值的計數(shù)值是否大于預(yù)設(shè)的計數(shù)值閥值,如果大于,則執(zhí)行步驟S4080,否則,執(zhí)行步驟S4100。
[0111]步驟S4100,確定檢測結(jié)果為內(nèi)容通過檢測。
[0112]如圖5所示,一種檢測網(wǎng)絡(luò)中內(nèi)容的系統(tǒng)包括如下單元。
[0113]接收單元510,用于接收應(yīng)用平臺發(fā)送的網(wǎng)絡(luò)中發(fā)布的內(nèi)容,以及所述內(nèi)容對應(yīng)的指示是否進行重新檢測的指示標識。
[0114]其中,當所述內(nèi)容對應(yīng)的配置參量的值達到預(yù)設(shè)的參量閥值時,所述指示標識指示對所述內(nèi)容進行重新檢測,所述配置參量用于表征所述內(nèi)容被關(guān)注的程度,所述配置參量的值越大,則所述內(nèi)容被關(guān)注的程度越高。
[0115]所述配置參量至少包括下列參量中的一種:
[0116]內(nèi)容被評論的次數(shù);
[0117]內(nèi)容被瀏覽的次數(shù);
[0118]內(nèi)容被轉(zhuǎn)發(fā)的次數(shù);
[0119]內(nèi)容在頁面中停留的時長。
[0120]判斷單元520,用于判斷接收的所述指示標識是否指示對所述內(nèi)容進行重新檢測。
[0121]第一檢測單元530,用于在所述指示標識沒有指示對所述內(nèi)容進行重新檢測時,根據(jù)檢測結(jié)果列表對所述內(nèi)容進行檢測,返回檢測結(jié)果;所述檢測結(jié)果列表中保存內(nèi)容的檢測結(jié)果。
[0122]第二檢測單元540,用于在所述指示標識指示對所述內(nèi)容進行重新檢測時,接收審核指令,根據(jù)所述審核指令對所述內(nèi)容進行檢測,返回檢測結(jié)果。
[0123]較佳地,所述系統(tǒng)還包括:哈希值計算單元550,如圖6所示。
[0124]哈希值計算單元550,用于在所述接收單元接收到應(yīng)用平臺發(fā)送的網(wǎng)絡(luò)中發(fā)布的內(nèi)容后,對所述內(nèi)容進行哈希運算,獲得所述內(nèi)容對應(yīng)的哈希值。
[0125]所述檢測結(jié)果列表中對應(yīng)地保存內(nèi)容的哈希值和內(nèi)容的檢測結(jié)果。
[0126]第一檢測單元530,具體用于判斷所述檢測結(jié)果列表中是否包括所述哈希值,如果不包括,則根據(jù)已接收的與所述內(nèi)容相同和/或相似內(nèi)容的數(shù)量對所述內(nèi)容進行檢測;如果包括,則獲取所述哈希值在所述檢測結(jié)果列表中對應(yīng)的檢測結(jié)果。
[0127]較佳地,哈希值計算單元550,具體用于除去所述內(nèi)容中冗余信息,對除去冗余信息的所述內(nèi)容進行哈希運算,獲得所述內(nèi)容對應(yīng)的指紋哈希值。
[0128]較佳地,哈希值計算單元550,還用于在獲得所述內(nèi)容對應(yīng)的指紋哈希值后,將所述指紋哈希值對應(yīng)的計數(shù)值加I。
[0129]第一檢測單元530,具體用于判斷所述指紋哈希值對應(yīng)的計數(shù)值是否大于預(yù)設(shè)的計數(shù)值閥值,如果大于,則接收審核指令,根據(jù)所述審核指令對所述內(nèi)容進行檢測;否則,確定檢測結(jié)果為所述內(nèi)容通過檢測。
[0130]較佳地,第一檢測單元530,還用于在所述檢測結(jié)果列表中對應(yīng)地保存所述哈希值和根據(jù)所述審核指令對所述內(nèi)容進行檢測所得的檢測結(jié)果。
[0131]較佳地,第一檢測單元530,還用于在根據(jù)已接收的與所述內(nèi)容相同和/或相似內(nèi)容的數(shù)量對所述內(nèi)容進行檢測之前,判斷所述內(nèi)容是否命中敏感詞庫中的敏感詞;如果是,則接收審核指令,根據(jù)所述審核指令對所述內(nèi)容進行檢測,獲取檢測結(jié)果;所述返回檢測結(jié)果之后還包括:在所述檢測結(jié)果列表中對應(yīng)地保存所述內(nèi)容的哈希值和所得的根據(jù)所述審核指令對所述內(nèi)容進行檢測所得的檢測結(jié)果;如果否,進行所述根據(jù)已接收的與所述內(nèi)容相同和/或相似內(nèi)容的數(shù)量對所述內(nèi)容進行檢測的步驟。
[0132]較佳地,第二檢測單元540,還用于在所述指示標識指示對所述內(nèi)容進行重新檢測時,接收審核指令,根據(jù)所述審核指令對所述內(nèi)容進行檢測,返回檢測結(jié)果后,在所述檢測結(jié)果列表中更新所述內(nèi)容的檢測結(jié)果為根據(jù)所述審核指令對所述內(nèi)容進行檢測所得的檢測結(jié)果。
[0133]以上所述僅為本發(fā)明的較佳實施例而已,并非用于限定本發(fā)明的保護范圍。凡在本發(fā)明的精神和原則之內(nèi)所作的任何修改、等同替換、改進等,均包含在本發(fā)明的保護范圍內(nèi)。
【權(quán)利要求】
1.一種檢測網(wǎng)絡(luò)中內(nèi)容的方法,其特征在于,所述方法包括: 接收應(yīng)用平臺發(fā)送的網(wǎng)絡(luò)中發(fā)布的內(nèi)容,以及所述內(nèi)容對應(yīng)的指示是否進行重新檢測的指示標識;其中當所述內(nèi)容對應(yīng)的配置參量的值達到預(yù)設(shè)的參量閥值時,所述指示標識指示對所述內(nèi)容進行重新檢測,所述配置參量用于表征所述內(nèi)容被關(guān)注的程度,所述配置參量的值越大,則所述內(nèi)容被關(guān)注的程度越高; 判斷接收的所述指示標識是否指示對所述內(nèi)容進行重新檢測; 在所述指示標識沒有指示對所述內(nèi)容進行重新檢測時,根據(jù)檢測結(jié)果列表對所述內(nèi)容進行檢測,返回檢測結(jié)果;所述檢測結(jié)果列表中保存內(nèi)容的檢測結(jié)果; 在所述指示標識指示對所述內(nèi)容進行重新檢測時,接收審核指令,根據(jù)所述審核指令對所述內(nèi)容進行檢測,返回檢測結(jié)果。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于, 所述配置參量至少包括下列參量中的一種: 內(nèi)容被評論的次數(shù); 內(nèi)容被瀏覽的次數(shù); 內(nèi)容被轉(zhuǎn)發(fā)的次數(shù); 內(nèi)容在頁面中停留的時長。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于, 所述接收應(yīng)用平臺發(fā)送的網(wǎng)絡(luò)中發(fā)布的內(nèi)容后,所述方法還包括: 對所述內(nèi)容進行哈希運算,獲得所述內(nèi)容對應(yīng)的哈希值; 所述檢測結(jié)果列表中對應(yīng)地保存內(nèi)容的哈希值和內(nèi)容的檢測結(jié)果; 所述根據(jù)檢測結(jié)果列表對所述內(nèi)容進行檢測具體包括: 判斷所述檢測結(jié)果列表中是否包括所述哈希值,如果不包括,則根據(jù)已接收的與所述內(nèi)容相同和/或相似內(nèi)容的數(shù)量對所述內(nèi)容進行檢測;如果包括,則獲取所述哈希值在所述檢測結(jié)果列表中對應(yīng)的檢測結(jié)果。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于, 所述對所述內(nèi)容進行哈希運算,獲得所述內(nèi)容對應(yīng)的哈希值具體包括: 除去所述內(nèi)容中冗余信息,對除去冗余信息的所述內(nèi)容進行哈希運算,獲得所述內(nèi)容對應(yīng)的指紋哈希值。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于, 所述獲得所述內(nèi)容對應(yīng)的指紋哈希值后還包括: 將所述指紋哈希值對應(yīng)的計數(shù)值加I ; 所述根據(jù)已接收的與所述內(nèi)容相同和/或相似內(nèi)容的數(shù)量對所述內(nèi)容進行檢測具體包括: 判斷所述指紋哈希值對應(yīng)的計數(shù)值是否大于預(yù)設(shè)的計數(shù)值閥值, 如果大于,則接收審核指令,根據(jù)所述審核指令對所述內(nèi)容進行檢測; 否則,確定檢測結(jié)果為所述內(nèi)容通過檢測。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于, 所述如果大于,則接收審核指令,根據(jù)所述審核指令對所述內(nèi)容進行檢測后還包括: 在所述檢測結(jié)果列表中對應(yīng)地保存所述哈希值和根據(jù)所述審核指令對所述內(nèi)容進行檢測所得的檢測結(jié)果。
7.根據(jù)權(quán)利要求3所述的方法,其特征在于, 所述根據(jù)已接收的與所述內(nèi)容相同和/或相似內(nèi)容的數(shù)量對所述內(nèi)容進行檢測之前還包括: 判斷所述內(nèi)容是否命中敏感詞庫中的敏感詞; 如果是,則接收審核指令,根據(jù)所述審核指令對所述內(nèi)容進行檢測,獲取檢測結(jié)果;所述返回檢測結(jié)果之后還包括:在所述檢測結(jié)果列表中對應(yīng)地保存所述內(nèi)容的哈希值和根據(jù)所述審核指令對所述內(nèi)容進行檢測所得的檢測結(jié)果; 如果否,進行所述根據(jù)已接收的與所述內(nèi)容相同和/或相似內(nèi)容的數(shù)量對所述內(nèi)容進行檢測的步驟。
8.根據(jù)權(quán)利要求1所述的方法,其特征在于, 所述在所述指示標識指示對所述內(nèi)容進行重新檢測時,接收審核指令,根據(jù)所述審核指令對所述內(nèi)容進行檢測,返回檢測結(jié)果后還包括: 在所述檢測結(jié)果列表中更新所述內(nèi)容的檢測結(jié)果為根據(jù)所述審核指令對所述內(nèi)容進行檢測所得的檢測結(jié)果。
9.一種檢測網(wǎng)絡(luò)中內(nèi)容的系統(tǒng),其特征在于,包括: 接收單元,用于接收應(yīng)用平臺發(fā)送的網(wǎng)絡(luò)中發(fā)布的內(nèi)容,以及所述內(nèi)容對應(yīng)的指示是否進行重新檢測的指示標識;其中當所述內(nèi)容對應(yīng)的配置參量的值達到預(yù)設(shè)的參量閥值時,所述指示標識指示對所述內(nèi)容進行重新檢測,所述配置參量用于表征所述內(nèi)容被關(guān)注的程度,所述配置參量的值越大,則所述內(nèi)容被關(guān)注的程度越高; 判斷單元,用于判斷接收的所述指示標識是否指示對所述內(nèi)容進行重新檢測; 第一檢測單元,用于在所述指示標識沒有指示對所述內(nèi)容進行重新檢測時,根據(jù)檢測結(jié)果列表對所述內(nèi)容進行檢測,返回檢測結(jié)果;所述檢測結(jié)果列表中保存內(nèi)容的檢測結(jié)果; 第二檢測單元,用于在所述指示標識指示對所述內(nèi)容進行重新檢測時,接收審核指令,根據(jù)所述審核指令對所述內(nèi)容進行檢測,返回檢測結(jié)果。
10.根據(jù)權(quán)利要求9所述的系統(tǒng),其特征在于, 所述系統(tǒng)還包括:哈希值計算單元; 所述哈希值計算單元,用于在所述接收單元接收到應(yīng)用平臺發(fā)送的網(wǎng)絡(luò)中發(fā)布的內(nèi)容后,對所述內(nèi)容進行哈希運算,獲得所述內(nèi)容對應(yīng)的哈希值; 所述檢測結(jié)果列表中對應(yīng)地保存內(nèi)容的哈希值和內(nèi)容的檢測結(jié)果; 所述第一檢測單元,具體用于判斷所述檢測結(jié)果列表中是否包括所述哈希值,如果不包括,則根據(jù)已接收的與所述內(nèi)容相同和/或相似內(nèi)容的數(shù)量對所述內(nèi)容進行檢測;如果包括,則獲取所述哈希值在所述檢測結(jié)果列表中對應(yīng)的檢測結(jié)果。
【文檔編號】H04L29/06GK104253809SQ201310271013
【公開日】2014年12月31日 申請日期:2013年6月29日 優(yōu)先權(quán)日:2013年6月29日
【發(fā)明者】田旭東 申請人:北京新媒傳信科技有限公司