国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種網(wǎng)站不良似然度獲取方法和裝置制造方法

      文檔序號(hào):6510674閱讀:223來(lái)源:國(guó)知局
      一種網(wǎng)站不良似然度獲取方法和裝置制造方法
      【專(zhuān)利摘要】本發(fā)明公開(kāi)了一種網(wǎng)站不良似然度獲取方法和裝置,該方法包括:統(tǒng)計(jì)網(wǎng)站疑似不良文本的數(shù)目;統(tǒng)計(jì)網(wǎng)站疑似不良圖片的數(shù)目;統(tǒng)計(jì)網(wǎng)站疑似不良視頻的數(shù)目;根據(jù)疑似不良文本的數(shù)目、疑似不良圖片的數(shù)目和疑似不良視頻的數(shù)目獲取網(wǎng)站的不良似然度。本發(fā)明通過(guò)對(duì)網(wǎng)站的文本、圖片和視頻內(nèi)容進(jìn)行分析,通過(guò)各種內(nèi)容的疑似不良數(shù)目判斷網(wǎng)站的不良似然度,判斷過(guò)程快速準(zhǔn)確,提供了對(duì)網(wǎng)絡(luò)環(huán)境的全面檢測(cè)。
      【專(zhuān)利說(shuō)明】一種網(wǎng)站不良似然度獲取方法和裝置
      【技術(shù)領(lǐng)域】
      [0001]本發(fā)明涉及互聯(lián)網(wǎng)不良信息識(shí)別領(lǐng)域,尤其涉及一種網(wǎng)站不良似然度獲取方法和
      裝直。
      【背景技術(shù)】
      [0002]當(dāng)今社會(huì)科學(xué)技術(shù)日新月異,隨著我國(guó)國(guó)民經(jīng)濟(jì)的不斷發(fā)展,人民生活水平的不斷提高,互聯(lián)網(wǎng)已經(jīng)深入家庭。如今,互聯(lián)網(wǎng)已經(jīng)改變和影響了每一個(gè)人的生活,在充分體驗(yàn)互聯(lián)網(wǎng)絡(luò)為生活、工作帶來(lái)方便、效率的同時(shí),網(wǎng)絡(luò)不良信息也在危害著廣大青少年尤其是未成年的青少年的身心健康。目前最容易接觸到網(wǎng)絡(luò)不良信息的是手機(jī),現(xiàn)在青少年近九成擁有移動(dòng)手機(jī),據(jù)不完全統(tǒng)計(jì),全國(guó)擁有1.5億19歲以下的青少年手機(jī)用戶(hù),據(jù)調(diào)查顯示,80%青少年瀏覽過(guò)黃色、暴力和血腥等不良信息。因此,如何發(fā)現(xiàn)和遏制網(wǎng)絡(luò)不良信息,保證青少年的身心健康,已經(jīng)成為眼下亟待解決的問(wèn)題。

      【發(fā)明內(nèi)容】

      [0003]本發(fā)明提供了一種對(duì)網(wǎng)站的文本、圖片和視頻內(nèi)容進(jìn)行分析統(tǒng)計(jì),獲取網(wǎng)站的不良似然度的方法和裝置。
      [0004]為實(shí)現(xiàn)上述方法和裝置,本發(fā)明采用以下技術(shù)方案:
      [0005]—方面米用一種網(wǎng)站不良似然度獲取方法,包括:
      [0006]統(tǒng)計(jì)網(wǎng)站疑似不良文本的數(shù)目;
      [0007]統(tǒng)計(jì)網(wǎng)站疑似不良圖片的數(shù)目;
      [0008]統(tǒng)計(jì)網(wǎng)站疑似不良視頻的數(shù)目;
      [0009]根據(jù)疑似不良文本的數(shù)目、疑似不良圖片的數(shù)目和疑似不良視頻的數(shù)目獲取網(wǎng)站的不良似然度。
      [0010]其中,所述統(tǒng)計(jì)網(wǎng)站疑似不良文本的數(shù)目,包括:
      [0011]用預(yù)設(shè)的不良關(guān)鍵字字庫(kù)與網(wǎng)站中的每個(gè)文本文件的文字進(jìn)行匹配;
      [0012]統(tǒng)計(jì)每個(gè)文本文件中不良關(guān)鍵字匹配個(gè)數(shù)和總次數(shù);
      [0013]當(dāng)文本文件中的不良關(guān)鍵字匹配個(gè)數(shù)和次數(shù)均達(dá)到閾值時(shí),將該文本文件標(biāo)記為疑似不良文本,統(tǒng)計(jì)網(wǎng)站中的疑似不良文本的數(shù)目。
      [0014]其中,所述統(tǒng)計(jì)網(wǎng)站疑似不良圖片的數(shù)目,包括:
      [0015]提取網(wǎng)站中每張圖片的膚色、紋理和姿態(tài)參數(shù);
      [0016]根據(jù)圖片的膚色、紋理和姿態(tài)參數(shù)對(duì)圖片進(jìn)行不良疑似度打分;
      [0017]當(dāng)圖片的分?jǐn)?shù)在預(yù)設(shè)范圍內(nèi)時(shí),將該圖片標(biāo)記為疑似不良圖片,統(tǒng)計(jì)網(wǎng)站中的疑似不良圖片數(shù)目。
      [0018]其中,所述統(tǒng)計(jì)網(wǎng)站疑似不良視頻的數(shù)目,包括:
      [0019]從網(wǎng)站的每個(gè)視頻中抽取關(guān)鍵幀;
      [0020]提取每個(gè)關(guān)鍵幀的膚色、紋理和姿態(tài)參數(shù);[0021]根據(jù)關(guān)鍵幀的膚色、紋理和姿態(tài)參數(shù)對(duì)關(guān)鍵幀進(jìn)行不良疑似度打分;
      [0022]當(dāng)關(guān)鍵幀的分?jǐn)?shù)在預(yù)設(shè)范圍內(nèi)時(shí),將該關(guān)鍵幀標(biāo)記為疑似不良幀;
      [0023]當(dāng)視頻的疑似不良幀占視頻關(guān)鍵幀的比例達(dá)到預(yù)設(shè)的閾值時(shí),將該視頻標(biāo)記為疑似不良視頻,統(tǒng)計(jì)網(wǎng)站疑似不良視頻的數(shù)目。
      [0024]其中,所述根據(jù)疑似不良文本的數(shù)目、疑似不良圖片的數(shù)目和疑似不良視頻的數(shù)目獲取網(wǎng)站的不良似然度,具體為:
      [0025]根據(jù)疑似不良文本、疑似不良圖片和疑似不良視頻的數(shù)目,預(yù)設(shè)的權(quán)重,預(yù)設(shè)的置信度獲取網(wǎng)站的不良似然度;所述不良似然度的獲取方法為:
      [0026]S=a XZ1XS1+β XZ2XS2+y XZ3XS3
      [0027]其中,S表示網(wǎng)站的不良似然度值;α表示文本的權(quán)重J1表示文本的置信度;S1表示疑似不良文本的數(shù)量;β表示圖片的權(quán)重;ζ2表示圖片的置信度;s2表示疑似不良圖片的數(shù)量;Y表示視頻的權(quán)重;z3表示視頻的置信度;s3表示疑似不良視頻的數(shù)量;α +β + y = 1。
      [0028]另一方面采用一種網(wǎng)站不良似然度獲取裝置,包括:
      [0029]第一統(tǒng)計(jì)單元,用于統(tǒng)計(jì)網(wǎng)站疑似不良文本的數(shù)目;
      [0030]第二統(tǒng)計(jì)單元,用于統(tǒng)計(jì)網(wǎng)站疑似不良圖片的數(shù)目;
      [0031]第三統(tǒng)計(jì)單元,用于統(tǒng)計(jì)網(wǎng)站疑似不良視頻的數(shù)目;
      [0032]似然度計(jì)算單元,用于根據(jù)疑似不良文本的數(shù)目、疑似不良圖片的數(shù)目和疑似不良視頻的數(shù)目獲取網(wǎng)站的不良似然度。
      [0033]其中,所述第一統(tǒng)計(jì)單元包括:
      [0034]關(guān)鍵字匹配模塊,用于用預(yù)設(shè)的不良關(guān)鍵字字庫(kù)與網(wǎng)站中的每個(gè)文本文件的文字進(jìn)行匹配;
      [0035]數(shù)目統(tǒng)計(jì)模塊,用于統(tǒng)計(jì)每個(gè)文本文件中不良關(guān)鍵字匹配個(gè)數(shù)和總次數(shù);
      [0036]文本計(jì)數(shù)模塊,用于當(dāng)文本文件中的不良關(guān)鍵字匹配個(gè)數(shù)和次數(shù)均達(dá)到閾值時(shí),將該文本文件標(biāo)記為疑似不良文本,統(tǒng)計(jì)網(wǎng)站中的疑似不良文本的數(shù)目。
      [0037]其中,所述第二統(tǒng)計(jì)單元包括:
      [0038]圖片參數(shù)提取模塊,用于提取網(wǎng)站中每張圖片的膚色、紋理和姿態(tài)參數(shù);
      [0039]圖片打分模塊,用于根據(jù)圖片的膚色、紋理和姿態(tài)參數(shù)對(duì)圖片進(jìn)行不良疑似度打分;
      [0040]圖片計(jì)數(shù)模塊,用于當(dāng)圖片的分?jǐn)?shù)在預(yù)設(shè)范圍內(nèi)時(shí),將該圖片標(biāo)記為疑似不良圖片,統(tǒng)計(jì)網(wǎng)站中的疑似不良圖片數(shù)目。
      [0041]其中,所述第三統(tǒng)計(jì)單元包括:
      [0042]關(guān)鍵幀抽取|吳塊,用于從網(wǎng)站的每個(gè)視頻中抽取關(guān)鍵幀;
      [0043]幀參數(shù)提取模塊,用于提取每個(gè)關(guān)鍵幀的膚色、紋理和姿態(tài)參數(shù);
      [0044]關(guān)鍵幀打分模塊,用于根據(jù)關(guān)鍵幀的膚色、紋理和姿態(tài)參數(shù)對(duì)關(guān)鍵幀進(jìn)行不良疑似度打分;
      [0045]關(guān)鍵幀標(biāo)記模塊,用于當(dāng)關(guān)鍵幀的分?jǐn)?shù)在預(yù)設(shè)范圍內(nèi)時(shí),將該關(guān)鍵幀標(biāo)記為疑似不良幀;
      [0046]視頻計(jì)數(shù)模塊,用于當(dāng)視頻的疑似不良幀占視頻關(guān)鍵幀的比例達(dá)到預(yù)設(shè)的閾值時(shí),將該視頻標(biāo)記為疑似不良視頻,統(tǒng)計(jì)網(wǎng)站疑似不良視頻的數(shù)目。
      [0047]其中,所述似然度計(jì)算單元具體用于:
      [0048]根據(jù)疑似不良文本、疑似不良圖片和疑似不良視頻的數(shù)目,預(yù)設(shè)的權(quán)重,預(yù)設(shè)的置信度獲取網(wǎng)站的不良似然度;所述不良似然度的獲取方法為:
      [0049]S=a XZ1XS1+^ XZ2XS2+y XZ3XS3
      [0050]其中,S表示網(wǎng)站的不良似然度值;α表示文本的權(quán)重J1表示文本的置信度;S1表示疑似不良文本的數(shù)量;β表示圖片的權(quán)重;ζ2表示圖片的置信度;s2表示疑似不良圖片的數(shù)量;Y表示視頻的權(quán)重;z3表示視頻的置信度;s3表示疑似不良視頻的數(shù)量;α +β + y = I。
      [0051]本發(fā)明的有益效果為:本發(fā)明對(duì)網(wǎng)站的文本、圖片和視頻內(nèi)容進(jìn)行分析,通過(guò)各種內(nèi)容的疑似不良數(shù)目判斷網(wǎng)站的不良似然度,判斷過(guò)程快速準(zhǔn)確,提供了對(duì)網(wǎng)絡(luò)環(huán)境的全面檢測(cè)。
      【專(zhuān)利附圖】

      【附圖說(shuō)明】
      [0052]圖1是本發(fā)明一種網(wǎng)站不良似然度獲取方法的第一實(shí)施例流程圖;
      [0053]圖2是本發(fā)明一種網(wǎng)站不良似然度獲取方法的第二實(shí)施例流程圖;
      [0054]圖3是本發(fā)明一種網(wǎng)站不良似然度獲取方法的對(duì)十個(gè)網(wǎng)站獲取的不良似然度統(tǒng)計(jì)圖;
      [0055]圖4是本發(fā)明一種 網(wǎng)站不良似然度獲取裝置的結(jié)構(gòu)方框圖;
      [0056]圖5是本發(fā)明一種網(wǎng)站不良似然度獲取裝置的第一統(tǒng)計(jì)單元的結(jié)構(gòu)方框圖;
      [0057]圖6是本發(fā)明一種網(wǎng)站不良似然度獲取裝置的第二統(tǒng)計(jì)單元的結(jié)構(gòu)方框圖;
      [0058]圖7是本發(fā)明一種網(wǎng)站不良似然度獲取裝置的第三統(tǒng)計(jì)單元的結(jié)構(gòu)方框圖。
      【具體實(shí)施方式】
      [0059]下面結(jié)合圖1至圖7并通過(guò)【具體實(shí)施方式】來(lái)進(jìn)一步說(shuō)明本發(fā)明的技術(shù)方案。
      [0060]圖1是本發(fā)明一種網(wǎng)站不良似然度獲取方法的第一實(shí)施例流程圖,如圖所示,該方法包括:
      [0061]步驟110:統(tǒng)計(jì)網(wǎng)站疑似不良文本的數(shù)目;
      [0062]步驟120:統(tǒng)計(jì)網(wǎng)站疑似不良圖片的數(shù)目;
      [0063]步驟130:統(tǒng)計(jì)網(wǎng)站疑似不良視頻的數(shù)目;
      [0064]上述三個(gè)步驟的執(zhí)行過(guò)程并無(wú)特定的先后順序,可同時(shí)統(tǒng)計(jì),可交錯(cuò)統(tǒng)計(jì),亦可按上述步驟描述的先后順序依次統(tǒng)計(jì)。步驟140:根據(jù)疑似不良文本的數(shù)目、疑似不良圖片的數(shù)目和疑似不良視頻的數(shù)目獲取網(wǎng)站的不良似然度。
      [0065]本發(fā)明對(duì)網(wǎng)站的文本、圖片和視頻內(nèi)容進(jìn)行分析,通過(guò)各種內(nèi)容的疑似不良數(shù)目判斷網(wǎng)站的不良似然度,判斷過(guò)程快速準(zhǔn)確,提供了對(duì)網(wǎng)絡(luò)環(huán)境的全面檢測(cè)。
      [0066]圖2是本發(fā)明一種網(wǎng)站不良似然度獲取方法的第二實(shí)施例流程圖,如圖所示,該方法包括:
      [0067]步驟201:用預(yù)設(shè)的不良關(guān)鍵字字庫(kù)與網(wǎng)站中的每個(gè)文本文件的文字進(jìn)行匹配。
      [0068]步驟202:統(tǒng)計(jì)每個(gè)文本文件中不良關(guān)鍵字匹配個(gè)數(shù)和次數(shù)。[0069]步驟203:當(dāng)文本文件中的不良關(guān)鍵字匹配個(gè)數(shù)和次數(shù)均達(dá)到閾值時(shí),將該文本文件標(biāo)記為疑似不良文本,統(tǒng)計(jì)網(wǎng)站中的疑似不良文本的數(shù)目。
      [0070]步驟204:提取網(wǎng)站中每張圖片的膚色、紋理和姿態(tài)參數(shù)。
      [0071]步驟205:根據(jù)圖片的膚色、紋理和姿態(tài)參數(shù)對(duì)圖片進(jìn)行不良疑似度打分。
      [0072]步驟206:當(dāng)圖片的分?jǐn)?shù)在預(yù)設(shè)范圍內(nèi)時(shí),將該圖片標(biāo)記為疑似不良圖片,統(tǒng)計(jì)網(wǎng)站中的疑似不良圖片數(shù)目。
      [0073]步驟207:從網(wǎng)站的每個(gè)視頻中抽取關(guān)鍵幀。
      [0074]步驟208:提取每個(gè)關(guān)鍵幀的膚色、紋理和姿態(tài)參數(shù)。
      [0075]步驟209:根據(jù)關(guān)鍵幀的膚色、紋理和姿態(tài)參數(shù)對(duì)關(guān)鍵幀進(jìn)行不良疑似度打分。
      [0076]步驟210:當(dāng)關(guān)鍵幀的分?jǐn)?shù)在預(yù)設(shè)范圍內(nèi)時(shí),將該關(guān)鍵幀標(biāo)記為疑似不良幀。
      [0077]步驟211:當(dāng)視頻的疑似不良幀占視頻關(guān)鍵幀的比例達(dá)到預(yù)設(shè)的閾值時(shí),將該視頻標(biāo)記為疑似不良視頻,統(tǒng)計(jì)網(wǎng)站疑似不良視頻的數(shù)目。
      [0078]步驟212:根據(jù)疑似不良文本、疑似不良圖片和疑似不良視頻的數(shù)目、預(yù)設(shè)的權(quán)重、預(yù)設(shè)的置信度獲取網(wǎng)站的不良似然度;所述不良似然度的獲取方法為:
      [0079]S=a XZ1XS1+^ XZ2XS2+y XZ3XS3
      [0080]其中,S表示網(wǎng)站的不良似然度值;α表示文本的權(quán)重J1表示文本的置信度;S1表示疑似不良文本的數(shù)量;β表示圖片的權(quán)重;ζ2表示圖片的置信度;s2表示疑似不良圖片的數(shù)量;Y表示視頻的權(quán)重;z3表示視頻的置信度;s3表示疑似不良視頻的數(shù)量;α +β + y = I。
      [0081]為了進(jìn)一步對(duì)本實(shí)施例進(jìn)行說(shuō)明,就實(shí)際的網(wǎng)站不良似然度獲取過(guò)程中進(jìn)行詳細(xì)闡述。文本的權(quán)重設(shè)置為0.6,文本的置信度設(shè)置為0.6,文本文件中的不良關(guān)鍵字匹配中標(biāo)個(gè)數(shù)和次數(shù)地閾值分別為3個(gè)和5次;圖片的權(quán)重設(shè)置為0.2,圖片的置信度設(shè)置為0.25 ;視頻的權(quán)重設(shè)置為0.2,視頻的置信度設(shè)置為0.6,視頻的疑似不良幀占視頻關(guān)鍵幀的比例的閾值為0.35。根據(jù)不良似然度的獲取方法:S= a XZ1XS1+^ XZ2XS2+Y XZ3XS3,疑似不良內(nèi)容越多,網(wǎng)站的不良似然度越高,如圖3所示是對(duì)10個(gè)網(wǎng)站進(jìn)行統(tǒng)計(jì)分析后得到的不良似然度的統(tǒng)計(jì)圖。從圖3中可以看出,編號(hào)為I的網(wǎng)站的不良似然度最高,為626.21,相對(duì)應(yīng)的,其為不良信息網(wǎng)站的可能性最高,需要對(duì)其進(jìn)行重點(diǎn)監(jiān)測(cè),如果監(jiān)測(cè)結(jié)果顯示其確實(shí)為不良信息網(wǎng)站,則依法進(jìn)行后續(xù)處理,以維護(hù)網(wǎng)絡(luò)環(huán)境的健康安全。
      [0082]圖4是本發(fā)明一種網(wǎng)站不良似然度獲取裝置400的結(jié)構(gòu)方框圖,如圖所示,該裝置包括:
      [0083]第一統(tǒng)計(jì)單元410,用于統(tǒng)計(jì)網(wǎng)站疑似不良文本的數(shù)目;
      [0084]第二統(tǒng)計(jì)單元420,用于統(tǒng)計(jì)網(wǎng)站疑似不良圖片的數(shù)目;
      [0085]第三統(tǒng)計(jì)單元430,用于統(tǒng)計(jì)網(wǎng)站疑似不良視頻的數(shù)目;
      [0086]似然度計(jì)算單元440,用于根據(jù)疑似不良文本的數(shù)目、疑似不良圖片的數(shù)目和疑似不良視頻的數(shù)目獲取網(wǎng)站的不良似然度。
      [0087]進(jìn)一步地,如圖5所示,所述第一統(tǒng)計(jì)單元410包括:
      [0088]關(guān)鍵字匹配模塊411,用于用預(yù)設(shè)的不良關(guān)鍵字字庫(kù)與網(wǎng)站中的每個(gè)文本文件的文字進(jìn)行匹配;
      [0089]數(shù)目統(tǒng)計(jì)模塊412,用于統(tǒng)計(jì)每個(gè)文本文件中不良關(guān)鍵字匹配個(gè)數(shù)和次數(shù);[0090]文本計(jì)數(shù)模塊413,用于當(dāng)文本文件中的不良關(guān)鍵字匹配個(gè)數(shù)和次數(shù)均達(dá)到閾值時(shí),將該文本文件標(biāo)記為疑似不良文本,統(tǒng)計(jì)網(wǎng)站中的疑似不良文本的數(shù)目。
      [0091]進(jìn)一步地,如圖6所示,所述第二統(tǒng)計(jì)單元420包括:
      [0092]圖片參數(shù)提取模塊421,用于提取網(wǎng)站中每張圖片的膚色、紋理和姿態(tài)參數(shù);
      [0093]圖片打分模塊422,用于根據(jù)圖片的膚色、紋理和姿態(tài)參數(shù)對(duì)圖片進(jìn)行不良疑似度打分;
      [0094]圖片計(jì)數(shù)模塊423,用于當(dāng)圖片的分?jǐn)?shù)在預(yù)設(shè)范圍內(nèi)時(shí),將該圖片標(biāo)記為疑似不良圖片,統(tǒng)計(jì)網(wǎng)站中的疑似不良圖片數(shù)目。
      [0095]進(jìn)一步地,如圖7所示,所述第三統(tǒng)計(jì)單元430包括:
      [0096]關(guān)鍵幀抽取|旲塊431,用于從網(wǎng)站的每個(gè)視頻中抽取關(guān)鍵幀;
      [0097]幀參數(shù)提取模塊432,用于提取每個(gè)關(guān)鍵幀的膚色、紋理和姿態(tài)參數(shù);
      [0098]關(guān)鍵幀打分模塊433,用于根據(jù)關(guān)鍵幀的膚色、紋理和姿態(tài)參數(shù)對(duì)關(guān)鍵幀進(jìn)行不良疑似度打分;
      [0099]關(guān)鍵幀標(biāo)記模塊434,用于當(dāng)關(guān)鍵幀的分?jǐn)?shù)在預(yù)設(shè)范圍內(nèi)時(shí),將該關(guān)鍵幀標(biāo)記為疑似不良幀;
      [0100]視頻計(jì)數(shù)模塊435,用于當(dāng)視頻的疑似不良幀占視頻關(guān)鍵幀的比例達(dá)到預(yù)設(shè)的閾值時(shí),將該視頻標(biāo)記為疑似不良視頻,統(tǒng)計(jì)網(wǎng)站疑似不良視頻的數(shù)目。
      [0101]具體地,所述似然度計(jì)算單元用于:
      [0102]根據(jù)疑似不良文本、疑似不良圖片和疑似不良視頻的數(shù)目、預(yù)設(shè)的權(quán)重、預(yù)設(shè)的置信度獲取網(wǎng)站的不良似然度;所述不良似然度的獲取方法為:
      [0103]s=a XZ1XS1+^ XZ2XS2+y XZ3XS3
      [0104]其中,S表示網(wǎng)站的不良似然度值;α表示文本的權(quán)重J1表示文本的置信度;S1表示疑似不良文本的數(shù)量;β表示圖片的權(quán)重;ζ2表示圖片的置信度;s2表示疑似不良圖片的數(shù)量;Y表示視頻的權(quán)重;z3表示視頻的置信度;s3表示疑似不良視頻的數(shù)量;α +β + y = 1。
      [0105]通過(guò)上述單元和模塊的配合工作,對(duì)網(wǎng)站的文本、圖片和視頻內(nèi)容進(jìn)行分析,通過(guò)各種內(nèi)容的疑似不良數(shù)目判斷網(wǎng)站的不良似然度,判斷過(guò)程快速準(zhǔn)確,提供了對(duì)網(wǎng)絡(luò)環(huán)境的全面檢測(cè)。
      [0106]以上結(jié)合具體實(shí)施例描述了本發(fā)明的技術(shù)原理。這些描述只是為了解釋本發(fā)明的原理,而不能以任何方式解釋為對(duì)本發(fā)明保護(hù)范圍的限制。基于此處的解釋?zhuān)绢I(lǐng)域的技術(shù)人員不需要付出創(chuàng)造性的勞動(dòng)即可聯(lián)想到本發(fā)明的其它【具體實(shí)施方式】,這些方式都將落入本發(fā)明的保護(hù)范圍之內(nèi)。
      【權(quán)利要求】
      1.一種網(wǎng)站不良似然度獲取方法,其特征在于,包括: 統(tǒng)計(jì)網(wǎng)站疑似不良文本的數(shù)目; 統(tǒng)計(jì)網(wǎng)站疑似不良圖片的數(shù)目; 統(tǒng)計(jì)網(wǎng)站疑似不良視頻的數(shù)目; 根據(jù)疑似不良文本的數(shù)目、疑似不良圖片的數(shù)目和疑似不良視頻的數(shù)目獲取網(wǎng)站的不良似然度。
      2.根據(jù)權(quán)利要求1所述的一種網(wǎng)站不良似然度獲取方法,其特征在于,所述統(tǒng)計(jì)網(wǎng)站疑似不良文本的數(shù)目,包括: 用預(yù)設(shè)的不良關(guān)鍵字字庫(kù)與網(wǎng)站中的每個(gè)文本文件的文字進(jìn)行匹配; 統(tǒng)計(jì)每個(gè)文本文件中不良關(guān)鍵字匹配個(gè)數(shù)和總次數(shù); 當(dāng)文本文件中的不良關(guān)鍵字匹配個(gè)數(shù)和次數(shù)均達(dá)到閾值時(shí),將該文本文件標(biāo)記為疑似不良文本,統(tǒng)計(jì)網(wǎng)站中的疑似不良文本的數(shù)目。
      3.根據(jù)權(quán)利要求1所述的一種網(wǎng)站不良似然度獲取方法,其特征在于,所述統(tǒng)計(jì)網(wǎng)站疑似不良圖片的數(shù)目,包括: 提取網(wǎng)站中每張圖片的膚色、紋理和姿態(tài)參數(shù); 根據(jù)圖片的膚色、紋理和姿態(tài)參數(shù)對(duì)圖片進(jìn)行不良疑似度打分; 當(dāng)圖片的分?jǐn)?shù)在預(yù)設(shè)范圍內(nèi)時(shí),將該圖片標(biāo)記為疑似不良圖片,統(tǒng)計(jì)網(wǎng)站中的疑似不良圖片數(shù)目。
      4.根據(jù)權(quán)利要求1所述的一種網(wǎng)站不良似然度獲取方法,其特征在于,所述統(tǒng)計(jì)網(wǎng)站疑似不良視頻的數(shù)目,包括: 從網(wǎng)站的每個(gè)視頻中抽取關(guān)鍵幀; 提取每個(gè)關(guān)鍵幀的膚色、紋理和姿態(tài)參數(shù); 根據(jù)關(guān)鍵幀的膚色、紋理和姿態(tài)參數(shù)對(duì)關(guān)鍵幀進(jìn)行不良疑似度打分; 當(dāng)關(guān)鍵幀的分?jǐn)?shù)在預(yù)設(shè)范圍內(nèi)時(shí),將該關(guān)鍵幀標(biāo)記為疑似不良幀; 當(dāng)視頻的疑似不良幀占視頻關(guān)鍵幀的比例達(dá)到預(yù)設(shè)的閾值時(shí),將該視頻標(biāo)記為疑似不良視頻,統(tǒng)計(jì)網(wǎng)站疑似不良視頻的數(shù)目。
      5.根據(jù)權(quán)利要求1所述的一種網(wǎng)站不良似然度獲取方法,其特征在于,所述根據(jù)疑似不良文本的數(shù)目、疑似不良圖片的數(shù)目和疑似不良視頻的數(shù)目獲取網(wǎng)站的不良似然度,具體為: 根據(jù)疑似不良文本、疑似不良圖片和疑似不良視頻的數(shù)目,預(yù)設(shè)的權(quán)重,預(yù)設(shè)的置信度獲取網(wǎng)站的不良似然度;所述不良似然度的獲取方法為: S= α XZ1XS1+ β XZ2XS2+ Y XZ3XS3 其中,S表示網(wǎng)站的不良似然度值;α表示文本的權(quán)重'I1表示文本的置信度A1表示疑似不良文本的數(shù)量;β表示圖片的權(quán)重;Ζ2表示圖片的置信度;S2表示疑似不良圖片的數(shù)量;Y表示視頻的權(quán)重;z3表示視頻的置信度;S3表示疑似不良視頻的數(shù)量;α + β + Y =1
      6. 一種網(wǎng)站不良似然度獲取裝置,其特征在于,包括: 第一統(tǒng)計(jì)單元,用于統(tǒng)計(jì)網(wǎng)站疑似不良文本的數(shù)目; 第二統(tǒng)計(jì)單元,用于統(tǒng)計(jì)網(wǎng)站疑似不良圖片的數(shù)目;第三統(tǒng)計(jì)單元,用于統(tǒng)計(jì)網(wǎng)站疑似不良視頻的數(shù)目; 似然度計(jì)算單元,用于根據(jù)疑似不良文本的數(shù)目、疑似不良圖片的數(shù)目和疑似不良視頻的數(shù)目獲取網(wǎng)站的不良似然度。
      7.根據(jù)權(quán)利要求6所述的一種網(wǎng)站不良似然度獲取裝置,其特征在于,所述第一統(tǒng)計(jì)單元包括: 關(guān)鍵字匹配模塊,用于用預(yù)設(shè)的不良關(guān)鍵字字庫(kù)與網(wǎng)站中的每個(gè)文本文件的文字進(jìn)行匹配; 數(shù)目統(tǒng)計(jì)模塊,用于統(tǒng)計(jì)每個(gè)文本文件中不良關(guān)鍵字匹配個(gè)數(shù)和總次數(shù); 文本計(jì)數(shù)模塊,用于當(dāng)文本文件中的不良關(guān)鍵字匹配個(gè)數(shù)和次數(shù)均達(dá)到閾值時(shí),將該文本文件標(biāo)記為疑似不良文本,統(tǒng)計(jì)網(wǎng)站中的疑似不良文本的數(shù)目。
      8.根據(jù)權(quán)利要求6所述的一種網(wǎng)站不良似然度獲取裝置,其特征在于,所述第二統(tǒng)計(jì)單元包括: 圖片參數(shù)提取模塊,用于提取網(wǎng)站中每張圖片的膚色、紋理和姿態(tài)參數(shù); 圖片打分模塊,用于根據(jù)圖片的膚色、紋理和姿態(tài)參數(shù)對(duì)圖片進(jìn)行不良疑似度打分;圖片計(jì)數(shù)模塊,用于當(dāng)圖片的分?jǐn)?shù)在預(yù)設(shè)范圍內(nèi)時(shí),將該圖片標(biāo)記為疑似不良圖片,統(tǒng)計(jì)網(wǎng)站中的疑似不良圖片數(shù)目。
      9.根據(jù)權(quán)利要求6所述的一種網(wǎng)站不良似然度獲取裝置,其特征在于,所述第三統(tǒng)計(jì)單元包括: 關(guān)鍵幀抽取1吳塊,用于.從網(wǎng)站的每個(gè)視頻中抽取關(guān)鍵幀; 幀參數(shù)提取模塊,用于提取每個(gè)關(guān)鍵幀的膚色、紋理和姿態(tài)參數(shù); 關(guān)鍵幀打分模塊,用于根據(jù)關(guān)鍵幀的膚色、紋理和姿態(tài)參數(shù)對(duì)關(guān)鍵幀進(jìn)行不良疑似度打分; 關(guān)鍵幀標(biāo)記模塊,用于當(dāng)關(guān)鍵幀的分?jǐn)?shù)在預(yù)設(shè)范圍內(nèi)時(shí),將該關(guān)鍵幀標(biāo)記為疑似不良幀; 視頻計(jì)數(shù)模塊,用于當(dāng)視頻的疑似不良幀占視頻關(guān)鍵幀的比例達(dá)到預(yù)設(shè)的閾值時(shí),將該視頻標(biāo)記為疑似不良視頻,統(tǒng)計(jì)網(wǎng)站疑似不良視頻的數(shù)目。
      10.根據(jù)權(quán)利要求6所述的一種網(wǎng)站不良似然度獲取裝置,其特征在于,所述似然度計(jì)算單元具體用于: 根據(jù)疑似不良文本、疑似不良圖片和疑似不良視頻的數(shù)目,預(yù)設(shè)的權(quán)重,預(yù)設(shè)的置信度獲取網(wǎng)站的不良似然度;所述不良似然度的獲取方法為: S= α XZ1XS1+ β XZ2XS2+ Y XZ3XS3 其中,S表示網(wǎng)站的不良似然度值;α表示文本的權(quán)重'I1表示文本的置信度A1表示疑似不良文本的數(shù)量;β表示圖片的權(quán)重;Ζ2表示圖片的置信度;S2表示疑似不良圖片的數(shù)量;Y表示視頻的權(quán)重;z3表示視頻的置信度;S3表示疑似不良視頻的數(shù)量;α + β + Y =1
      【文檔編號(hào)】G06F17/30GK103473299SQ201310404372
      【公開(kāi)日】2013年12月25日 申請(qǐng)日期:2013年9月6日 優(yōu)先權(quán)日:2013年9月6日
      【發(fā)明者】宋同珍 申請(qǐng)人:北京銳安科技有限公司
      網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
      • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1