国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種對(duì)終端內(nèi)容的處理方法及系統(tǒng)的制作方法

      文檔序號(hào):9631740閱讀:349來源:國(guó)知局
      一種對(duì)終端內(nèi)容的處理方法及系統(tǒng)的制作方法
      【技術(shù)領(lǐng)域】
      [0001]本申請(qǐng)涉及信息處理技術(shù)領(lǐng)域,特別涉及一種對(duì)終端內(nèi)容的處理方法及系統(tǒng)。
      【背景技術(shù)】
      [0002]隨著計(jì)算機(jī)及通信技術(shù)的高速發(fā)展,互聯(lián)網(wǎng)的巨大影響和利潤(rùn)驅(qū)使很多別有用心的人借助互聯(lián)網(wǎng)進(jìn)行各種不良行為。IDC的統(tǒng)計(jì)曾顯示,有30% -40%的Internet訪問是與工作無關(guān)的,其中相當(dāng)大的比例訪問色情、暴力、反動(dòng)等站點(diǎn),Internet資源被嚴(yán)重浪費(fèi)。近年來,互聯(lián)網(wǎng)色情、釣魚、暴力等不良信息的泛濫嚴(yán)重?cái)_亂了互聯(lián)網(wǎng)秩序,造成一系列不良影響,其中,互聯(lián)網(wǎng)色情特別影響著廣大青少年的身心健康。
      [〇〇〇3] 隨著智能終端設(shè)備的發(fā)展,人們?cè)絹碓搅?xí)慣于利用手機(jī)或者平板電腦瀏覽網(wǎng)站、觀賞圖片或者閱讀小說,因此智能終端內(nèi)的內(nèi)容也有很大概率涉及色情內(nèi)容。
      [0004]1999年歐盟啟動(dòng)了安全網(wǎng)絡(luò)行動(dòng)計(jì)劃,利用五年時(shí)間先后組織歐盟125個(gè)研究組織完成35項(xiàng)科研項(xiàng)目,這些研究項(xiàng)目以跨地域、文化、語言的網(wǎng)絡(luò)有害信息過濾和評(píng)估方案為主要研究目標(biāo),希望在歐盟建立統(tǒng)一的網(wǎng)絡(luò)有害信息過濾系統(tǒng)。近年來,國(guó)內(nèi)模式識(shí)別國(guó)家重點(diǎn)實(shí)驗(yàn)室開展了敏感信息與行為監(jiān)控實(shí)用化技術(shù)的研究與開發(fā),主要是對(duì)圖像視頻進(jìn)行內(nèi)容理解,處于實(shí)驗(yàn)室階段。
      [0005]現(xiàn)有技術(shù)中利用單一模態(tài)對(duì)不良信息進(jìn)行檢測(cè),方法包括:文本過濾、黑白名單過濾、IP過濾、圖像內(nèi)容理解等,另外也包括網(wǎng)頁內(nèi)容與圖像融合的模式學(xué)習(xí)方法。雖然上述方法各自有其特點(diǎn),且在不同方面的檢測(cè)上各有所長(zhǎng),但也存在各自的缺點(diǎn)。
      [0006]綜上所述,現(xiàn)有技術(shù)中只是提取彼此不相關(guān)聯(lián)的單一模態(tài)來對(duì)網(wǎng)絡(luò)不良信息進(jìn)行檢測(cè),存在著統(tǒng)計(jì)學(xué)習(xí)的方法特征提取不全等問題,因此,導(dǎo)致了檢測(cè)性能低且檢測(cè)系統(tǒng)的魯棒性差,并且目前對(duì)不良信息的檢測(cè)方法也不太容易移植到智能終端設(shè)備上。
      [0007]應(yīng)該注意,上面對(duì)技術(shù)背景的介紹只是為了方便對(duì)本申請(qǐng)的技術(shù)方案進(jìn)行清楚、完整的說明,并方便本領(lǐng)域技術(shù)人員的理解而闡述的。不能僅僅因?yàn)檫@些方案在本申請(qǐng)的【背景技術(shù)】部分進(jìn)行了闡述而認(rèn)為上述技術(shù)方案為本領(lǐng)域技術(shù)人員所公知。

      【發(fā)明內(nèi)容】

      [0008]本申請(qǐng)實(shí)施例的目的在于提供一種對(duì)終端內(nèi)容的處理方法及系統(tǒng),從而能夠?qū)K端內(nèi)的圖片、文本以及鏈接進(jìn)行全面檢測(cè),并對(duì)檢測(cè)到的不良信息及時(shí)處理。
      [0009]本申請(qǐng)實(shí)施例提供的一種對(duì)終端內(nèi)容的處理方法及系統(tǒng)是這樣實(shí)現(xiàn)的:
      一種對(duì)終端內(nèi)容的處理方法,包括:
      提取待處理的終端內(nèi)容對(duì)應(yīng)的特征符;
      對(duì)提取的所述特征符進(jìn)行辨別處理,得到與所述特征符對(duì)應(yīng)的辨別結(jié)果;
      根據(jù)所述辨別結(jié)果,對(duì)所述特征符對(duì)應(yīng)的待處理的終端內(nèi)容進(jìn)行處理。
      [0010]一種對(duì)終端內(nèi)容的處理系統(tǒng),包括:
      特征符提取單元,用于提取待處理的終端內(nèi)容對(duì)應(yīng)的特征符;辨別處理單元,用于對(duì)提取的所述特征符進(jìn)行辨別處理,得到與所述特征符對(duì)應(yīng)的辨別結(jié)果;處理單元,用于根據(jù)所述辨別結(jié)果,對(duì)所述特征符對(duì)應(yīng)的待處理的終端內(nèi)容進(jìn)行處理。
      [0011 ] 本申請(qǐng)實(shí)施例提供的一種對(duì)終端內(nèi)容的處理方法及系統(tǒng),通過提取出終端內(nèi)容對(duì)應(yīng)的特征符,進(jìn)而可以對(duì)提取的特征符進(jìn)行辨別處理。進(jìn)一步地,當(dāng)辨別處理的結(jié)果為存在不良信息時(shí),便可以對(duì)該不良信息進(jìn)行刪除處理,從而保證了終端內(nèi)容的健康。
      [0012]參照后文的說明和附圖,詳細(xì)公開了本申請(qǐng)的特定實(shí)施方式,指明了本申請(qǐng)的原理可以被采用的方式。應(yīng)該理解,本申請(qǐng)的實(shí)施方式在范圍上并不因而受到限制。在所附權(quán)利要求的精神和條款的范圍內(nèi),本申請(qǐng)的實(shí)施方式包括許多改變、修改和等同。
      [0013]針對(duì)一種實(shí)施方式描述和/或示出的特征可以以相同或類似的方式在一個(gè)或更多個(gè)其它實(shí)施方式中使用,與其它實(shí)施方式中的特征相組合,或替代其它實(shí)施方式中的特征。
      [0014]應(yīng)該強(qiáng)調(diào),術(shù)語“包括/包含”在本文使用時(shí)指特征、整件、步驟或組件的存在,但并不排除一個(gè)或更多個(gè)其它特征、整件、步驟或組件的存在或附加。
      【附圖說明】
      [0015]所包括的附圖用來提供對(duì)本申請(qǐng)實(shí)施例的進(jìn)一步的理解,其構(gòu)成了說明書的一部分,用于例示本申請(qǐng)的實(shí)施方式,并與文字描述一起來闡釋本申請(qǐng)的原理。顯而易見地,下面描述中的附圖僅僅是本申請(qǐng)的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。在附圖中:
      圖1為本申請(qǐng)實(shí)施例提供的一種對(duì)終端內(nèi)容的處理方法的流程圖;
      圖2為本申請(qǐng)實(shí)施例提供的一種對(duì)終端內(nèi)容的處理系統(tǒng)的功能模塊圖。
      【具體實(shí)施方式】
      [0016]為了使本技術(shù)領(lǐng)域的人員更好地理解本申請(qǐng)中的技術(shù)方案,下面將結(jié)合本申請(qǐng)實(shí)施例中的附圖,對(duì)本申請(qǐng)實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本申請(qǐng)一部分實(shí)施例,而不是全部的實(shí)施例?;诒旧暾?qǐng)中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其它實(shí)施例,都應(yīng)當(dāng)屬于本申請(qǐng)保護(hù)的范圍。
      [0017]圖1為本申請(qǐng)實(shí)施例提供的一種終端內(nèi)容的處理方法的流程圖。雖然下文描述流程包括以特定順序出現(xiàn)的多個(gè)操作,但是應(yīng)該清楚了解,這些過程可以包括更多或更少的操作,這些操作可以順序執(zhí)行或并行執(zhí)行(例如使用并行處理器或多線程環(huán)境)。如圖1所示,所述方法可以包括:
      S1:提取待處理的終端內(nèi)容對(duì)應(yīng)的特征符。
      [0018]在本申請(qǐng)實(shí)施例中,所述待處理的終端內(nèi)容可以包括文本、圖片或者鏈接中的至少一種。對(duì)于文本和鏈接,本申請(qǐng)實(shí)施例可以對(duì)其中的字符串進(jìn)行識(shí)別,以判定所述文本和鏈接中是否包含不良信息。具體地,本申請(qǐng)實(shí)施例可以預(yù)先建立信息過濾庫。所述信息過濾庫中可以包括各種敏感詞或者敏感域名,所述敏感詞以及敏感域名以字符串的形式保存于所述信息過濾庫中。在建立了信息過濾庫后,本申請(qǐng)實(shí)施例便可以對(duì)所述文本以及鏈接進(jìn)行掃描,并提取出所述文本以及鏈接中與所述信息過濾庫中的內(nèi)容相匹配的字符串。這些提取出的字符串即可以視為與不良信息相關(guān)。因此,可以將提取的所述字符串確定為所述待處理的終端內(nèi)容的特征符。所述特征符可以用來表征所述待處理的終端內(nèi)容,通過對(duì)所述特征符進(jìn)行辨別,便相當(dāng)于對(duì)所述待處理的終端內(nèi)容進(jìn)行辨別。
      [0019]另外,由于圖片與文本以及鏈接在表現(xiàn)形式上有區(qū)別,因此本申請(qǐng)實(shí)施例在對(duì)圖片提取對(duì)應(yīng)的特征符時(shí)則無法通過提取字符串的方式來進(jìn)行。由于不良的圖片中往往會(huì)暴露人體較多的皮膚,那么本申請(qǐng)實(shí)施例可以通過識(shí)別待處理的圖片中人體的膚色特征來辨別該待處理的圖片是否屬于不良圖片。具體地,本申請(qǐng)實(shí)施例可以根據(jù)貝葉斯分類準(zhǔn)則,提取所述待處理的終端內(nèi)容中的膚色特征。在實(shí)際應(yīng)用場(chǎng)景中,本申請(qǐng)實(shí)施例可以預(yù)先建立訓(xùn)練樣本集。所述訓(xùn)練樣本集中可以包括黃色、白色、黑色三個(gè)任重的若干皮膚圖像。然后可以用訓(xùn)練學(xué)習(xí)的樣本做評(píng)判估計(jì),對(duì)所有訓(xùn)練樣本集中的所有圖像進(jìn)行分類判斷,從而可以根據(jù)貝葉斯準(zhǔn)則得到貝葉斯膚色分類器。這樣,通過得到的貝葉斯膚色分類器,便可以對(duì)待處理的終端內(nèi)容中的膚色部分進(jìn)行識(shí)別,從而能夠提取出所述待處理的終端內(nèi)容中的膚色特征,所述的膚色特征可以用面積來表示。那么提取的所述膚色特征便可以確定為所述待處理的終端內(nèi)容的特征符。
      [0020]在上述對(duì)圖片信息提取膚色特征的表述中不難看出,盡管這種方法實(shí)現(xiàn)比較簡(jiǎn)單,能夠簡(jiǎn)化對(duì)終端內(nèi)容的處理流程,然而這種方法會(huì)存在誤判的情況,例如當(dāng)圖片中的人體穿著泳衣時(shí),便會(huì)裸露大量的皮膚,然而這種裸露時(shí)屬于健康的裸露,并非屬于不良信息。因此利用上述對(duì)圖片信息提取膚色特征的方法可能會(huì)對(duì)圖片是否屬于不良信息造成誤判。而對(duì)于不良圖片而言,其裸露的部位往往是特殊的人體部位,基于此,在本申請(qǐng)一優(yōu)選實(shí)施例中,為了更加精確地對(duì)圖片內(nèi)容進(jìn)行識(shí)別,可以對(duì)圖片中預(yù)設(shè)的人體部位進(jìn)行識(shí)別。當(dāng)所述預(yù)設(shè)的人體部位為裸露時(shí),則可以判定所述圖片為不良信息。具體地,在本申請(qǐng)?jiān)搩?yōu)選實(shí)施例中,可以提取待處理的終端內(nèi)容中預(yù)設(shè)人體部位的特征。在實(shí)際應(yīng)用場(chǎng)景中,本申請(qǐng)實(shí)施例可以對(duì)待處理的終端內(nèi)容中的人體進(jìn)行識(shí)別,并且將預(yù)設(shè)人體部位處的圖片截取,從而形成所述預(yù)設(shè)人體部位的特征。然后可以對(duì)所述預(yù)設(shè)人體部位的特征進(jìn)行識(shí)別,從而判斷該待處理的圖片是否屬于不良圖片。
      [0021]S2:對(duì)提取的所述特征符進(jìn)行辨別處理,得到與所述特征符對(duì)應(yīng)的辨別結(jié)果。
      [0022]在提取得到待處理終端內(nèi)容對(duì)應(yīng)的特征符后,便可以對(duì)該特征符進(jìn)行辨別處理。具體地,對(duì)于文本和鏈接而言,可以統(tǒng)計(jì)提取的所述特征符在所述待處理的終端內(nèi)容中所占的比重。例如,在某一文本內(nèi)容中,提取出的特征符(敏感字符串)占總文本的60%,那么說明在該文本中大量出現(xiàn)了敏感字符串。那么假設(shè)預(yù)設(shè)的比重閾值為10%,那么計(jì)算的比重則達(dá)到了預(yù)設(shè)閾值,從而可以判定所述文本屬于不良文本,從而可以得出的辨別結(jié)果為存在不良信息。
      [0023]對(duì)于通過提取膚色特征來辨別圖片的方法,由于辨別出的膚色特征可以用面積來表示,那么可以采用與文本和鏈接相同的判斷方法,計(jì)算提取的膚色特征占人體面積的比重,并且將計(jì)算的比重與預(yù)設(shè)閾值進(jìn)行比較,從而可以判定所述圖片是否屬于不良圖片。
      [0024]然而對(duì)于根據(jù)預(yù)設(shè)人體部位的特征來
      當(dāng)前第1頁1 2 
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1