未成年人專用網(wǎng)頁(yè)瀏覽過濾軟件狗設(shè)備的制作方法
【專利摘要】本發(fā)明提供一種未成年人專用網(wǎng)頁(yè)瀏覽過濾軟件狗設(shè)備,采用SPI攔截過濾模式。包括軟件狗硬件單元和PC機(jī)執(zhí)行單元,其中軟件狗硬件單元包含色情站點(diǎn)庫(kù)模塊、白名單庫(kù)模塊、特征庫(kù)模塊和自動(dòng)安裝模塊;PC執(zhí)行單元包括瀏覽器攔截監(jiān)視模塊、色情內(nèi)容分析模塊、歷史攔截表。
【專利說明】 未成年人專用網(wǎng)頁(yè)瀏覽過濾軟件狗設(shè)備
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種網(wǎng)頁(yè)瀏覽過濾軟件狗設(shè)備,特別涉及到基于色情圖片的特征分析,包括色情關(guān)鍵字和色情圖元進(jìn)行過濾分析的方法。
【背景技術(shù)】
[0002]隨著現(xiàn)代網(wǎng)路技術(shù)的飛速發(fā)展,互聯(lián)網(wǎng)成為人們?nèi)粘I钪胁豢苫蛉钡妮o助工具,人們可以通過互聯(lián)網(wǎng)進(jìn)行各種商務(wù)活動(dòng),也可以通過互聯(lián)網(wǎng)獲取各種資訊,互聯(lián)網(wǎng)徹底改變了現(xiàn)代人的生活?;ヂ?lián)網(wǎng)的快速發(fā)展給人們生活帶來了便利,也帶來了不少問題,特別是少年兒童對(duì)互聯(lián)網(wǎng)上的非法信息判別能力弱,容易受到影響而造成不良后果,如何最大范圍內(nèi)清潔互聯(lián)網(wǎng),為少年兒童提供一個(gè)健康積極的網(wǎng)絡(luò)環(huán)境是迫在眉睫的事情。目前對(duì)網(wǎng)絡(luò)不良內(nèi)容主要通過屏蔽和轉(zhuǎn)接URL方式,識(shí)別經(jīng)分析的電子通訊中的URL并且分類成適合或不適合,以經(jīng)過分類的URL的函數(shù)形式來轉(zhuǎn)發(fā)電子通訊。例如,適合的電子通訊可轉(zhuǎn)發(fā)至被訪地址,而不適合的電子通訊具有受控制的訪問。這種方法可以對(duì)很多公開的不良網(wǎng)頁(yè)進(jìn)行屏蔽,也可以通過舉報(bào)等方式,不斷收納受控制的網(wǎng)站。但是這樣也帶來一個(gè)問題,就是很多網(wǎng)站并非簡(jiǎn)單的認(rèn)為是色情的或不是色情的,其中有很多很有用的信息,同時(shí)也會(huì)摻雜不少不良信息,一旦完全屏蔽,會(huì)帶來很多不便。能否有一種針對(duì)具體網(wǎng)頁(yè)的技術(shù),對(duì)頁(yè)面上內(nèi)容進(jìn)行分析,適合的內(nèi)容予以通過,不適合的內(nèi)容進(jìn)行屏蔽或被替代,這樣就不會(huì)因噎廢食了,既帶來了方便,同時(shí)又保證了少年兒童不受影響。
【發(fā)明內(nèi)容】
[0003]本發(fā)明所要解決的技術(shù)問題是:針對(duì)上述存在的問題,提供一種通過SPI攔截過濾的軟件狗設(shè)備。
[0004]本發(fā)明是這樣實(shí)現(xiàn)的:
一種采用SPI攔截過濾的軟件狗設(shè)備,包括軟件狗硬件單元和PC機(jī)執(zhí)行單元,其中軟件狗硬件單元包含色情站點(diǎn)庫(kù)模塊、白名單庫(kù)模塊、特征庫(kù)模塊和自動(dòng)安裝模塊;PC執(zhí)行單元包括瀏覽器攔截監(jiān)視模塊、色情內(nèi)容分析模塊、歷史攔截表。
[0005]色情站點(diǎn)庫(kù)模塊包含常見的色情站點(diǎn)記錄,并在使用過程中不斷更新。
[0006]白名單庫(kù)初始為空,在使用過程中不斷更新。
[0007]特征庫(kù)單元包括色情文本關(guān)鍵字庫(kù)、色情圖元特征庫(kù),用作分析單元的比對(duì)分析。
[0008]自動(dòng)安裝模塊負(fù)責(zé)在初次插入本設(shè)備時(shí),把PC執(zhí)行單元安裝到PC機(jī)上。
[0009]瀏覽器攔截監(jiān)視單元用來實(shí)時(shí)檢測(cè)瀏覽器進(jìn)程,當(dāng)瀏覽器啟動(dòng)后,自動(dòng)檢測(cè)軟件狗硬件是否存在,如果不存在則關(guān)閉瀏覽器,同時(shí)提示插入軟件狗。如果存在,則截獲瀏覽器的內(nèi)容并根據(jù)其源地址檢索白名單庫(kù)和色情站點(diǎn)庫(kù),屬于白名單庫(kù),原報(bào)文原封不動(dòng)直接轉(zhuǎn)發(fā),屬于色情站點(diǎn)庫(kù)備案的直接返回警示頁(yè)面,未備案的,繼續(xù)搜索歷史攔截表,如果有相同的記錄,則直接用上次同樣的方法處理;如果沒有則將截獲的http報(bào)文,交到色情內(nèi)容分析單元處理。
[0010]色情內(nèi)容分析單元包括文本分析模塊、圖片分析模塊和視頻分析模塊。將接收到的內(nèi)容分為文本、圖片和視頻,分別調(diào)用相應(yīng)的分析模塊進(jìn)行處理,并把處理的結(jié)果寫進(jìn)歷史攔截表,并對(duì)白名單庫(kù)和色情站點(diǎn)庫(kù)進(jìn)行更新。
[0011]歷史攔截表包括多級(jí)屏蔽,如地址Url級(jí)、頁(yè)面Page級(jí)和頁(yè)面元素element級(jí)。Url級(jí)將被直接攔截,返回網(wǎng)站禁止訪問提示頁(yè),并在色情站點(diǎn)庫(kù)備案;頁(yè)面Page級(jí)有部分頁(yè)面禁止訪問,返回頁(yè)面不存在提示,其他頁(yè)面正常訪問;頁(yè)面元素element級(jí)屏蔽時(shí)頁(yè)面依然可以正常訪問,但是頁(yè)面上的色情文字、圖片和視頻被替換成預(yù)置的內(nèi)容。
[0012]本發(fā)明的創(chuàng)新點(diǎn)是:
1、軟件和硬件結(jié)合進(jìn)行色情分析監(jiān)測(cè)。過濾軟件全部存放在軟件狗硬件內(nèi),在初次插入軟件狗時(shí)自動(dòng)安裝到系統(tǒng),為不熟悉電腦的家長(zhǎng)帶來了方便;軟件狗內(nèi)自帶了常見的色情站點(diǎn)庫(kù)和白名單庫(kù),瀏覽器攔截監(jiān)視單元首先掃描硬件自帶的色情站點(diǎn)庫(kù)和白名單庫(kù),提聞了系統(tǒng)運(yùn)行的效率。
[0013]2、多級(jí)屏蔽,靈活自如,屏蔽等級(jí)分為地址Url級(jí)、頁(yè)面Page級(jí)和頁(yè)面元素element級(jí),既屏蔽了常見的色情網(wǎng)站,又可以對(duì)必須訪問的網(wǎng)站進(jìn)行頁(yè)面Page級(jí)屏蔽和頁(yè)面元素element級(jí)屏蔽。在保證網(wǎng)絡(luò)清潔的前提下,最大限度地獲取網(wǎng)絡(luò)上的資源。
【專利附圖】
【附圖說明】
[0014]圖1為本發(fā)明的裝置總體示意圖。
【具體實(shí)施方式】
[0015]下面結(jié)合附圖詳細(xì)說明本發(fā)明,其作為本說明書的一部分,通過實(shí)施例來說明本發(fā)明的原理。
[0016]未成年人專用網(wǎng)頁(yè)瀏覽過濾軟件狗設(shè)備包括軟件狗硬件單元和PC執(zhí)行單元。當(dāng)設(shè)備初次使用時(shí),會(huì)將除色情站點(diǎn)庫(kù)、白名單庫(kù)和特征庫(kù)以外的軟體部分安裝到PC機(jī)上,形成PC執(zhí)行單元。PC執(zhí)行單元包括瀏覽器攔截監(jiān)視模塊、色情內(nèi)容分析模塊和歷史攔截表。
[0017]瀏覽器攔截監(jiān)視模塊通過自定義傳輸服務(wù)提供者接口 SPI來實(shí)現(xiàn),SPI由很多層構(gòu)成,通過修改SPI配置表,加載我們自己的層,把其中的WSPStartup函數(shù)導(dǎo)出以便上一層SPI程序調(diào)用。操作系統(tǒng)會(huì)根據(jù)SPI配置表加載SPI模塊。
[0018]當(dāng)瀏覽器啟動(dòng)并接收到http報(bào)文時(shí),我們通過SPI配置表自定義的層也同時(shí)被加載,瀏覽器攔截監(jiān)視模塊將截獲報(bào)文并自動(dòng)檢查硬件單元是否存在,如果不存在會(huì)提示插入過濾軟件狗設(shè)備。如果存在則截獲瀏覽器的報(bào)文并根據(jù)其源地址檢索白名單庫(kù)和色情站點(diǎn)庫(kù),屬于白名單庫(kù),原報(bào)文原封不動(dòng)直接轉(zhuǎn)發(fā),屬于色情站點(diǎn)庫(kù)備案的直接返回警示頁(yè)面。如果沒有檢索到,則需要對(duì)網(wǎng)頁(yè)內(nèi)容進(jìn)行分析,把報(bào)文傳送到色情內(nèi)容分析模塊,該分析模塊首先將原報(bào)文備份,然后將其分成文本、圖片和視頻三部分,分別交到文本分析模塊、圖片分析模塊和視頻分析模塊。文本模塊根據(jù)特征庫(kù)中色情文本關(guān)鍵字進(jìn)行檢索,分析報(bào)文中是否含有色情關(guān)鍵字;圖片分析模塊調(diào)用特征庫(kù)中圖元特征,對(duì)圖片進(jìn)行分析,發(fā)現(xiàn)有符合特征的圖元,即認(rèn)為是色情圖片;視頻分析模塊按照均勻間隔抽取部分幀圖片,對(duì)照特征庫(kù)圖元特征,分析符合特征的圖元,如果有則認(rèn)為是色情視頻。
[0019]如果所有的分析均沒有發(fā)現(xiàn)問題,則認(rèn)為是正常的,瀏覽器攔截監(jiān)視模塊將原始的http協(xié)議報(bào)文,進(jìn)行轉(zhuǎn)發(fā)并更新白名單庫(kù);如果網(wǎng)站是必須訪問的站點(diǎn),但是有部分內(nèi)容未成年人不宜觀看,就需要對(duì)其內(nèi)容進(jìn)行分析和屏蔽。如果分析到文本含有色情內(nèi)容,其色情文本將被系統(tǒng)預(yù)定義的文本替代。同樣如果分析到圖片或視頻有色情內(nèi)容,它們也會(huì)被預(yù)定義的圖片和視頻取代。這樣既保證了網(wǎng)站的資源能夠獲取,又能保證色情內(nèi)容被屏蔽。每次分析的結(jié)果都寫進(jìn)歷史攔截表,以便下一次分析時(shí)參考。
[0020]由本領(lǐng)域技術(shù)人員做出的各種變化或改型都不會(huì)脫離本發(fā)明的范圍。
【權(quán)利要求】
1.一種采用SPI攔截過濾的軟件狗設(shè)備,包括軟件狗硬件單元和PC機(jī)執(zhí)行單元,其中軟件狗硬件單元包含色情站點(diǎn)庫(kù)模塊、白名單庫(kù)模塊、特征庫(kù)模塊和自動(dòng)安裝模塊;PC執(zhí)行單元包括瀏覽器攔截監(jiān)視模塊、色情內(nèi)容分析模塊、歷史攔截表。
2.色情站點(diǎn)庫(kù)模塊包含常見的色情站點(diǎn)記錄,并在使用過程中不斷更新。
3.白名單庫(kù)初始為空,在使用過程中不斷更新。
4.特征庫(kù)單元包括色情文本關(guān)鍵字庫(kù)、色情圖元特征庫(kù),用作分析單元的比對(duì)分析。
5.自動(dòng)安裝模塊負(fù)責(zé)在初次插入本設(shè)備時(shí),把PC執(zhí)行單元安裝到PC機(jī)上。
6.瀏覽器攔截監(jiān)視單元用來實(shí)時(shí)檢測(cè)瀏覽器進(jìn)程,當(dāng)瀏覽器啟動(dòng)后,自動(dòng)檢測(cè)軟件狗硬件是否存在,如果不存在則關(guān)閉瀏覽器,同時(shí)提示插入軟件狗。
7.如果存在,則截獲瀏覽器的內(nèi)容并處理。
8.色情內(nèi)容分析單元包括文本分析模塊、圖片分析模塊和視頻分析模塊。
9.將接收到的內(nèi)容分為文本、圖片和視頻,分別調(diào)用相應(yīng)的分析模塊進(jìn)行處理,并把處理的結(jié)果寫進(jìn)歷史攔截表,并對(duì)白名單庫(kù)和色情站點(diǎn)庫(kù)進(jìn)行更新。
10.歷史攔截表包括多級(jí)屏蔽,如地址Url級(jí)、頁(yè)面Page級(jí)和頁(yè)面元素element級(jí)。
【文檔編號(hào)】G06F17/30GK104268284SQ201410561327
【公開日】2015年1月7日 申請(qǐng)日期:2014年10月21日 優(yōu)先權(quán)日:2014年10月21日
【發(fā)明者】胡平 申請(qǐng)人:合肥星服信息科技有限責(zé)任公司