專利名稱:內容篡改檢測裝置的制作方法
技術領域:
本發(fā)明涉及內容篡改檢測裝置,該內容篡改檢測裝置檢測出對互聯(lián)網(wǎng)上公開的主頁等的內容進行的篡改。
背景技術:
近年來,由于互聯(lián)網(wǎng)的普及,企業(yè)、團體等制作主頁并在互聯(lián)網(wǎng)上公開各種信息,并且使用所公開的主頁的用戶也增加。但是,用戶當中也存在非法訪問互聯(lián)網(wǎng)上的Web服務器并篡改他人主頁的源內容的黑客(hacker)。因此,出現(xiàn)了檢測出源內容的篡改并發(fā)出警告的Web服務器(參照例如特開2002-207623號公報)。在此,利用圖1說明具有該內容篡改檢測功能的Web服務器(以下稱為“篡改檢測服務器100”)。
圖1所示為現(xiàn)有篡改檢測服務器100的結構圖。現(xiàn)有篡改檢測服務器100與不具有篡改檢測功能的Web服務器同樣,具有用于對在互聯(lián)網(wǎng)5上公開提供的主頁的源內容(以下稱為“源內容”)進行存儲的公開內容存儲部11、和受理來自用戶的訪問的受理部12。另外,現(xiàn)有的篡改檢測服務器100還具有提取部13,根據(jù)用戶的訪問,從公開內容存儲部11提取源內容;發(fā)送部14,通過互聯(lián)網(wǎng)5將提取的源內容發(fā)送給用戶。
另外,現(xiàn)有的篡改檢測服務器100還具有備份存儲部15,用于存儲作為原始(被篡改前的)源內容的備份的備份內容;以及讀取部101,按照規(guī)定的時間間隔,從公開內容存儲部11和備份存儲部15讀取源內容和備份內容。而且,現(xiàn)有的篡改檢測服務器100還具有比較部102,將讀取部101讀取的源內容和備份內容進行對比,檢測出兩者差異;以及警告輸出部103,當源內容與備份內容存在差異時,通過互聯(lián)網(wǎng)5向主頁管理者發(fā)送警告。
在上述現(xiàn)有的篡改檢測服務器100中,比較部102例如每天在規(guī)定時刻檢查源內容與備份內容是否存在差異。若差異小,警告輸出部103視為源內容被篡改而向主頁管理者發(fā)出警告。這樣,主頁管理者在源內容被沒有權限的用戶非法篡改的情況下,可以知道該事實并針對該篡改采取適當措施。
但是,現(xiàn)有的篡改檢測服務器100在源內容和備份內容有差異的情況下,不管差異大小都發(fā)出警告,因此接收到警告的管理者不知道上述兩種內容的差異是大還是小。即,管理者僅接收到警告,但無法判斷對源內容的篡改是重大的還是微小的。主頁管理者想要知道的不是微小的篡改,而是重大的篡改。
發(fā)明內容
本發(fā)明的目的是針對上述問題提供一種內容篡改檢測裝置,檢測出對規(guī)定的內容進行了預先確定的重大篡改的情況。
為了實現(xiàn)上述目的,本發(fā)明的內容篡改檢測裝置,檢測出對互聯(lián)網(wǎng)上公開的內容進行的篡改,其特征在于,具有比較單元,將第1存儲單元中存儲的第1內容和第2存儲單元中存儲的第2內容進行對比,并檢測出所述第1內容和所述第2內容的差分;關鍵字判斷單元,針對由所述比較單元檢測的各差分,判斷在與所述差分關聯(lián)的部位是否包含規(guī)定的關鍵字;警告判斷單元,利用由所述關鍵字判斷單元得到的判斷結果,判斷是否輸出警告;以及警告輸出單元,當所述警告判斷單元判斷為輸出警告時,輸出警告。
這樣,本發(fā)明的內容篡改檢測裝置根據(jù)第1內容和第2內容的、與差分關聯(lián)的部位中是否包含規(guī)定關鍵字,來判斷是否輸出警告。因此,內容管理者只要預先確定用于判斷是否有人進行了自己預先確定的重大篡改的關鍵字,上述管理者就可以在所述內容被進行了自己預先確定的重大篡改時,知曉該事實。
另外,本發(fā)明還可以實現(xiàn)為以本發(fā)明內容篡改檢測裝置的特征構成單元為步驟的內容篡改檢測方法,或者可以實現(xiàn)為包含這些步驟的程序。該程序可以通過CD-ROM等記錄介質或通信網(wǎng)絡等傳輸介質流通。
本發(fā)明可以提供一種內容篡改檢測裝置,其用于檢測出對規(guī)定內容進行了預先確定的重大篡改的情況。
圖1所示為現(xiàn)有篡改檢測服務器100的結構圖。
圖2所示為實施方式1的內容提供系統(tǒng)的硬件結構圖。
圖3所示為實施方式1的服務器1的結構框圖。
圖4所示為以HTML描述的原始主頁的源內容(備份內容)的一例。
圖5所示為關鍵字/權重存儲部64中存儲的關鍵字和權重的具體示例。
圖6所示為原始源內容被篡改后的第1內容(以下稱為“第1篡改內容”)的一例。
圖7所示為原始源內容被篡改后的第2內容(以下稱為“第2篡改內容”)的一例。
圖8所示為顯示警告時的顯示狀況示例。
圖9所示為實施方式1的內容篡改檢測裝置16的動作流程圖。
圖10所示為實施方式2的服務器91的結構框圖。
圖11所示為實施方式2的內容篡改檢測裝置92的動作流程圖。
具體實施例方式
以下參照
本發(fā)明的最佳實施方式。
(實施方式1)首先,通過圖2~圖8說明實施方式1的內容提供系統(tǒng)的結構。
圖2所示為實施方式1的內容提供系統(tǒng)的硬件結構圖。實施方式1的內容提供系統(tǒng)是用于收發(fā)主頁源內容(以下簡稱為“源內容”)的系統(tǒng)。實施方式1的內容提供系統(tǒng)如圖2所示,由具有內容篡改檢測裝置16的服務器1、管理者計算機2、多個用戶計算機3、分別與管理者計算機2和各用戶計算機3連接的多個顯示裝置4,以及將服務器1、管理者計算機2和各用戶計算機3相互連接的互聯(lián)網(wǎng)5構成。
服務器1是根據(jù)用戶的訪問將源內容發(fā)送到該用戶使用的計算機3的裝置。管理者計算機2是主頁管理者使用的裝置,各用戶計算機3是希望瀏覽主頁的用戶使用的裝置。
圖3所示為上述內容提供系統(tǒng)的服務器1的結構框圖。如上所述,服務器1是根據(jù)用戶的訪問發(fā)送源內容的裝置。如圖3所示,服務器1具有公開內容存儲部11、受理部12、提取部13、發(fā)送部14、備份存儲部15和內容篡改檢測裝置16。
公開內容存儲部11是用于存儲互聯(lián)網(wǎng)5上公開提供的主頁的源內容的結構單元,是第1存儲單元的一個例子。另外,在實施方式1中,假定原始的(被篡改前的)源內容是以HTML(Hyper Text Markup Language)描述的。關于原始源內容的具體例子,將通過圖4在后描述。而且假定公開內容存儲部11有可能被不具有關于改寫源內容的權限的用戶非法訪問。
受理部12是用于從用戶使用的用戶計算機3受理該用戶的訪問的結構單元;提取部13是根據(jù)受理部12受理的用戶的訪問,從公開內容存儲部11提取源內容的結構單元。發(fā)送部14是通過互聯(lián)網(wǎng)5,將提取部13提取的源內容發(fā)送到用戶使用的用戶計算機3的結構單元;備份存儲部15是第2存儲單元的一個例子,是用于存儲作為原始源內容備份的備份內容的結構單元。另外,備份存儲部15與公開內容存儲部11不同,假定其不會被不具有改寫源內容權限的用戶訪問。即,假定備份內容不會被篡改。
內容篡改檢測裝置16當原始源內容被進行了主頁管理者預先確定的重大篡改時,檢測出該篡改。如圖3所示,內容篡改檢測裝置16具備讀取判斷部61、讀取部62、比較部63、關鍵字/權重存儲部64、關鍵字判斷部65、檢測關鍵字存儲部66、權重加法運算部67、閾值存儲部68、警告判斷部69和警告輸出部70。
讀取判斷部61是訪問公開內容存儲部11和備份存儲部15,并判斷是否可以逐行讀取源內容和備份內容的結構單元。在實施方式1中,如上所述,原始源內容是以HTML描述的,備份內容是原始源內容的備份,因此原始源內容和備份內容可以逐行讀取。因此,當公開內容存儲部11中存儲的源內容是原始源內容或者是利用HTML對原始源內容篡改后的內容時,源內容可以逐行讀取。
讀取部62是從公開內容存儲部11和備份存儲部15分別逐行讀取源內容和備份內容的結構單元。
比較部63是將讀取部62讀取的源內容與備份內容進行對比,并檢測出源內容與備份內容的差分的結構單元。關鍵字/權重存儲部64是用于存儲主頁管理者預先選擇的多個關鍵字、和上述管理者預先向各關鍵字分配的權重的結構單元。關鍵字和權重用于判斷對原始源內容的篡改是否是上述管理者預先確定的重大篡改。關鍵字和權重的具體示例將通過圖5后述。
關鍵字判斷部65是這樣的結構單元,即對比較部63檢測出的各差分,判斷出表示該差分的屬性的標識符中是否包含有關鍵字/權重存儲部64中存儲的多個關鍵字當中的一個,并且判斷包含哪個關鍵字。標識符是與差分相關的部位的一個例子。檢測關鍵字存儲部66是這樣的結構單元,其中存儲被關鍵字判斷部65判斷為包含在標識符中的關鍵字,以及源內容中包含該關鍵字的行。權重加法運算(重み加算)部67是針對由比較部63檢測出的全部差分,對用分配給各標識符中包含的關鍵字的權重進行加法運算的結構單元。
閾值存儲部68是存儲作為判斷基準的閾值的結構單元,所述判斷基準用于判斷是否對原始源內容進行了主頁管理者預先確定的重大篡改。警告判斷部69是這樣的結構單元,即檢查權重加法運算部67得到的合計值是否超過閾值存儲部68中存儲的閾值,并當合計值超過閾值時判斷為輸出警告,當合計值小于等于閾值時判斷為不輸出警告。警告輸出部70是這樣的結構單元,即在警告判斷部69判斷為輸出警告的情況下,通過互聯(lián)網(wǎng)5向主頁管理者使用的管理者計算機2輸出警告。該警告中包含檢測關鍵字存儲部66中存儲的各關鍵字、和源內容中各關鍵字所在的行。而且,通過與管理者計算機2連接的顯示裝置4顯示警告,對于所顯示警告的具體示例,將通過圖8在后描述。
圖4所示為以HTML描述的原始源內容的一例。原始源內容如圖4所示,是利用各種標識符描述所顯示主頁內的文字或圖的大小、形狀、顏色等形態(tài)的文件數(shù)據(jù)。在實施方式1中,假設源內容的第1行包含標識符“<http lang=″ja″>”,第2行包含標識符“<title>”,第7行包含標識符“<comment>”,第10行和第25行包含標識符“<jpg>”。另外,圖4左端的數(shù)n(n為自然數(shù))表示源內容中的行數(shù)。
圖5所示為關鍵字/權重存儲部64中存儲的關鍵字和權重的具體示例。關鍵字和權重如上所述,用于判斷對源內容的篡改是否是主頁管理者預先確定的重大篡改。在實施方式1中,如圖5所示,作為關鍵字例舉了“http”、“jpg”、“cgi”、“exe”、“title”,并分別將權重“6”、“10”、“15”、“20”、“20”分配給各關鍵字。關鍵字是由上述管理者選擇的,權重是由上述管理者分配的。所分配的權重的數(shù)字越大,對管理者來說越重要。
圖6所示為圖4所示的原始源內容被不具有改寫權限的用戶非法篡改后的第1內容(第1篡改內容)的示例。與圖4所示的原始源內容對比,圖6所示的第1篡改內容明顯是原始源文件的第7行和第25行這2處被篡改后的內容。
圖7所示為圖4所示的原始源內容被不具有改寫權限的用戶非法篡改后的第2內容(第2篡改內容)的示例。與圖4所示原始源內容對比,圖7所示的第2篡改內容明顯是原始源文件的第2行、第7行、第10行和第25行這4處被篡改后的內容。
圖8所示為從輸出部70輸出的警告由與管理者計算機2相連的顯示裝置4顯示時的顯示狀況的示例。警告輸出部70輸出警告后,與管理者計算機2相連的顯示裝置4如圖8所示,顯示出“主頁中識別出重大篡改”的文字。而且,顯示裝置4還顯示被篡改且標識符內包含關鍵字/權重存儲部64中存儲的關鍵字的行的編號,以及該關鍵字。
以下,說明實施方式1的內容提供系統(tǒng)的動作。
首先,簡要說明用戶想要瀏覽主頁時內容提供系統(tǒng)的動作。
用戶想要瀏覽主頁時,利用自己使用的用戶計算機3,通過互聯(lián)網(wǎng)5訪問服務器1。在服務器1中,受理部12受理用戶的訪問,提取部13根據(jù)受理部12受理的用戶訪問,從公開內容存儲部11中提取源內容;發(fā)送部14通過互聯(lián)網(wǎng)5,將提取部13提取的源內容發(fā)送給來訪的用戶計算機3。用戶計算機3利用瀏覽器再生源內容,與用戶計算機3相連的顯示裝置4顯示根據(jù)源內容再生的圖像。源內容如果是原始源內容,則用戶就可以瀏覽期望的主頁。
但是,如上所述,公開內容存儲部11有可能被不具有改寫源內容權限的用戶非法訪問。因此,公開內容存儲部11中存儲的源內容有可能不是原始的源內容,而是對其篡改后的內容。以下,通過圖9說明內容篡改檢測裝置16的動作,其檢測出對原始源內容進行了主頁管理者預先確定的重大篡改的情況。
圖9所示為實施方式1的服務器1具備的內容篡改檢測裝置16的動作流程圖。假定內容篡改檢測裝置16每天在規(guī)定時刻(例如每天8點),檢查是否有人對源內容進行了重大篡改。
每天到規(guī)定時刻時,讀取判斷部61訪問公開內容存儲部11和備份存儲部15,判斷是否可以分別逐行讀取公開內容存儲部11中存儲的源內容、和備份存儲部15中存儲的備份內容(S1)。無法逐行讀取源內容和備份內容兩者或當中的一個時(S1為“否”),內容篡改檢測裝置16結束動作。如上所述,在實施方式1中,原始源內容以HTML描述,而備份內容則是原始源內容的備份,因而也以HTML描述。因此,如果源內容是原始源內容或者是通過HTML對原始源內容篡改后的內容,則源內容和備份內容可以逐行讀取(S1為“是”)。這樣,在可以逐行讀取源內容和備份內容的情況下(S1為“是”),讀取部62從公開內容存儲部11和備份存儲部15,分別逐行讀取源內容和備份內容(S2)。
然后,比較部63將讀取部62讀取的每行源內容和備份內容進行對比,并檢查源內容與備份內容是否存在差分(S3)。如果沒有差分(S3為“否”),內容篡改檢測裝置16的動作返回到上一步驟,即判斷是否可以對源內容和備份內容的、分別已讀取區(qū)域的下一部分讀取1行的步驟(以下稱為“讀取判斷步驟”)(S1)。例如,公開內容如果是圖6所示的第1篡改內容,則該第1篡改內容的第1行與圖4所示的備份內容的第1行相同,兩者沒有差異。因此,在這種情況下,內容篡改檢測裝置16的動作返回到讀取判斷步驟(S1),即判斷是否可以對源內容和備份內容的第2行讀取1行。
與此相對,如果源內容和備份內容存在差分(S3為“是”),關鍵字判斷部65取得關鍵字/權重存儲部64中存儲的多個關鍵字(S4)。然后,關鍵字判斷部65將表示差分屬性的標識符和從關鍵字/權重存儲部64取得的多個關鍵字進行對照,判斷標識符中是否包含多個關鍵字當中的一個(S5)。并且,關鍵字判斷部65判斷標識符中包含的關鍵字是哪一個。結果,如果標識符中不包含任何關鍵字(S5為“否”),則內容篡改檢測裝置16的動作返回上述讀取判斷步驟(S1)。
在此,說明一具體示例,該例子中,假定源內容是圖6所示的第1篡改內容,源內容和備份內容存在差分,但表示該差分的屬性的標識符中不包含關鍵字/權重存儲部64中所存儲的任何一個關鍵字。
注意第1篡改內容(參照圖6)和備份內容(參照圖4)的第7行,第1篡改內容中描述為“<comment>產(chǎn)品種類</comment>”,而備份內容中描述為“<comment>商品種類</comment>”。因此,比較部63對第1篡改內容和備份內容的第7行,檢測出相對備份內容的“商品”部分的差分“產(chǎn)品”(S3為“是”)。但是,表示該差分“產(chǎn)品”屬性的標識符從圖6的第7行可看出,為“<comment>”,該標識符當中不包含關鍵字/權重存儲部64中所存儲的任何一個關鍵字(參照圖5)(S5為“否”)。因此,內容篡改檢測裝置16的動作返回上述讀取判斷步驟(S1)。
而當關鍵字判斷部65判斷為在表示差分屬性的標識符中,包含有關鍵字/權重存儲部64中所存儲的任意一個關鍵字時(S5為“是”),檢測關鍵字存儲部66存儲該關鍵字和源內容中包含該關鍵字的行(S6)。權重加法運算部67從關鍵字/權重存儲部64取得分配給該關鍵字的權重(S7)。然后,權重加法運算部67對源內容和備份內容的已對比區(qū)域的全部差分,對與表示各差分屬性的標識符中包含的關鍵字對應的權重的合計值(到上次為止的總權重),加上從關鍵字/權重存儲部64取得的權重(表示關鍵字判斷部65本次檢測差分屬性的標識符中包含的關鍵字的權重)(S8)。即,權重加法運算部67對源內容和備份內容的、到本次為止已對比區(qū)域的全部差分,獲得與表示各差分屬性的標識符中包含的關鍵字對應的權重的合計值(到本次為止的總權重)(S8)。
在此,說明一具體例,在該具體例中,假定源內容是圖7所示的第2篡改內容,源內容和備份內容有差分,并且表示該差分的屬性的標識符中包含關鍵字/權重存儲部64中存儲的一個關鍵字。
注意第2篡改內容(參照圖7)和備份內容(參照圖4)的第2行,第2篡改內容中描述為“<title>×××電器株式會社</title>”,而備份內容中描述為“<title>○○○電器株式會社</title>”。因此,比較部63對第2篡改內容和備份內容的第2行,檢測出相對備份內容的“○○○”部分的差分“×××”(S3為“是”)。表示該差分“×××”屬性的標識符可從圖7的第2行看出,為“<title>”,該標識符當中包含關鍵字/權重存儲部64中存儲的“title”(S5為“是”)。
但是,從圖7和圖4可看出,第2篡改內容和備份內容的第1行中不存在差分。因此,到源內容的第1行為止的總權重(到上次為止的總權重)為“0”。因此,權重加法運算部67將關鍵字“title”的權重“20”(參照圖5)加到到上次為止的總權重“0”上,從而得到到本次為止的總權重“20”(S8),所述關鍵字“title”包含在表示關鍵字判斷部65本次檢測的差分(第2行的差分)的屬性的標識符中。
作為其它的例子,注意第2篡改內容(參照圖7)和備份內容(參照圖4)的第10行,第2篡改內容中描述為“<jpg>小汽車</jpg>”,而備份內容中描述為“<jpg>等離子電視</jpg>”。因此,比較部63對第2篡改內容和備份內容的第10行,檢測出相對備份內容的“等離子電視”部分的差分“小汽車”(S3為“是”)。從圖7的第10行可看出,表示該差分“小汽車”的屬性的標識符為“<jpg>”,該標識符當中包含關鍵字/權重存儲部64中存儲的“jpg”(S5為“是”)。在此,假定到源內容和備份內容的第9行為止的總權重(到上次為止的總權重)為“20”,則權重加法運算部67將關鍵字“jpg”的權重“10”(參照圖5)加到到上次為止的總權重“20”上,從而得到到本次為止的總權重“30”(S8),所述關鍵字“jpg”包含在表示關鍵字判斷部65本次檢測的差分(第10行的差分)的屬性的標識符中。
這樣,在得到到本次為止的總權重后,警告判斷部69取得閾值存儲部68中存儲的閾值(S9),然后檢查權重加法運算部67得到的合計值(到本次為止的總權重)是否超過所取得的閾值(閾值存儲部68中存儲的閾值)(S10)。如果到本次為止的總權重小于等于閾值(S10為“否”),則警告判斷部69判斷不輸出警告,并返回上述讀取判斷步驟(S1)。
如果到本次為止的總權重超過閾值(S10為“是”),則警告判斷部69判斷輸出警告,并基于該判斷,警告輸出部70通過互聯(lián)網(wǎng)5向主頁管理者使用的管理者計算機2輸出警告(S11)。此時,警告輸出部70還輸出一信息,該信息用于確定檢測關鍵字存儲部66中存儲的各關鍵字、和源內容中包含各關鍵字的行。
管理者計算機2通過與管理者計算機2連接的顯示裝置4,顯示警告輸出部70輸出的警告(參照圖8)。這樣,上述管理者在對源內容被進行了自己預先確定的重大篡改時,可以知曉該篡改。而且,如圖8所示,顯示裝置4顯示出對內容進行了篡改的且標識符中包含關鍵字的行的編號和關鍵字,因此上述管理者可以知曉源內容的哪個部分被進行了重大篡改。
如上所述,實施方式1的內容篡改檢測裝置16將源內容和備份內容進行對比,判斷表示兩內容的差分屬性的標識符中是否包含主頁管理者所選擇的關鍵字。然后,內容篡改檢測裝置16在與標識符中包含的關鍵字對應的權重的相加值超過上述管理者設定的閾值時,向上述管理者輸出警告。
例如,圖6所示的第1篡改內容與圖4所示的原始源內容相比可以看出,第7行和第15行這2個部位被篡改。但是,上述管理者將閾值設定為“25”時,將第1篡改內容和備份內容進行對比得到的總權重為“10”,不超過“25”,因此視為沒有進行上述管理者預先確定的重大篡改,不輸出警告。
而圖7所示的第2篡改內容是圖4所示的原始源內容的第2行、第7行、第10行和第25行這4個部位被篡改的內容。因此,第2篡改內容和備份內容在對比到第9行時,權重加法運算部67算出的總權重為“30”,超過了“25”。這樣,如果原始源內容被篡改為第2篡改內容,則判斷為對原始源內容進行了重大篡改,并輸出警告。
這樣,實施方式1的內容篡改檢測裝置16不是在原始源內容被篡改的所有情況下都輸出警告,而是僅在原始源內容被進行了主頁管理者預先確定的重大篡改的情況下,才輸出警告。結果,上述管理者僅在源內容被進行了自己預先確定的重大篡改的情況下,才知曉該篡改。
另外,在上述實施方式1中,權重加法運算部67是針對每行源內容算出權重的合計值,但權重加法運算部67也可以不算出每行的權重合計值,而是算出每個規(guī)定范圍內的合計值。而且,權重加法運算部67也可以在對整個源內容和整個備份內容進行對比后,得到全部與表示差分屬性的標識符中包含的各關鍵字對應的權重的合計值。
關鍵字判斷部65也可以不通過對表示差分屬性的標識符和關鍵字/權重存儲部64中存儲的多個關鍵字進行對照,來判斷標識符中是否包含多個關鍵字當中的一個,而是如下進行判斷。即,關鍵字判斷部65也可以將差分自身與上述多個關鍵字進行對照,并判斷差分當中是否包含多個關鍵字當中的一個。這種情況下,權重加法運算部67對源內容和備份內容中被對比區(qū)域的所有差分,得到與各差分中包含的關鍵字對應的權重的合計值。在此,差分自身是與差分相關的部位的一個例子。另外,與差分關聯(lián)的部位不限于表示差分屬性的標識符和差分自身。
(實施方式2)以下,通過圖10和圖11說明實施方式2的服務器91和內容篡改檢測裝置92。
實施方式1的內容篡改檢測裝置16將源內容和備份內容進行對比,當與表示兩個內容差分的屬性的標識符中包含的關鍵字對應的權重的相加值超過規(guī)定閾值時,輸出警告。而實施方式2的內容篡改檢測裝置92則如后所述,將源內容和備份內容進行對比后,計算表示兩內容差分屬性的標識符中包含的關鍵字的個數(shù),當所計算的個數(shù)超過規(guī)定的閾值時,輸出警告。
該點是實施方式2與實施方式1的不同點,因此在本實施方式2中,以與實施方式1的不同點為中心進行說明。另外,在實施方式2中,對于與實施方式1中出現(xiàn)的構成部分相同的構成部分使用相同的符號,省略對其的重復說明。
圖10所示為實施方式2的服務器91的結構框圖。服務器91是根據(jù)用戶的訪問發(fā)送源內容的裝置。服務器91如圖10所示,具有公開內容存儲部11、受理部12、提取部13、發(fā)送部14、備份存儲部15和內容篡改檢測裝置92。
內容篡改檢測裝置92是當原始源內容被進行了主頁管理者預先確定的重大篡改時檢測出該篡改的裝置。如圖10所示,內容篡改檢測裝置92包括讀取判斷部61、讀取部62、比較部63、關鍵字存儲部93、關鍵字判斷部65、檢測關鍵字存儲部66、計測部94、閾值存儲部95、警告判斷部96和警告輸出部70。
關鍵字存儲部93是用于存儲主頁管理者預先選擇的多個關鍵字的結構單元。關鍵字用于判斷對原始源文件的篡改是否是上述管理者預先確定的重大篡改。計測部94是就比較部63檢測出的全部差分,計算表示差分屬性的各標識符中包含的關鍵字個數(shù)的結構單元。
閾值存儲部95是存儲閾值的結構單元,該閾值作為判斷是否有人對原始源內容進行了主頁管理者預先確定的重大篡改的判斷基準。警告判斷部96是檢查計測部94計測的合計個數(shù)是否超過閾值存儲部95中存儲的閾值,當合計個數(shù)超過閾值時,判斷為輸出警告,當合計個數(shù)小于等于閾值時,判斷為不輸出警告的結構單元。
以下通過圖11說明實施方式2的內容篡改檢測裝置92的動作。
圖11所示為實施方式2的內容篡改檢測裝置92的動作流程圖。假定內容篡改檢測裝置92在每天的規(guī)定時刻檢查是否有人對源內容進行了重大篡改。
每天到規(guī)定時刻時,讀取判斷部61訪問公開內容存儲部11和備份存儲部15,判斷是否可以分別逐行讀取公開內容存儲部11中存儲的源內容、和備份存儲部15中存儲的備份內容(S21)。無法逐行讀取源內容和備份內容兩者或當中的一個時(S21為“否”),內容篡改檢測裝置92結束動作??梢灾鹦凶x取源內容和備份內容的情況下(S21為“是”),讀取部62從公開內容存儲部11和備份存儲部15分別逐行讀取源內容和備份內容(S22)。
然后,比較部63將讀取部62讀取的每行源內容和備份內容進行對比,并檢查源內容與備份內容是否存在差分(S23)。如果沒有差分(S23為“否”),內容篡改檢測裝置92的動作返回上一步驟,即判斷是否可以對源內容和備份內容的各自己讀取區(qū)域的下一部分讀取1行的步驟(以下稱為“讀取判斷步驟”)(S21)。
與此相對,如果源內容和備份內容存在差分(S23為“是”),關鍵字判斷部65取得關鍵字存儲部93中存儲的多個關鍵字(S24)。然后,關鍵字判斷部65將表示差分屬性的標識符與從關鍵字存儲部93取得的多個關鍵字進行對照,判斷標識符中是否包含多個關鍵字當中的一個(S25)。并且,關鍵字判斷部65判斷標識符中包含的關鍵字是哪一個。
判斷結果,如果標識符中不包含任何關鍵字(S25為“否”),則內容篡改檢測裝置92的動作返回上述讀取判斷步驟(S21)。
而當表示差分屬性的標識符中包含關鍵字存儲部93中存儲的任意一個關鍵字時(S25為“是”),檢測關鍵字存儲部66存儲該關鍵字和源內容中包含該關鍵字的行(S26)。然后,計測部94對源內容與備份內容的已對比區(qū)域的全部差分,將表示關鍵字判斷部65本次檢測出的差分的屬性的標識符中包含的關鍵字的個數(shù)(通常為“1”),與表示各差分的屬性的標識符中包含的關鍵字的合計個數(shù)(到上次為止的總個數(shù))相加(S27)。即,計測部94對源內容和備份內容的到本次為止已對比區(qū)域的全部差分,得到表示各差分屬性的標識符中包含的關鍵字的合計個數(shù)(到本次為止的總個數(shù))(S27)。
這樣,在得到到本次為止的總個數(shù)后,警告判斷部96取得閾值存儲部95中存儲的閾值(S28),然后檢查計測部94得到的合計個數(shù)(到本次為止的總個數(shù))是否超過所取得的閾值(閾值存儲部95中存儲的閾值)(S29)。如果到本次為止的總個數(shù)小于等于閾值(S29為“否”),警告判斷部96判斷為不輸出警告,并返回上述讀取判斷步驟(S21)。
如果到本次為止的總個數(shù)超過閾值(S29為“是”),警告判斷部96判斷為輸出警告,根據(jù)該判斷,警告輸出部70通過互聯(lián)網(wǎng)5向主頁管理者使用的管理者計算機2輸出警告(S30)。此時,警告輸出部70還輸出一信息,該信息用于確定檢測關鍵字存儲部66中存儲的各關鍵字、和源內容中包含各關鍵字的行。
管理者計算機2通過與管理者計算機2連接的顯示裝置4,顯示警告輸出部70輸出的警告(參照圖8)。這樣,上述管理者在有人對源內容進行了自己預先確定的重大篡改時,可以知曉該篡改。而且,如圖8所示,顯示裝置4顯示內容被篡改且標識符中包含關鍵字的行的編號和關鍵字,因此,上述管理者可以知曉源內容的哪個部分被進行了重大篡改。
如上所述,實施方式2的內容篡改檢測裝置92將源內容和備份內容進行對比,判斷表示兩內容的差分的屬性的標識符中是否包含主頁管理者所選擇的關鍵字。然后,內容篡改檢測裝置92在標識符中包含的關鍵字的個數(shù)超過上述管理者設定的閾值時,向上述管理者輸出警告。
即,實施方式2的內容篡改檢測裝置92不是在原始源內容被篡改的所有情況下都輸出警告,而是僅在原始源內容被進行了上述管理者預先確定的重大篡改的情況下,才輸出警告。結果,上述管理者僅在源內容被進行了自己預先確定的重大篡改的情況下,才知曉該篡改。
另外,在上述實施方式2中,計測部94對每行源內容計算關鍵字的合計個數(shù),但也可以不對每行計算合計個數(shù),而是對每個規(guī)定范圍計算關鍵字的合計個數(shù)。而且,計測部94也可以在對整個源內容和整個備份內容進行對比后,得到全部表示差分的屬性的標識符中包含的關鍵字的合計個數(shù)。
關鍵字判斷部65也可以將差分自身與關鍵字存儲部93中存儲的多個關鍵字進行對照,判斷差分當中是否包含多個關鍵字當中的一個。這種情況下,計測部94對源內容和備份內容的被對比區(qū)域的所有差分,得到各差分中包含的關鍵字的合計個數(shù)。在此,差分自身是與差分關聯(lián)的部位的一個例子。另外,與差分關聯(lián)的部位不限于表示差分屬性的標識符和差分自身。
另外,警告判斷部96也可以在關鍵字判斷部65判斷為與差分關聯(lián)的部位(標識符內或差分內)中包含關鍵字時,直接判斷為輸出警告。
產(chǎn)業(yè)上的實用性本發(fā)明的內容篡改檢測裝置具有可以檢測出對規(guī)定內容進行了預先確定的重大篡改情況的效果,并且可以用作內容篡改檢測裝置等,檢測對互聯(lián)網(wǎng)上公開的主頁等的內容的篡改。
權利要求
1.一種內容篡改檢測裝置,用于檢測對互聯(lián)網(wǎng)上公開的內容進行的篡改,其特征在于,具有比較單元,將第1存儲單元中存儲的第1內容和第2存儲單元中存儲的第2內容進行對比,并檢測出所述第1內容和所述第2內容的差分;關鍵字判斷單元,針對由所述比較單元檢測的各差分,判斷在與所述差分關聯(lián)的部位是否包含規(guī)定的關鍵字;警告判斷單元,利用由所述關鍵字判斷單元得到的判斷結果,判斷是否輸出警告;以及警告輸出單元,當所述警告判斷單元判斷為輸出警告時,輸出警告。
2.如權利要求1所述的內容篡改檢測裝置,其特征在于,與所述差分關聯(lián)的部位是表示所述差分的屬性的標識符。
3.如權利要求1所述的內容篡改檢測裝置,其特征在于,與所述差分關聯(lián)的部位是所述差分自身。
4.如權利要求1所述的內容篡改檢測裝置,其特征在于,所述關鍵字存在多個,并且各所述關鍵字中分配有規(guī)定的權重;所述關鍵字判斷單元判斷在與所述差分關聯(lián)的部位中包含的所述關鍵字是否是多個所述關鍵字當中的一個;所述內容篡改檢測裝置還具有權重加法運算單元,該權重加法運算單元利用由所述關鍵字判斷單元得到的判斷結果,針對由所述比較單元檢測出的全部差分,將分配到與各所述差分關聯(lián)的部位中包含的所述關鍵字的權重相加;在由所述權重加法運算單元得到的合計值超過規(guī)定閾值時,所述警告判斷單元判斷為輸出警告。
5.如權利要求4所述的內容篡改檢測裝置,其特征在于,所述比較單元從頭開始依次對每個相互對應的規(guī)定范圍的所述第1內容和所述第2內容進行對比,并檢測出各范圍的差分;在所述比較單元每次結束各所述范圍的對比時,所述權重加法運算單元針對由所述比較單元對比的全部范圍的全部差分,將分配到與各所述差分關聯(lián)的部位中包含的所述關鍵字的權重相加;在所述權重加法運算單元每次結束運算時,所述警告判斷單元判斷由所述權重加法運算單元得到的合計值是否超過所述閾值,所述合計值超過所述閾值時,判斷為輸出警告。
6.如權利要求5所述的內容篡改檢測裝置,其特征在于,所述規(guī)定范圍為1行。
7.如權利要求1所述的內容篡改檢測裝置,其特征在于,還具有計測單元,計測單元針對由所述比較單元檢測出的全部差分,計算與各所述差分關聯(lián)的部位中包含的所述關鍵字的個數(shù);在所述計測單元計算出的個數(shù)超過規(guī)定閾值時,所述警告判斷單元判斷為輸出警告。
8.如權利要求7所述的內容篡改檢測裝置,其特征在于,所述比較單元從頭開始依次對每個相互對應的規(guī)定范圍的所述第1內容和所述第2內容進行對比,并檢測出各范圍的差分;在所述比較單元每次結束各所述范圍的對比時,所述計測單元針對由所述比較單元對比的全部范圍的全部差分,計算與各所述差分關聯(lián)的部位中包含的所述關鍵字的個數(shù);在所述計測單元每次結束計算時,所述警告判斷單元判斷所述計測單元計算出的個數(shù)是否超過所述閾值,在計算出的個數(shù)超過所述閾值時,判斷為輸出警告。
9.如權利要求8所述的內容篡改檢測裝置,其特征在于,所述規(guī)定范圍為1行。
10.如權利要求1所述的內容篡改檢測裝置,其特征在于,所述第1內容是所述互聯(lián)網(wǎng)上公開提供的主頁的源內容;所述第2內容是原始的所述源內容的備份。
11.一種服務器,在互聯(lián)網(wǎng)上公開內容、并檢測對所述內容進行的篡改,其特征在于,包括存儲第1內容的第1存儲單元;存儲第2內容的第2存儲單元;根據(jù)用戶的訪問發(fā)送所述第1內容的發(fā)送單元;比較單元,將第1存儲單元中存儲的第1內容和第2存儲單元中存儲的第2內容進行對比,并檢測出所述第1內容和所述第2內容的差分;關鍵字判斷單元,針對由所述比較單元檢測的各差分,判斷在與所述差分關聯(lián)的部位是否包含規(guī)定的關鍵字;警告判斷單元,利用由所述關鍵字判斷單元得到的判斷結果,判斷是否輸出警告;以及警告輸出單元,當所述警告判斷單元判斷為輸出警告時,輸出警告。
12.一種內容篡改檢測方法,用于檢測對互聯(lián)網(wǎng)上公開的內容進行的篡改,其特征在于,包括比較步驟,將第1存儲單元中存儲的第1內容和第2存儲單元中存儲的第2內容進行對比,并檢測出所述第1內容和所述第2內容的差分;關鍵字判斷步驟,針對所述比較步驟中檢測出的各差分,判斷與所述差分關聯(lián)的部位中是否包含有規(guī)定的關鍵字;警告判斷步驟,利用所述關鍵字判斷步驟中得到的判斷結果,判斷是否輸出警告;以及警告輸出步驟,當所述警告判斷步驟中判斷為輸出警告時,輸出警告。
13.一種計算機執(zhí)行程序,用于檢測對互聯(lián)網(wǎng)上公開的內容進行的篡改,其特征在于,包括比較步驟,將第1存儲單元中存儲的第1內容和第2存儲單元中存儲的第2內容進行對比,并檢測出所述第1內容和所述第2內容的差分;關鍵字判斷步驟,針對所述比較步驟中檢測出的各差分,判斷與所述差分關聯(lián)的部位中是否包含有規(guī)定的關鍵字;警告判斷步驟,利用所述關鍵字判斷步驟中得到的判斷結果,判斷是否輸出警告;以及警告輸出步驟,當所述警告判斷步驟中判斷為輸出警告時,輸出警告。
全文摘要
本發(fā)明提供了一種檢測出對規(guī)定內容進行了預先確定的重大篡改的情況的內容篡改檢測裝置。內容篡改檢測裝置(16)具有比較部(63),將公開內容存儲部(11)內的主頁的源內容和備份存儲部(15)內的備份內容進行對比,并檢測出兩者差分;關鍵字判斷部(65),針對所檢測的各差分,判斷表示該差分屬性的標識符中是否包含規(guī)定關鍵字,并判斷所包含的關鍵字是哪一個;權重加法運算部(67),將由比較部(63)檢測出的全部差分的各標識符中包含的關鍵字上所分配的權重相加;警告判斷部(69),當權重加法運算部(67)得到的合計值超過規(guī)定閾值時,判斷為輸出警告;以及警告輸出部(70),當判斷為輸出警告時,輸出警告。
文檔編號G06F12/14GK1642113SQ200510004730
公開日2005年7月20日 申請日期2005年1月17日 優(yōu)先權日2004年1月15日
發(fā)明者角浩二 申請人:松下電器產(chǎn)業(yè)株式會社