一種電子文件安全檢索的方法
【專利摘要】本發(fā)明公開了一種電子文件安全檢索的方法,該方法首先在執(zhí)行電子文件更新操作時對電子文件進行實時索引并將結果更新到索引文件,然后在索引文件內容發(fā)生變化后,索引器通知搜索器對索引文件進行重新定向,接著在用戶檢索文件前,系統(tǒng)分別查找當前用戶及其所在用戶組的電子文件訪問控制列表,作為用戶安全檢索結果的過濾器。該方法還可包括向用戶提供高級檢索入口,用戶可根據(jù)電子文件的元數(shù)據(jù)自定義查詢條件。該方法能夠保證電子文件的安全檢索,安全檢索的實現(xiàn)基于松耦合的理念進行設計,即電子文件ACL訪問控制相關數(shù)據(jù)不會存儲到索引文件中,這樣就避免了每次修改ACL權限時,頻繁的更新電子文件對應的索引文件,大大減少了系統(tǒng)的資源消耗。
【專利說明】—種電子文件安全檢索的方法
【技術領域】
[0001]本發(fā)明涉及電子文件安全管理,尤其涉及一種電子文件安全檢索的方法,屬于計算機信息安全【技術領域】。
【背景技術】
[0002]電子文件管理系統(tǒng)(也稱為ERMS)為當前企業(yè)或政府部門中的海量電子文件進行全生命周期的管理提供了很好的解決方案,具體的生命周期過程包括電子文件的捕獲、歸檔(或者說登記)、檢索利用以及鑒定處置,其中鑒定處置過程可對保管期限到期的電子文件執(zhí)行銷毀、續(xù)存或者將其移交到數(shù)字檔案館。在電子文件的歸檔管理過程中,對海量電子文件的檢索是ERMS的核心功能之一。
[0003]當前,在企業(yè)電子文件管理系統(tǒng)中,對電子文件進行歸檔后,對電子文件的檢索主要采用如下幾種方法:第一,采用數(shù)據(jù)庫的索引技術,但面對海量的非結構化電子文件,這種檢索方式顯然不能快速且準確的搜索到相應的搜索結構;第二,采用高性能的基于Java語言實現(xiàn)的全文檢索工具包Lucene進行文件檢索,這種方式能夠對非結構化的電子文件進行全文檢索,但是電子文件訪問的安全性無法得到保障。
[0004]因此,如何解決電子文件安全檢索問題,同時又能夠保證電子文件檢索的實時性,成為一個亟待解決的問題。
【發(fā)明內容】
[0005]本發(fā)明公開了一種電子文件安全檢索的方法,解決了在保證電子文件檢索實時性的同時電子文件安全檢索的問題。
[0006]為實現(xiàn)上述發(fā)明目的,本發(fā)明采取的技術方案是:一種電子文件安全檢索的方法,包括以下步驟:
第一步:實時索引:在電子文件歸檔時或在歸檔后執(zhí)行電子文件更新操作時,索引組件對電子文件進行實時索引并將結果更新到索引文件;
第二步:實時搜索:索引文件內容發(fā)生變化后,索引器通知搜索器對索引文件進行重新定向;
第三步:在系統(tǒng)中配置用戶及用戶組的電子文件訪問控制列表,在用戶檢索文件前,系統(tǒng)分別查找當前用戶及其所在用戶組的電子文件訪問控制列表,取得用戶及其所在用戶組中含有“瀏覽內容”權限的所有電子文件的集合,作為用戶安全檢索結果的過濾器;若用戶沒有登錄系統(tǒng),進入檢索界面,輸入檢索條件,檢索的結果為空;已經(jīng)登錄系統(tǒng)的用戶,輸入檢索條件后,系統(tǒng)根據(jù)檢索條件使用搜索器搜索檢索文件中的電子文件,使用過濾器過濾搜索結果。
[0007]所述電子文件安全檢索的方法還可包括:向用戶提供高級檢索入口,用戶可根據(jù)電子文件的元數(shù)據(jù)自定義查詢條件,根據(jù)自定義的查詢條件搜索出權限范圍內的電子文件。[0008]本發(fā)明方法針對不同用戶,根據(jù)對應的電子文件訪問權限,基于Lucene全文檢索工具包,對電子文件的相關元數(shù)據(jù)和內容進行快速檢索,進而查找到權限范圍內的電子文件列表,同時能夠對查找出的電子文件執(zhí)行權限范圍內的操作,具體包括:下載、鑒定處置、預覽元數(shù)據(jù)。本發(fā)明貫穿了電子文件管理的整個生命周期,即在電子文件的歸檔登記時由索引器對登記的文件實時索引;在電子文件歸檔維護時,由索引器對索引文件實時更新;當電子文件在文件管理系統(tǒng)中的保存時間到期之后,若對該文件執(zhí)行銷毀,索引器同時刪除該文件對應的索引項。每個過程執(zhí)行的同時,索引器會通知搜索器對索引文件重新快照,以保證搜索的實時性,同時也在一定程度上減少了系統(tǒng)的資源消耗。更為重要的是,安全檢索的實現(xiàn)基于松耦合的理念進行設計,即電子文件ACL訪問控制相關數(shù)據(jù)不會存儲到索引文件中,這樣就避免了每次修改ACL權限時,頻繁的更新電子文件對應的索引文件,大大減少了系統(tǒng)的資源消耗。
【專利附圖】
【附圖說明】
[0009]圖1為本發(fā)明實時索引的功能示意圖。
[0010]圖2為本發(fā)明實時搜索的功能示意圖。
[0011]圖3為本發(fā)明安全檢索的功能示意圖。
【具體實施方式】
[0012]下面結合附圖和【具體實施方式】,對本發(fā)明作進一步詳細說明。
[0013]圖1為本發(fā)明實時索引的功能示意圖。在電子文件管理系統(tǒng)中,對電子文件的索引總共發(fā)生在三個階段:電子文件歸檔、電子文件分類管理和電子文件的銷毀。在電子文件管理系統(tǒng)中,檔案管理員對相關電子文件進行歸檔登記的同時,索引組件首先解析出文件相關的元數(shù)據(jù)和實體內容,進而對文本進行分詞,分詞過程執(zhí)行完畢后,將結果添加到索引文件。同理,電子文件若已經(jīng)歸檔,此時若再對該文件進行元數(shù)據(jù)的修改,索引組件會重新對該文檔進行電子文件元數(shù)據(jù)和實體內容的解析,分詞完畢后,將結果更新到索引文件。若電子文件在電子文件管理系統(tǒng)中的存放期限已到,檔案管理員對該電子文件執(zhí)行銷毀動作,此時索引器會刪除該電子文件對應的所有索引項。
[0014]現(xiàn)以電子文件的歸檔為例,來說明實時索引的過程。電子文件管理員登錄電子文件管理系統(tǒng),選擇待歸檔的電子文件,并保證文件元數(shù)據(jù)等的合法性和完整性,執(zhí)行歸檔登記操作。電子文件被存儲到介質后,索引器開始對電子文件的元數(shù)據(jù)進行索引。要索引的電子文件的元數(shù)據(jù)是可配置的,若未進行配置,則默認對電子文件所有的元數(shù)據(jù)及實體內容進行索弓I。當電子文件對應的索引項被添加到索弓I文件后,索引器會通知搜索器對索引文件重新快照,從而保證檢索的實時性。
[0015]電子文件歸檔成功之后,用戶可在電子文件的檢索模塊中輸入剛歸檔成功的文檔相關元數(shù)據(jù)或實體相關內容,若用戶擁有歸檔文件的預覽權限,則可以搜索到剛歸檔成功的電子文件。通過此操作,可以驗證搜索的實時性。
[0016]圖2為本發(fā)明實時搜索的功能示意圖。本過程采用了“觀察者”設計模式來實現(xiàn)實時搜索。在文件管理系統(tǒng)中,只有執(zhí)行電子文件歸檔操作、電子文件元數(shù)據(jù)修改和電子文件銷毀操作時,索引器會執(zhí)行索引文件更新操作(具體可包括添加、更新、刪除),索引文件內容發(fā)生變化后,索引器會通知搜索器對索引文件進行重新定向,即搜索器對索引文件進行重新快照?;谧钚碌目煺?,用戶就可以根據(jù)查詢條件搜索到最新的查詢結果。反之,當索引文件未發(fā)生變化時,索引器不會對索引文件進行重新快照,大大減少了系統(tǒng)的資源消耗。
[0017]為了能清晰表達實時搜索,現(xiàn)以某一業(yè)務背景來描述這一技術過程。假設公司某一員工對某一電子文件擁有編輯權限,文件審計管理員對該文件只有預覽權限。文件審計管理員在電子文件管理系統(tǒng)的檢索模塊中輸入查詢詞匯,檢索到該電子文件,若發(fā)現(xiàn)該電子文件元數(shù)據(jù)填寫有誤,便告知該員工及時進行修改。員工對該電子文件進行重新修改,索引器會同步更新該電子文件對應的索引項,同時文件審計管理員正在使用檢索模塊核查其他的電子文件,檢索過程并不受索引過程的影響。最后,員工告知文件審計管理員文件已經(jīng)修改完成,文件審計管理員立刻對該電子文件進行檢索,發(fā)現(xiàn)電子文件的元數(shù)據(jù)已經(jīng)修改成功。整個實時搜索的實際偏差一般不會超過5秒。具體實時搜索的流程圖請參考附圖2。
[0018]圖3為本發(fā)明安全檢索的功能示意圖。安全檢索的實現(xiàn)基于松耦合的理念進行設計,即電子文件的訪問控制列表(ACL)信息不會存儲到索引文件中,這樣就避免了每次修改ACL權限時,頻繁的更新電子文件對應的索引文件,大大減少了系統(tǒng)的資源消耗。
[0019]對電子文件管理系統(tǒng)來說,采用ACL模型有以下優(yōu)點:把ACL權限控制數(shù)據(jù)作為元數(shù)據(jù)存放,與電子文件的分步式存儲模型匹配,可以更加全面準確描述電子文件信息;在ACL訪問控制列表下,單個電子文件權限獲取比關系型數(shù)據(jù)庫快;配合電子文件管理系統(tǒng)中用戶組等功能使用時,容易動態(tài)地、批量地調整不同人員的權限。
[0020]在電子文件管理系統(tǒng)中,為了提高ACL的分配效率,通常把ACL與電子文件的分類方案相結合,采用分級授權的方式進行分配。
[0021]ACL訪問控制模型包括兩個要素:訪問者和訪問者可以執(zhí)行的操作(權限)。其中,訪問者表示可以訪問電子文件的對象。在電子文件管理系統(tǒng)中可以是用戶,也可以是用戶組(一組具有某些相同特性的用戶集合)。某個用戶對電子文件的操作權限是此電子文件所有ACL列表中該用戶擁有操作權限的并集。可執(zhí)行的操作描述了訪問者可以對該電子文件進行的操作內容。電子文件管理系統(tǒng)中對電子文件的權限控制包括在線和離線,其中,在線權限包括:授權、維護類目、維護案卷、創(chuàng)建文件、修改文件、預覽元數(shù)據(jù)、預覽內容、打印。離線權限包括:下載、是否為密文下載、下載文檔可否編輯(當下載的是明文時,默認用戶含有此權限,若是密文下載則需要設置此權限)、下載后可打開文件次數(shù)(默認用戶無限次打開,若是密文下載,則可以設置打開的次數(shù))、下載后文件有效期(當電子文件是明文下載時默認不限制期限。若是密文下載可以設置電子文件的有效期)。電子文件的打開次數(shù)和有效期只能選擇一個,當選擇打開次數(shù)時,可以設定有效打開次數(shù);當選擇文件有效期時,可以設置電子文件有效期到期日。
[0022]其中與搜索相關的權限包括:“瀏覽內容”、“瀏覽元數(shù)據(jù)”、“下載”等的操作權限。在檢索電子文件時,先查找當前用戶及其所在的用戶組包含的所有具有“瀏覽內容”權限的電子文件,放入過濾器中。再根據(jù)檢索條件使用搜索器搜索檢索文件中的電子文件,使用過濾器過濾搜索結果。最后把搜索結果以列表形式展現(xiàn)。當瀏覽搜索結果中的記錄時,系統(tǒng)會判斷用戶及其所在的用戶組對此電子文件的ACL訪問權限,并根據(jù)權限結果判斷是否顯示電子文件元數(shù)據(jù),是否賦予用戶下載的權限。
[0023]在系統(tǒng)中配置用戶及用戶組的電子文件ACL訪問控制列表。其中與搜索相關的權限包括:“瀏覽內容”、“瀏覽元數(shù)據(jù)”和“下載”等。在用戶檢索文件前,系統(tǒng)分別查找當前用戶及其所在用戶組的電子文件ACL訪問控制列表,取得用戶及其所在用戶組中含有“瀏覽內容”權限的所有電子文件的集合。作為用戶安全檢索結果的過濾器。
[0024]若用戶沒有登錄系統(tǒng),進入檢索界面,輸入檢索條件,檢索的結果為空。已經(jīng)登錄系統(tǒng)的用戶,輸入檢索條件后,系統(tǒng)根據(jù)檢索條件使用搜索器搜索檢索文件中的電子文件,使用過濾器過濾搜索結果。列表結果中展現(xiàn)了與關鍵詞相關的內容摘要。
[0025]檢索的結果會隨著用戶及其所在用戶組的ACL訪問控制列表的改變而變化,若用戶A在檢索時,對文件B有“瀏覽內容”的權限,且檢索條件與文件B相關,則文件B會出現(xiàn)在檢索結果中。當其進行下次檢索時,其本身或其所在用戶組的ACL訪問控制列表被改變后,用戶A對文件B沒有“瀏覽內容”的權限,不管檢索條件是否與文件B相關,文件B將不會顯示在結果列表中。
[0026]預覽檢索結果時,系統(tǒng)會再次判斷用戶對將要預覽的文件的訪問權限。只有用戶在預覽文件時含有“瀏覽內容”的權限,系統(tǒng)才會展現(xiàn)文件的具體內容,同理,只有用戶對文件含有“預覽元數(shù)據(jù)”的權限,用戶才可以看到文件的具體元數(shù)據(jù)信息。
[0027]當瀏覽文件B檢索結果前,用戶或其所在的用戶組ACL訪問控制列表被改變了,使得用戶對文件B沒有“瀏覽內容”或“瀏覽元數(shù)據(jù)”等的權限,則預覽界面的展現(xiàn)與會發(fā)生相應的變化。
[0028]系統(tǒng)對搜索結果中文件的下載也是在用戶執(zhí)行相關操作時,根據(jù)用戶及其所在用戶組的ACL訪問控制列表實時判斷的。
[0029]當用戶要查找某些電子文件,且對該電子文件的某些元數(shù)據(jù)屬性值已經(jīng)有了確切的認識或者某種程度的了解,單純使用關鍵字進行檢索往往會返回很多與查找資源不匹配的電子文件記錄。此時,自定義搜索為用戶提供了更為方便的檢索入口。自定義搜索根據(jù)電子文件對應的數(shù)據(jù)類型,自動加載該電子文件對應的所有元數(shù)據(jù)以供用戶進行選擇,用戶可以將這些元數(shù)據(jù)進行任意的組合,形成最終的搜索條件,然后就可以搜索到與搜索條件匹配的權限范圍內的電子文件記錄。具體操作如下:首先選擇電子文件類型,然后根據(jù)選擇的類型,把該類型對應的電子文件元數(shù)據(jù)加載到前臺的下拉列表中,此時用戶可以選擇下拉列表中的元數(shù)據(jù)進行搜索條件的自由組合;最后,根據(jù)組合后的查詢條件執(zhí)行搜索,就可以檢索到匹配查詢條件且在權限范圍內的電子文件信息列表。
[0030]以上通過分別描述每個過程的實施場景案例,詳細描述了本發(fā)明,本領域的技術人員應能理解,在不脫離本發(fā)明實質的范圍內,可以作修改和變形,比如部分模塊的剝離使用和將系統(tǒng)嵌入于其他應用系統(tǒng)中。
【權利要求】
1.一種電子文件安全檢索的方法,其特征在于包括以下步驟: (1)實時索引:在電子文件歸檔時或在歸檔后執(zhí)行電子文件更新操作時,索引組件對電子文件進行實時索引并將結果更新到索引文件; (2)實時搜索:索引文件內容發(fā)生變化后,索引器通知搜索器對索引文件進行重新定向; (3)在系統(tǒng)中配置用戶及用戶組的電子文件訪問控制列表,在用戶檢索文件前,系統(tǒng)分別查找當前用戶及其所在用戶組的電子文件訪問控制列表,取得用戶及其所在用戶組中含有“瀏覽內容”權限的所有電子文件的集合,作為用戶安全檢索結果的過濾器;若用戶沒有登錄系統(tǒng),進入檢索界面,輸入檢索條件,檢索的結果為空;已經(jīng)登錄系統(tǒng)的用戶,輸入檢索條件后,系統(tǒng)根據(jù)檢索條件使用搜索器搜索檢索文件中的電子文件,使用過濾器過濾搜索結果。
2.一種電子文件安全檢索的方法,其特征在于還包括:向用戶提供高級檢索入口,用戶根據(jù)電子文件的元數(shù)據(jù)自定義查詢條件,根據(jù)自定義的查詢條件搜索出權限范圍內的電子文件。
【文檔編號】G06F17/30GK103823902SQ201410099615
【公開日】2014年5月28日 申請日期:2014年3月18日 優(yōu)先權日:2014年3月18日
【發(fā)明者】王玉, 陳萬江, 張衛(wèi), 殷建琳, 張曉波 申請人:南京新模式軟件集成有限公司