基于虛擬打印的電子檔案自動(dòng)采集系統(tǒng)及采集方法【專利摘要】本發(fā)明涉及信息領(lǐng)域,具體是指一種基于虛擬打印機(jī)的電子檔案自動(dòng)采集系統(tǒng)及其使用方法。基于虛擬打印機(jī)的電子檔案自動(dòng)采集系統(tǒng),包括,客戶端,用于發(fā)出虛擬打印機(jī)打印指令并對(duì)經(jīng)過身份認(rèn)證的客戶指令打印生成通用格式的電子文件,并將客戶端的身份認(rèn)證信息及電子文件通過網(wǎng)絡(luò)傳輸給服務(wù)器端;服務(wù)器端,用于驗(yàn)證客戶端用戶的身份,接收客戶端傳送過來的電子文件。基于虛擬打印的電子檔案自動(dòng)化采集系統(tǒng)都將非常有效解決上述存在的困境。既簡(jiǎn)化并縮短了從檔案歸檔到提供利用的操作復(fù)雜度及時(shí)間周期,同時(shí)又歸避了由對(duì)紙質(zhì)檔案數(shù)字化而產(chǎn)生的所有可能產(chǎn)生的質(zhì)量問題?!緦@f明】基于虛擬打印的電子檔案自動(dòng)采集系統(tǒng)及采集方法【
技術(shù)領(lǐng)域:
】[0001]本發(fā)明涉及信息領(lǐng)域,具體是指一種基于虛擬打印機(jī)的電子檔案自動(dòng)采集系統(tǒng)及采集方法?!?br>背景技術(shù):
】[0002]隨著學(xué)校信息化建設(shè)的不斷發(fā)展,學(xué)校各部門電子文件的產(chǎn)生量日益巨大,大量的電子文件從各個(gè)管理與職能部門的業(yè)務(wù)系統(tǒng)中產(chǎn)生。電子文件和紙質(zhì)文件的雙套制管理模式,是檔案工作的現(xiàn)行管理模式。比如說,教學(xué)是高校的主體,僅從教學(xué)這條線來講,各層次學(xué)生基本信息及其在校其間的學(xué)籍信息,是教學(xué)類檔案的重要組成部分。此類檔案,在收集或采集時(shí),均是每年均由本科生院、研究生院以及繼續(xù)教育學(xué)院,通過自己的教務(wù)系統(tǒng),向檔案館打印成紙質(zhì)的來移交歸檔,但是其對(duì)應(yīng)的電子文件,則都由檔案館在紙質(zhì)文件歸檔后進(jìn)行掃描加工,形成電子文件,再對(duì)外提供利用。由于數(shù)量大,整個(gè)掃描加工過程需要花相當(dāng)?shù)臅r(shí)間和人力才能完成,而且掃描過程中,對(duì)掃描質(zhì)量的控制變得非常重要,對(duì)原始紙質(zhì)檔案的清晰度要求也高,這樣掃描的結(jié)果才能符合利用的要求,其中的任何一個(gè)環(huán)節(jié)出現(xiàn)問題,都會(huì)對(duì)整體掃描質(zhì)量直至最后的利用環(huán)節(jié)產(chǎn)生影響。[0003]可見在實(shí)際歸檔前的電子文件不能被有效利用,導(dǎo)致檔案館收集紙質(zhì)文件又須花費(fèi)費(fèi)用掃描成電子文件,成本高,效率低,而且掃描的質(zhì)量又不能有效把控?!?br/>發(fā)明內(nèi)容】[0004]為了解決以上問題,本發(fā)明提供了一種可以電子化傳輸和管理的基于虛擬打印機(jī)的電子檔案自動(dòng)采集系統(tǒng)及采集方法。[0005]基于虛擬打印機(jī)的電子檔案自動(dòng)采集系統(tǒng),包括,[0006]客戶端,用于發(fā)出虛擬打印機(jī)打印指令,并將客戶端的身份認(rèn)證信息及請(qǐng)求打印的數(shù)據(jù)通過網(wǎng)絡(luò)傳輸給服務(wù)器端;[0007]服務(wù)器端,用于驗(yàn)證客戶端用戶的身份,接收客戶端傳送過來的請(qǐng)求打印的數(shù)據(jù)并生成電子文件。[0008]其中,[0009]所述客戶端將請(qǐng)求打印的數(shù)據(jù)經(jīng)加密后通過網(wǎng)絡(luò)傳輸;服務(wù)器端接收到請(qǐng)求打印的數(shù)據(jù)后進(jìn)行解密、加工、數(shù)據(jù)分析,并生成通用格式的電子文件,每個(gè)電子文件帶有一個(gè)識(shí)別碼;[0010]所述服務(wù)器端生成的電子文件加密,并通過網(wǎng)絡(luò)傳輸傳送到客戶端;客戶端接收到上述電子文件后,則提示用戶保存或者選擇打印機(jī)打印成紙質(zhì)文件,所述紙質(zhì)文件附帶有和電子文件相同的識(shí)別碼。[0011]優(yōu)選的,所述識(shí)別碼的形式為:一串文字、二維碼圖片、條形碼圖片,以及其它可支持特定設(shè)備識(shí)別的形式。[0012]優(yōu)選的,所述虛擬打印機(jī)是一種軟件程式,模擬實(shí)現(xiàn)打印機(jī)的功能,打印文件;所述身份認(rèn)證采用的方式為:用戶在客戶端輸入賬號(hào)及密碼,然后網(wǎng)絡(luò)請(qǐng)求至服務(wù)器端進(jìn)行認(rèn)證用戶輸入的賬號(hào)及密碼是否正確,或使用用戶的數(shù)字證書,或使用第三方身份認(rèn)證平臺(tái);所述通用格式的電子文件為PDF格式;所述加解密/網(wǎng)絡(luò)傳輸使用TCP/IP作為網(wǎng)絡(luò)傳輸協(xié)議,同時(shí)使用HTTP協(xié)議作為數(shù)據(jù)傳送協(xié)議。[0013]優(yōu)選的,所述加工、數(shù)據(jù)分析為系統(tǒng)針對(duì)檔案歸檔業(yè)務(wù)需求提供的以下處理功能:OCR識(shí)別與模式匹配功能、識(shí)別碼生成功能和服務(wù)器端文件存儲(chǔ)及管理功能。[0014]優(yōu)選的,服務(wù)器端文件存儲(chǔ)及管理功能包括:[0015](I)支持按部門定義文件夾,使得電子文件自動(dòng)歸屬到相應(yīng)的部門文件夾下;[0016](2)支持自定義電子文件自動(dòng)生成名稱;[0017](3)支持按元數(shù)據(jù)項(xiàng)進(jìn)行檢索與二次檢索;[0018](4)支持根據(jù)電子文件匹配的模板進(jìn)行自動(dòng)分類,如發(fā)文、學(xué)籍卡等;[0019](5)支持文件壓縮與加密存儲(chǔ);[0020](6)支持二維碼檢索;[0021](7)支持電子公章和電子簽名章的應(yīng)用;[0022](8)支持WS接口方式及XML方式電子文件批量導(dǎo)出;[0023](9)支持電子文件的全量備份、增量備份、異機(jī)備份等多種形式;[0024](10)支持對(duì)特異性數(shù)據(jù)來源的元數(shù)據(jù)分析功能;[0025](11)支持管理與上傳電子文件模板;[0026](12)支持?jǐn)U展數(shù)據(jù)接口,使與紙質(zhì)材料二維碼相對(duì)應(yīng)的電子文件、歸檔附加信息等傳遞到“預(yù)立卷系統(tǒng)”或“數(shù)檔系統(tǒng)”。[0027]另外本發(fā)明還提供了一種電子檔案采集方法。[0028]基于虛擬打印機(jī)的電子檔案自動(dòng)采集方法,包括如下步驟:[0029]I)用戶在客戶端使用學(xué)籍系統(tǒng),或OA系統(tǒng),或其它業(yè)務(wù)系統(tǒng)打印網(wǎng)頁(yè)、電子表格或電子文件時(shí),選擇虛擬打印機(jī)進(jìn)行打??;[0030]2)虛擬打印機(jī)接收到打印請(qǐng)求后,判斷當(dāng)前用戶身份是否已認(rèn)證,如果未認(rèn)證,則提示用戶首先將身份認(rèn)證信息通過網(wǎng)絡(luò)傳輸?shù)椒?wù)器端進(jìn)行身份認(rèn)證;[0031]3)身份認(rèn)證通過后,客戶端將請(qǐng)求打印的數(shù)據(jù)經(jīng)加密以及網(wǎng)絡(luò)傳輸,傳送到服務(wù)器端;[0032]4)服務(wù)器端接收到請(qǐng)求的數(shù)據(jù)后進(jìn)行解密、加工、數(shù)據(jù)分析,并生成通用格式的電子文件,所述電子文件帶有一個(gè)識(shí)別碼;[0033]5)服務(wù)器端將上述電子文件加密以及網(wǎng)絡(luò)傳輸,傳送到客戶端;[0034]6)客戶端接收到上述電子文件后,則提示用戶保存或者選擇實(shí)際的打印機(jī)進(jìn)行打印成帶有識(shí)別碼的紙質(zhì)文件。[0035]其中,[0036]所述識(shí)別碼的形式為:一串文字、二維碼圖片、條形碼圖片,以及其它可支持特定設(shè)備識(shí)別的形式;[0037]所述虛擬打印機(jī)是一種軟件程式,模擬實(shí)現(xiàn)打印機(jī)的功能,打印文件;[0038]所述身份認(rèn)證采用的方式為:用戶在客戶端輸入賬號(hào)及密碼,然后網(wǎng)絡(luò)請(qǐng)求至服務(wù)器端進(jìn)行認(rèn)證用戶輸入的賬號(hào)及密碼是否正確,或使用用戶的數(shù)字證書,或使用第三方身份認(rèn)證平臺(tái);[0039]所述通用格式的電子文件為PDF格式;[0040]所述加解密/網(wǎng)絡(luò)傳輸使用TCP/IP作為網(wǎng)絡(luò)傳輸協(xié)議,同時(shí)使用HTTP協(xié)議作為數(shù)據(jù)傳送協(xié)議;[0041]所述加工、數(shù)據(jù)分析為系統(tǒng)針對(duì)檔案歸檔業(yè)務(wù)需求提供的以下處理功能:0CR識(shí)別與模式匹配功能、識(shí)別碼生成功能和服務(wù)器端文件存儲(chǔ)及管理功能。優(yōu)選的,所述服務(wù)器端文件存儲(chǔ)及管理功能包括:[0042](I)支持按部門定義文件夾,使得電子文件自動(dòng)歸屬到相應(yīng)的部門文件夾下;[0043](2)支持自定義電子文件自動(dòng)生成名稱;[0044](3)支持按元數(shù)據(jù)項(xiàng)進(jìn)行檢索與二次檢索;[0045](4)支持根據(jù)電子文件匹配的模板進(jìn)行自動(dòng)分類,如發(fā)文、學(xué)籍卡等;[0046](5)支持文件壓縮與加密存儲(chǔ);[0047](6)支持二維碼檢索;[0048](7)支持電子公章和電子簽名章的應(yīng)用;[0049](8)支持WS接口方式及XML方式電子文件批量導(dǎo)出;[0050](9)支持電子文件的全量備份、增量備份、異機(jī)備份等多種形式;[0051](10)支持對(duì)特異性數(shù)據(jù)來源的元數(shù)據(jù)分析功能;[0052](11)支持管理與上傳電子文件模板;[0053](12)支持?jǐn)U展數(shù)據(jù)接口,使與紙質(zhì)材料二維碼相對(duì)應(yīng)的電子文件、歸檔附加信息等傳遞到“預(yù)立卷系統(tǒng)”或“數(shù)檔系統(tǒng)”。[0054]基于虛擬打印的電子檔案自動(dòng)化采集系統(tǒng)由兩部分組成。[0055]第一部分為,客戶端程式。該程式關(guān)鍵實(shí)現(xiàn)虛擬打印機(jī)。用戶在打印網(wǎng)頁(yè)、電子表格或電子文件時(shí),可以選擇該虛擬打印機(jī)進(jìn)行打印。通過虛擬打印機(jī)可回避對(duì)業(yè)務(wù)系統(tǒng)的技術(shù)介入,不存在考慮接口的問題,通用性強(qiáng),做到與業(yè)務(wù)系統(tǒng)的無關(guān)性。[0056]第二部分為,服務(wù)器端程式。該程式關(guān)鍵實(shí)現(xiàn)驗(yàn)證客戶端用戶的身份,以及接收客戶端傳送過來的電子文件。[0057]不論在學(xué)籍材料的雙套制歸檔,還是在學(xué)校OA系統(tǒng)每年的來文,以及其它學(xué)校業(yè)務(wù)系統(tǒng)中產(chǎn)生的歸檔電子文件歸檔,基于虛擬打印的電子檔案自動(dòng)化采集系統(tǒng)都將非常有效解決上述存在的困境。既簡(jiǎn)化并縮短了從檔案歸檔到提供利用的操作復(fù)雜度及時(shí)間周期,同時(shí)又歸避了由對(duì)紙質(zhì)檔案數(shù)字化而產(chǎn)生的所有可能產(chǎn)生的質(zhì)量問題?!緦@綀D】【附圖說明】[0058]圖1是實(shí)施例1的流程示意圖。[0059]圖2是實(shí)施例2的流程示意圖。[0060]圖3是本發(fā)明實(shí)施例的應(yīng)用模型示意圖?!揪唧w實(shí)施方式】[0061]下面結(jié)合具體實(shí)施例進(jìn)一步闡述本發(fā)明,應(yīng)理解,以下實(shí)施例僅用于說明本發(fā)明而不用于限制本發(fā)明的保護(hù)范圍。[0062]實(shí)施例1[0063]如圖1所示,第一種解決方案如下:[0064](I)用戶在使用學(xué)籍系統(tǒng),或OA系統(tǒng),或其它業(yè)務(wù)系統(tǒng)打印網(wǎng)頁(yè)、電子表格或電子文件時(shí),選擇虛擬打印機(jī)進(jìn)行打印。[0065](2)虛擬打印機(jī)接收到打印請(qǐng)求后,判斷當(dāng)前用戶身份是否已認(rèn)證,如果未認(rèn)證,則提示用戶首先進(jìn)行身份認(rèn)證。[0066](3)身份認(rèn)證通過后,客戶端程式將請(qǐng)求打印的數(shù)據(jù)經(jīng)加密以及網(wǎng)絡(luò)傳輸,傳送到服務(wù)器端程式;[0067](4)服務(wù)器端程式接收到請(qǐng)求的數(shù)據(jù)后進(jìn)行解密、加工、數(shù)據(jù)分析,并生成通用格式的電子文件;[0068](5)服務(wù)器端程式將上述電子文件加密以及網(wǎng)絡(luò)傳輸,傳送到客戶端程式;[0069](6)客戶端程式接收到上述電子文件后,則提示用戶保存或者選擇實(shí)際的打印機(jī)進(jìn)行打印成紙質(zhì)文件;[0070]實(shí)施例2[0071]如圖2所示第二種解決方案如下:[0072](I)用戶在使用學(xué)籍系統(tǒng),或OA系統(tǒng),或其它業(yè)務(wù)系統(tǒng)打印網(wǎng)頁(yè)、電子表格或電子文件時(shí),選擇虛擬打印機(jī)進(jìn)行打印。[0073](2)虛擬打印機(jī)接收到打印請(qǐng)求后,判斷當(dāng)前用戶身份是否已認(rèn)證,如果未認(rèn)證,則提示用戶首先進(jìn)行身份認(rèn)證。[0074](3)身份認(rèn)證通過后,客戶端程式將請(qǐng)求打印的數(shù)據(jù)進(jìn)行加工、數(shù)據(jù)分析,并生成通用格式的電子文件;[0075](4)客戶端程式將上述電子文件以及分析后形成的數(shù)據(jù)經(jīng)加密以及網(wǎng)絡(luò)傳輸,傳送到服務(wù)器端程式;[0076](5)服務(wù)器端程式接收到上述電子文件以及分析數(shù)據(jù)后進(jìn)行解密,再處理;[0077](6)客戶端程式提示用戶保存上述電子文件,或者選擇實(shí)際的打印機(jī)進(jìn)行打印上述電子文件成紙質(zhì)文件;[0078]通過上述兩種解決方法,用戶非常方便的完成了實(shí)現(xiàn)電子文件的自動(dòng)歸檔,以及形成相應(yīng)的紙質(zhì)文件。[0079]⑴識(shí)別碼[0080]為了檔案管操作人員收集到紙質(zhì)文件后,能夠快速實(shí)現(xiàn)紙質(zhì)文件與電子文件的歸檔過程,因此通常在生成通用格式的電子文件時(shí),自動(dòng)為該電子文件加入一個(gè)識(shí)別碼。[0081]識(shí)別碼的形式可以是:一串文字、二維碼圖片、條形碼圖片,以及其它可支持特定設(shè)備識(shí)別的形式。[0082]例如文字識(shí)別碼,檔案館人員在歸檔紙質(zhì)材料時(shí)直接輸入這些文字即可快速檢索到相應(yīng)的電子文件。二維碼、條形碼圖片,檔案館人員在歸檔紙質(zhì)材料時(shí)可使用支持掃描二維碼、條形碼的設(shè)備快速檢索到相應(yīng)的電子文件。[0083](2)虛擬打印機(jī)[0084]虛擬打印機(jī),就是虛擬的打印機(jī),它是一種軟件程式,模擬實(shí)現(xiàn)打印機(jī)的功能,打印文件。虛擬打印機(jī)同真實(shí)打印機(jī)一樣,安裝完畢后,打開“控制面板”中的“打印機(jī)和傳真”,就會(huì)看到所安裝的虛擬打印機(jī),可以像使用一臺(tái)打印機(jī)一樣使用它們。鼠標(biāo)雙擊將其打開,可以對(duì)其“打印首選項(xiàng)”和“屬性”進(jìn)行修改,從而設(shè)定是否共享、可使用時(shí)間、是否后臺(tái)打印和優(yōu)先級(jí),以及紙張大小、版式安排等。它們同樣能截獲所有Windows程序的打印操作,或模擬打印效果,或完成某一特殊功能。[0085](3)身份認(rèn)證[0086]身份認(rèn)證通常采用以下幾種方式:[0087]1.用戶輸入賬號(hào)及密碼,然后網(wǎng)絡(luò)請(qǐng)求至服務(wù)器端程式進(jìn)行認(rèn)證用戶輸入的賬號(hào)及密碼是否正確;[0088]i1.使用用戶的數(shù)字證書;[0089]ii1.使用第三方身份認(rèn)證平臺(tái);[0090]iv.其它身份認(rèn)證方法;[0091](4)通用格式的電子文件[0092]系統(tǒng)默認(rèn)使用PDF作為通用格式。PDF全稱PortableDocumentFormat,譯為〃便攜文檔格式",是一種電子文件格式。這種文件格式與操作系統(tǒng)平臺(tái)無關(guān),也就是說,PDF文件不管是在Windows,Unix還是在蘋果公司的MacOS操作系統(tǒng)中都是通用的。這一'丨生能使它成為在Internet上進(jìn)行電子文檔發(fā)行和數(shù)字化信息傳播的理想文檔格式。同時(shí)TOF文件是以PostScript語(yǔ)言圖象模型為基礎(chǔ),無論在哪種打印機(jī)上都可保證精確的顏色和準(zhǔn)確的打印效果,即PDF會(huì)忠實(shí)地再現(xiàn)原稿的每一個(gè)字符、顏色以及圖象。[0093](5)加解密/網(wǎng)絡(luò)傳輸[0094]使用TCP/IP作為網(wǎng)絡(luò)傳輸協(xié)議,同時(shí)使用HTTP協(xié)議作為數(shù)據(jù)傳送協(xié)議,而且使用HTTP協(xié)議可以有效解決繞開防火墻。HTTPS是在HTTP之上的安全超文本傳輸協(xié)議。HTTPS應(yīng)用了Netscape的完全套接字層(SSL)作為HTTP應(yīng)用層的子層。SSL使用40位關(guān)鍵字作為RC4流加密算法。同時(shí)HTTPS和SSL也支持使用X.509數(shù)字認(rèn)證。[0095]SSL協(xié)議位于TCP/IP協(xié)議與各種應(yīng)用層協(xié)議之間,為數(shù)據(jù)通訊提供安全支持。SSL協(xié)議可分為兩層:SSL記錄協(xié)議(SSLRecordProtocol):它建立在可靠的傳輸協(xié)議(如TCP)之上,為高層協(xié)議提供數(shù)據(jù)封裝、壓縮、加密等基本功能的支持。SSL握手協(xié)議(SSLHandshakeProtocol):它建立在SSL記錄協(xié)議之上,用于在實(shí)際的數(shù)據(jù)傳輸開始前,通訊雙方進(jìn)行身份認(rèn)證、協(xié)商加密算法、交換加密密鑰等。[0096]因此,使用HTTPS為客戶端與服務(wù)器端之間的網(wǎng)絡(luò)傳輸起到如下作用:[0097]I認(rèn)證用戶和服務(wù)器,確保數(shù)據(jù)發(fā)送到正確的客戶機(jī)和服務(wù)器;[0098]Ii加密數(shù)據(jù)以防止數(shù)據(jù)中途被竊??;[0099]Iii維護(hù)數(shù)據(jù)的完整性,確保數(shù)據(jù)在傳輸過程中不被改變。[0100](6)加工、數(shù)據(jù)分析[0101]系統(tǒng)針對(duì)檔案歸檔業(yè)務(wù)需求提供以下幾個(gè)主要的處理功能。[0102]A.0CR識(shí)別與模式匹配[0103]通過虛擬打印機(jī)接管請(qǐng)求打印的電子原件,如果為圖像,則經(jīng)過OCR識(shí)別技術(shù)自動(dòng)識(shí)別出中文,同時(shí)結(jié)合模式庫(kù)對(duì)這些中文進(jìn)行抽取元數(shù)據(jù)。如果為其它格式的文檔,則結(jié)合模式庫(kù)對(duì)這些文檔進(jìn)行抽取元數(shù)據(jù)。[0104]OCR識(shí)別可以使用Tesseract的OCR引擎。Tesseract的OCR引擎最先由HP實(shí)驗(yàn)室于1985年開始研發(fā),至1995年時(shí)已經(jīng)成為OCR業(yè)內(nèi)最準(zhǔn)確的三款識(shí)別引擎之一。Tesseract目前已作為開源項(xiàng)目發(fā)布在GoogleProject。[0105]模式庫(kù)主要有幾種類型。一種類型是在識(shí)別出中文的基礎(chǔ)上,根據(jù)出現(xiàn)的前后順序建立的模板。另一種類型是基于元數(shù)據(jù)出現(xiàn)的XY位置而建立的模板。另外就是根據(jù)特定文檔通過外掛程式進(jìn)行準(zhǔn)確抽取元數(shù)據(jù)。通過這些模板對(duì)電子原件進(jìn)行元數(shù)據(jù)分析,抽取元數(shù)據(jù)信息。如發(fā)文,則元數(shù)據(jù)有發(fā)文的主題、發(fā)文單位、文號(hào)、日期等。如成績(jī)信息,則有學(xué)生姓名、年級(jí)、班級(jí)、學(xué)號(hào)、學(xué)期等。還有一種類型是基于語(yǔ)義進(jìn)行識(shí)別。[0106]B.生成識(shí)別碼[0107]在生成通用格式的電子文件時(shí),自動(dòng)為該電子文件加入一個(gè)識(shí)別碼。識(shí)別碼的形式支持文字、二維碼、條形碼等。[0108]C.服務(wù)器端文件存儲(chǔ)及管理[0109]支持按部門定義文件夾,使得電子文件自動(dòng)歸屬到相應(yīng)的部門文件夾下;[0110]支持自定義電子文件自動(dòng)生成名稱;[0111]支持按元數(shù)據(jù)項(xiàng)進(jìn)行檢索與二次檢索;[0112]支持根據(jù)電子文件匹配的模板進(jìn)行自動(dòng)分類,如發(fā)文、學(xué)籍卡等;[0113]支持文件壓縮與加密存儲(chǔ);[0114]支持二維碼檢索;[0115]支持電子公章和電子簽名章的應(yīng)用;[0116]支持WS接口方式及XML方式電子文件批量導(dǎo)出;[0117]支持電子文件的全量備份、增量備份、異機(jī)備份等多種形式;[0118]支持對(duì)特異性數(shù)據(jù)來源的元數(shù)據(jù)分析功能;[0119]支持管理與上傳電子文件模板(即為模式庫(kù));[0120]支持?jǐn)U展數(shù)據(jù)接口,使與紙質(zhì)材料二維碼相對(duì)應(yīng)的電子文件、歸檔附加信息等傳遞到“預(yù)立卷系統(tǒng)”或“數(shù)檔系統(tǒng)”。[0121]D.其它功能模塊[0122]如圖3所示描述了實(shí)際兼職檔案員操作的應(yīng)用模型。兼職檔案員針對(duì)需打印生成的紙質(zhì)歸檔原件,通過系統(tǒng)上述步驟形成相應(yīng)的電子文件及紙質(zhì)材料。另外針對(duì)對(duì)于已存在的紙質(zhì)歸檔實(shí)體與對(duì)應(yīng)電子文件,通過適度改進(jìn)業(yè)務(wù)系統(tǒng),使系統(tǒng)能夠獲取相應(yīng)目錄數(shù)據(jù)信息及其電子文件,這些作為主體歸檔材料,同時(shí)業(yè)務(wù)辦理過程形成的過程信息與過程文件,仍然可以通過系統(tǒng)上述步驟,打印生成業(yè)務(wù)過程紙質(zhì)原件與電子文件。【權(quán)利要求】1.基于虛擬打印機(jī)的電子檔案自動(dòng)采集系統(tǒng),其特征在于:包括,客戶端,用于發(fā)出虛擬打印機(jī)打印指令,并將客戶端的身份認(rèn)證信息及請(qǐng)求打印的數(shù)據(jù)通過網(wǎng)絡(luò)傳輸給服務(wù)器端;服務(wù)器端,用于驗(yàn)證客戶端用戶的身份,接收客戶端傳送過來的請(qǐng)求打印的數(shù)據(jù)并生成電子文件;其中,所述客戶端將請(qǐng)求打印的數(shù)據(jù)經(jīng)加密后通過網(wǎng)絡(luò)傳輸;服務(wù)器端接收到請(qǐng)求打印的數(shù)據(jù)后進(jìn)行解密、加工、數(shù)據(jù)分析,并生成通用格式的電子文件,每個(gè)電子文件帶有一個(gè)識(shí)別碼;所述服務(wù)器端生成的電子文件加密,并通過網(wǎng)絡(luò)傳輸傳送到客戶端;客戶端接收到上述電子文件后,則提示用戶保存或者選擇打印機(jī)打印成紙質(zhì)文件,所述紙質(zhì)文件附帶有和電子文件相同的識(shí)別碼。2.根據(jù)權(quán)利要求1所述的基于虛擬打印機(jī)的電子檔案自動(dòng)采集系統(tǒng),其特征在于:所述識(shí)別碼的形式為:一串文字、二維碼圖片、條形碼圖片,以及其它可支持特定設(shè)備識(shí)別的形式。3.根據(jù)權(quán)利要求1或2所述的基于虛擬打印機(jī)的電子檔案自動(dòng)采集系統(tǒng),其特征在于:所述虛擬打印機(jī)是一種軟件程式,模擬實(shí)現(xiàn)打印機(jī)的功能,打印文件;所述身份認(rèn)證采用的方式為:用戶在客戶端輸入賬號(hào)及密碼,然后網(wǎng)絡(luò)請(qǐng)求至服務(wù)器端進(jìn)行認(rèn)證用戶輸入的賬號(hào)及密碼是否正確,或使用用戶的數(shù)字證書,或使用第三方身份認(rèn)證平臺(tái);所述通用格式的電子文件為PDF格式;所述加解密/網(wǎng)絡(luò)傳輸使用TCP/IP作為網(wǎng)絡(luò)傳輸協(xié)議,同時(shí)使用HTTP協(xié)議作為數(shù)據(jù)傳送協(xié)議。4.根據(jù)權(quán)利要求1-3任一所述的基于虛擬打印機(jī)的電子檔案自動(dòng)采集系統(tǒng),其特征在于:所述加工、數(shù)據(jù)分析為系統(tǒng)針對(duì)檔案歸檔業(yè)務(wù)需求提供的以下處理功能=OCR識(shí)別與模式匹配功能、識(shí)別碼生成功能和服務(wù)器端文件存儲(chǔ)及管理功能。5.根據(jù)權(quán)利要求4所述的基于虛擬打印機(jī)的電子檔案自動(dòng)采集系統(tǒng),其特征在于:月艮務(wù)器端文件存儲(chǔ)及管理功能包括:(1)支持按部門定義文件夾,使得電子文件自動(dòng)歸屬到相應(yīng)的部門文件夾下;(2)支持自定義電子文件自動(dòng)生成名稱;(3)支持按元數(shù)據(jù)項(xiàng)進(jìn)行檢索與二次檢索;(4)支持根據(jù)電子文件匹配的模板進(jìn)行自動(dòng)分類,如發(fā)文、學(xué)籍卡等;(5)支持文件壓縮與加密存儲(chǔ);(6)支持二維碼檢索;(7)支持電子公章和電子簽名章的應(yīng)用;(8)支持WS接口方式及XML方式電子文件批量導(dǎo)出;(9)支持電子文件的全量備份、增量備份、異機(jī)備份等多種形式;(10)支持對(duì)特異性數(shù)據(jù)來源的元數(shù)據(jù)分析功能;(11)支持管理與上傳電子文件模板;(12)支持?jǐn)U展數(shù)據(jù)接口,使與紙質(zhì)材料二維碼相對(duì)應(yīng)的電子文件、歸檔附加信息等傳遞到“預(yù)立卷系統(tǒng)”或“數(shù)檔系統(tǒng)”。6.基于虛擬打印機(jī)的電子檔案自動(dòng)采集方法,其特征在于:包括如下步驟:1)用戶在客戶端使用學(xué)籍系統(tǒng),或OA系統(tǒng),或其它業(yè)務(wù)系統(tǒng)打印網(wǎng)頁(yè)、電子表格或電子文件時(shí),選擇虛擬打印機(jī)進(jìn)行打??;2)虛擬打印機(jī)接收到打印請(qǐng)求后,判斷當(dāng)前用戶身份是否已認(rèn)證,如果未認(rèn)證,則提示用戶首先將身份認(rèn)證信息通過網(wǎng)絡(luò)傳輸?shù)椒?wù)器端進(jìn)行身份認(rèn)證;3)身份認(rèn)證通過后,客戶端將請(qǐng)求打印的數(shù)據(jù)經(jīng)加密以及網(wǎng)絡(luò)傳輸,傳送到服務(wù)器端;4)服務(wù)器端接收到請(qǐng)求的數(shù)據(jù)后進(jìn)行解密、加工、數(shù)據(jù)分析,并生成通用格式的電子文件,所述電子文件帶有一個(gè)識(shí)別碼;5)服務(wù)器端將上述電子文件加密以及網(wǎng)絡(luò)傳輸,傳送到客戶端;6)客戶端接收到上述電子文件后,則提示用戶保存或者選擇實(shí)際的打印機(jī)進(jìn)行打印成帶有識(shí)別碼的紙質(zhì)文件。7.根據(jù)權(quán)利要求所述的基于虛擬打印機(jī)的電子檔案自動(dòng)采集方法,其特征在于:所述識(shí)別碼的形式為:一串文字、二維碼圖片、條形碼圖片,以及其它可支持特定設(shè)備識(shí)別的形式;所述虛擬打印機(jī)是一種軟件程式,模擬實(shí)現(xiàn)打印機(jī)的功能,打印文件;所述身份認(rèn)證采用的方式為:用戶在客戶端輸入賬號(hào)及密碼,然后網(wǎng)絡(luò)請(qǐng)求至服務(wù)器端進(jìn)行認(rèn)證用戶輸入的賬號(hào)及密碼是否正確,或使用用戶的數(shù)字證書,或使用第三方身份認(rèn)證平臺(tái);所述通用格式的電子文件為PDF格式;所述加解密/網(wǎng)絡(luò)傳輸使用TCP/IP作為網(wǎng)絡(luò)傳輸協(xié)議,同時(shí)使用HTTP協(xié)議作為數(shù)據(jù)傳送協(xié)議;所述加工、數(shù)據(jù)分析為系統(tǒng)針對(duì)檔案歸檔業(yè)務(wù)需求提供的以下處理功能:0CR識(shí)別與模式匹配功能、識(shí)別碼生成功能和服務(wù)器端文件存儲(chǔ)及管理功能。8.根據(jù)權(quán)利要求7所述的基于虛擬打印機(jī)的電子檔案自動(dòng)采集方法,其特征在于:所述服務(wù)器端文件存儲(chǔ)及管理功能包括:(1)支持按部門定義文件夾,使得電子文件自動(dòng)歸屬到相應(yīng)的部門文件夾下;(2)支持自定義電子文件自動(dòng)生成名稱;(3)支持按元數(shù)據(jù)項(xiàng)進(jìn)行檢索與二次檢索;(4)支持根據(jù)電子文件匹配的模板進(jìn)行自動(dòng)分類,如發(fā)文、學(xué)籍卡等;(5)支持文件壓縮與加密存儲(chǔ);(6)支持二維碼檢索;(7)支持電子公章和電子簽名章的應(yīng)用;(8)支持WS接口方式及XML方式電子文件批量導(dǎo)出;(9)支持電子文件的全量備份、增量備份、異機(jī)備份等多種形式;(10)支持對(duì)特異性數(shù)據(jù)來源的元數(shù)據(jù)分析功能;(11)支持管理與上傳電子文件模板;(12)支持?jǐn)U展數(shù)據(jù)接口,使與紙質(zhì)材料二維碼相對(duì)應(yīng)的電子文件、歸檔附加信息等傳遞到“預(yù)立卷系統(tǒng)”或“數(shù)檔系統(tǒng)”?!疚臋n編號(hào)】G06F3/12GK103973692SQ201410202184【公開日】2014年8月6日申請(qǐng)日期:2014年5月13日優(yōu)先權(quán)日:2014年5月13日【發(fā)明者】胡志富,濮永革,張軍申請(qǐng)人:浙江大學(xué)