国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      用于自動和動態(tài)地構(gòu)建文件管理應用程序的方法和系統(tǒng)的制作方法

      文檔序號:6650379閱讀:279來源:國知局
      專利名稱:用于自動和動態(tài)地構(gòu)建文件管理應用程序的方法和系統(tǒng)的制作方法
      技術領域
      本發(fā)明總的涉及內(nèi)容管理。更具體地,本發(fā)明涉及一種內(nèi)容管理應用程序,其應用相關文件分析、元數(shù)據(jù)抽取和業(yè)務處理相關算法及方法來自動和動態(tài)地對文件進行分類,以便路由、處理和執(zhí)行定制的業(yè)務邏輯。
      背景技術
      內(nèi)容管理被定義為在任何介質(zhì)中或以任何格式建立、組織、管理和存儲數(shù)字作品集合的軟件。內(nèi)容管理是指處理各種類型的結(jié)構(gòu)化和非結(jié)構(gòu)化的信息的過程,該結(jié)構(gòu)化和非結(jié)構(gòu)化信息包括圖像和文件,可包括帳單數(shù)據(jù)、用戶服務信息和其它類型的內(nèi)容。內(nèi)容管理還指的是捕獲、存儲、分類、編碼、集成、更新和保護任何和全部信息的過程。研究估算超過75%的企業(yè)數(shù)據(jù)是非結(jié)構(gòu)化和與文件相關的(Lyman Peter等人著“多少信息,2000”,http://www.sims.berkeley.edu/how-much-info.)。
      內(nèi)容管理市場的關鍵技術包括文件管理、網(wǎng)絡內(nèi)容管理、數(shù)字資產(chǎn)管理和記錄管理。內(nèi)容管理的典型用戶在文件量大的產(chǎn)業(yè)中,其中文件管理是基本需求,通常由于管理和服從的原因。內(nèi)容包括許多不同形式的需要管理的非結(jié)構(gòu)化數(shù)據(jù)業(yè)務文件、動態(tài)網(wǎng)絡內(nèi)容、記錄管理和豐富媒體。業(yè)務文件包括合同、發(fā)貨單、表格和電子郵件。舉例來說,業(yè)務文件能方便內(nèi)部后-辦公室處理及與用戶、合作伙伴和供應商直接外部通信。動態(tài)網(wǎng)絡內(nèi)容包括有關數(shù)據(jù)庫中的業(yè)務數(shù)據(jù)和個人化信息。記錄管理典型地由政府和工業(yè)規(guī)范來驅(qū)動以便有效進行文件處理、審計索引和數(shù)據(jù)保留。豐富媒體包括數(shù)字音頻和視頻。豐富媒體是許多產(chǎn)業(yè)中培訓、教育、營銷和用戶關系管理中的快速變化領域。
      將文件管理與工作流相關的概念已經(jīng)通用了幾十年,許多文件管理系統(tǒng)包括該特征。一個傳統(tǒng)的方法用涉及為一個機器工具公司提供處理的案例研究來對集成文件和工作流管理的問題提供工具和方法(Morschheuser,S.,等著的“應用到機器工具公司的提供處理的集成文件和工作流管理”,有組織的計算系統(tǒng)會議公報,1995)。該傳統(tǒng)方法為一種過程定義語言,使得帶有工作流引擎的面向文件的工具更加高效。
      另一傳統(tǒng)方法將活動文件特性的思想利用到文件管理應用程序(Dourish,P.,等人著“利用用戶特定活動特性延伸文件管理系統(tǒng)”,信息系統(tǒng)的ACM學報(TOIS),第18卷,第2期,2000)。該傳統(tǒng)方法避免以前的分層存儲機制,而反映對用戶任務很有意義的文件分類,提供統(tǒng)一交互架構(gòu)中一個或多個個體的想法的集成手段。基于特性的文件管理系統(tǒng)增加了活動特性的概念,以便在特性基礎結(jié)構(gòu)上提供基于文件的服務,該活動特性載有可執(zhí)行碼。
      而另一傳統(tǒng)的系統(tǒng)捕獲基本的自由結(jié)構(gòu)化文件,諸如典型地用于辦公室領域中的文件(Mattos,N.M.,等人著“集成辦公室文件處理和管理的方法”,ACM SIGOIS公報,辦公室信息系統(tǒng)會議公報,第11卷,第2-3期,1990)。該傳統(tǒng)系統(tǒng)易于處理包含信息。分析過的文件存儲在文件管理系統(tǒng)中,該文件管理系統(tǒng)連接到幾個不同的后續(xù)服務并用作基本工作流。
      FileNet提供一種結(jié)合了文件技術的工作流引擎來分別自動操作制造和特別業(yè)務處理(Whelan,D“FileNet集成文件管理數(shù)據(jù)庫使用和問題”,ACM SIGMOD記錄,數(shù)據(jù)管理1998ACM SIGMOD國際會議學報,第27卷,第2期,1998)。
      大多數(shù)傳統(tǒng)文件管理系統(tǒng)由一相關模型支持。關于有關的關系模型研究,關系方案的正式模型化源自對運行時間方面的強調(diào),諸如查詢表達(Andries M等人著“用于延伸的實體關系模型的混合查詢語言”,視覺語言和計算期刊,8(1),1997,視覺查詢系統(tǒng)特刊;和Angelaccio M等人著“QBD*完全視覺查詢系統(tǒng)”,視覺語言和計算期刊,1(2),255-273,1990)、查詢結(jié)果顯示和對存儲數(shù)據(jù)的導航??偟膩碚f,這些任務稱作視覺查詢系統(tǒng)(VQS)(Catarci,T.,等人著“數(shù)據(jù)庫的視覺查詢系統(tǒng)一個調(diào)查”技術報告SI/RR-95/17,Dipartimentodi Scienze dell’Informazione,Universita’di Roma“La Sapienza”1995)。
      對比來說,在用于定義和操作數(shù)據(jù)模型和數(shù)據(jù)庫方案的工具所提供的接口方面,傳統(tǒng)系統(tǒng)投入的注意力較少。商用數(shù)據(jù)庫建模產(chǎn)品(例如Ration工具)提供視覺數(shù)據(jù)建模文檔,其集成到更廣泛的軟件開發(fā)周期中(Gornik D,“UML數(shù)據(jù)建模文檔”,IBM Rational軟件白紙TP 16205/02,2003)。這些文檔通常適應于關系數(shù)據(jù)庫的UML(統(tǒng)一建模語言)建模。由Wisconsin大學開發(fā)的OPOSSUM系統(tǒng)允許數(shù)據(jù)庫方案通過方案可視化操作來編輯(Haber,E.M.等人著“OPOSSUM靈活的方案可視化和編輯工具”,1994ACM CHI會議公報,MA波士頓,1994年4月;Haber,E.M.等人著“Opossum通過可定制的可視化的桌面方案管理”,于第21次國際VLDB會議公報,第527-538頁,瑞典Zurich,1995年9月)。
      文件管理系統(tǒng)典型地包括文件理解和分類的某些方面來支持業(yè)務處理。已經(jīng)有人探索了分類機器打印的文件的通常問題,其中視覺布局是識別精細?;悇e的一個關鍵因素,這是因為文件內(nèi)容特征相似。文件管理的一個傳統(tǒng)方法利用從文件頁的掃描二進制圖像檢測的布局結(jié)構(gòu),而不利用光學字符識別(OCR)結(jié)果,而是利用屬性關系圖(Bagdanov,A.D.,等人著“利用一階隨機圖形的精細?;募诸悺?,ICDAR01學報)。
      另一傳統(tǒng)系統(tǒng)在布局上利用基于“邏輯近似性”的學習技術,其中定向的權(quán)重圖用于代表文件布局(Li,X.,等人著“帶有學習能力的文件分類和抽取系統(tǒng)”,ICDAR99學報)。而另一傳統(tǒng)系統(tǒng)利用基于視覺相似性的文件分類(Hu,J等人著“文件圖像布局比較和分類”,ICDAR99學報)。在該傳統(tǒng)系統(tǒng)中,引入間隔編碼法來捕獲空間布局的元素。這些傳統(tǒng)系統(tǒng)提出基于隱馬爾可夫模型的頁面布局分類系統(tǒng),該系統(tǒng)是可以基于空間特征可訓練和延伸的。
      另一傳統(tǒng)系統(tǒng)利用面向用戶的掃描圖像部分的“快速捕獲”,其包括易于訪問、編輯、和分配到需要的目的地(如檔案、應用程序和網(wǎng)頁等)的工具(Simske,S.J等人著“編輯和創(chuàng)作面向用戶的掃描圖像的分析”,文件工程2003ACM論壇公報,2003)。這些工具利用面向用戶的分區(qū)分析(公知為“點擊與選擇”)和基于統(tǒng)計的區(qū)域分類?!包c擊與選擇”包含從下向上的分區(qū)分析引擎?;诮y(tǒng)計的區(qū)域分類允許區(qū)域的快速重構(gòu)。
      雖然這些傳統(tǒng)技術被證明是有用的,但還需要進一步的改進。文件管理應用程序的生命周期典型地包括以下階段a)內(nèi)容的攝取(ingest)或捕獲;b)管理(包括搜索、檢取和工作流);c)在業(yè)務過程結(jié)束時完成;以及d)由于服從和規(guī)定的原因而建檔。
      攝取或捕獲階段典型地產(chǎn)生關于進入文件的元數(shù)據(jù),并將該文件與內(nèi)容管理系統(tǒng)中定義的方案關聯(lián)起來。相關于一個方案的元數(shù)據(jù)使得管理階段能在業(yè)務處理和工作流的上下文中有效地搜索數(shù)據(jù)庫。在完成了相關于處理的所有管理和事務之后,可以觸發(fā)完成(fulfillment)動作,諸如通知、與其它系統(tǒng)(如記帳、支付、記錄等)的集成。如果文件需要保留一固定的時間段用于審計,可以在斷線存儲器中建檔。
      傳統(tǒng)的文件管理系統(tǒng)在分開的捕獲子系統(tǒng)中管理攝取階段,這些子系統(tǒng)使得元數(shù)據(jù)在分開的環(huán)境中規(guī)定。傳統(tǒng)文件管理系統(tǒng)中應該管理的數(shù)據(jù)放置在不同的位置,如不同的業(yè)務分支、相對于主辦公室的現(xiàn)場辦公室等。隨后文件被“釋放”到文件管理系統(tǒng)。由于這些捕獲子系統(tǒng)經(jīng)常是從總的內(nèi)容管理系統(tǒng)中分離出來的,所抽取的元數(shù)據(jù)被松散地連到方案和業(yè)務處理。其結(jié)果是,經(jīng)常有相關于元數(shù)據(jù)的實際分配和相關于具體方案和處理的一個人工步驟,這導致總的上下文的效率降低。例如,一個業(yè)務需要的數(shù)據(jù)典型地通常由人工成批地收集和處理。此外,在管理階段之后,攝取階段總是與業(yè)務處理的完成或觸發(fā)沒有聯(lián)系。
      因此需要一種系統(tǒng)、一種服務、一種計算機程序產(chǎn)品和相關的方法,用來自動、動態(tài)和有選擇地構(gòu)建(compose)和管理數(shù)據(jù)和文件。這種需求目前尚未得到滿足。

      發(fā)明內(nèi)容
      本發(fā)明滿足這一需要提供一個系統(tǒng)、一種服務、一個計算機程序產(chǎn)品和一相關方法(這里統(tǒng)稱為“該系統(tǒng)”或“本系統(tǒng)”),用于應用相關文件分析、元數(shù)據(jù)抽取、業(yè)務處理相關算法和方法來自動、動態(tài)和選擇性地分類文件,以進行路由、處理和執(zhí)行定制的業(yè)務邏輯。
      本發(fā)明提供一種智能文件管理架構(gòu),具有相關文件分析、元數(shù)據(jù)抽取和業(yè)務處理相關算法和方法。本系統(tǒng)從一個或多個通道接受文件-掃描紙件、打印數(shù)據(jù)流、來自桌上電腦的電子文件,分類這些文件并抽取元數(shù)據(jù),執(zhí)行定制的應用文檔并觸發(fā)與該處理有關的業(yè)務邏輯。
      本發(fā)明包括一個元數(shù)據(jù)提示模塊、一個元數(shù)據(jù)抽取模塊、業(yè)務處理過程、一個驗證模塊和一個執(zhí)行模塊。元數(shù)據(jù)提示模塊安裝在諸如掃描儀或打印機的輸入設備中。當用戶通過輸入設備將一個文件輸入到本系統(tǒng)中時,元數(shù)據(jù)提示模塊通過一個或多個提示從用戶請求關于該文件的信息。這些提示的形式可以是選擇、按鈕點擊、文本輸入等。在一個實施例中,元數(shù)據(jù)提示模塊安裝在具有元數(shù)據(jù)抽取模塊的服務器上。元數(shù)據(jù)抽取模塊自動從文件中抽取元數(shù)據(jù)。
      執(zhí)行模塊安裝在網(wǎng)關上。在一個實施例中,執(zhí)行模塊安裝在帶有元數(shù)據(jù)抽取模塊的服務器上。執(zhí)行模塊恢復文件和來自服務器的相關元數(shù)據(jù)。執(zhí)行模塊如確定的文件和相關元數(shù)據(jù)那樣,選擇性地、自動地執(zhí)行業(yè)務處理中的指令。
      業(yè)務處理包括由執(zhí)行模塊執(zhí)行的指令。這些指令逐文件地選擇地被執(zhí)行,逐文件基礎是從文件分類確定的。用戶可以對于每個文件類型選擇執(zhí)行業(yè)務處理的哪個指令。進一步,用戶可以在本系統(tǒng)操作時修正指令的選擇而不改變執(zhí)行模塊的任何部分并且不關閉本系統(tǒng)或重啟本系統(tǒng)。如相關元數(shù)據(jù)和業(yè)務處理確定的,執(zhí)行模塊將文件和相關元數(shù)據(jù)發(fā)送到一個或多個輸出設備。
      傳統(tǒng)的內(nèi)容管理系統(tǒng)構(gòu)成一個單一的架構(gòu),其利用一個共有基礎結(jié)構(gòu)緊密地將收取階段和管理階段及完成階段連在一起。相比較而言,本系統(tǒng)利用動態(tài)和靈活的架構(gòu),該架構(gòu)使得相關于文件管理處理的周期次數(shù)顯著減少,提供了處理中的總體效率。
      傳統(tǒng)內(nèi)容管理系統(tǒng)依賴具有特征的可預測位置的結(jié)構(gòu)化的形式,通常僅僅在視覺特征上操作。本系統(tǒng)包括業(yè)務處理形式的一個規(guī)則引擎,來檢測和分類非結(jié)構(gòu)化形式和結(jié)構(gòu)化形式,這里屬性和視覺布局的位置不是固定的。本系統(tǒng)使用規(guī)則謂語中的文件布局及布局內(nèi)的文本內(nèi)容來檢測和分類文件。由本系統(tǒng)管理的文件流可動態(tài)配置到一個應用,這是傳統(tǒng)工作流和文件管理產(chǎn)品不能提供的。本系統(tǒng)在動態(tài)配置性能方面可有效定制,并適用于真實世界的文件,如發(fā)貨單和航運帳單。
      本系統(tǒng)可以做成一個實用程序,如自動文件管理實用程序。本系統(tǒng)向用戶提供識別自動文件管理實用程序的一個或多個業(yè)務處理、然后調(diào)用該自動文件管理實用程序來接收作為輸入的文件、從該文件抽取元數(shù)據(jù)、分析該文件的元數(shù)據(jù)并分類該文件的手段。本系統(tǒng)向用戶提供接收文件和相關元數(shù)據(jù)需要驗證的通知的手段。本系統(tǒng)向用戶提供驗證或增加文件和相關元數(shù)據(jù)的手段。本系統(tǒng)還發(fā)出一個更新內(nèi)容到輸出設備,該更新內(nèi)容包括文件、相關元數(shù)據(jù)、文件的分類、用戶提供的增加的數(shù)據(jù)、用戶采取的行動及業(yè)務處理的執(zhí)行結(jié)果。本系統(tǒng)還提供當本系統(tǒng)處于操作中用戶修改業(yè)務處理的手段。


      本發(fā)明的各種特征和獲得方式將參考后續(xù)的說明書、權(quán)利要求書和附圖做更詳細的說明,其中標號適當?shù)刂貜褪褂靡灾该饔嘘P項目的相關性,其中圖1是其中可以使用本發(fā)明的文件管理系統(tǒng)的示范操作環(huán)境的示意圖;圖2是圖1中的文件管理系統(tǒng)的高級體系結(jié)構(gòu)的方框圖;圖3是說明本發(fā)明的文件和元數(shù)據(jù)流的圖1和圖2中的文件管理系統(tǒng)的方框圖;圖4是說明圖1和圖2的文件管理系統(tǒng)的操作方法的處理流程圖;圖5是圖1和圖2的文件管理系統(tǒng)的示范性業(yè)務處理;圖6是說明圖1和圖2的文件管理系統(tǒng)的串行連接特性的方框圖;圖7是說明圖1和圖2中的文件管理系統(tǒng)的可擴展性(scalability)和分布性質(zhì)方框圖。
      具體實施例方式
      圖1顯示了示范性整體環(huán)境(“內(nèi)容管理系統(tǒng)100”),其中可以使用本發(fā)明的一個系統(tǒng)、一種服務、一個計算機程序產(chǎn)品和相關方法(文件管理系統(tǒng)10或“系統(tǒng)10”),用于自動、動態(tài)地為電子商務主管服務構(gòu)建文件管理應用程序。系統(tǒng)10包括典型地嵌入或安裝于輸入設備15或服務器20或網(wǎng)關25的軟件編程碼或計算機程序產(chǎn)品??蛇x地,系統(tǒng)10可以存儲在合適的存儲介質(zhì)上,諸如盤、CD、硬驅(qū)等設備上。雖然系統(tǒng)10是關于文件提及的,其可以用于管理能電子地傳送、處理、存儲的任何類型或形式的內(nèi)容,例如紙件或電子文件、照片、視頻記錄、音頻記錄等。
      輸入設備15可以由多種設備表示,諸如計算機30、掃描儀35或打印機40。輸入設備15是能將內(nèi)容輸入到內(nèi)容管理系統(tǒng)100的任何類型的內(nèi)容捕獲設備。用戶可以通過輸入設備15輸入文件、圖像、視頻、音頻等到內(nèi)容管理系統(tǒng)100。輸入設備15可以通過網(wǎng)絡45訪問服務器20。網(wǎng)關25通過網(wǎng)絡45訪問服務器20和輸出設備50。
      輸入設備15、服務器20、網(wǎng)關25和輸出設備50的每一個都包括允許通過網(wǎng)絡45安全接口的軟件。服務器20、網(wǎng)關25和輸出設備50分別經(jīng)通信鏈路55、60、65連接到網(wǎng)絡45。通信鏈路55、60、65包括諸如電話、電纜和衛(wèi)星鏈路等鏈路。輸入設備15可以經(jīng)諸如電話、電纜或衛(wèi)星鏈路的通信鏈路連接到網(wǎng)絡45。計算機30、掃描儀35和打印機40經(jīng)通信鏈路70、75、80連接到網(wǎng)絡45。
      雖然系統(tǒng)10是關于網(wǎng)絡45描述的,輸入設備15、服務器20、網(wǎng)關25和輸出設備50也可以經(jīng)局域網(wǎng)、廣域網(wǎng)或其它任何允許輸入設備15、服務器20、網(wǎng)關25和輸出設備50之間通信的網(wǎng)絡來通信。此外,輸入設備15、服務器20、網(wǎng)關25或輸出設備50中的任何一個或多個可以共同定位,經(jīng)過諸如局域網(wǎng)的網(wǎng)絡來通信,而輸入設備15、服務器20、網(wǎng)關25和輸出設備50中的其它設備可以遠地定位,經(jīng)過諸如因特網(wǎng)的網(wǎng)絡來連接。
      計算機30在內(nèi)容管理系統(tǒng)100中的功能為輸入設備。計算機30可以用作其它功能,例如作為到內(nèi)容管理系統(tǒng)100的用戶接口。用戶可以從計算機或計算機30所代表的其它設備訪問文件以驗證或瀏覽。
      圖2說明了系統(tǒng)10的高級層次結(jié)構(gòu)。系統(tǒng)10包括元數(shù)據(jù)提示模塊205、元數(shù)據(jù)抽取模塊210、業(yè)務處理215、執(zhí)行模塊220。元數(shù)據(jù)提示模塊205安裝在輸入設備15上。當用戶經(jīng)輸入設備15輸入一文件到內(nèi)容管理系統(tǒng)100時,元數(shù)據(jù)提示模塊205通過一個或多個提示(prompts)向用戶請求關于該文件的信息。這些提示可以采用文本、音頻、視頻等形式。在一個實施例中,元數(shù)據(jù)提示模塊205安裝在服務器20上。
      元數(shù)據(jù)抽取模塊210安裝在服務器20上。元數(shù)據(jù)抽取模塊210自動地從該文件抽取元數(shù)據(jù)。執(zhí)行模塊220安裝在網(wǎng)關25上。業(yè)務處理215也安裝在網(wǎng)關25上,它包括由執(zhí)行模塊220執(zhí)行的指令。執(zhí)行模塊220從服務器20檢取該文件和相關元數(shù)據(jù)。執(zhí)行模塊220分析該文件和相關元數(shù)據(jù)來確定文件類型并分類該文件。執(zhí)行模塊220于是逐個文件地、選擇性地、自動地執(zhí)行業(yè)務處理215中的指令,確定文件類型和文件分類。
      用戶可以針對每個文件類型選擇業(yè)務處理215中的哪個指令被執(zhí)行。此外用戶可以在系統(tǒng)10操作時修改指令的選擇,而不改變執(zhí)行模塊220的任何部分、關掉系統(tǒng)10或重啟系統(tǒng)10。執(zhí)行模塊220發(fā)出外部系統(tǒng)更新到輸出設備50來將該文件、相關元數(shù)據(jù)和執(zhí)行模塊220的輸出集成到輸出設備50。外部系統(tǒng)更新包括生成、更新、刪除或查詢。雖然輸出設備50僅為說明的目的表示為一個設備,應該清楚系統(tǒng)10也可以應用于例如作為輸出設備50操作的附加設備上。此外,附加設備和輸出設備50可以操作多個不同的應用程序,諸如數(shù)據(jù)庫、數(shù)據(jù)存儲、內(nèi)容管理系統(tǒng)等。
      圖3更詳細地顯示了內(nèi)容管理系統(tǒng)100A的例子。圖4(圖4A和4B)顯示了內(nèi)容管理系統(tǒng)100A中的操作系統(tǒng)10的方法400。操作中,結(jié)合參考圖3和4,用戶經(jīng)輸入設備15通過例如掃描一個文件、經(jīng)打印機驅(qū)動器直接打印一個文件等輸入一個文件(步驟405)。元數(shù)據(jù)提示模塊205針對關于該文件的信息提示用戶(步驟410)。元數(shù)據(jù)提示模塊205允許系統(tǒng)10與用戶接口并請求關于與該文件相關的用戶的信息,例如用戶名稱、用戶ID或用戶意見。元數(shù)據(jù)提示模塊205還允許系統(tǒng)10與用戶接口并請求不能從該文件識別的關于該文件的信息。用戶提供的關于用戶的信息和關于該文件的信息稱為用戶提示(user-prompted)元數(shù)據(jù)。
      例如,對于發(fā)貨單,元數(shù)據(jù)提示模塊205可以請求交易日期、批發(fā)商等。對于保險索賠,元數(shù)據(jù)提示模塊205可以請求單據(jù)號、客戶等。元數(shù)據(jù)提示模塊205檢測正輸入文件的文件類型并根據(jù)文件類型調(diào)整提供給用戶的提示。元數(shù)據(jù)提示模塊205通常針對文件中未提供的關于該文件的信息提示用戶。在對于保險公司的內(nèi)容管理系統(tǒng)100A的一個例子中,對于產(chǎn)生的不同類型的文件,諸如發(fā)貨單、索賠、估算、損害圖片、證言的視頻、音頻采訪、修理投標等,提示是不同的。元數(shù)據(jù)提示模塊205的輸出是文件和用戶提示元數(shù)據(jù)。
      文件和與該文件相關的用戶提示元數(shù)據(jù)被發(fā)送到服務器20和元數(shù)據(jù)抽取模塊210(步驟415)。服務器20暫時存儲該文件和用戶提示元數(shù)據(jù)(步驟420)。元數(shù)據(jù)抽取模塊210處理該文件以便獲得抽取的元數(shù)據(jù)(步驟425);即,通過從該文件自動抽取元數(shù)據(jù)發(fā)現(xiàn)的關于該文件的數(shù)據(jù)。從文件自動抽取元數(shù)據(jù)可以使用任何方法,例如光學字符識別(OCR),邏輯OCR,命名的實體抽取等等。該文件、用戶提示元數(shù)據(jù)和抽取的元數(shù)據(jù)總稱為文件/元數(shù)據(jù)包。
      執(zhí)行模塊220從服務器20檢取(retrieve)文件/元數(shù)據(jù)包(步驟430)。執(zhí)行模塊220選擇性地自動執(zhí)行業(yè)務處理215中的指令。執(zhí)行模塊220基于用戶提示的元數(shù)據(jù)和抽取的元數(shù)據(jù)自動分類該文件(步驟435)。執(zhí)行模塊220自動確定文件是例如發(fā)貨單、保險索賠中的證據(jù)、一個申請表等?;谖募诸?,執(zhí)行模塊220從文件的相關部分有選擇地抽取關鍵數(shù)據(jù)字段(步驟440)。例如,執(zhí)行模塊220可以根據(jù)文件分類從文件內(nèi)的已知位置抽取交易號、文件ID號等。選擇性抽取的結(jié)果稱作分區(qū)(zonal)數(shù)據(jù)元素。業(yè)務處理215確定關鍵數(shù)據(jù)字段及在文件中的位置。
      執(zhí)行模塊220執(zhí)行的具體抽取是從業(yè)務處理215確定的。對于每個文件類型,業(yè)務處理215確定分類要求、要抽取的數(shù)據(jù)、OCR要求等。如業(yè)務處理215指示的,執(zhí)行模塊220可以選擇性地僅OCR文件中特定的區(qū)域,這里稱為分區(qū)OCR(zonal OCR)。例如,用到保險索賠處理上,分區(qū)OCR可以抽取關于索賠的信息而不是索賠者的地址。
      如業(yè)務處理215指示的,執(zhí)行模塊220發(fā)送一個通知給用戶,通知需要驗證文件/元數(shù)據(jù)包及分區(qū)數(shù)據(jù)元素(步驟445)。這個通知可以通過任何方式提供,如郵件、電子郵件、即時消息、語音郵件、蜂窩電話、無線、電話或任何其它機制,通知適當?shù)娜藖眚炞C文件。執(zhí)行模塊220可以從文件分類確定通知的接收者。例如,可以通知一個人來驗證保險索賠,同時通知另一個人來驗證發(fā)貨單。業(yè)務處理215提供驗證通知的指示到一個特定的人或組織。
      執(zhí)行模塊220將文件/元數(shù)據(jù)包、分區(qū)數(shù)據(jù)元素、業(yè)務處理215確定的分類結(jié)果輸出到驗證模塊。用戶驗證(步驟450)包括瀏覽和校正數(shù)據(jù)、增加(augment)數(shù)據(jù)及執(zhí)行任何需要的動作。在一個實施例中,通過驗證接口(例如基于網(wǎng)絡的驗證接口)向用戶提供驗證頁面。執(zhí)行模塊220從用戶提示的元數(shù)據(jù)和抽取的元數(shù)據(jù)提供的信息中及業(yè)務處理215提供的指令中生成一個或多個定制的驗證頁面“onthe fly”。
      用戶瀏覽用戶提示的元數(shù)據(jù)、抽取的元數(shù)據(jù)和分區(qū)數(shù)據(jù)元素來檢查OCR和印刷錯誤。用戶可以瀏覽文件的分類以便更精確。用戶還可以在需要時增加數(shù)據(jù)。此外,用戶可以執(zhí)行文件到達后需要的任何操作,例如支付發(fā)貨單。在瀏覽和修改之后,驗證模塊將驗證的文件/元數(shù)據(jù)包、驗證的分區(qū)數(shù)據(jù)元素、驗證的分類結(jié)果、任何增加的數(shù)據(jù)、用戶執(zhí)行的任何操作的記錄返回到執(zhí)行模塊。
      驗證模塊305獲得的結(jié)果被返回到執(zhí)行模塊220(步驟455)。執(zhí)行模塊220選擇性地自動執(zhí)行來自業(yè)務處理215的任何附加指令(步驟460)。執(zhí)行模塊220將文件/元數(shù)據(jù)包與輸出設備50關聯(lián)起來(步驟465)。輸出設備可以是數(shù)據(jù)庫、內(nèi)容管理系統(tǒng)、內(nèi)容存儲器等。執(zhí)行模塊220將文件/元數(shù)據(jù)包、分區(qū)數(shù)據(jù)元素、增加的數(shù)據(jù)、業(yè)務處理215的執(zhí)行結(jié)果、用戶執(zhí)行的任何動作的記錄及任何需要的外部系統(tǒng)更新輸出到輸出設備(步驟470)。執(zhí)行模塊220的輸出還包括與輸出設備的外部系統(tǒng)集成,如生成、更新、刪除和查詢。
      執(zhí)行模塊220根據(jù)相關于用戶提示的元數(shù)據(jù)和抽取的元數(shù)據(jù)中的信息的業(yè)務處理215處理文件/元數(shù)據(jù)包。在一個實施例中,業(yè)務處理215以結(jié)構(gòu)化或半結(jié)構(gòu)化的表述存儲,如可擴展的標識語言(XML)、網(wǎng)絡服務的業(yè)務處理執(zhí)行語言(BPEL)等。業(yè)務處理215將系統(tǒng)10定制到某特定業(yè)務發(fā)展和某具體業(yè)務處理。業(yè)務處理215是動態(tài)可適應的;業(yè)務處理215中編碼的邏輯業(yè)務處理可簡單地通過改變一個文件(例如XML文件)來改變,而無需改變系統(tǒng)10的任何其它部分、安裝新軟件、重啟內(nèi)容管理系統(tǒng)100A、中斷內(nèi)容管理系統(tǒng)100A的操作。
      業(yè)務處理215的示范說明作為XML文件500顯示在圖5中。雖然為說明目的業(yè)務處理215僅相對于XML文件做了說明,很顯然系統(tǒng)10也可以應用到例如任何結(jié)構(gòu)化或半結(jié)構(gòu)化編程語言。業(yè)務處理215包括分類說明505、分區(qū)OCR說明510、通知說明515。根據(jù)需要可以增加另外的說明到業(yè)務處理215。
      對業(yè)務處理215的每個構(gòu)成元件,使用說明520可以設定為開(on)(如圖5所示)或關(&lt;USAGE&gt;Off&lt;/USAGE&gt;)。如圖5所示,使用說明520對于分類說明505、分區(qū)OCR說明510、通知說明515設定為“開”。分類說明505、分區(qū)OCR說明510、通知說明515之中的一個或多個的使用說明520可在操作內(nèi)容管理系統(tǒng)100的任何時間改變。
      分類說明505和分區(qū)OCR說明510還包括驗證說明525。驗證說明525指定文件自動處理的人工驗證??梢詾榉诸愓f明505和分區(qū)OCR說明510指定驗證說明525。驗證說明525可以設定為“開”(如圖5所示)或關(&lt;VERIFICATION&gt;Off&lt;/VERIFICATION&gt;)。分類說明505和分區(qū)OCR說明510中的一個或多個的驗證說明525可以在內(nèi)容管理系統(tǒng)100的操作期間的任意時間改變。
      通知說明515包括通知接口說明530、通知接觸說明535、通知文本540。雖然在圖5中示為電子郵件通知,該通知接口說明530可以制作為其它形式的通知,例如郵件、即時消息、語音消息(如蜂窩電話)、無線、電話等。由通知接口說明530、通知接觸說明535和通知文本540指定的任何一個或多個形式的通知可以在內(nèi)容管理系統(tǒng)100操作期間的任意時間改變。
      圖6示出一個實施例,其中附加版本的內(nèi)容管理系統(tǒng)100作為串行內(nèi)容管理系統(tǒng)600的節(jié)點來操作。內(nèi)容管理系統(tǒng)100B包括具有元數(shù)據(jù)提示模塊205(未示出)的輸入設備15B、元數(shù)據(jù)抽取模塊210B、執(zhí)行模塊220B和輸出設備50B。類似地,內(nèi)容管理系統(tǒng)100C包括具有元數(shù)據(jù)提示模塊205(未示出)的輸入設備15C、元數(shù)據(jù)抽取模塊210C、執(zhí)行模塊220C和輸出設備50C??梢栽黾觾?nèi)容管理系統(tǒng)100的附加版本,如內(nèi)容管理系統(tǒng)100N所示的。內(nèi)容管理系統(tǒng)100N包括具有元數(shù)據(jù)提示模塊205(未示出)的輸入設備15N、元數(shù)據(jù)抽取模塊210N、執(zhí)行模塊220N和輸出設備50N。
      內(nèi)容管理系統(tǒng)100B、內(nèi)容管理系統(tǒng)100C和內(nèi)容管理系統(tǒng)100N中的每一個在工作流中作為節(jié)點運行。執(zhí)行模塊220B的輸出發(fā)送到內(nèi)容管理系統(tǒng)100B的輸出設備50B及內(nèi)容管理系統(tǒng)100C的元數(shù)據(jù)抽取模塊210C。以類似的方式,執(zhí)行模塊605的輸出發(fā)送到串行內(nèi)容管理系統(tǒng)600的總工作流的下一個元數(shù)據(jù)抽取模塊610。
      例如,串行內(nèi)容管理系統(tǒng)600可以表示一個發(fā)明的專利申請發(fā)展過程的工作流。內(nèi)容管理系統(tǒng)100B代表專利披露(disclosure)節(jié)點。內(nèi)容管理系統(tǒng)100C代表專利評估(review)節(jié)點。內(nèi)容管理系統(tǒng)100N代表專利申請?zhí)峤还?jié)點。輸入設備15B代表從一個大公司的世界各地的發(fā)明人收集信息的許多輸入設備。輸入設備15B包括發(fā)明人使用的計算機、掃描儀、打印機、實驗設備或任何其它捕獲可以用于專利申請發(fā)展過程的信息的設備。來自輸入設備15B的信息發(fā)送到元數(shù)據(jù)抽取模塊210B和執(zhí)行模塊220B,用于如前所述地處理。執(zhí)行模塊的輸出如前所述地進行驗證并存儲在輸出設備50B中。
      執(zhí)行模塊220B的選擇輸出由執(zhí)行模塊220B自動輸入到元數(shù)據(jù)抽取模塊210C并加到專利評估節(jié)點的信息流上。專利評估節(jié)點需要的進一步信息由輸入設備15C收集。專利評估節(jié)點的驗證過程包括管理者和同伴對專利申請的認同。
      執(zhí)行模塊220C的選擇輸出自動輸入到元數(shù)據(jù)抽取模塊210N并加到專利申請?zhí)峤还?jié)點的信息流上。到元數(shù)據(jù)抽取模塊210N的輸入包括來自專利評審節(jié)點、專利代理人的輸入、專利申請寫作者的輸入、起草者的輸入及發(fā)明人的附加輸入的選擇的文件和信息。執(zhí)行模塊50N的輸出包括專利申請和申請文件。
      圖7顯示分布式文件管理系統(tǒng)700,該系統(tǒng)說明了系統(tǒng)10的分布式能力并說明系統(tǒng)10的可擴展性。例如,一個公司可以包括北美分部、亞太分部和歐洲分部。北美分部包括北美內(nèi)容管理系統(tǒng)705。亞太分部包括亞太內(nèi)容管理系統(tǒng)710。歐洲分部包括歐洲內(nèi)容管理系統(tǒng)715。
      北美內(nèi)容管理系統(tǒng)705包括諸如輸入設備15AA到15AN中的任何一個或多個輸入設備、諸如元數(shù)據(jù)抽取模塊210AA到210AN中的任何一個或多個的元數(shù)據(jù)抽取模塊、諸如執(zhí)行模塊220AA到220AN中的任何一個或多個的執(zhí)行模塊。輸入設備15AA到15AN、元數(shù)據(jù)抽取模塊210AA到210AN和執(zhí)行模塊220AA到220AN中的任何一個或多個可以在同一房間、同一建筑或整個北美的不同位置。此外,可以按照需要將輸入設備15AA到15AN,元數(shù)據(jù)抽取模塊210AA到210AN,或執(zhí)行模塊220AA到220AN中的適當數(shù)量的單元加入到北美內(nèi)容管理系統(tǒng)705之中,以便充分管理文件流。
      亞太內(nèi)容管理系統(tǒng)710包括輸入設備15BB、元數(shù)據(jù)抽取模塊210BB和執(zhí)行模塊220BB。輸入設備15BB、元數(shù)據(jù)抽取模塊210BB和執(zhí)行模塊220BB中的任何一個或多個可以在同一房間、同一建筑或整個亞太地區(qū)的不同位置。雖然輸入設備15BB、元數(shù)據(jù)抽取模塊210BB和執(zhí)行模塊220BB的每一個都在圖7中示出,可以按照需要將輸入設備15AA,元數(shù)據(jù)抽取模塊210BB和執(zhí)行模塊220BB中的適當數(shù)量的設備加入到亞太內(nèi)容管理系統(tǒng)710之中,以便充分管理文件流。
      歐洲內(nèi)容管理系統(tǒng)715包括輸入設備15CC、元數(shù)據(jù)抽取模塊210CC和執(zhí)行模塊220CC。輸入設備15CC、元數(shù)據(jù)抽取模塊210CC和執(zhí)行模塊220CC中的任何一個或多個可以在同一房間、同一建筑或整個歐洲的不同位置。雖然輸入設備15CC、元數(shù)據(jù)抽取模塊210CC和執(zhí)行模塊220CC的每一個都在圖7中示出,可以按照需要將輸入設備15CC,元數(shù)據(jù)抽取模塊210CC和執(zhí)行模塊220CC加入到歐洲內(nèi)容管理系統(tǒng)715之中,以便充分管理文件流。
      如圖7所示,北美內(nèi)容管理系統(tǒng)705、亞太內(nèi)容管理系統(tǒng)710和歐洲內(nèi)容管理系統(tǒng)715的輸出發(fā)送到一個輸出設備50AA。輸出設備50AA可以放置在北美、亞太地區(qū)、歐洲或其他任何位置。因此,使用系統(tǒng)10的內(nèi)容管理系統(tǒng)100可以在世界范圍串行(圖6)或分布式(圖7)管理文件流,或者以結(jié)合了串行和分布式特征的方式來管理文件流。例如,亞太內(nèi)容管理系統(tǒng)710可以由串行內(nèi)容管理系統(tǒng)600代替,輸出設備50N的功能由輸出設備50AA代替。
      本內(nèi)容管理系統(tǒng)可以應用的一個例子為信用卡爭端管理。例如,一個客戶關系管理公司處理客戶和銷售商之間因為信用卡收費引起的爭端。信用卡爭端管理的傳統(tǒng)內(nèi)容管理系統(tǒng)的爭端處理流典型地如下1、客戶打電話給客戶服務代表(CSR),并接收到一個唯一的案件ID和客戶爭端表;2、爭端管理系統(tǒng)接收銷售商爭端文件并自動存儲該銷售商爭端文件到傳統(tǒng)的文件管理系統(tǒng)中;3、客戶利用多種輸入通道(例如郵件、電子郵件或傳真)將該爭端表和證明文件郵回到客戶關系管理公司;4、郵件室工作人員掃描客戶文件;客戶文件放在停放區(qū)域直到客戶服務代表瀏覽該客戶文件及將客戶文件與爭端記錄聯(lián)系起來;5、客戶還通過電子郵件發(fā)送一個證明該爭端的收據(jù);此電子郵件要求在該電子郵件能與爭端記錄聯(lián)系起來之前客戶服務代表對其進行閱覽。
      利用傳統(tǒng)的信用卡爭端管理內(nèi)容管理系統(tǒng),當客戶已經(jīng)發(fā)送了爭端文件時會在步驟3、4之間發(fā)生多達一周的延遲,直到客戶服務代表評估爭端文件夾。與將客戶文件與爭端文件夾鏈接相關的人工步驟是由爭端處理中的不同人員參與的,由此引起延遲。
      利用內(nèi)容管理系統(tǒng)100和系統(tǒng)10,自上述步驟3的改進的處理過程如下1、郵件室工作人員使用輸入設備15掃描客戶文件,響應來自元數(shù)據(jù)提示模塊205的提示輸入案件ID。系統(tǒng)10自動將客戶文件與爭端記錄關聯(lián)起來。
      2、收到客戶的電子郵件后,客戶服務代表通過響應來自元數(shù)據(jù)提示模塊205的提示輸入案件ID,將該電子郵件直接從電子郵件應用程序插入到正確的爭端文件夾。
      3、執(zhí)行模塊220自動地將爭端文件夾移動從“懸置”狀態(tài)移動到“準備好”狀態(tài)以便爭端辦公人員閱覽(即驗證)。
      內(nèi)容管理系統(tǒng)100和系統(tǒng)10提供的改進的業(yè)務處理能減少爭端解決時間,從大約一周到大約兩天,這為客戶提供了有吸引力的業(yè)務價值。
      內(nèi)容管理系統(tǒng)100和系統(tǒng)10可以應用的另一例子可以是管理停車票據(jù)。大城市管理停車票據(jù)的過程包括數(shù)據(jù)中心、呼叫中心、支付系統(tǒng)和支付應用。美國的一個大城市每年擁有300萬手寫票據(jù)。
      目前,停車票據(jù)通過晚上從分支辦公室(全城大約30個分支辦公室,平均每個位置有1萬張票據(jù))收集紙件文件來管理。在中心位置,由兩個掃描儀操作人員和專門負責掃描后驗證文件任務的十個驗證人員,利用高容量掃描儀將文件成批掃描成圖像。在建立票據(jù)的電子記錄之前這個過程花費3個工作日;因此票據(jù)輸入和驗證是相關于票據(jù)的任何業(yè)務處理的關鍵因素。
      內(nèi)容管理系統(tǒng)100和系統(tǒng)10在票據(jù)事件的1個工作日內(nèi)生成每個分支位置的1萬張票據(jù)的電子記錄。系統(tǒng)10還支持票據(jù)和相關數(shù)據(jù)的分布式驗證,這樣票據(jù)記錄可以在兩個工作日內(nèi)觸發(fā)與票據(jù)相關的業(yè)務處理215??傮w來說,在處理周期中,利用內(nèi)容管理系統(tǒng)100和系統(tǒng)10可以獲得高效率。
      應當理解,已經(jīng)說明的本發(fā)明的具體實施例只是本發(fā)明原理的特定應用??梢栽诓幻撾x本發(fā)明的精神和范圍,對本系統(tǒng)、方法和服務做成很多變動,用于自動和動態(tài)地為電子商務主持服務構(gòu)造文件管理應用程序。雖然本發(fā)明是針對文件的,很顯然本發(fā)明也可以應用于可以電子傳送、處理或存儲的任何形式或類型的內(nèi)容,例如紙件或電子文件、照片、視頻記錄、音頻記錄等。
      權(quán)利要求
      1.一種自動和動態(tài)地為一個文件構(gòu)建多個文件管理應用程序的方法,包括從輸入設備接收該文件;自動獲取多個與該文件有關的用戶提示的元數(shù)據(jù);自動從該文件抽取多個抽取的元數(shù)據(jù);對該文件、用戶提示的元數(shù)據(jù)、抽取的元數(shù)據(jù)和分區(qū)數(shù)據(jù)元素中的任何一個或多個執(zhí)行業(yè)務處理,以獲得業(yè)務處理執(zhí)行結(jié)果;若需要,則自動地通知用戶,該文件、用戶提示的元數(shù)據(jù)和抽取的元數(shù)據(jù)中的任何一個或多個需要驗證;以及將該文件、用戶提示的元數(shù)據(jù)和抽取的元數(shù)據(jù)集成到輸出設備。
      2.如權(quán)利要求1所述的方法,還包括自動地對該文件執(zhí)行選擇性抽取,以產(chǎn)生分區(qū)數(shù)據(jù)元素。
      3.如權(quán)利要求1所述的方法,還包括將該文件、用戶提示的元數(shù)據(jù)和抽取的元數(shù)據(jù)中的任何一個或多個提供給用戶進行驗證。
      4.如權(quán)利要求1所述的方法,還包括自動地提示用戶提供所述多個用戶提示的元數(shù)據(jù)。
      5.如權(quán)利要求1所述的方法,其中該文件包括紙件文件、電子文件、視頻記錄、音頻記錄、照片和數(shù)字照片中的任何一個或多個。
      6.如權(quán)利要求1所述的方法,其中驗證包括多個用戶提供的增加的數(shù)據(jù)。
      7.如權(quán)利要求2所述的方法,其中自動地抽取所抽取的元數(shù)據(jù)的步驟包括對文件執(zhí)行光學字符識別。
      8.如權(quán)利要求7所述的方法,其中自動地執(zhí)行選擇性抽取的步驟包括在該文件的特定部分執(zhí)行光學字符識別。
      9.如權(quán)利要求8所述的方法,其中該文件的特定部分是所述業(yè)務處理確定的。
      10.如權(quán)利要求9所述的方法,其中業(yè)務部分被用戶改動,以改變文件的特定部分的位置。
      11.如權(quán)利要求1所述的方法,其中該輸入設備包括掃描儀、計算機、打印機和其中可以在本地閱覽器及應用程序中的任何一個或多個中閱覽文件的設備中的任何一個或多個。
      12.如權(quán)利要求1所述的方法,其中集成的步驟包括創(chuàng)建、更新、刪除和查詢中的任何一個或多個。
      13.如權(quán)利要求1所述的方法,其中集成的步驟包括與外部系統(tǒng)接口進行接口。
      14.如權(quán)利要求13所述的方法,其中該外部系統(tǒng)接口是由所述業(yè)務處理指定的。
      15.如權(quán)利要求1所述的方法,其中用戶通過所述業(yè)務處理指定用于驗證的驗證接口。
      16.如權(quán)利要求1所述的方法,其中用戶通過所述業(yè)務處理指定用于通知的通知接口。
      17.如權(quán)利要求1所述的方法,其中用戶通過所述業(yè)務處理指定對輸出設備的訪問。
      18.如權(quán)利要求1所述的方法,其中所述業(yè)務處理在分布環(huán)境中操作。
      19.如權(quán)利要求1所述的方法,其中所述業(yè)務處理在包括結(jié)構(gòu)化格式的文件中規(guī)定。
      20.如權(quán)利要求1所述的方法,其中所述業(yè)務處理在包括半結(jié)構(gòu)化格式的文件中規(guī)定。
      21.一種自動和動態(tài)地為一個文件構(gòu)建多個文件管理應用程序的方法,包括為用戶提供識別和修改業(yè)務處理的裝置;調(diào)用自動文件管理實用程序,其中所述文件和所述業(yè)務處理是所述自動文件管理實用程序可用的;為用戶提供驗證文件和相關數(shù)據(jù)的裝置;產(chǎn)生驗證的文件和多個驗證的數(shù)據(jù);為用戶提供增加文件和相關數(shù)據(jù),和產(chǎn)生多個增加的數(shù)據(jù)的裝置;并且其中驗證的文件、驗證的數(shù)據(jù)和增加的數(shù)據(jù)由自動文件管理實用程序根據(jù)所述業(yè)務處理的指示來處理。
      22.一種計算機程序產(chǎn)品,具有多個可執(zhí)行指令碼,用于自動和動態(tài)地為一個文件構(gòu)建多個文件管理應用程序,包括第一組指令碼,用于從輸入設備接收該文件;第二組指令碼,用于自動地獲取多個與該文件相關的用戶提示的元數(shù)據(jù);第三組指令碼,用于自動地從該文件抽取多個抽取的元數(shù)據(jù);第四組指令碼,用于對所述文件、用戶提示的元數(shù)據(jù)、抽取的元數(shù)據(jù)和分區(qū)數(shù)據(jù)元素中的任何一個或多個執(zhí)行業(yè)務處理,以獲得業(yè)務處理執(zhí)行結(jié)果;若需要,還包括第五組指令碼,用于自動地向用戶通知,所述文件、用戶提示的元數(shù)據(jù)和抽取的元數(shù)據(jù)中的任何一個或多個需要驗證;和第六組指令碼,用于將所述文件、用戶提示的元數(shù)據(jù)和抽取的元數(shù)據(jù)集成到輸出設備。
      23.一種文件管理系統(tǒng),用于自動和動態(tài)地為一個文件構(gòu)建多個文件管理應用程序,包括產(chǎn)生該文件的輸入設備;用于自動地獲取與該文件相關的多個用戶提示的元數(shù)據(jù)的模塊;用于自動地從該文件抽取多個抽取的元數(shù)據(jù)的元數(shù)據(jù)抽取模塊;執(zhí)行模塊,用于對所述文件、用戶提示的元數(shù)據(jù)、抽取的元數(shù)據(jù)和分區(qū)數(shù)據(jù)元素中的任何一個或多個執(zhí)行業(yè)務處理以獲得業(yè)務處理執(zhí)行結(jié)果;若需要,還包括通知模塊,用于自動地通知用戶,所述文件、用戶提示的元數(shù)據(jù)和抽取的元數(shù)據(jù)中的任何一個或多個需要驗證;輸出設備,用于將所述文件、用戶提示的元數(shù)據(jù)和抽取的元數(shù)據(jù)集成到輸出設備。
      全文摘要
      一種文件管理系統(tǒng),應用相關文件分析、元數(shù)據(jù)抽取、業(yè)務處理相關算法和方法來自動、動態(tài)地分類文件,以進行路由、處理和執(zhí)行定制業(yè)務邏輯。該文件管理系統(tǒng)從一個或多個通道接受文件,分類該文件,抽取元數(shù)據(jù),執(zhí)行定制的應用文檔并觸發(fā)與該處理相關的業(yè)務邏輯。該文件管理系統(tǒng)包括一個規(guī)則引擎,用來檢測和分類非結(jié)構(gòu)化形式和結(jié)構(gòu)化形式,這里屬性的位置和視覺布局的位置是不固定的。該文件管理系統(tǒng)提供管理文件的分立系統(tǒng)間的自動鏈接,用于完全執(zhí)行業(yè)務處理。
      文檔編號G06F17/30GK1801147SQ200510119370
      公開日2006年7月12日 申請日期2005年11月2日 優(yōu)先權(quán)日2004年11月3日
      發(fā)明者維卡斯·克里什納, 薩維塔·斯里尼瓦桑 申請人:國際商業(yè)機器公司
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1