專利名稱::優(yōu)化聯(lián)合數(shù)據(jù)庫管理系統(tǒng)的方法和系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
:文中所述的本發(fā)明涉及從聯(lián)合(federated)數(shù)據(jù)庫系統(tǒng)即從透明地將多個(gè)自主(autonomous)數(shù)據(jù)庫系統(tǒng)集成為單個(gè)虛擬數(shù)據(jù)庫即聯(lián)合數(shù)據(jù)庫的元數(shù)據(jù)庫管理系統(tǒng)提取數(shù)據(jù)。構(gòu)成數(shù)據(jù)庫仍是自主的、分離的和不同的。文中所述的方法、系統(tǒng)和程序產(chǎn)品涉及搜索聯(lián)合分布式計(jì)算機(jī)系統(tǒng)內(nèi)存儲(chǔ)的數(shù)據(jù)以及分布式數(shù)據(jù)庫的管理,包括數(shù)據(jù)庫數(shù)據(jù)和文件的訪問和檢索,以及從聯(lián)合數(shù)據(jù)庫檢索數(shù)據(jù)庫數(shù)據(jù)和文件。本發(fā)明的另一個(gè)方面包括組織數(shù)據(jù)或文件并使其相互關(guān)聯(lián),包括關(guān)系模型、網(wǎng)絡(luò)模型、層次模型和實(shí)體-關(guān)系模型。
背景技術(shù):
:聯(lián)合數(shù)據(jù)庫系統(tǒng)是一種元數(shù)據(jù)庫管理系統(tǒng)(DBMS),其透明地將分離的、不同的多個(gè)自主數(shù)據(jù)庫系統(tǒng)集成為單個(gè)聯(lián)合數(shù)據(jù)庫。構(gòu)成數(shù)據(jù)庫經(jīng)由計(jì)算機(jī)網(wǎng)絡(luò)、互聯(lián)網(wǎng)、局域網(wǎng)和虛擬網(wǎng)絡(luò)互連,并且可在地理上分散。由于構(gòu)成數(shù)據(jù)庫系統(tǒng)仍保持自主,所以聯(lián)合數(shù)據(jù)庫系統(tǒng)是對(duì)將多個(gè)異類數(shù)據(jù)庫合并在一起的不簡單的任務(wù)的一種替代選擇。通過數(shù)據(jù)抽象、包裝器(wrapper)函數(shù)和容器函數(shù),聯(lián)合數(shù)據(jù)庫系統(tǒng)可提供統(tǒng)一的前端用戶界面,使得用戶可通過單個(gè)查詢?cè)诙鄠€(gè)數(shù)據(jù)庫內(nèi)存儲(chǔ)和檢索數(shù)據(jù),即使構(gòu)成數(shù)據(jù)庫是異類的。為此,聯(lián)合數(shù)據(jù)庫系統(tǒng)必須能夠?qū)⒉樵兘鈽?gòu)成子查詢以便提交給相關(guān)的構(gòu)成DBMS,此后系統(tǒng)必須合并或聚合子查詢的結(jié)果集。由于各數(shù)據(jù)庫管理系統(tǒng)使用不同的查詢語言,所以聯(lián)合數(shù)據(jù)庫系統(tǒng)必須頻繁地將包裝器應(yīng)用于子查詢以將它們轉(zhuǎn)換成合適的查詢語言。迄今為止,聯(lián)合數(shù)據(jù)庫已被以多種方式預(yù)測能夠在概念層次解決無數(shù)問題。但是,對(duì)于真實(shí)世界的實(shí)際問題,聯(lián)合系統(tǒng)還沒有實(shí)現(xiàn)上述預(yù)測。一個(gè)尤其苦惱的挑戰(zhàn)是獲得針對(duì)多維物理和“人員”挑戰(zhàn)的最優(yōu)解決方案。因此,很清楚,需要考慮超出數(shù)據(jù)庫元數(shù)據(jù)層次和機(jī)器層次的問題,并探索解決方案空間(solutionspace)和相關(guān)聯(lián)的軟約束。軟約束是指法律和制度上的約束例如機(jī)密性和道德規(guī)范、人員可用性、性能需求等。
發(fā)明內(nèi)容這些以及其他問題可用文中所述的方法、系統(tǒng)和程序產(chǎn)品消除。具體地,文中所述的本發(fā)明提出了一種用于使技能和資產(chǎn)尤其是人員技能和人力資產(chǎn)(peopleasset)與需求和需要匹配的方法、系統(tǒng)和程序產(chǎn)品。具體地,本發(fā)明的方法、系統(tǒng)和程序解決了這樣敘述的分配問題“我有一組人員,每個(gè)人都具有一組技能,而由于外部約束(法律的、集體談判等),僅能向某些人分配某些任務(wù),某些數(shù)據(jù)不能離開某些地點(diǎn)或者不能給某些人,并且某些數(shù)據(jù)不能具體化”。根據(jù)文中所述的本發(fā)明,數(shù)據(jù),包括傳統(tǒng)數(shù)據(jù)庫數(shù)據(jù)和來自異類數(shù)據(jù)庫的數(shù)據(jù),被聯(lián)合以生成解決方案空間,其中例如通過整數(shù)規(guī)劃優(yōu)化解決方案集。該方法、系統(tǒng)和程序產(chǎn)品利用數(shù)據(jù)庫聯(lián)合和“提取、轉(zhuǎn)換和加載”(“ETL”)數(shù)據(jù)庫管理來查詢、搜索和選擇性地提取數(shù)據(jù),呈現(xiàn)數(shù)據(jù),使用復(fù)雜優(yōu)化例如整數(shù)規(guī)劃、混合整數(shù)規(guī)劃、試探法和人工智能等技術(shù)、人為干預(yù)和請(qǐng)求另外的數(shù)據(jù)來分析和呈現(xiàn)數(shù)據(jù)。當(dāng)該方法、系統(tǒng)和程序產(chǎn)品用于研究或臨床環(huán)境,并且例如隨后公布(或提交給管理當(dāng)局)時(shí),需要釋放足夠的數(shù)據(jù)以滿足學(xué)術(shù)上的、制度上的或管理上的需求。這使得產(chǎn)物為大量個(gè)別數(shù)據(jù)的總和。查詢、搜索和選擇性提取數(shù)據(jù)的步驟是遵守具體化(materialization)和呈現(xiàn)上的約束執(zhí)行的。作為示例而不是限制,這些約束包括私密的個(gè)人數(shù)據(jù)例如性傳播疾病的存在或不存在、遺傳異常的存在或不存在乃至信譽(yù)度。類似地,所述約束可包括制度上機(jī)密的數(shù)據(jù)例如何人將執(zhí)行工作、資源分配和交付、預(yù)算、技能集、策略、費(fèi)用分配、代替現(xiàn)金支付的實(shí)物捐獻(xiàn)、輸入和輸出的時(shí)間約束。另外,在臨床、測試或流行病學(xué)上下文中,信息傳遞可被法律例如HIPP限制和私人約束所約束。通過聯(lián)合數(shù)據(jù),整個(gè)數(shù)據(jù)的全體僅需在計(jì)算期間具體化,而完成的產(chǎn)物僅是聚合數(shù)據(jù)如總和以及統(tǒng)計(jì)量。在實(shí)際計(jì)算中,使用在聯(lián)合系統(tǒng)內(nèi)的不同數(shù)據(jù)庫管理系統(tǒng)的不同表上的臨時(shí)表、關(guān)聯(lián)表構(gòu)建中間數(shù)據(jù)庫。一當(dāng)在聯(lián)合數(shù)據(jù)庫上運(yùn)行查詢并報(bào)告,所述臨時(shí)表就被鎖定或消失。文中所述的方法、系統(tǒng)和程序產(chǎn)品探索了整個(gè)問題空間,展示了所有約束,并使用例如整數(shù)規(guī)劃技術(shù)針對(duì)加權(quán)的、多維準(zhǔn)則函數(shù)(multidimensionalcriteriafunction)優(yōu)化這些約束。整個(gè)數(shù)據(jù)集用于對(duì)可能的解決方案建模,包含數(shù)據(jù)結(jié)構(gòu)、元數(shù)據(jù)、數(shù)據(jù)模式和可能的關(guān)聯(lián)表(associativetable),從而比較如被成本、策略、人員和資產(chǎn)的可用性以及必需的時(shí)間線約束的ETL解決方案與聯(lián)合解決方案。在附圖中示出了本發(fā)明的各個(gè)方面。圖1示出最初的發(fā)現(xiàn)當(dāng)前環(huán)境的步驟。圖2示出接下來的分析當(dāng)前環(huán)境的步驟。圖3示出定義可用資源的步驟。圖4示出定義項(xiàng)目(project)約束的步驟。圖5示出設(shè)計(jì)實(shí)現(xiàn)需求的最優(yōu)解決方案。圖6示出給定所有約束、要求(claim)和資源,計(jì)算最優(yōu)解決方案的步驟。圖7示出聯(lián)合數(shù)據(jù)系統(tǒng)的概觀。圖8示出用于設(shè)計(jì)聯(lián)合數(shù)據(jù)庫系統(tǒng)的流程圖的概觀。圖9示出執(zhí)行查詢并隨后處理結(jié)果集的流程圖的概觀。圖10示出從輸入約束變量和約束通過對(duì)約束和變量的分析到優(yōu)化優(yōu)化工具和技術(shù)并執(zhí)行優(yōu)化的判定樹。圖11示出數(shù)據(jù)庫聯(lián)合和“提取、轉(zhuǎn)換和加載”(ETL)數(shù)據(jù)庫管理的高層概觀,該數(shù)據(jù)庫管理用于查詢、搜索和選擇性地提取數(shù)據(jù),呈現(xiàn)數(shù)據(jù),使用復(fù)雜優(yōu)化例如整數(shù)規(guī)劃、混合整數(shù)規(guī)劃、試探法和人工智能等技術(shù)、人為干預(yù)和請(qǐng)求另外的數(shù)據(jù)來分析和呈現(xiàn)數(shù)據(jù)。具體實(shí)施例方式本發(fā)明的方法、系統(tǒng)和程序產(chǎn)品解決了這樣敘述的分配問題“我有一組人員,每個(gè)人都具有一組技能,而由于外部約束(法律約束、集體談判等),僅能向某些人分配某些任務(wù),某些數(shù)據(jù)不能離開某些地點(diǎn)或者不能給某些人,并且某些數(shù)據(jù)不能具體化”。當(dāng)本發(fā)明的方法、系統(tǒng)和程序產(chǎn)品用于研究環(huán)境并隨后公布(或者提交給管理當(dāng)局)時(shí),需要釋放足夠的數(shù)據(jù)以滿足學(xué)術(shù)上的、制度上的或管理上的需求。數(shù)據(jù)庫聯(lián)合使得輸出為大量個(gè)別數(shù)據(jù)的結(jié)果。通過聯(lián)合數(shù)據(jù),數(shù)據(jù)的全體僅在計(jì)算期間具體化,而完成的產(chǎn)物僅是聚合數(shù)據(jù)如僅是總和以及統(tǒng)計(jì)量。在實(shí)際計(jì)算中,使用從在聯(lián)合系統(tǒng)內(nèi)的不同數(shù)據(jù)庫管理系統(tǒng)的不同表得到的臨時(shí)表、關(guān)聯(lián)表來構(gòu)建中間數(shù)據(jù)庫。一當(dāng)在聯(lián)合數(shù)據(jù)庫上運(yùn)行查詢并報(bào)告,該臨時(shí)表就被鎖定或消失。文中所述的方法、系統(tǒng)和程序產(chǎn)品研究了整個(gè)問題空間,展示了所有約束,并針對(duì)加權(quán)的多維準(zhǔn)則函數(shù)優(yōu)化這些約束。整個(gè)數(shù)據(jù)集用于對(duì)可能的解決方案建模,包括數(shù)據(jù)結(jié)構(gòu)、元數(shù)據(jù)、數(shù)據(jù)模式和可能的關(guān)聯(lián)表,從而比較如被成本、策略、人員和資產(chǎn)的可用性以及必需的時(shí)間線約束的ETL解決方案與聯(lián)合解決方案。圖1示出最初的發(fā)現(xiàn)包含單元1001、1003、1005、1007的當(dāng)前環(huán)境的步驟。這包括評(píng)估不同的源系統(tǒng)數(shù)據(jù)約束以及回顧性和預(yù)期性數(shù)據(jù)集成挑戰(zhàn),客戶和行業(yè)數(shù)據(jù)標(biāo)準(zhǔn)的影響。約束和機(jī)會(huì)包括當(dāng)前的集成能力,所需的集成解決方案的性質(zhì)以及客戶團(tuán)隊(duì)技能。圖2示出下一個(gè)分析包含單元1001、1003、1005、1007的當(dāng)前環(huán)境的步驟。分析當(dāng)前環(huán)境包括理解按照源的可用元數(shù)據(jù)1011、1013、1015、1017。還包括分析當(dāng)前環(huán)境以分析數(shù)據(jù)集成方法和按照源的數(shù)據(jù)模型1021、1023、1025、1027,指示ETL或聯(lián)合或混合方法,并定義必須遵守的集成規(guī)則1031、1033、1035、1037。隨后,訪問當(dāng)前的技能1041、1043、1045、1047,推薦最優(yōu)的技能集,并確定彌補(bǔ)該差距的機(jī)制。該分析還包括確定現(xiàn)有基礎(chǔ)結(jié)構(gòu)的最優(yōu)使用以使可用性最大。圖3示出定義可用資源的步驟。在此上下文中,資源包括具有技能1103和訓(xùn)練1105的可用人員1101,另外的訓(xùn)練的可用性,網(wǎng)絡(luò)和網(wǎng)絡(luò)容量1107、計(jì)算設(shè)備1109和軟件可用性1111,物理資源1113,存儲(chǔ)器1115,時(shí)間約束1117和美元可用性(資金)1119。圖4示出定義項(xiàng)目約束的步驟。這些約束可以是法律1201(HIPA,知識(shí)產(chǎn)權(quán)),安全性1203(信息傳遞1205、IT1207和安全約束1209),社會(huì)(組織結(jié)構(gòu)和約束1211、個(gè)人策略1212和限制1214、組織靈活性1213),環(huán)境(有害物質(zhì)1215),資金約束1217,團(tuán)隊(duì)位置1219和旅行約束,數(shù)據(jù)(數(shù)據(jù)庫互操作性1225、數(shù)據(jù)兼容性1223、數(shù)據(jù)質(zhì)量1221),風(fēng)險(xiǎn)1227和IT資產(chǎn)1229(軟件、網(wǎng)絡(luò)、數(shù)據(jù)庫和硬件要求以及性能特性),發(fā)展需求1226和必需的交付步驟1231。圖5示出設(shè)計(jì)最優(yōu)解決方案以實(shí)現(xiàn)需求。最優(yōu)解決方案包括一個(gè)或多個(gè)實(shí)體統(tǒng)一化方案(entityunificationscheme)1301,共形維度(conformaldimension)1303,和聚合方案1305,以及獲得統(tǒng)一的元數(shù)據(jù)模型1311和統(tǒng)一的數(shù)據(jù)模型1313。圖6示出給定所有約束、要求和資源,計(jì)算最優(yōu)解決方案的步驟。在此步驟中,各種資源集合是要求者(claimant)集合1401,該集合通過ETL1411、聯(lián)合1413或混合(hybrid)被處理。這些數(shù)據(jù)項(xiàng)目在例如臨時(shí)結(jié)構(gòu)和持久結(jié)構(gòu)中被處理,從而都生成“視圖”1421。圖10所示的該方法在多維約束的上下文內(nèi)優(yōu)化了聯(lián)合數(shù)據(jù)庫和ETL數(shù)據(jù)庫以及數(shù)據(jù)庫查詢,使用ETL1511、ETL和聯(lián)合的混合1513以及聯(lián)合1515的技術(shù)集合數(shù)據(jù)以確定優(yōu)化技術(shù)1521以獲得優(yōu)化解決方案,包括候選最優(yōu)解決方案的集合。在大的現(xiàn)代企業(yè)例如醫(yī)學(xué)研究機(jī)構(gòu)、大學(xué)、醫(yī)療中心和多部門企業(yè)中,幾乎不可避免地,組織的不同部分將使用不同的數(shù)據(jù)庫管理系統(tǒng)來存儲(chǔ)和搜索它們的關(guān)鍵數(shù)據(jù)。但是,只是通過組合來自這些系統(tǒng)的信息,現(xiàn)代臨床、學(xué)術(shù)或研究機(jī)構(gòu)機(jī)構(gòu)才能夠?qū)崿F(xiàn)它們包含的數(shù)據(jù)的全部價(jià)值。例如,在衛(wèi)生保健行業(yè)中,兼并、合并和收購幾乎是常事。新創(chuàng)建或合并的實(shí)體繼承了原機(jī)構(gòu)的數(shù)據(jù)存儲(chǔ)庫(store)。許多這些存儲(chǔ)庫將是關(guān)系數(shù)據(jù)庫管理系統(tǒng),但是經(jīng)常來自不同的制造商;例如一個(gè)公司可主要使用Sybase,而另一個(gè)公司使用InformixIDS。它們可均具有一個(gè)或多個(gè)文檔管理系統(tǒng)-例如Documentum或IBMContentManager-來存儲(chǔ)文本文檔例如患者記錄、醫(yī)囑(order)、實(shí)驗(yàn)室測試等的副本。每個(gè)可具有計(jì)算重要信息(例如過敏性、藥物反應(yīng)和相互作用等)或挖掘關(guān)于患者或試驗(yàn)對(duì)象的健康問題的信息的應(yīng)用。在結(jié)構(gòu)合并之后,它們需要能夠訪問來自所有的存儲(chǔ)庫集合的所有患者信息,使用現(xiàn)有的和新的應(yīng)用分析它們的新的客戶檔案(portfolio),并通常通過共同接口使用組合的原始機(jī)構(gòu)的資源。它們需要能夠識(shí)別共同的患者和對(duì)象,并合并它們的患者記錄的相關(guān)部分,盡管不同的臨床和研究服務(wù)和部門可能使用完全不同的識(shí)別鍵不統(tǒng)一地引用它們的患者。聯(lián)合技術(shù)可通過為不同數(shù)據(jù)提供統(tǒng)一的接口來大大減輕這些情況中的困難。如果聯(lián)合系統(tǒng)是透明的,則它對(duì)用戶屏蔽底層數(shù)據(jù)源的差別、特質(zhì)和實(shí)現(xiàn)。理想地,它使得聯(lián)合源的集合在用戶看來像是單個(gè)系統(tǒng)。用戶應(yīng)該不需要知道數(shù)據(jù)存儲(chǔ)在哪里(位置透明性),數(shù)據(jù)源支持哪種語言或編程接口(調(diào)用透明性),如果使用SQL的話源支持SQL的哪種方言(方言透明性),數(shù)據(jù)是如何物理存儲(chǔ)的,或者數(shù)據(jù)是否被分區(qū)和/或被復(fù)制(物理數(shù)據(jù)獨(dú)立性、分段(fragmentation)和復(fù)制透明性),或使用哪種網(wǎng)絡(luò)協(xié)議(網(wǎng)絡(luò)透明性)。用戶應(yīng)看到單個(gè)統(tǒng)一的接口,包括單組錯(cuò)誤代碼(錯(cuò)誤代碼透明性)。IBM提供了所有這些特征,從而允許好像所有數(shù)據(jù)都位于單個(gè)數(shù)據(jù)庫內(nèi)似地編寫應(yīng)用,盡管實(shí)際上數(shù)據(jù)可存儲(chǔ)在數(shù)據(jù)源的異類集合中。聯(lián)合的另一個(gè)方面是異質(zhì)性。異質(zhì)性是各數(shù)據(jù)源之間的區(qū)別程度。源可在許多方面不同。它們可在不同硬件上運(yùn)行,使用不同的網(wǎng)絡(luò)協(xié)議,并具有不同的軟件來管理它們的數(shù)據(jù)存儲(chǔ)。它們可具有不同的查詢語言,不同的查詢能力乃至不同的數(shù)據(jù)模型。它們可不同地處理錯(cuò)誤,或提供不同的事務(wù)語義。它們可象具有相同或不同的模式的兩個(gè)Oracle實(shí)例那樣相似,其中一個(gè)運(yùn)行Oracle8i,另一個(gè)運(yùn)行Oracle9i。或者,它們可如同功能強(qiáng)大的關(guān)系數(shù)據(jù)庫、簡單的結(jié)構(gòu)化的平面文件、獲得形式為URL的查詢并根據(jù)某種DTD返回半結(jié)構(gòu)化的XML的網(wǎng)站、Web服務(wù)以及響應(yīng)于特定的一組函數(shù)調(diào)用的應(yīng)用那樣各不相同。IBM的聯(lián)合數(shù)據(jù)庫可容納所有這些差別,從而將例如這些系統(tǒng)的系統(tǒng)包含在無縫的、透明的聯(lián)合中。在聯(lián)合系統(tǒng)中,可能需要新的源來滿足用戶的企業(yè)的變化需求。聯(lián)合使得可容易地添加新的源。聯(lián)合數(shù)據(jù)庫引擎經(jīng)由已知為包裝器的軟件組件訪問資源。訪問新型數(shù)據(jù)源是通過獲得或創(chuàng)建對(duì)于該源的包裝器來完成的。包裝器體系結(jié)構(gòu)使得能夠建立新的包裝器。一旦包裝器存在,簡單的數(shù)據(jù)定義語言(DDL)語句允許將源動(dòng)態(tài)地添加到聯(lián)合中而不會(huì)停止正在進(jìn)行的查詢或事務(wù)。任何數(shù)據(jù)源都可被包裝。IBM支持ANSISQL/MED標(biāo)準(zhǔn)(MED代表外部數(shù)據(jù)管理)。此標(biāo)準(zhǔn)記載了聯(lián)合服務(wù)器用于與外部數(shù)據(jù)源通信的協(xié)議。寫到SQL/MED接口的任何包裝器都可與IBM的聯(lián)合數(shù)據(jù)庫一起使用。因此,包裝器可由用戶、廠商和第三方編寫。聯(lián)合的另一個(gè)方面是數(shù)據(jù)源的自主。通常,數(shù)據(jù)源具有已有的應(yīng)用和用戶。因此,重要的是,源在被帶入聯(lián)合中時(shí)該源的操作不會(huì)被影響。現(xiàn)有的應(yīng)用將無改變地運(yùn)行,數(shù)據(jù)不會(huì)被移動(dòng)和修改,接口仍保持相同。數(shù)據(jù)源處理對(duì)數(shù)據(jù)的請(qǐng)求的方式不會(huì)受針對(duì)聯(lián)合系統(tǒng)執(zhí)行全局查詢的影響,盡管這些全局查詢可能觸及許多不同的數(shù)據(jù)源。同樣,當(dāng)數(shù)據(jù)源進(jìn)入或離開聯(lián)合時(shí)對(duì)本地系統(tǒng)的一致性沒有影響。通過優(yōu)化器獲得優(yōu)化的性能。優(yōu)化器是確定執(zhí)行每個(gè)查詢的最佳方式的、關(guān)系數(shù)據(jù)庫管理系統(tǒng)的組件。關(guān)系查詢是非過程性的,在執(zhí)行查詢時(shí)每個(gè)關(guān)系算子通常存在多種不同的實(shí)現(xiàn),并且通常存在可以進(jìn)行選擇的、算子的許多可能的排序。盡管一些優(yōu)化器使用試探式規(guī)則來選擇執(zhí)行策略,但是優(yōu)選的聯(lián)合數(shù)據(jù)庫考慮各種可能的策略,對(duì)每種策略的可能的成本建模并選擇成本最小的策略(通常,成本用消耗的系統(tǒng)資源衡量)。在聯(lián)合系統(tǒng)中,優(yōu)化器必須確定查詢中涉及的不同操作是應(yīng)該由聯(lián)合服務(wù)器完成還是由存儲(chǔ)數(shù)據(jù)的源完成。它還必須確定操作的順序,以及使用什么實(shí)現(xiàn)來完成查詢的本地部分。為了做出這些決定,優(yōu)化器必須通過某種方式知道每個(gè)數(shù)據(jù)源可完成什么以及其成本大小。例如,如果數(shù)據(jù)源是文件,則假設(shè)其是智能的、并且要求其執(zhí)行分類(sort)或應(yīng)用某個(gè)函數(shù)是沒有意義的。另一方面,如果源是能夠應(yīng)用謂詞并進(jìn)行聯(lián)結(jié)的關(guān)系數(shù)據(jù)庫系統(tǒng),則利用其能力是個(gè)好主意,如果這將減小需要被帶回聯(lián)合引擎的數(shù)據(jù)的量的話。這通常將依賴個(gè)別查詢的細(xì)節(jié)。在一個(gè)實(shí)施例中,優(yōu)化器與用于查詢中涉及的不同源的包裝器一起工作以評(píng)估可能性。在執(zhí)行策略時(shí),好的決定和壞的決定之間的差別往往是性能上的幾個(gè)量級(jí)。為了進(jìn)一步提高性能,每個(gè)包裝器實(shí)現(xiàn)通過使用每個(gè)數(shù)據(jù)源的本機(jī)API來利用源提供的調(diào)節(jié)器(knob)。例如,將多個(gè)結(jié)果行分塊到一個(gè)消息(也叫做塊讀取)是常見的性能調(diào)節(jié)器。查詢編譯器將與包裝器通信以指示哪些查詢片段可利用塊讀取,從而在運(yùn)行時(shí)獲得最大性能而不會(huì)損失查詢語義。圖7內(nèi)示出一個(gè)聯(lián)合系統(tǒng)體系結(jié)構(gòu)。應(yīng)用可使用任何被支持的接口(包括ODBC、JDBC或Web服務(wù)客戶機(jī))與聯(lián)合服務(wù)器交互。聯(lián)合服務(wù)器利用被稱為包裝器的軟件模塊與數(shù)據(jù)源通信。該系統(tǒng)包括客戶機(jī)107,SQLAPI109和聯(lián)合數(shù)據(jù)庫服務(wù)器112。聯(lián)合數(shù)據(jù)庫服務(wù)器112包括包裝器應(yīng)用114,數(shù)據(jù)庫目錄116和元數(shù)據(jù)數(shù)據(jù)庫118。服務(wù)器112從多個(gè)具有相關(guān)聯(lián)的數(shù)據(jù)儲(chǔ)存庫(repository)123、127的后端數(shù)據(jù)源121、125接收數(shù)據(jù)。聯(lián)合系統(tǒng)是通過安裝聯(lián)合引擎112并然后配置該引擎以與數(shù)據(jù)源對(duì)話建立的。存在一些向聯(lián)合系統(tǒng)添加新的數(shù)據(jù)源121或125的步驟。首先,必須安裝用于源121或125的包裝器114,然后必須告知聯(lián)合數(shù)據(jù)庫服務(wù)器在哪里可找到此包裝器。這是通過CREATEWRAPPER語句完成的。如果需要多個(gè)相同類型的源,則僅需要一個(gè)包裝器。例如,即使聯(lián)合系統(tǒng)將包括可能位于不同機(jī)器上的五個(gè)Oracle數(shù)據(jù)庫實(shí)例,仍僅需要一個(gè)Oracle包裝器,并因此僅需要一個(gè)CREATEWRAPPER語句。但是,還必須向系統(tǒng)標(biāo)識(shí)每個(gè)單獨(dú)的源。這可通過CREATESERVER語句完成。如果存在五個(gè)Oracle數(shù)據(jù)庫實(shí)例,則必須發(fā)出五個(gè)CREATESERVER語句。例如,假設(shè)存在用于訪問網(wǎng)站的包裝器,以及用戶希望從中訪問數(shù)據(jù)的特定網(wǎng)站。此語句主要告知聯(lián)合數(shù)據(jù)庫在哪里可找到用于web_wrapper的代碼。接下來,通過將實(shí)際網(wǎng)站標(biāo)識(shí)為與web_wrapper相關(guān)聯(lián)的服務(wù)器,可向聯(lián)合數(shù)據(jù)庫告知將使用的該實(shí)際網(wǎng)站。OPTIONS子句允許以包裝器為訪問此數(shù)據(jù)源類型的實(shí)例將需要的信息來定制基本的CREATESERVER語句。在包裝器114和服務(wù)器112已被定義之后,必須根據(jù)聯(lián)合中間件的數(shù)據(jù)模型描述在遠(yuǎn)程源121處的數(shù)據(jù)123。由于文中所述的聯(lián)合數(shù)據(jù)庫支持對(duì)象-關(guān)系數(shù)據(jù)模型,所以來自遠(yuǎn)程源的數(shù)據(jù)的每個(gè)匯集必須作為具有合適類型的列的表向聯(lián)合引擎描述。被建模為表的外部數(shù)據(jù)的匯集被稱為綽號(hào),并且其表名和列名用于由應(yīng)用提交給聯(lián)合的SQL。綽號(hào)經(jīng)由CREATENICKNAME語句被標(biāo)識(shí)。下面的語句為關(guān)于天氣的信息的匯集建立了綽號(hào),并且標(biāo)識(shí)了可用于查詢的“列”。“OPTIONS”子句仍是傳遞包裝器需要的信息的方式,這次是為了針對(duì)綽號(hào)處理查詢。除了存儲(chǔ)數(shù)據(jù)之外,許多數(shù)據(jù)源還能夠執(zhí)行專門的搜索或其他計(jì)算。這些能力可在SQL中被描述為用戶定義的函數(shù)。用戶定義的函數(shù)被外部數(shù)據(jù)源實(shí)現(xiàn)為映射函數(shù)。再次地,映射函數(shù)經(jīng)由DDL語句向聯(lián)合系統(tǒng)標(biāo)識(shí)。CREATEFUNCTION語句告知聯(lián)合數(shù)據(jù)庫這是可在SELECT語句內(nèi)出現(xiàn)的函數(shù)。ASTEMPLATE子句告知聯(lián)合函數(shù)該函數(shù)沒有本地實(shí)現(xiàn)。接下來,CREATEFUNCTIONMAPPING語句告知聯(lián)合系統(tǒng)什么服務(wù)器可對(duì)該函數(shù)求值??蔀橄嗤瘮?shù)建立一些函數(shù)映射。對(duì)于我們的示例,下面的語句完成映射。DDL語句產(chǎn)生描述關(guān)于綽號(hào)以及映射函數(shù)的簽名的信息的元數(shù)據(jù)。此元數(shù)據(jù)被聯(lián)合查詢處理引擎使用,并存儲(chǔ)在聯(lián)合數(shù)據(jù)庫的全局目錄內(nèi)。圖8內(nèi)示出元數(shù)據(jù)和查詢的實(shí)際設(shè)計(jì),該設(shè)計(jì)包括首先確定數(shù)據(jù)源服務(wù)器的模式和元數(shù)據(jù)配置的步驟201。下一步是列舉可用資源203,并列舉安全性和機(jī)密性需求205。它們用于根據(jù)該模式和元數(shù)據(jù)、列舉的可用資源以及列舉的安全性和機(jī)密性需求計(jì)算最優(yōu)的聯(lián)合數(shù)據(jù)庫管理系統(tǒng)設(shè)計(jì)207;并設(shè)計(jì)最優(yōu)的聯(lián)合數(shù)據(jù)庫管理系統(tǒng)??捎觅Y源的確定包括確定人員、技能集、網(wǎng)絡(luò)能力、計(jì)算設(shè)備、預(yù)算、時(shí)間約束、軟件系統(tǒng)、數(shù)據(jù)庫管理系統(tǒng)應(yīng)用程序接口和存儲(chǔ)器。確定安全性和機(jī)密性需求包括確定例如由健康保險(xiǎn)便攜性和隱私法案以及其他法令和契約限制強(qiáng)加的病歷機(jī)密性。設(shè)計(jì)最優(yōu)的聯(lián)合數(shù)據(jù)庫管理系統(tǒng)的最終步驟使用實(shí)體統(tǒng)一化方案、共形維度、聚合方案,統(tǒng)一的元數(shù)據(jù)以及統(tǒng)一的數(shù)據(jù)模型中的一個(gè)或多個(gè)。在聯(lián)合系統(tǒng)被配置之后,應(yīng)用可向聯(lián)合服務(wù)器提交用SQL寫的查詢。聯(lián)合服務(wù)器優(yōu)化該查詢,開發(fā)其中查詢被分解成可在各個(gè)數(shù)據(jù)源上執(zhí)行的片段的執(zhí)行計(jì)劃。如上所述,查詢的很多分解都是可能的,并且優(yōu)化器根據(jù)最小的預(yù)計(jì)總資源消耗在其中進(jìn)行選擇。一旦已選擇計(jì)劃,聯(lián)合服務(wù)器就會(huì)驅(qū)動(dòng)執(zhí)行,調(diào)用包裝器來執(zhí)行分配給它們的片段。為了執(zhí)行片段,包裝器執(zhí)行完成工作所需要的任何數(shù)據(jù)源操作,這可能是被提交給數(shù)據(jù)源的用本機(jī)查詢語言寫成的一系列函數(shù)調(diào)用或查詢。得到的數(shù)據(jù)流被返回聯(lián)合服務(wù)器,該服務(wù)器組合這些數(shù)據(jù)流,執(zhí)行任何另外的不能被數(shù)據(jù)源完成的處理,并將最終結(jié)果返回應(yīng)用。如圖9所示,該方法包括向與聯(lián)合服務(wù)器相關(guān)聯(lián)的應(yīng)用提交查詢的步驟301。隨后是在聯(lián)合服務(wù)器內(nèi)優(yōu)化該查詢的步驟303。接下來,將該查詢分解成用于在各個(gè)數(shù)據(jù)源執(zhí)行的片段305,并調(diào)用包裝器來執(zhí)行片段307。下一步,將數(shù)據(jù)流返回聯(lián)合服務(wù)器309。組合返回的數(shù)據(jù)流并執(zhí)行數(shù)據(jù)源沒有完成的任何另外的處理311。將最終結(jié)果返回與聯(lián)合服務(wù)器相關(guān)聯(lián)的應(yīng)用313。解決方案的實(shí)際優(yōu)化包括首先優(yōu)化優(yōu)化技術(shù)和工具的選擇,然后使用優(yōu)化工具和技術(shù)的優(yōu)化選擇獲得最優(yōu)或相對(duì)最優(yōu)的解決方案。圖10示出從約束變量和約束的輸入通過對(duì)約束和變量的分析到優(yōu)化所述優(yōu)化工具和技術(shù)并執(zhí)行優(yōu)化的判定樹。這樣,可將數(shù)據(jù)與優(yōu)化工具和技術(shù)相匹配,即將變量和約束與ETL或聯(lián)合或它們的混合相匹配。圖10的判定樹包括查看每種數(shù)據(jù)類型,查看模型,查看元數(shù)據(jù),并優(yōu)化以得到初始的一組可行的方法和工具,然后得到初始的一組最優(yōu)或近似最優(yōu)的解決方案。通常,隨后逐步調(diào)整加權(quán)函數(shù)和目標(biāo)函數(shù)。在此上下文中,優(yōu)化可包括從數(shù)據(jù)庫將有限的數(shù)據(jù)提取到中間和虛擬表,并從中間和虛擬表提取選擇的數(shù)據(jù)以便進(jìn)一步處理。這避免了在機(jī)密或受限數(shù)據(jù)上進(jìn)行處理。在圖11的流程圖示出的本發(fā)明的優(yōu)選示例中,利用數(shù)據(jù)庫聯(lián)合和“提取、轉(zhuǎn)換和加載”(“ETL”)數(shù)據(jù)庫管理系統(tǒng)的協(xié)作401來查詢、搜索和選擇性地提取數(shù)據(jù)403,呈現(xiàn)數(shù)據(jù)405,然后使用復(fù)雜優(yōu)化例如整數(shù)規(guī)劃、混合整數(shù)規(guī)劃、試探法和人工智能等技術(shù)進(jìn)行數(shù)據(jù)分析和呈現(xiàn)407。這些步驟可包括試探法。另外,數(shù)據(jù)分析和呈現(xiàn)的步驟可得出這樣的結(jié)果,該結(jié)果指示不可得到數(shù)值結(jié)果,或者需要另外的數(shù)據(jù),或者候選解決方案集合需要人為干預(yù)409,并且如果這樣指示的話請(qǐng)求另外的數(shù)據(jù)411。查詢、搜索和選擇性提取數(shù)據(jù)的步驟遵守具體化和呈現(xiàn)上的約束執(zhí)行。作為示例而不是限制,這些約束包括私密個(gè)人數(shù)據(jù)例如性傳播疾病的存在或不存在、遺傳異常的存在或不存在乃至信譽(yù)度。類似地,所述約束可包括制度上機(jī)密的數(shù)據(jù)例如何人將執(zhí)行工作、資源分配和提交、預(yù)算、技能集、策略、費(fèi)用分?jǐn)?、代替現(xiàn)金支付的實(shí)物捐獻(xiàn)、輸入和輸出的時(shí)間約束。另外,在臨床、測試或流行病學(xué)上下文中,信息傳遞可被法律例如HIPP限制和私人限制約束。所述約束可促使數(shù)據(jù)僅短暫地和暫時(shí)地可用,并且僅能實(shí)時(shí)使用。這可避免具體化。類似地,可通過僅將數(shù)據(jù)庫主密鑰和私人識(shí)別標(biāo)記(personalidentificationindicia)登記在永不會(huì)具體化的虛擬表中來保持它們機(jī)密。數(shù)據(jù)輸入可以是一部分一部分的,這可能是由于數(shù)據(jù)庫聯(lián)合或數(shù)據(jù)接口。對(duì)數(shù)據(jù)輸入的約束可被資源或預(yù)算驅(qū)動(dòng)。通常,聯(lián)合系統(tǒng)可用于存在多個(gè)數(shù)據(jù)源并且需要組合來自這些源的信息的任何場合。醫(yī)學(xué)研究、藥物測試、臨床護(hù)理和學(xué)術(shù)研究等等是多位置活動(dòng),這種活動(dòng)意味著需要協(xié)調(diào)在全世界的多個(gè)位置的活動(dòng)。例如,醫(yī)藥公司可能在歐洲和美國具有實(shí)驗(yàn)室。每個(gè)實(shí)驗(yàn)室都具有尋找新藥物以對(duì)抗特定疾病的科學(xué)家。這些科學(xué)家都必須訪問存儲(chǔ)在專用系統(tǒng)內(nèi)的化合物數(shù)據(jù)庫,所述系統(tǒng)允許用化合物的特定特性或化學(xué)結(jié)構(gòu)(結(jié)構(gòu)相似性)進(jìn)行搜索。在兩個(gè)實(shí)驗(yàn)室中,科學(xué)家進(jìn)行化合物的高吞吐量篩選以測試它們針對(duì)不同生物學(xué)目標(biāo)的有效性。這些測試的結(jié)果存儲(chǔ)在每個(gè)實(shí)驗(yàn)室的關(guān)聯(lián)數(shù)據(jù)庫中??茖W(xué)家訪問的其他數(shù)據(jù)源包括基因組和蛋白質(zhì)組(proteomic)信息的大的平面文件,臨床試驗(yàn)或疾病過程的多維結(jié)果,患者數(shù)據(jù)庫,數(shù)據(jù)和分析的電子表格,圖像和文本文檔。例如,不同實(shí)驗(yàn)室中的科學(xué)家具有不同但關(guān)聯(lián)的任務(wù),追求不同但關(guān)聯(lián)的治療或處理。這導(dǎo)致他們進(jìn)行不同的試驗(yàn),并專注于特定的多組化合物。但是,同一種化合物往往可對(duì)不同目標(biāo)是有用的,并且有時(shí)一個(gè)測試可對(duì)于其他測試的結(jié)果是好的指示。因此,重要的是,一個(gè)實(shí)驗(yàn)室中的科學(xué)家能夠訪問在另一個(gè)實(shí)驗(yàn)室產(chǎn)生的數(shù)據(jù)以便不進(jìn)行重復(fù)工作。盡管這可通過建立包含所有化合物數(shù)據(jù)和測試結(jié)果的大倉庫實(shí)現(xiàn),但是此方法存在一些缺點(diǎn)。首先,測試結(jié)果數(shù)據(jù)快速變化,每天都會(huì)從大西洋兩側(cè)添加成千上萬的記錄,這使得難以維護(hù)。其次,或者倉庫必須在兩個(gè)地點(diǎn)被復(fù)制,或者某一地點(diǎn)必須承受較慢的訪問數(shù)據(jù)的性能。復(fù)制會(huì)增加解決方案的成本以及維護(hù)的復(fù)雜性。第三,需要將今天存儲(chǔ)在專門儲(chǔ)存庫內(nèi)的化合物數(shù)據(jù)遷移到關(guān)系數(shù)據(jù)庫,包括重新實(shí)現(xiàn)搜索算法以及任何現(xiàn)有的應(yīng)用。聯(lián)合解決方案消除了這些問題。數(shù)據(jù)保留在現(xiàn)有數(shù)據(jù)源中,同時(shí)它們的本機(jī)訪問路徑未改變,當(dāng)前應(yīng)用未改變地運(yùn)行。但是,可容易地構(gòu)建不管洲、元數(shù)據(jù)或模式如何均可從任何源訪問數(shù)據(jù)的應(yīng)用。本地?cái)?shù)據(jù)依然是本地的,以便進(jìn)行快速訪問。根據(jù)需要,仍可訪問較不經(jīng)常使用的遠(yuǎn)程數(shù)據(jù),并且可由聯(lián)合服務(wù)器優(yōu)化查詢以確保盡可能高效地檢索它們。如果需要的話,對(duì)于被兩個(gè)實(shí)驗(yàn)室頻繁訪問的數(shù)據(jù)的那些部分仍可使用復(fù)制。如果用戶可在多個(gè)不同數(shù)據(jù)庫上工作,包括選擇、插入、更新和刪除,就好像所有表都位于單個(gè)數(shù)據(jù)庫內(nèi)似的,則可大大提高生產(chǎn)率。數(shù)據(jù)庫聯(lián)合正好可這樣做它使得表看上去象都位于相同數(shù)據(jù)庫內(nèi)。聯(lián)合系統(tǒng)在遠(yuǎn)程系統(tǒng)即“數(shù)據(jù)源”內(nèi)的表上操作。該遠(yuǎn)程表在聯(lián)合數(shù)據(jù)庫服務(wù)器112數(shù)據(jù)庫內(nèi)表現(xiàn)為虛擬表。客戶機(jī)應(yīng)用程序可在聯(lián)合數(shù)據(jù)庫服務(wù)器112數(shù)據(jù)庫內(nèi)的虛擬表上執(zhí)行操作,但是,真正的持久存儲(chǔ)位于遠(yuǎn)程數(shù)據(jù)庫121、125內(nèi)。每個(gè)后端數(shù)據(jù)源121、125將聯(lián)合數(shù)據(jù)庫服務(wù)器112僅看作另一個(gè)數(shù)據(jù)庫客戶機(jī)連接。后端數(shù)據(jù)源121、125僅服務(wù)于對(duì)數(shù)據(jù)庫操作的客戶機(jī)請(qǐng)求。聯(lián)合數(shù)據(jù)庫服務(wù)器112需要客戶機(jī)軟件來訪問每個(gè)遠(yuǎn)程數(shù)據(jù)庫。IBMInformix、Sybase、Oracle等的客戶機(jī)軟件需要被安裝以訪問每種后端數(shù)據(jù)源121、125。到數(shù)據(jù)庫聯(lián)合的應(yīng)用接口是SQL。這與必須學(xué)習(xí)一種新的接口相比,可大大提高生產(chǎn)率。可使用與本地表相同的用于選擇、插入、更新和刪除的語法訪問遠(yuǎn)程表。并不是所有表操作都可進(jìn)行,但是DB2v8內(nèi)的InformationIntegrator通過提供插入和更新功能而前進(jìn)了一大步?!鞍b器”定義了理解如何與后端數(shù)據(jù)源數(shù)據(jù)庫121、125通信的庫文件(其中庫在圖7中表示為元件114)。它使用客戶機(jī)連接軟件來訪問遠(yuǎn)程數(shù)據(jù)庫。存在兩種定義包裝器的方法,使用SQL或在DB2v8內(nèi)使用圖形用戶界面(GUI)。使用SQL形成包裝器的示例如下所示|CREATEWRAPPER“INFORMIX”LIBRARY‘db2informix.dll’;|GUI向?qū)菑目刂浦行陌l(fā)起的。下面給出SQL的示例CREATESERVER“rcfliif”TYPEINFORMIXVERSION‘9.3’WRAPPER“INFORMIX”O(jiān)PTIONS(NODE‘fliif’,DBNAME‘stores_demo’,ADDCPU_RATIO‘1’,ADDIO_RATIO‘1’,ADDCOMM_RATE‘1’,ADDDB2_MAXIMAL_PUSHDOWN‘Y’);NODE指定了遠(yuǎn)程數(shù)據(jù)庫服務(wù)器并且不是TCP/IP主機(jī)名。DBNAME定義了遠(yuǎn)程數(shù)據(jù)庫。PUSHDOWN是默認(rèn)的,其指示聯(lián)結(jié)應(yīng)該在遠(yuǎn)程服務(wù)器上發(fā)生。在后面將對(duì)此進(jìn)行測試并查看一些數(shù)據(jù)庫優(yōu)化器解釋計(jì)劃(explainplan)。本發(fā)明例如可通過具有這樣的系統(tǒng)實(shí)現(xiàn),該系統(tǒng)用于通過在一個(gè)或一組專用處理器中或者在具有專用代碼的一個(gè)或一組專用處理器中執(zhí)行作為軟件應(yīng)用的方法從聯(lián)合數(shù)據(jù)庫管理系統(tǒng)搜索、提取、轉(zhuǎn)換、加載和呈現(xiàn)數(shù)據(jù)。該代碼執(zhí)行一系列機(jī)器可讀指令,所述指令也被稱為代碼。這些指令可位于不同類型的信號(hào)承載介質(zhì)內(nèi)。在此方面,本發(fā)明的一個(gè)方面涉及一種包括有形地包含機(jī)器可讀指令的程序的信號(hào)承載介質(zhì)或信號(hào)承載媒體的程序產(chǎn)品,所述機(jī)器可讀指令的程序可被數(shù)字處理裝置執(zhí)行以執(zhí)行作為軟件應(yīng)用的用于從聯(lián)合數(shù)據(jù)庫管理系統(tǒng)搜索、提取、轉(zhuǎn)換、加載和呈現(xiàn)數(shù)據(jù)的方法。該信號(hào)攜帶介質(zhì)可包括例如服務(wù)器中的存儲(chǔ)器。服務(wù)器中的存儲(chǔ)器可以是非易失性的存儲(chǔ)器、數(shù)據(jù)盤乃至用于下載到處理器以便安裝的廠商服務(wù)器上的存儲(chǔ)器?;蛘呖蛇x擇地,所述指令可被包含在信號(hào)承載介質(zhì)例如光數(shù)據(jù)存儲(chǔ)盤內(nèi)?;蛘呖蛇x擇地,所述指令可存儲(chǔ)在多種機(jī)器可讀數(shù)據(jù)存儲(chǔ)介質(zhì)或媒體中的任何一個(gè)上,所述機(jī)器可讀數(shù)據(jù)存儲(chǔ)介質(zhì)或媒體可包括例如“硬盤驅(qū)動(dòng)器”、RAID陣列、RAMAC、磁數(shù)據(jù)存儲(chǔ)軟盤(例如軟盤)、磁帶、數(shù)字光帶、RAM、ROM、EPROM、EEPROM、閃速存儲(chǔ)器、磁光存儲(chǔ)器、紙制穿孔卡片,或任何其他合適的信號(hào)承載介質(zhì),包括傳輸介質(zhì),例如可以是電的、光的和/或無線的數(shù)字和/或模擬通信鏈路。作為示例,機(jī)器可讀指令可包含從語言例如“C++”、Java、Pascal、ADA、匯編程序等編譯的軟件目標(biāo)代碼。另外,程序代碼例如可被壓縮、加密或進(jìn)行這兩個(gè)操作,并且可如在Zip代碼和cab代碼內(nèi)包括可執(zhí)行代碼、腳本代碼以及安裝向?qū)?。如文中使用的,術(shù)語位于信號(hào)承載介質(zhì)內(nèi)或上的機(jī)器可讀指令或代碼包括所有上述運(yùn)送手段。盡管前面的公開示出本發(fā)明的許多例示性實(shí)施例,但是對(duì)于本領(lǐng)域的那些技術(shù)人員很明顯,可實(shí)現(xiàn)許多修改和變型而不會(huì)背離被所附權(quán)利要求限定的本發(fā)明的范圍。此外,盡管可用單數(shù)說明或要求保護(hù)本發(fā)明的元件,也設(shè)想了復(fù)數(shù),除非明確地規(guī)定局限于單數(shù)。權(quán)利要求1.一種用于優(yōu)化具有聯(lián)合數(shù)據(jù)庫服務(wù)器和多個(gè)數(shù)據(jù)源服務(wù)器的聯(lián)合數(shù)據(jù)庫管理系統(tǒng)的方法,該方法包括以下步驟a)確定數(shù)據(jù)源服務(wù)器的模式和元數(shù)據(jù)配置;b)列舉可用資源;c)列舉安全性和機(jī)密性需求;d)根據(jù)該模式和元數(shù)據(jù)、列舉的可用資源以及列舉的安全性和機(jī)密性需求計(jì)算最優(yōu)的聯(lián)合數(shù)據(jù)庫管理系統(tǒng);并e)設(shè)計(jì)最優(yōu)的聯(lián)合數(shù)據(jù)庫管理系統(tǒng);以及f)提供用于包括用戶試探和數(shù)據(jù)輸入的用戶輸入的功能。2.根據(jù)權(quán)利要求1的方法,其中,可用資源包括人員、技能集、網(wǎng)絡(luò)能力、計(jì)算設(shè)備、預(yù)算、時(shí)間約束、軟件系統(tǒng)、數(shù)據(jù)庫管理系統(tǒng)應(yīng)用程序接口和存儲(chǔ)器。3.根據(jù)權(quán)利要求1的方法,其中,所述安全性和機(jī)密性需求包括病歷機(jī)密性。4.根據(jù)權(quán)利要求1的方法,還包括使用實(shí)體統(tǒng)一化方案、共形維度、聚合方案,統(tǒng)一的元數(shù)據(jù)以及統(tǒng)一的數(shù)據(jù)模型中的一個(gè)或多個(gè)設(shè)計(jì)最優(yōu)的聯(lián)合數(shù)據(jù)庫管理系統(tǒng)。5.一種向聯(lián)合數(shù)據(jù)庫管理系統(tǒng)提交查詢并從該系統(tǒng)獲得優(yōu)化的輸出的方法,該方法包括以下步驟a)向與聯(lián)合服務(wù)器相關(guān)聯(lián)的應(yīng)用提交查詢;b)在聯(lián)合服務(wù)器內(nèi)優(yōu)化該查詢;c)將該查詢分解成用于在各個(gè)數(shù)據(jù)源執(zhí)行的片段;d)調(diào)用包裝器來執(zhí)行片段;e)將數(shù)據(jù)流返回聯(lián)合服務(wù)器;f)組合返回的數(shù)據(jù)流,并執(zhí)行數(shù)據(jù)源沒有完成的任何另外的處理;以及g)將最終結(jié)果返回與聯(lián)合服務(wù)器相關(guān)聯(lián)的應(yīng)用。6.根據(jù)權(quán)利要求5的方法,其中,所述最終結(jié)果是對(duì)用戶交互的請(qǐng)求。7.根據(jù)權(quán)利要求5的方法,其中,所述最終響應(yīng)是數(shù)據(jù)。8.根據(jù)權(quán)利要求5的方法,包括通過包裝器執(zhí)行數(shù)據(jù)源操作以進(jìn)行指定的函數(shù)調(diào)用和查詢的步驟來執(zhí)行所述片段,其中查詢以本機(jī)查詢語言被提交給數(shù)據(jù)源。9.根據(jù)權(quán)利要求5的方法,其中,各個(gè)數(shù)據(jù)源處的執(zhí)行包括從數(shù)據(jù)服務(wù)器提取、傳遞和加載數(shù)據(jù)。10.根據(jù)權(quán)利要求9的方法,其中,各個(gè)數(shù)據(jù)源處的執(zhí)行包括動(dòng)態(tài)地實(shí)時(shí)地從數(shù)據(jù)服務(wù)器提取、傳遞和加載數(shù)據(jù)而沒有使其具體化。11.一種包括用于執(zhí)行根據(jù)權(quán)利要求1-10的方法中的任何一個(gè)的裝置的系統(tǒng)。全文摘要用于配置和使用聯(lián)合數(shù)據(jù)庫管理系統(tǒng)的方法、系統(tǒng)和程序產(chǎn)品。元數(shù)據(jù)和查詢的設(shè)計(jì)包括首先確定數(shù)據(jù)源服務(wù)器的模式和元數(shù)據(jù)配置的步驟。下一個(gè)步驟是列舉可用資源,并列舉安全性和機(jī)密性需求。這些用于根據(jù)該模式和元數(shù)據(jù)、列舉的可用資源以及列舉的安全性和機(jī)密性需求計(jì)算最優(yōu)的聯(lián)合數(shù)據(jù)庫管理系統(tǒng)設(shè)計(jì);并設(shè)計(jì)最優(yōu)的聯(lián)合數(shù)據(jù)庫管理系統(tǒng)。文檔編號(hào)G06F17/30GK101067823SQ20071010774公開日2007年11月7日申請(qǐng)日期2007年4月29日優(yōu)先權(quán)日2006年5月2日發(fā)明者R·R·弗里德蘭德,J·R·克雷默,R·亨尼塞申請(qǐng)人:國際商業(yè)機(jī)器公司