基于圖挖掘技術(shù)的語義化業(yè)務生成系統(tǒng)和方法

文檔序號：6518915閱讀：217來源：國知局

基于圖挖掘技術(shù)的語義化業(yè)務生成系統(tǒng)和方法
【專利摘要】一種基于圖挖掘技術(shù)的語義化Web業(yè)務生成系統(tǒng)和方法，系統(tǒng)基于傳統(tǒng)服務器構(gòu)建而成，利用包括自然語言分詞、圖挖掘、聚類、語義化分析、服務流程化生成和服務執(zhí)行的多項技術(shù)，對用戶使用自然語言或文字描述的應用需求進行收集和分析后，自動提取關(guān)鍵詞，并解析其服務需求，再在構(gòu)造的Web服務樹圖中挖掘出可用的服務及其組合方式，最后在系統(tǒng)集成運行環(huán)境中，完成服務的自動執(zhí)行，并反饋執(zhí)行結(jié)果。本發(fā)明優(yōu)點是：直接對用戶自然語言或文字描述的需求進行操作，注重語義化特性，還集成了業(yè)務執(zhí)行環(huán)境，直接得到業(yè)務運行結(jié)果，既貼近和符合用戶的使用習慣與需求，有利于擴大用戶范圍，還實現(xiàn)了系統(tǒng)的整體自動化運行和維護，適用于分布式的執(zhí)行環(huán)境。
【專利說明】基于圖挖掘技術(shù)的語義化業(yè)務生成系統(tǒng)和方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種基于圖挖掘技術(shù)的語義化Web業(yè)務生成系統(tǒng)和方法，屬于計算機和網(wǎng)絡的【技術(shù)領(lǐng)域】。
【背景技術(shù)】
[0002]Web 服務(Web Service)是一種服務導向架構(gòu) SOA (Service-orientedarchitecture)的技術(shù)，通過標準的Web協(xié)議提供各種應用服務，目的是保證不同平臺的應用服務可以互操作。Web服務是一種具有自包含、自描述、模塊化特性和基于Internet的新型分布式計算模型。Web服務中的主從式架構(gòu)(Client-server)之間根據(jù)簡單對象訪問協(xié)議SOAP (Simple Object Access Protocol)傳遞XML格式消息,在Web服務中，由服務器提供一個機器可讀的描述(通?；赪SDL描述語言)，以辨識服務器所提供的Web服務。由于每個Web服務往往用于完成單項或單獨的任務，并不能迎合用戶的多重需求，因此如何將多個Web服務進行組合執(zhí)行已經(jīng)成為學術(shù)界研究的熱點。
[0003]現(xiàn)有技術(shù)中，有關(guān)Web服務組合技術(shù)問題主要有以下三種實現(xiàn)方式:
[0004]第一種現(xiàn)有技術(shù):文獻《Studyon Semantic Web Service Composition Basedon Petri Net》(干丨_|于 Journal of Hebei University of Engineering Natural ScienceEdition, 2009)實現(xiàn)了一種基于Petri網(wǎng)結(jié)構(gòu)的Web服務生成方式:通過Petri網(wǎng)對語義層次上的Web服務組合進行描述與建模，并將Petri網(wǎng)形式化元素加入到Web服務中，然后對Petri網(wǎng)模型用XML進行描述，使之能在實際中應用。最后，給出了基于Petri網(wǎng)的Web服務組合應用實例。
[0005]該技術(shù)是基于Petri網(wǎng)的結(jié)構(gòu)實現(xiàn)的，形式為模式化、流程化的輸入輸出串聯(lián)，并借助Petri網(wǎng)的思想形成流程圖的方式。這種模型更多地用于Web服務組合的驗證和分析，而不適用于Web組合從無到有的構(gòu)造過程。
[0006]第二種現(xiàn)有技術(shù):文獻《WebService Composition Algorithm Based on QoSRelation))(刊于 Computer Engineering, Vol.37, N0.18, 2011)提出一種基于 QoS 關(guān)聯(lián)的Web服務生成方法，反映了 Web服務組合過程中服務類之間的關(guān)聯(lián)性和客戶對服務非功能屬性的偏好，以及服務調(diào)用過程中不同服務質(zhì)量QoS屬性。在評價服務組合優(yōu)劣程度過程中，考慮服務類在QoS屬性上的關(guān)聯(lián)關(guān)系，對QoS數(shù)據(jù)進行統(tǒng)一規(guī)格化和綜合評估。實驗證明，該方法具有較好的執(zhí)行效率和穩(wěn)定性。
[0007]該技術(shù)方法需要借助服務的QoS信息作為Web服務組合的主要參照對象。QoS為網(wǎng)絡服務的質(zhì)量參數(shù)，其衡量參數(shù)是服務網(wǎng)絡的傳輸帶寬、傳送時延、數(shù)據(jù)丟包率等。因此該方案更適合于確定流程組合后，在功能相同的Web服務中，根據(jù)QoS屬性選擇優(yōu)化的服務進行組合。對于流程設計和確定，幫助不大。
[0008]第三種現(xiàn)有技術(shù):文獻《AnApproach to Constructing WebService Workflow Based on Business Spanning Graph》(干丨 J 于 Journal ofSoftware, Vol.18，N0.8，August2007)與本發(fā)明裝置與方法最為相近，它提出了一種基于業(yè)務生成圖的Web服務工作流構(gòu)造模型。該模型將功能相同或相似的服務聚集成一類服務集合，每類服務集合采用生成樹的方式組織，并依據(jù)工作流的業(yè)邏輯關(guān)系形成業(yè)務生成圖。同時，在重定義粒子群算法的位置、速度、加/減法和乘法的基礎上，結(jié)合遺傳算法中的交叉和變異操作。該模型能夠有效地屏蔽組成工作流的Web服務物理上的變化與差異，較好地組合了 Internet中的Web服務資源，適合于虛擬計算環(huán)境的應用要求。
[0009]該技術(shù)的業(yè)務生成圖中的Web服務生成構(gòu)造方法，所使用的服務流程圖是一種半自動服務組合方式:首先要由用戶根據(jù)需求建立適合具體應用需求的工作流業(yè)務邏輯模型。對于Web服務的自動化生成應用來說，工作流的業(yè)務邏輯模型對于用戶應該是透明的，并且該方法的適用范圍有限，只適用于已具備相應基礎知識的用戶。而對于普通用戶來說，其能夠描述的只是自然語言上的需求，不可能也不會去構(gòu)造邏輯模型。
[0010]總之，上述現(xiàn)有技術(shù)都不能夠很好地解決Web服務生成技術(shù)的相關(guān)問題。

【發(fā)明內(nèi)容】

[0011]有鑒于此，本發(fā)明的目的是提供一種基于圖挖掘技術(shù)的語義化Web業(yè)務生成系統(tǒng)和方法，用于解決下述多個技術(shù)問題:1、為用戶的自然語言或文字描述的需求提供自動化的服務生成模式支持，實現(xiàn)從自然語言或文字中提取關(guān)鍵字，進而分解需求，再通過需求執(zhí)行服務查找，最終自動生成Web服務的過程。2、該系統(tǒng)的輸入為廣義上的自然語言或文字，因此適用于各種輸入接口，網(wǎng)絡終端和移動終端都可以進行適配。3、Web服務的業(yè)務生成注重自然語言或文字的語義化特性，而不是單一的借助服務定義中的輸入輸出匹配。4、在服務生成后，加入服務的直接執(zhí)行部分，得到的反饋不是單一的服務組合流程，而是直接的執(zhí)行結(jié)果的反饋。
[0012]為了達到上述目的，本發(fā)明提供了一種基于圖挖掘技術(shù)的語義化Web業(yè)務生成系統(tǒng)，其特征在于:該系統(tǒng)是基于傳統(tǒng)服務器構(gòu)建而成，系統(tǒng)利用包括自然語言分詞、圖挖掘、聚類、語義化分析、服務流程化生成和服務執(zhí)行的多項技術(shù)，對用戶使用自然語言或文字描述的應用需求進行收集和分析后，自動提取關(guān)鍵詞并解析其服務需求，再在構(gòu)造的Web服務圖中挖掘出可用的服務及其組合方式，最后在該系統(tǒng)集成運行環(huán)境中，完成服務的自動執(zhí)行，并反饋返回執(zhí)行結(jié)果；該系統(tǒng)設有下述五個組成構(gòu)件:自然語言收集構(gòu)件、自然語言分析構(gòu)件、網(wǎng)絡服務挖掘組織構(gòu)件、網(wǎng)絡服務生成構(gòu)件和網(wǎng)絡服務執(zhí)行構(gòu)件；其中:
[0013]自然語言收集構(gòu)件，為具有通用接口和開發(fā)功能的網(wǎng)絡終端，作為該系統(tǒng)的輸入端，用于通過網(wǎng)頁、安卓或IOS系統(tǒng)客戶端軟件獲取用戶自然語言或文字的輸入信息:包括格式化字段和非格式化的自然語言或文字，以收集與獲取用戶的需求描述，并將語言或文字傳遞給自然語言分析構(gòu)件；該自然語言收集構(gòu)件能夠適配多種終端，以滿足用戶的不同需求，并為其他開發(fā)者提供開發(fā)與擴展平臺；
[0014]自然語言分析構(gòu)件，作為直接接受用戶信息的前端，負責對用戶輸入的自然語言或文字描述的需求執(zhí)行機器化分析和學習，獲知用戶輸入信息的意圖，進而分析用戶需求，為網(wǎng)絡服務生成構(gòu)件提供機器可識別的格式化信息；其順序設有:與詞性標注數(shù)據(jù)庫連接的詞性標注模塊、長句邏輯切分模塊、關(guān)鍵詞抽取模塊、同義詞詞典映射模塊和信息模板抽取模塊，以及分別與后述四個模塊交互信息的語句詞性語義信息構(gòu)建模塊；
[0015]網(wǎng)絡服務挖掘組織構(gòu)件，負責藉由垂直搜索領(lǐng)域的爬蟲、索引和聚類的技術(shù)，采用圖挖掘技術(shù)的組織思路，對用戶在網(wǎng)絡上使用的各種可用服務進行抓取、挖掘和收集，并在進行系統(tǒng)的初步分析后，構(gòu)建為森林式服務組織樹圖，并存儲于服務數(shù)據(jù)庫，以供網(wǎng)絡服務生成構(gòu)件使用；設有:網(wǎng)絡服務爬蟲模塊、網(wǎng)絡服務聚類模塊、語義化服務建圖模塊、圖操作接口模塊和服務數(shù)據(jù)庫；
[0016]網(wǎng)絡服務生成構(gòu)件，負責對用戶需求做出相應、及時的服務識別和服務生成，并形成一套可行的服務方案:其輸入分別來自自然語言分析構(gòu)件和網(wǎng)絡服務挖掘組織構(gòu)件:由自然語言分析構(gòu)件得到包括關(guān)鍵詞的匹配結(jié)果和詞義、詞性判斷的結(jié)構(gòu)化的詞語需求分析結(jié)果，由網(wǎng)絡服務挖掘組織構(gòu)件得到統(tǒng)一的圖操作接口和能夠查詢的服務數(shù)據(jù)庫；再對提取的用戶格式化需求信息進行機器判定和語義化分析，形成具有針對性的服務查詢需求，并執(zhí)行相關(guān)操作，生成對應格式的網(wǎng)絡服務；設有:順序連接的輸入解析模塊、查詢規(guī)則生成模塊、圖操作模塊、信息提取模塊和Bpel業(yè)務模板生成模塊；
[0017]網(wǎng)絡服務執(zhí)行構(gòu)件，為應用開放性原則設計的應用環(huán)境，負責利用包括Bpel格式和所有支持Bpel格式適配的執(zhí)行環(huán)境執(zhí)行適配所生成的網(wǎng)絡服務，并執(zhí)行該服務整體方案；并結(jié)合用戶的使用方式和形式，將執(zhí)行結(jié)果及時反饋給用戶；該構(gòu)件作為系統(tǒng)的輸出，也能藉由符合輸出接口標準的其他構(gòu)件完成相應操作和返回執(zhí)行結(jié)果。
[0018]為了達到上述目的，本發(fā)明還提供了一種本發(fā)明基于圖挖掘技術(shù)的語義化Web業(yè)務生成系統(tǒng)的工作方法，其特征在于:所述方法包括下列操作步驟:
[0019](I)系統(tǒng)通過自然語言收集構(gòu)件、即終端采用各類形式的收集器接收來自用戶采用自然語音或文字輸入的應用需求，并由自然語言收集構(gòu)件對用戶輸入進行處理后，發(fā)送到自然語言分析構(gòu)件；
[0020](2)自然語言分析構(gòu)件對自然語言收集構(gòu)件處理后的需求進行機器識別處理，自動形成結(jié)構(gòu)化的Web網(wǎng)絡應用需求，并轉(zhuǎn)送到網(wǎng)絡服務生成構(gòu)件；
[0021](3)網(wǎng)絡服務挖掘組織構(gòu)件利用搜索引擎的思想及技術(shù)，抓取網(wǎng)絡中的服務后，將Web服務數(shù)據(jù)存入服務數(shù)據(jù)庫；服務聚類模塊利用聚類算法對抓取的各個零散的Web服務進行基于內(nèi)容的信息聚類處理，并在每個聚類塊中提取關(guān)鍵詞作為歸類的依據(jù)，再提取關(guān)鍵詞，構(gòu)成聚類數(shù)據(jù)和存入服務數(shù)據(jù)庫；語義化服務建圖模塊根據(jù)服務數(shù)據(jù)庫中的原始服務信息和聚類數(shù)據(jù)，借助圖挖掘的組織思想，對Web服務進行結(jié)構(gòu)化組織，建立森林式的服務組織樹圖；同時根據(jù)系統(tǒng)需要，添加其他自定義的、能被系統(tǒng)識別的服務后，將服務組織樹圖永久性地存儲于服務數(shù)據(jù)庫；并向網(wǎng)絡服務生成構(gòu)件提供使用圖操作的統(tǒng)一接口；
[0022](4)網(wǎng)絡服務生成構(gòu)件接收來自自然語言分析構(gòu)件的分析結(jié)果，并與網(wǎng)絡服務挖掘組織構(gòu)件協(xié)同合作，進行服務查找和組織，形成一套整體的服務執(zhí)行方案，即生成Bpel格式的網(wǎng)絡服務組織結(jié)果；
[0023](5)網(wǎng)絡服務執(zhí)行構(gòu)件接收來自網(wǎng)絡服務生成構(gòu)件的Bpel格式的Web服務執(zhí)行方案，并將該Web服務的Bpel文件分發(fā)到業(yè)務處理節(jié)點上的Bpel執(zhí)行容器中運行，并根據(jù)用戶的使用方式和形式，將最終執(zhí)行結(jié)果反饋給用戶。
[0024]本發(fā)明基于圖挖掘技術(shù)的語義化Web業(yè)務生成系統(tǒng)和方法是基于圖挖掘技術(shù)的思想，運用聚類、接口匹配、語義化分析、服務執(zhí)行等技術(shù)對Web服務進行分析，對用戶采用自然語言或文字描述的應用需求進行解析和相應的機器學習，通過服務組織樹圖結(jié)構(gòu)和圖挖掘算法對網(wǎng)絡應用服務進行組合，最后在執(zhí)行環(huán)境中完成服務的自動執(zhí)行并返回結(jié)果。其關(guān)鍵技術(shù)包括:
[0025]本發(fā)明是基于自然語言或文字直接描述的應用需求進行處理的業(yè)務生成系統(tǒng)，其業(yè)務生成過程既不依賴用戶對系統(tǒng)技術(shù)的了解，也不依賴用戶終端的實現(xiàn)方式，而是直接貼近用戶的日常行為和習慣的表達方式，屏蔽了通常搜索引擎對搜索詞結(jié)構(gòu)的依賴性。
[0026]本發(fā)明系統(tǒng)采用一種基于森林式的服務組織樹圖的存儲結(jié)構(gòu)，引入主干節(jié)點，枝干節(jié)點和葉子(服務)節(jié)點共存的組織方式，屏蔽了單純由QoS信息或輸入輸出結(jié)構(gòu)進行判定的片面性，從語義化特性入手，結(jié)合輸入輸出參數(shù)匹配和QoS信息等特征，構(gòu)造出完成整體應用需求的Web服務組合。
[0027]本發(fā)明提出一種結(jié)合網(wǎng)絡服務生成與執(zhí)行為一體的解決方案，與傳統(tǒng)的只集中于業(yè)務生成方向的研究不同。本發(fā)明還設置有執(zhí)行環(huán)境，能夠自動化地執(zhí)行整個操作流程，并直接反饋運行結(jié)果，對用戶屏蔽了 Web服務及組合執(zhí)行的內(nèi)部過程，對用戶更加友好。
[0028]與最接近的現(xiàn)有技術(shù)相比較，本發(fā)明系統(tǒng)和方法的優(yōu)點是:
[0029]與第一種現(xiàn)有技術(shù)相比較，本發(fā)明提出了一種基于樹圖組織結(jié)構(gòu)的Web服務生成方法，不僅涉及流程中的輸入輸出工作流，更加注重語義化特性的構(gòu)造。從語義角度切入業(yè)務組織和生成過程，更加貼近和符合用戶的需求。
[0030]與第二種現(xiàn)有技術(shù)相比較，本發(fā)明不僅利用服務QoS作為選擇參考，還考慮服務語義、用戶反饋評分等信息，選擇標準更全面。同時加入了業(yè)務執(zhí)行環(huán)境部件，在完成Web業(yè)務構(gòu)造以后，就自動執(zhí)行之。用戶可以不直接接觸服務QoS信息，而只關(guān)注執(zhí)行結(jié)果；有利于適用更大范圍用戶群，也適用于分布式的執(zhí)行環(huán)境。
[0031]與第三種現(xiàn)有技術(shù)相比較，本發(fā)明系統(tǒng)是直接對用戶自然語言或文字描述的需求進行操作。不僅避免了用戶對工作流程的手工構(gòu)造，也屏蔽了用戶直接接觸其他實現(xiàn)技術(shù)，適用于多種終端接入形式。同時，集成了業(yè)務執(zhí)行環(huán)境部件，屏蔽了用戶對內(nèi)部Web服務的生成過程的接觸，直接得到業(yè)務運行結(jié)果。這樣既滿足了普通用戶采用自然語言或文字輸入其應用需求和直接得到自然語言或文字描述的結(jié)果需求，還實現(xiàn)了系統(tǒng)的整體自動化運行和維護。
【專利附圖】

【附圖說明】
[0032]圖1是本發(fā)明基于圖挖掘技術(shù)的語義化Web業(yè)務生成系統(tǒng)結(jié)構(gòu)組成示意圖。
[0033]圖2是本發(fā)明系統(tǒng)中的自然語言分析構(gòu)件結(jié)構(gòu)組成示意圖。
[0034]圖3是本發(fā)明系統(tǒng)中的網(wǎng)絡服務挖掘組織構(gòu)件結(jié)構(gòu)組成示意圖。
[0035]圖4是本發(fā)明系統(tǒng)中的服務組織樹圖結(jié)構(gòu)組成示意圖。
[0036]圖5是本發(fā)明系統(tǒng)中的網(wǎng)絡服務生成構(gòu)件結(jié)構(gòu)組成示意圖。
[0037]圖6是本發(fā)明基于圖挖掘技術(shù)的語義化Web業(yè)務生成系統(tǒng)的業(yè)務生成時序圖。
[0038]圖7是本發(fā)明基于圖挖掘技術(shù)的語義化Web業(yè)務生成系統(tǒng)生成語義化業(yè)務的操作步驟流程圖。
【具體實施方式】
[0039]為使本發(fā)明的目的、技術(shù)方案和優(yōu)點更加清楚，下面結(jié)合附圖對本發(fā)明作進一步的詳細描述。[0040]本發(fā)明基于圖挖掘技術(shù)的語義化Web業(yè)務生成系統(tǒng)是基于傳統(tǒng)服務器構(gòu)建而成的，系統(tǒng)利用自然語言分詞、圖挖掘、聚類、語義化分析、服務流程化生成和服務執(zhí)行等多項技術(shù)，對用戶使用自然語言或文字輸入的應用需求進行收集和分析后，自動提取關(guān)鍵詞并解析其服務需求，再在構(gòu)造的Web服務圖中挖掘出可用的服務及其組合方式，最后在該系統(tǒng)集成運行環(huán)境中，完成服務的自動執(zhí)行，并反饋返回執(zhí)行結(jié)果。
[0041]參見圖1，介紹該系統(tǒng)設置的五個組成構(gòu)件:自然語言收集構(gòu)件、自然語言分析構(gòu)件、網(wǎng)絡服務挖掘組織構(gòu)件、網(wǎng)絡服務生成構(gòu)件和生成網(wǎng)絡服務后的網(wǎng)絡服務執(zhí)行構(gòu)件。本發(fā)明的創(chuàng)新集中體現(xiàn)自然語言分析構(gòu)件、網(wǎng)絡服務挖掘組織構(gòu)件和網(wǎng)絡服務生成構(gòu)件。系統(tǒng)架構(gòu)中的自然語言收集構(gòu)件和生成后服務執(zhí)行構(gòu)件則是參照統(tǒng)一化接口設計，可由任何適用接口的部件或裝置替換之。其中:
[0042](A)自然語言收集構(gòu)件是具有通用接口和開發(fā)功能的網(wǎng)絡終端，作為該系統(tǒng)的輸入端，用于通過網(wǎng)頁、安卓或IOS系統(tǒng)客戶端軟件獲取用戶自然語言或文字的輸入信息:包括格式化字段和非格式化的自然語言或文字，以收集與獲取用戶描述的應用需求，并將語言或文字傳遞給自然語言分析構(gòu)件。該自然語言收集構(gòu)件能夠適配多種終端，以滿足用戶的不同需求，并為其他開發(fā)者提供開發(fā)與擴展平臺。
[0043](B)自然語言分析構(gòu)件，作為直接接受用戶信息的前端，負責對用戶輸入的自然語言或文字描述的應用需求執(zhí)行機器化分析和學習，獲知用戶輸入信息的意圖，進而分析用戶的各方面需求，為網(wǎng)絡服務生成構(gòu)件提供機器可識別的格式化信息。
[0044]參見圖2，介紹自然語言分析構(gòu)件順序設置的七個組成模塊:與詞性標注數(shù)據(jù)庫連接的詞性標注模塊、長句邏輯切分模塊、關(guān)鍵詞抽取模塊、同義詞詞典映射模塊和信息模板抽取模塊，以及分別與后述四個模塊交互信息的語句詞性語義信息構(gòu)建模塊。這些模塊功能如下:
[0045]詞性標注模塊:負責根據(jù)詞性標注數(shù)據(jù)庫中存儲的信息，對用戶利用語言或文字描述的應用需求中各個詞語標注其詞性和涵義后，傳遞給長句邏輯切分模塊。
[0046]詞性標注數(shù)據(jù)庫:用于存儲每個字、詞及其多種不同的詞性和涵義，以便根據(jù)位于不同位置的字、詞，并結(jié)合上下文和自然語句的組織模式賦予不同位置的字、詞的當前不同詞性與涵義(例如:英文單詞“place”的名詞涵義為“地點”，動詞涵義為“放置”)。在抽取關(guān)鍵詞時，也在詞性標注數(shù)據(jù)庫中查詢其相應涵義。每個自然語句的組織形式包括主語、謂語和賓語等，位于不同位置的詞語帶有不同詞性，例如:在主語中為名詞，在謂語中為動詞。系統(tǒng)能夠結(jié)合上下文和自然語句的組織模式，判斷語句中的每個字、詞語的當前詞性，然后抽取關(guān)鍵詞，并在詞性標注數(shù)據(jù)庫中查詢其相應含義。
[0047]長句邏輯切分模塊:負責對完成詞性標注后的語句的整體架構(gòu)進行機器判斷，按照主謂賓結(jié)構(gòu)抽取主句和從句，并進行長句邏輯切分，切分為多個主謂賓結(jié)構(gòu)，以確定每個詞語的詞性與涵義，并將涵義信息傳遞給關(guān)鍵詞抽取模塊，為以后抽取關(guān)鍵詞提供便利條件。
[0048]關(guān)鍵詞抽取模塊:負責根據(jù)不同領(lǐng)域和用戶提供的配置文件，選取其中不同的關(guān)鍵詞；因該系統(tǒng)特別適用于垂直領(lǐng)域內(nèi)的操作需求，即面向一個或多個特定領(lǐng)域的應用，用戶都有明確的領(lǐng)域劃分，并希望系統(tǒng)輸出結(jié)果符合其適用領(lǐng)域。故該模塊所選取的關(guān)鍵詞為該應用領(lǐng)域的重點字、詞，且具有該領(lǐng)域的明確涵義。[0049]同義詞詞典映射模塊:負責根據(jù)關(guān)鍵詞抽取模塊選取的關(guān)鍵詞，從信息模板抽取模塊中提取與其匹配或相關(guān)的詞語，以供語句詞性語義信息構(gòu)建模塊進行后續(xù)處理；
[0050]語句詞性語義信息構(gòu)建模塊:用于接收長句邏輯切分、關(guān)鍵詞抽取和同義詞詞典映射共三個模塊的處理結(jié)果，判斷各個字、詞的詞性與涵義，以及其在句子中的位置，分別計算其權(quán)重，以便根據(jù)權(quán)重判斷用戶自然語言或文字描述的需求中的詞語是否為關(guān)鍵詞，以供信息模板抽取模塊再次抽取進行機器分析；
[0051]信息模板抽取模塊:負責接收同義詞詞典映射模塊和語句詞性語義信息構(gòu)建模塊選取的關(guān)鍵詞和處理結(jié)果，利用各個關(guān)鍵詞并結(jié)合其詞語涵義和信息模板，生成機器可識別的格式化結(jié)構(gòu)信息模板，再輸出給網(wǎng)絡服務生成構(gòu)件，以使生成的結(jié)果與應用需求更加匹配，避免產(chǎn)生用戶不需要的垃圾信息。
[0052](C)網(wǎng)絡服務挖掘組織構(gòu)件，負責藉由垂直搜索領(lǐng)域的爬蟲、索引和聚類的技術(shù)，采用圖挖掘技術(shù)的組織思路，對用戶在網(wǎng)絡上使用的各種可用服務進行抓取、挖掘和收集，并在進行系統(tǒng)的初步分析后，構(gòu)建為森林式服務組織樹圖，并存儲于服務數(shù)據(jù)庫，以供網(wǎng)絡服務生成構(gòu)件使用。設有(參見圖3所示):網(wǎng)絡服務爬蟲模塊、網(wǎng)絡服務聚類模塊、語義化服務建圖模塊、圖操作接口模塊和服務數(shù)據(jù)庫。這些模塊功能如下:
[0053]網(wǎng)絡服務爬蟲模塊:用于利用網(wǎng)絡爬蟲對網(wǎng)絡中存在的Web服務進行抓取和收集，并將Web服務的原始信息保存于服務數(shù)據(jù)庫，以供后續(xù)模塊處理。
[0054]網(wǎng)絡服務聚類模塊:用于從服務數(shù)據(jù)庫中提取原始服務信息，并對網(wǎng)絡服務爬蟲模塊抓取的各個零散的Web服務進行語義化信息提取，再針對語義信息進行聚類處理后，將語義相近的服務聚成一類后，從中提取關(guān)鍵詞，構(gòu)成聚類數(shù)據(jù)；然后將聚類數(shù)據(jù)存儲于服務數(shù)據(jù)庫中。
[0055]語義化服務建圖模塊:用于根據(jù)服務數(shù)據(jù)庫中的原始服務信息和聚類數(shù)據(jù)，借助圖挖掘的組織思想，對Web服務進行結(jié)構(gòu)化組織，從而將Web服務按照樹圖的結(jié)構(gòu)進行整理和分類，形成森林式的服務組織樹圖，再將該服務組織樹圖存儲于服務數(shù)據(jù)庫，以供網(wǎng)絡服務生成構(gòu)件使用；
[0056]圖操作接口模塊:用于為規(guī)范操作服務數(shù)據(jù)庫而提供的統(tǒng)一接口，以供網(wǎng)絡服務生成構(gòu)件使用服務數(shù)據(jù)庫。
[0057]服務數(shù)據(jù)庫:用于存儲該系統(tǒng)中的文件和數(shù)據(jù)，包括:由網(wǎng)絡服務爬蟲模塊利用網(wǎng)絡爬蟲針對互聯(lián)網(wǎng)上的Web服務特征抓取的服務文件，網(wǎng)絡服務聚類模塊從網(wǎng)絡服務爬蟲模塊抓取的服務文件提取語義化信息、并進行聚類處理后存儲的聚類數(shù)據(jù)；以及語義化服務建圖模塊依據(jù)Web服務的語義化信息和圖形思想建立的森林式的服務組織樹圖。
[0058]參見圖4，介紹森林式的服務組織樹圖的結(jié)構(gòu)組成:以語義化特性作為導向，在服務數(shù)據(jù)庫中抽取多個不同領(lǐng)域和不同范圍的子樹形成的。該服務組織樹圖存儲于系統(tǒng)的服務數(shù)據(jù)庫，供網(wǎng)絡服務生成構(gòu)件使用；每個服務組織樹圖中順序設有三種節(jié)點:主干節(jié)點、枝干節(jié)點和葉子節(jié)點，其中主干節(jié)點和枝干節(jié)點屬于概念性節(jié)點，代表的是抽象的語義概念。葉子節(jié)點為具體的Web服務節(jié)點，每個葉子節(jié)點代表唯一的一項Web服務。葉子節(jié)點根部是枝干節(jié)點(代表一個服務簇的聚合概念)，每個Web服務節(jié)點與其所歸屬的枝干節(jié)點之間設有一條無向的邊，代表該服務歸屬于該聚合概念的枝干節(jié)點。每個葉子節(jié)點連接一個或多個枝干節(jié)點，每個枝干節(jié)點也可包含一個或多個服務節(jié)點。枝干節(jié)點根部是連接多個枝干節(jié)點的主干節(jié)點，作為該樹圖中更高級抽象概念的根節(jié)點，每個主干節(jié)點連接一個或多個枝干節(jié)點，也能直接連接葉子節(jié)點，表明該葉子代表的Web服務在語義上直接歸屬該主干節(jié)點。從服務數(shù)據(jù)庫中抽取多個不同領(lǐng)域、不同范圍的子樹，就構(gòu)成了森林式的此服務組織樹圖，并存儲于系統(tǒng)的服務數(shù)據(jù)庫中，供網(wǎng)絡服務生成構(gòu)件使用。不同于現(xiàn)有技術(shù)，該服務組織圖是以Web服務的語義化特性作為導向，并引入概念性節(jié)點，且與具體的Web服務共存于服務組織樹圖中。
[0059](D)網(wǎng)絡服務生成構(gòu)件，負責對用戶需求做出相應、及時的服務識別和服務組織生成，并形成一套可行的服務方案:其輸入分別來自自然語言分析構(gòu)件和網(wǎng)絡服務挖掘組織構(gòu)件:由自然語言分析構(gòu)件得到包括關(guān)鍵詞的匹配結(jié)果和詞義、詞性判斷的結(jié)構(gòu)化的詞語需求分析結(jié)果，由網(wǎng)絡服務挖掘組織構(gòu)件得到統(tǒng)一的圖操作接口和能夠查詢的服務數(shù)據(jù)庫；再對提取的用戶格式化需求信息進行機器判定和語義化分析，形成具有針對性的服務查詢需求，并執(zhí)行相關(guān)操作，生成對應格式的網(wǎng)絡服務。其結(jié)構(gòu)組成如圖5所示，設有:順序連接的輸入解析模塊、查詢規(guī)則生成模塊、圖操作模塊、信息提取模塊和業(yè)務流程執(zhí)行語言Bpel (Business Process Execution Language)業(yè)務模板生成模塊；各個模塊功能說明如下:
[0060]圖操作模塊采用網(wǎng)絡服務挖掘組織構(gòu)件的服務數(shù)據(jù)庫進行查詢，按照相應的查詢規(guī)則，過濾查詢條件，并將查詢到的Web服務信息進行相應組織，交給信息提取模塊。信息提取模塊收到來自圖操作模塊的Web服務信息后,對Web信息中的service、operation域進行匹配和篩選，將可用的接口信息交給Bpel業(yè)務模板生成模塊，形成Bpel格式的結(jié)構(gòu)化執(zhí)行單元，提供給網(wǎng)絡服務執(zhí)行構(gòu)件。
[0061]輸入解析模塊:用于對來自自然語言分析構(gòu)件的包括關(guān)鍵詞的匹配結(jié)果和詞義判斷的結(jié)構(gòu)化的詞語需求進行分析處理，再從網(wǎng)絡服務挖掘組織部分得到可查詢的服務信息數(shù)據(jù)庫信息后，一起送入查詢規(guī)則生成模塊；
[0062]查詢規(guī)則生成模塊:用于根據(jù)服務數(shù)據(jù)庫對用戶格式化需求中的信息進行語義化分析和機器判定，并以用戶是否存在某方面的需求為基準，刪除其中不能被機器采用的用戶需求，構(gòu)建具有針對性的、更接近于用戶需求的各個查詢要求(或路由信息)，因路由信息代表廣泛意義上的處理流程，且涉及服務數(shù)據(jù)圖中各個節(jié)點的條件路由，故簡稱為路由信息，以便對用戶需求進行全方位的提取和存儲。因網(wǎng)絡服務生成構(gòu)件是針對垂直領(lǐng)域應用提供服務，并根據(jù)垂直領(lǐng)域的通常需求來分析用戶的格式化需求:先對用戶需求和領(lǐng)域概念進行匹配，再判斷用戶是否有具體概念的需求。例如對于旅游服務領(lǐng)域，可根據(jù)領(lǐng)域內(nèi)概念(地點、時間、旅行方式等)分析用戶的格式化需求，判斷用戶是否對旅游地點，旅游時間和旅游方式上有特定要求,從而形成針對旅游概念的查詢要求。查詢規(guī)則生成模塊根據(jù)主干結(jié)點下的枝干結(jié)點來判斷機器能夠處理哪些查詢要求，以提取相應信息，傳遞給圖操作模塊；并對查詢要求信息進行分析，得到每個查詢要求的權(quán)值，構(gòu)成各個基本的查詢要求。該查詢要求是從用戶需求中提煉出的，適宜機器識別和操作的用戶需求的描述方法，明確指出在圖搜索過程中需要搜索的概念和相應概念的權(quán)值；基本的查詢要求是能夠直接應用于圖操作模塊的查詢操作。然后，就從網(wǎng)絡服務挖掘組織構(gòu)件的服務數(shù)據(jù)庫進行查詢，并將查詢結(jié)果進行相應組織，形成Bpel格式的結(jié)構(gòu)化接口，提供給任何支持Bpel格式的運行環(huán)境。[0063]圖操作模塊:負責根據(jù)垂直領(lǐng)域的常規(guī)需求，分析用戶的格式化需求，比對用戶需求和領(lǐng)域概念的匹配程度，判斷用戶需求是否有明確的概念，以形成相應明確的查詢要求描述后，再從網(wǎng)絡服務挖掘組織構(gòu)件的服務數(shù)據(jù)庫進行查詢，并對查詢結(jié)果進行組織:根據(jù)配置的查詢要求信息，從主干結(jié)點的匹配開始，逐層遍歷和篩選各個枝干結(jié)點和葉子節(jié)點；并根據(jù)權(quán)值搜索服務組織圖，在同一枝干節(jié)點擁有多個類似功能和語義的Web服務時，再比較不同的葉子結(jié)點、即具體Web服務的用戶反饋評分和QoS分值，提取和配置其中分值較高的葉子節(jié)點。
[0064]信息提取模塊:負責根據(jù)各個模塊的返回信息，找到網(wǎng)絡服務爬蟲模塊抓取的包括WSDL文件和其他形式標注文件的服務原始信息進行解析，根據(jù)語義化匹配提取其中可用且匹配的Web服務的operation操作信息列表。
[0065]Bpel業(yè)務模板生成模塊:負責根據(jù)信息提取模塊得到的operation操作信息列表查詢使用的類型type、網(wǎng)址url的信息，構(gòu)造出執(zhí)行環(huán)境中能夠自動運行的Bpel流程部署文件。
[0066](E)網(wǎng)絡服務的執(zhí)行構(gòu)件，為應用開放性原則設計的應用環(huán)境，負責利用包括Bpel格式和所有支持Bpel格式適配的執(zhí)行環(huán)境執(zhí)行適配生成的網(wǎng)絡整體服務方案；并結(jié)合用戶的使用方式和形式，將執(zhí)行結(jié)果及時反饋給用戶；該構(gòu)件作為系統(tǒng)的輸出，也能藉由符合輸出接口標準的其他構(gòu)件完成相應操作和返回執(zhí)行結(jié)果。
[0067]參見圖6和圖7，介紹本發(fā)明基于圖挖掘技術(shù)的語義化Web業(yè)務生成系統(tǒng)的工作方法的下述五個具體操作步驟:
[0068]步驟1，系統(tǒng)通過自然語言收集構(gòu)件、即終端采用各類形式的收集器接收來自用戶采用自然語音或文字輸入的應用需求，并由自然語言收集構(gòu)件對用戶輸入進行處理后，發(fā)送到自然語言分析構(gòu)件。
[0069]步驟2，自然語言分析構(gòu)件對自然語言收集構(gòu)件處理后的需求進行機器識別處理，自動形成結(jié)構(gòu)化的Web網(wǎng)絡應用需求，并轉(zhuǎn)送到網(wǎng)絡服務生成構(gòu)件。
[0070]該步驟2包括下列操作內(nèi)容:自然語言分析構(gòu)件接收來自自然語言收集構(gòu)件的自然語言或文字描述的應用需求后，詞性標注模塊借助詞性標注服務數(shù)據(jù)庫中的已有信息，對應用需求中的各個詞匯進行詞性標注。長句邏輯切分模塊對句子的整體架構(gòu)進行機器判斷，按照設定的領(lǐng)域需求的應用，構(gòu)建主謂賓的結(jié)構(gòu)，并抽取主句和從句；關(guān)鍵詞抽取模塊也按照該設定應用領(lǐng)域提取該領(lǐng)域內(nèi)的關(guān)鍵詞。同義詞詞典映射模塊提取與關(guān)鍵詞匹配或相關(guān)的詞，并計算其權(quán)重。信息模板抽取模塊將結(jié)合上述各個詞語的涵義和信息模板，生成格式化結(jié)構(gòu)后，輸出給網(wǎng)絡服務生成構(gòu)件。
[0071]步驟3，網(wǎng)絡服務挖掘組織構(gòu)件利用搜索引擎的思想及技術(shù)，抓取網(wǎng)絡中的服務后，將Web服務數(shù)據(jù)存入服務數(shù)據(jù)庫。服務聚類模塊利用聚類算法對抓取的各個零散的Web服務進行基于內(nèi)容的信息聚類處理，并在每個聚類塊中提取關(guān)鍵詞作為歸類的依據(jù)，再提取關(guān)鍵詞，構(gòu)成聚類數(shù)據(jù)和存入服務數(shù)據(jù)庫。語義化服務建圖模塊根據(jù)服務數(shù)據(jù)庫中的原始服務信息和聚類數(shù)據(jù)，借助圖挖掘的組織思想，對Web服務進行結(jié)構(gòu)化組織，建立森林式的服務組織樹圖；同時根據(jù)系統(tǒng)需要，添加其他自定義的、能被系統(tǒng)識別的服務后，將服務組織樹圖永久性地存儲于服務數(shù)據(jù)庫。這些服務組織圖在開始時進行創(chuàng)建，后期可隨時更新。最后，向網(wǎng)絡服務生成構(gòu)件提供使用圖操作的統(tǒng)一接口。[0072]步驟4，網(wǎng)絡服務生成構(gòu)件接收來自自然語言分析構(gòu)件的分析結(jié)果，并與網(wǎng)絡服務挖掘組織構(gòu)件協(xié)同合作，進行服務的查找和組織，形成一套整體的服務執(zhí)行方案，即生成Bpel格式的網(wǎng)絡服務組織結(jié)果。
[0073]該步驟4包括下列操作內(nèi)容:
[0074](41)輸入解析模塊對來自自然語言分析構(gòu)件的格式化需求進行分析處理。
[0075](42)查詢規(guī)則生成模塊根據(jù)用戶是否存在某方面的需求為基準，刪除其中機器不能采用的用戶需求，構(gòu)建更接近于用戶需求內(nèi)容的各個查詢要求，以便對用戶需求進行全方位的提取和存儲。查詢規(guī)則生成模塊根據(jù)主干結(jié)點下的枝干結(jié)點判斷機器能夠處理用戶的哪些查詢要求，以提取相應的查詢信息，同時對查詢要求進行分析，獲得每個查詢要求的權(quán)值，構(gòu)成各個基本的查詢要求。
[0076](43)圖操作模塊根據(jù)配置的各個基本的查詢要求，從主干結(jié)點開始匹配，逐層遍歷和篩選各個枝干結(jié)點和葉子節(jié)點；并根據(jù)權(quán)值搜索服務組織樹圖，在同一枝干節(jié)點能夠擁有多個類似功能和語義的Web服務時，再比較不同的葉子結(jié)點、即具體Web服務的用戶反饋評分和QoS分值，提取和配置其中分值較高的K個葉子節(jié)點返回。
[0077](44)信息提取模塊根據(jù)返回信息，找到網(wǎng)絡服務爬蟲模塊抓取的包括用XML語言描述的Web服務和說明如何與Web服務通信與接口信息的WSDL (Web ServicesDescription Language)文件和其他形式標注文件的服務原始信息進行解析,再根據(jù)語義化匹配提取其中可用、且匹配的Web服務的操作operation信息列表,再根據(jù)operation查詢使用的類型type、網(wǎng)址url等信息，構(gòu)造出執(zhí)行環(huán)境中可自動運行的Bpel流程部署文件。
[0078]步驟5，網(wǎng)絡服務執(zhí)行構(gòu)件接收來自網(wǎng)絡服務生成構(gòu)件的Bpel格式的Web服務執(zhí)行方案，并將該Web服務的Bpel文件分發(fā)到業(yè)務處理節(jié)點上的Bpel執(zhí)行容器中運行，并根據(jù)用戶的使用方式和形式，將最終執(zhí)行結(jié)果反饋給用戶。網(wǎng)絡服務執(zhí)行構(gòu)件支持任何Bpel格式的執(zhí)行環(huán)境進行適配。
[0079]本發(fā)明已經(jīng)進行了多次實施例的試驗，且試驗是成功的，實現(xiàn)了發(fā)明目的，也說明了本發(fā)明系統(tǒng)的結(jié)構(gòu)組成及其工作方法都是可行的。
[0080]以上所述僅為本發(fā)明的較佳實施例而已，并不用以限制本發(fā)明，凡在本發(fā)明的精神和原則之內(nèi)，所做的任何修改、等同替換、改進等，均應包含在本發(fā)明保護的范圍之內(nèi)。
【權(quán)利要求】
1.一種基于圖挖掘技術(shù)的語義化Web業(yè)務生成系統(tǒng)，其特征在于:該系統(tǒng)是基于傳統(tǒng)服務器構(gòu)建而成，系統(tǒng)利用包括自然語言分詞、圖挖掘、聚類、語義化分析、服務流程化生成和服務執(zhí)行的多項技術(shù)，對用戶使用自然語言或文字描述的應用需求進行收集和分析后，自動提取關(guān)鍵詞并解析其服務需求，再在構(gòu)造的Web服務圖中挖掘出可用的服務及其組合方式，最后在該系統(tǒng)集成運行環(huán)境中，完成服務的自動執(zhí)行，并反饋返回執(zhí)行結(jié)果；該系統(tǒng)設有下述五個組成構(gòu)件:自然語言收集構(gòu)件、自然語言分析構(gòu)件、網(wǎng)絡服務挖掘組織構(gòu)件、網(wǎng)絡服務生成構(gòu)件和網(wǎng)絡服務生成后的網(wǎng)絡服務執(zhí)行構(gòu)件；其中: 自然語言收集構(gòu)件，為具有通用接口和開發(fā)功能的網(wǎng)絡終端，作為該系統(tǒng)的輸入端，用于通過網(wǎng)頁、安卓或IOS系統(tǒng)客戶端軟件獲取用戶自然語言或文字的輸入信息:包括格式化字段和非格式化的自然語言或文字，以收集與獲取用戶的需求描述，并將語言或文字傳遞給自然語言分析構(gòu)件;該自然語言收集構(gòu)件能夠適配多種終端，以滿足用戶的不同需求，并為其他開發(fā)者提供開發(fā)與擴展平臺；自然語言分析構(gòu)件，作為直接接受用戶信息的前端，負責對用戶輸入的自然語言或文字描述的需求執(zhí)行機器化分析和學習，獲知用戶輸入信息的意圖，進而分析用戶需求，為網(wǎng)絡服務生成構(gòu)件提供機器可識別的格式化信息；其順序設有:與詞性標注數(shù)據(jù)庫連接的詞性標注模塊、長句邏輯切分模塊、關(guān)鍵詞抽取模塊、同義詞詞典映射模塊和信息模板抽取模塊，以及分別與后述四個模塊交互信息的語句詞性語義信息構(gòu)建模塊；網(wǎng)絡服務挖掘組織構(gòu)件，負責藉由垂直搜索領(lǐng)域的爬蟲、索引和聚類的技術(shù)，采用圖挖掘技術(shù)的組織思路，對用戶在網(wǎng)絡上使用的各種可用服務進行抓取、挖掘和收集，并在進行系統(tǒng)的初步分析后，構(gòu)建為森林式服務組織樹圖，并存儲于服務數(shù)據(jù)庫，以供網(wǎng)絡服務生成構(gòu)件使用；設有:網(wǎng)絡服務爬蟲模塊、網(wǎng)絡服務聚類模塊、語義化服務建圖模塊、圖操作接口模塊和服務數(shù)據(jù)庫; 網(wǎng)絡服務生成構(gòu)件，負責對用戶需求做出相應、及時的服務識別和服務生成，并形成一套可行的服務方案:其輸入分別來自自然語言分析構(gòu)件和網(wǎng)絡服務挖掘組織構(gòu)件:由自然語言分析構(gòu)件得到包括關(guān)鍵詞的匹配結(jié)果和詞義、詞性判斷的結(jié)構(gòu)化的詞語需求分析結(jié)果，由網(wǎng)絡服務挖掘組織構(gòu)件得到統(tǒng)一的圖操作接口和能夠查詢的服務數(shù)據(jù)庫；再對提取的用戶格式化需求信息進行機器判定和語義化分析，形成具有針對性的服務查詢需求，并執(zhí)行相關(guān)操作，生成對應格式的網(wǎng)絡服務；設有:順序連接的輸入解析模塊、查詢規(guī)則生成模塊、圖操作模塊、信息提取模塊和Bpel業(yè)務模板生成模塊；網(wǎng)絡服務執(zhí)行構(gòu)件，為應用開放性原則設計的應用環(huán)境，負責利用包括Bpel格式和所有支持Bpel格式適配的執(zhí)行環(huán)境執(zhí)行適配所生成的網(wǎng)絡服務，并執(zhí)行該服務整體方案；并結(jié)合用戶的使用方式和形式，將執(zhí)行結(jié)果及時反饋給用戶；該構(gòu)件作為系統(tǒng)的輸出，也能藉由符合輸出接口標準的其他構(gòu)件完成相應操作和返回執(zhí)行結(jié)果。
2.根據(jù)權(quán)利要求1所述的系統(tǒng)，其特征在于:所述自然語言分析構(gòu)件中的七個組成模塊功能如下: 詞性標注模塊，負責根據(jù)詞性標注數(shù)據(jù)庫中存儲的信息，對用戶利用語言或文字描述的需求中各個詞語標注其詞性和涵義后，傳遞給長句邏輯切分模塊；詞性標注數(shù)據(jù)庫，用于存儲字、詞及其多種不同的詞性和涵義，以便根據(jù)位于不同位置的字、詞，并結(jié)合上下文和自然語句的組織模式賦予不同位置的字、詞的當前不同詞性與涵義；在抽取關(guān)鍵詞時，也在詞性標注數(shù)據(jù)庫中查詢其相應涵義；所述自然語句的組織形式包括主語、謂語和賓語；長句邏輯切分模塊，負責對完成詞性標注后的語句的整體架構(gòu)進行機器判斷，按照主謂賓結(jié)構(gòu)抽取主句和從句，并進行長句邏輯切分，切分為多個主謂賓結(jié)構(gòu)，以確定每個詞語的詞性與涵義，并將涵義信息傳遞給關(guān)鍵詞抽取模塊；關(guān)鍵詞抽取模塊，負責根據(jù)不同領(lǐng)域和用戶提供的配置文件，選取其中不同的關(guān)鍵詞，生成機器可識別的信息模板；因該系統(tǒng)特別適用于垂直領(lǐng)域內(nèi)的操作需求，即面向一個或多個特定領(lǐng)域的應用，故該模塊所選取的關(guān)鍵詞為該應用領(lǐng)域的重點字、詞，且具有該領(lǐng)域的明確涵義；同義詞詞典映射模塊，負責根據(jù)關(guān)鍵詞抽取模塊選取的關(guān)鍵詞，從信息模板抽取模塊中提取與其匹配或相關(guān)的詞語，以供語句詞性語義信息構(gòu)建模塊進行后續(xù)處理；語句詞性語義信息構(gòu)建模塊，用于接收長句邏輯切分、關(guān)鍵詞抽取和同義詞詞典映射共三個模塊的處理結(jié)果，判斷各個字、詞的詞性與涵義，以及其在句子中的位置，分別計算其權(quán)重，以便根據(jù)權(quán)重判斷用戶自然語言或文字描述的需求中的詞語是否為關(guān)鍵詞，以供信息模板抽取模塊再次抽取進行機器分析；信息模板抽取模塊，負責接收同義詞詞典映射模塊和語句詞性語義信息構(gòu)建模塊選取的關(guān)鍵詞和處理結(jié)果，利用各個關(guān)鍵詞并結(jié)合其詞語涵義和信息模板，生成機器可識別的格式化結(jié)構(gòu)信息模板，再輸出給網(wǎng)絡服務生成構(gòu)件，以使生成的結(jié)果與需求更匹配，避免產(chǎn)生用戶不需要的垃圾信息。
3.根據(jù)權(quán)利要求1所述的系統(tǒng)，其特征在于:所述網(wǎng)絡服務挖掘組織構(gòu)件中的各個模塊功能如下: 網(wǎng)絡服務爬蟲模塊，用于利用網(wǎng)絡爬蟲對網(wǎng)絡中存在的Web服務進行抓取和收集，并將Web服務的原始信息保存于服務數(shù)據(jù)庫，以供后續(xù)模塊處理；網(wǎng)絡服務聚類模塊，用于從服務數(shù)據(jù)庫中提取原始服務信息，并對網(wǎng)絡服務爬蟲模塊抓取的各個零散的Web服務進行語義化信息提取，再針對語義信息進行聚類處理后，將語義相近的服務聚成一類后，從中提取關(guān)鍵詞，構(gòu)成聚類數(shù)據(jù)；然后將聚類數(shù)據(jù)存回服務數(shù)據(jù)庫中；語義化服務建圖模塊，用于根據(jù)服務數(shù)據(jù)庫中的原始服務信息和聚類數(shù)據(jù)，借助圖挖掘的組織思想，對Web服務進行結(jié)構(gòu)化組織，從而將Web服務按照圖的結(jié)構(gòu)進行整理和分類，形成森林式的服務組織樹圖，再將該服務組織樹圖存儲于服務數(shù)據(jù)庫，以供網(wǎng)絡服務生成構(gòu)件使用；圖操作接口模塊，用于為規(guī)范地操作服務數(shù)據(jù)庫而提供的統(tǒng)一接口，以供網(wǎng)絡服務生成構(gòu)件使用服務數(shù)據(jù)庫；服務數(shù)據(jù)庫，用于存儲該系統(tǒng)中的文件和數(shù)據(jù)，包括:由網(wǎng)絡服務爬蟲模塊利用網(wǎng)絡爬蟲針對互聯(lián)網(wǎng)上的Web服務特征抓取的服務文件，網(wǎng)絡服務聚類模塊從網(wǎng)絡服務爬蟲模塊抓取的服務文件提取語義化信息、并進行聚類處理后存儲的聚類數(shù)據(jù)；以及語義化服務建圖模塊依據(jù)Web服務的語義化信息和圖形思想建立的森林式的服務組織樹圖。
4.根據(jù)權(quán)利要求1所述的系統(tǒng)，其特征在于:所述森林式的服務組織樹圖結(jié)構(gòu)是以語義化特性作為導向，在服務數(shù)據(jù)庫中抽取多個不同領(lǐng)域和不同范圍的子樹形成的；該服務組織樹圖存儲于系統(tǒng)的服務數(shù)據(jù)庫，供網(wǎng)絡服務生成構(gòu)件使用；每個服務組織樹圖中順序設有:主干節(jié)點，枝干節(jié)點和葉子節(jié)點，其中:葉子節(jié)點為具體的Web服務節(jié)點，每個葉子節(jié)點代表唯一的一項Web服務，葉子節(jié)點根部是代表一個服務簇的聚合的枝干節(jié)點，每個Web服務節(jié)點與其所歸屬的枝干節(jié)點之間設有一條無向的邊，代表該服務歸屬于該聚合概念的枝干節(jié)點；每個葉子節(jié)點連接一個或多個枝干節(jié)點，每個枝干節(jié)點包含一個或多個服務節(jié)點；枝干節(jié)點根部是連接多個枝干節(jié)點的主干節(jié)點，作為該樹圖中更高級抽象概念的根節(jié)點，每個主干節(jié)點連接一個或多個枝干節(jié)點，也能直接連接葉子節(jié)點，表明該葉子代表的Web服務在語義上直接歸屬該主干節(jié)點；不同于現(xiàn)有技術(shù)，該服務組織圖是以Web服務的語義化特性作為導向，并引入概念性節(jié)點，且與具體的Web服務共存于服務組織樹圖中。
5.根據(jù)權(quán)利要求1所述的系統(tǒng)，其特征在于:所述網(wǎng)絡服務生成構(gòu)件中的各個模塊功能如下: 輸入解析模塊用于對來自自然語言分析構(gòu)件的包括關(guān)鍵詞的匹配結(jié)果和詞義判斷的結(jié)構(gòu)化的詞語需求進行分析處理，對用戶的格式化需求進行機器判定，再從網(wǎng)絡服務挖掘組織部分得到可查詢的服務信息數(shù)據(jù)庫信息后，一起送入查詢規(guī)則生成模塊；查詢規(guī)則生成模塊，用于根據(jù)服務數(shù)據(jù)庫對用戶格式化需求中的信息進行語義化分析和機器判定，并以用戶是否存在某方面的需求為基準，刪除其中不能被機器采用的用戶需求，構(gòu)建具有針對性的、更接近于用戶需求的各個查詢要求，以便對用戶需求進行全方位的提取和存儲；查詢規(guī)則生成模塊根據(jù)主干節(jié)點下的枝干節(jié)點來判斷機器能夠處理哪些查詢要求，以提取相應信息，并對查詢要求信息進行分析，得到每個查詢要求的權(quán)值，構(gòu)成各個基本的查詢要求；該查詢要求是從用戶需求中提煉出的，適宜機器識別和操作的用戶需求描述方法，明確指出在圖搜索過程中需要搜索的概念和相應概念的權(quán)值；基本的查詢要求是能夠直接應用于圖操作模塊的查詢操作；圖操作模塊，負責根據(jù)垂直領(lǐng)域的常規(guī)需求，分析用戶的格式化需求，比對用戶需求和領(lǐng)域概念的匹配程度，判斷用戶需求是否有明確的概念，以形成相應明確的查詢要求描述后，再從網(wǎng)絡服務挖掘組織構(gòu)件的服務數(shù)據(jù)庫進行查詢，并對查詢結(jié)果進行組織:根據(jù)配置的查詢要求信息，從主干節(jié)點的匹配開始，逐層遍歷和篩選各個枝干節(jié)點和葉子節(jié)點；并根據(jù)權(quán)值搜索服務組織圖，在同一枝干節(jié)點擁有多個類似功能和語義的Web服務時，再比較不同的葉子節(jié)點、即具體Web服務的用戶反饋評分和QoS分值，提取和配置其中分值較高的葉子節(jié)點；信息提取模塊，負責根據(jù)各個模塊的返回信息，找到網(wǎng)絡服務爬蟲模塊抓取的包括WSDL文件和其他形式標注文件的服務原始信息進行解析，根據(jù)語義化匹配提取其中可用且匹配的Web服務的operation操作信息列表；業(yè)務流程執(zhí)行語言Bpel (Business Process Execution Language)業(yè)務模板生成模塊，負責根據(jù)信息提取模塊得到的operation操作信息列表查詢使用的類型type、網(wǎng)址url的信息，構(gòu)造出執(zhí)行環(huán)境中能夠自動運行的Bpel流程部署文件。
6.一種采用權(quán)利要求1所述基于圖挖掘技術(shù)的語義化Web業(yè)務生成系統(tǒng)的工作方法，其特征在于:所述方法包括下列操作步驟: (I)系統(tǒng)通過自然語言收集構(gòu)件、即終端采用各類形式的收集器接收來自用戶采用自然語音或文字輸入的應用需求，并由自然語言收集構(gòu)件對用戶輸入進行處理后，發(fā)送到自然語言分析構(gòu)件； (2)自然語言分析構(gòu)件對自然語言收集構(gòu)件處理后的需求進行機器識別處理，自動形成結(jié)構(gòu)化的Web網(wǎng)絡應用需求，并轉(zhuǎn)送到生成構(gòu)件； (3)網(wǎng)絡服務挖掘組織構(gòu)件利用搜索引擎的思想及技術(shù)，抓取網(wǎng)絡中的服務后，將Web服務數(shù)據(jù)存入服務數(shù)據(jù)庫；服務聚類模塊利用聚類算法對抓取的各個零散的Web服務進行基于內(nèi)容的信息聚類處理，并在每個聚類塊中提取關(guān)鍵詞作為歸類的依據(jù)，再提取關(guān)鍵詞，構(gòu)成聚類數(shù)據(jù)和存入服務數(shù)據(jù)庫；語義化服務建圖模塊根據(jù)服務數(shù)據(jù)庫中的原始服務信息和聚類數(shù)據(jù)，借助圖挖掘的組織思想，對Web服務進行結(jié)構(gòu)化組織，建立森林式的服務組織樹圖；同時根據(jù)系統(tǒng)需要，添加其他自定義的、能被系統(tǒng)識別的服務后，將服務組織樹圖永久性地存儲于服務數(shù)據(jù)庫；并向網(wǎng)絡服務生成構(gòu)件提供使用圖操作的統(tǒng)一接口； (4)網(wǎng)絡服務生成構(gòu)件接收來自自然語言分析構(gòu)件的分析結(jié)果，并與網(wǎng)絡服務挖掘組織構(gòu)件協(xié)同合作，進行服務查找和組織，形成一套整體的服務執(zhí)行方案，即生成Bpel格式的網(wǎng)絡服務組織結(jié)果； (5)網(wǎng)絡服務執(zhí)行構(gòu)件接收來自網(wǎng)絡服務生成構(gòu)件的Bpel格式的Web服務執(zhí)行方案，并將該Web服務的Bpel文件分發(fā)到業(yè)務處理節(jié)點上的Bpel執(zhí)行容器中運行，并根據(jù)用戶的使用方式和形式，將最終執(zhí)行結(jié)果反饋給用戶。
7.根據(jù)權(quán)利要求6所述的方法，其特征在于:所述步驟(2)包括下列操作內(nèi)容:自然語言分析構(gòu)件接收來自自然語言收集構(gòu)件的自然語言或文字描述的應用需求后，詞性標注模塊借助詞性標注服務數(shù)據(jù) 庫中的已有信息，對應用需求中的各個詞匯進行詞性標注；長句邏輯切分模塊對句子的整體架構(gòu)進行機器判斷，按照設定的領(lǐng)域需求的應用，構(gòu)建主謂賓的結(jié)構(gòu)，并抽取主句和從句；關(guān)鍵詞抽取模塊也按照該設定應用領(lǐng)域提取該領(lǐng)域內(nèi)的關(guān)鍵詞；同義詞詞典映射模塊提取與關(guān)鍵詞匹配或相關(guān)的詞，并計算其權(quán)重；信息模板抽取模塊將結(jié)合上述各個詞語的涵義和信息模板，生成格式化結(jié)構(gòu)后，輸出給網(wǎng)絡服務生成構(gòu)件。
8.根據(jù)權(quán)利要求6所述的方法，其特征在于:所述步驟(4)包括下列操作內(nèi)容: (41)輸入解析模塊對來自自然語言分析構(gòu)件的格式化需求進行分析處理； (42)查詢規(guī)則生成模塊根據(jù)用戶是否存在某方面的需求為基準，刪除其中不能被機器采用的用戶需求，構(gòu)建更接近于用戶需求內(nèi)容的各個查詢要求，以便對用戶需求進行全方位的提取和存儲；查詢規(guī)則生成模塊根據(jù)主干節(jié)點下的枝干節(jié)點判斷機器能夠處理用戶的哪些查詢要求，以提取相應信息，同時對查詢要求進行分析，獲得每個查詢要求的權(quán)值，構(gòu)成各個基本的查詢要求； (43)圖操作模塊根據(jù)配置的各個基本的查詢要求，從主干節(jié)點的匹配開始，逐層遍歷和篩選各個枝干節(jié)點和葉子節(jié)點；并根據(jù)權(quán)值搜索服務組織樹圖，在同一枝干節(jié)點能擁有多個類似功能和語義的Web服務時，再比較不同的葉子節(jié)點、即具體Web服務的用戶反饋評分和QoS分值，提取和配置其中分值較高的葉子節(jié)點； (44)信息提取模塊根據(jù)返回信息，找到網(wǎng)絡服務爬蟲模塊抓取的包括用XML語言描述Web服務和說明如何與Web服務通信與接口信息的WSDL文件和其他形式標注文件的服務原始信息進行解析，根據(jù)語義化匹配提取其中可用且匹配的Web服務的操作operation信息列表，再根據(jù)operation查詢使用的type、url的信息,構(gòu)造出執(zhí)行環(huán)境中可自動運行的Bpel流程部署文件。
【文檔編號】G06F17/30GK103631882SQ201310566235
【公開日】2014年3月12日申請日期:2013年11月14日優(yōu)先權(quán)日:2013年11月14日
【發(fā)明者】趙耀, 林榮恒, 劉榕, 趙翔, 鄒華, 楊放春申請人:北京郵電大學

完整全部詳細技術(shù)資料下載

該技術(shù)已申請專利。僅供學習研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：趙耀;林榮恒;劉榕;趙翔;鄒華;楊放春
技術(shù)所有人：北京郵電大學
我是此專利的發(fā)明人

上一篇：一種基于微博熱門話題的視頻聚合方法及系統(tǒng)的制作方法
上一篇：薄板大型油箱焊接反變形成型方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進行咨詢。
1、李老師：1.計算力學 2.無損檢測
2、畢老師：機構(gòu)動力學與控制
3、袁老師：1.計算機視覺 2.無線網(wǎng)絡及物聯(lián)網(wǎng)
4、王老師：1.計算機網(wǎng)絡安全 2.計算機仿真技術(shù)
5、王老師：1.網(wǎng)絡安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應用
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

業(yè)務建模與數(shù)據(jù)挖掘相關(guān)技術(shù)

dnf生成業(yè)務數(shù)據(jù)失敗相關(guān)技術(shù)

生成業(yè)務數(shù)據(jù)失敗相關(guān)技術(shù)

lol生成業(yè)務數(shù)據(jù)失敗相關(guān)技術(shù)

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

基于圖挖掘技術(shù)的語義化業(yè)務生成系統(tǒng)和方法