一種面向領(lǐng)域服務(wù)目標(biāo)的知識(shí)庫構(gòu)建方法
【專利摘要】本發(fā)明公開了一種面向領(lǐng)域服務(wù)目標(biāo)的知識(shí)庫構(gòu)建方法,包括以下步驟:1)對(duì)從服務(wù)注冊(cè)庫中獲取的Web服務(wù)描述信息進(jìn)行預(yù)處理并構(gòu)建領(lǐng)域關(guān)鍵詞排序表;2)利用領(lǐng)域關(guān)鍵詞排序表,從Web服務(wù)的多種描述信息中進(jìn)行服務(wù)目標(biāo)抽取,得到Web服務(wù)的服務(wù)目標(biāo)集;3)對(duì)一個(gè)領(lǐng)域內(nèi)所有Web服務(wù)重復(fù)執(zhí)行步驟2,在此基礎(chǔ)上進(jìn)行領(lǐng)域服務(wù)目標(biāo)抽取,并由領(lǐng)域?qū)<疫M(jìn)行領(lǐng)域服務(wù)目標(biāo)知識(shí)庫的構(gòu)建或完善。本發(fā)明的有益效果是:1)獲取的服務(wù)目標(biāo)可以為基于目標(biāo)的服務(wù)發(fā)現(xiàn)提供支持,有助于提高服務(wù)發(fā)現(xiàn)和推薦的質(zhì)量;2)領(lǐng)域服務(wù)目標(biāo)知識(shí)庫作為一種領(lǐng)域資產(chǎn),在用戶服務(wù)需求的獲取與分析中,能夠提升用戶需求的豐富和完善度。
【專利說明】一種面向領(lǐng)域服務(wù)目標(biāo)的知識(shí)庫構(gòu)建方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明屬于服務(wù)計(jì)算【技術(shù)領(lǐng)域】,特別涉及一種面向領(lǐng)域服務(wù)目標(biāo)的知識(shí)庫構(gòu)建方法。
【背景技術(shù)】
[0002]隨著面向服務(wù)的架構(gòu)(Service-Oriented Architecture, S0A)和軟件即服務(wù)(Software as a Service, SaaS)技術(shù)的發(fā)展,互聯(lián)網(wǎng)上已經(jīng)發(fā)布了大量的Web服務(wù),且增長趨勢十分明顯。例如,截止到2013年8月25日,Web服務(wù)搜索引擎Seekda統(tǒng)計(jì)的Web服務(wù)已超過28000個(gè),Web服務(wù)編程網(wǎng)站ProgrammableWeb上發(fā)布的Web服務(wù)也已超過9800個(gè)。這些公開發(fā)布的Web服務(wù)作為一種共享資源,能夠極大地提高軟件開發(fā)的效率,并可降低軟件開發(fā)的成本。但是,如何有效地從大規(guī)模的Web服務(wù)注冊(cè)庫中獲取用戶所需要的Web服務(wù)仍然是一個(gè)挑戰(zhàn)性問題。
[0003]服務(wù)發(fā)現(xiàn)(Service Discovery)是一個(gè)根據(jù)服務(wù)請(qǐng)求者的需求查找合適服務(wù)的過程,是實(shí)現(xiàn)服務(wù)共享和復(fù)用的前提。目前,大多數(shù)主流的服務(wù)注冊(cè)站點(diǎn)(如Seekda和Programmableffeb)都為用戶提供了相應(yīng)的服務(wù)搜索機(jī)制,但這些服務(wù)搜索機(jī)制主要是基于簡單的關(guān)鍵字匹配,沒有考慮服務(wù)的功能語義信息,導(dǎo)致查全率和查準(zhǔn)率不高,影響Web服務(wù)發(fā)現(xiàn)的質(zhì)量。為了解決基于關(guān)鍵字搜索的局限性,眾多研究者提出了基于語義的Web服務(wù)發(fā)現(xiàn)方法,但這些方法在很大程度上取決于是否有可用的、良構(gòu)的領(lǐng)域本體(DomainOntology),而構(gòu)造這種體現(xiàn)領(lǐng)域知識(shí)的本體往往非常困難。因此,如何準(zhǔn)確地進(jìn)行Web服務(wù)發(fā)現(xiàn),仍然是一個(gè)亟待解決的問題。
[0004]用戶進(jìn)行Web服務(wù)發(fā)現(xiàn)時(shí),通常會(huì)使用能夠準(zhǔn)確表達(dá)其需求的高層次目標(biāo),如“規(guī)劃行程(plan a trip)”、“預(yù)訂旅館(book a hotel)”等。與基于關(guān)鍵字匹配的查詢相比,這種目標(biāo)驅(qū)動(dòng)的、能體現(xiàn)用戶意圖的查詢方式可以為用戶返回更準(zhǔn)確的結(jié)果。近年來,越來越多的研究工作將目標(biāo)用于Web服務(wù)的發(fā)現(xiàn)和建模中。但是,還沒有相關(guān)工作來研究如何從服務(wù)的描述信息中進(jìn)行領(lǐng)域相關(guān)的服務(wù)目標(biāo)知識(shí)的挖掘。因此,有必要研究如何從服務(wù)描述中進(jìn)行服務(wù)目標(biāo)(體現(xiàn)服務(wù)核心功能的特征詞或短語)抽取,并需要進(jìn)一步研究領(lǐng)域服務(wù)目標(biāo)知識(shí)庫的構(gòu)造以便進(jìn)行服務(wù)目標(biāo)的重用,從而為服務(wù)發(fā)現(xiàn)提供支持。
【發(fā)明內(nèi)容】
[0005]針對(duì)該問題,本發(fā)明的目的是提出一種服務(wù)目標(biāo)的抽取方法,并進(jìn)一步構(gòu)建領(lǐng)域服務(wù)目標(biāo)知識(shí)庫,從而為服務(wù)發(fā)現(xiàn)提供支持。
[0006]為實(shí)現(xiàn)本發(fā)明所述目的,本發(fā)明采用如下技術(shù)方案:一種面向領(lǐng)域服務(wù)目標(biāo)的知識(shí)庫構(gòu)建方法,其特征在于,包括以下步驟:
[0007]步驟1:收集Web服務(wù)的描述信息,將文本描述以文檔的形式存儲(chǔ),然后對(duì)收集的描述文檔進(jìn)行預(yù)處理,得到用戶所需要的Web服務(wù)描述文檔中的關(guān)鍵詞,并對(duì)每個(gè)關(guān)鍵詞在該文檔中的出現(xiàn)次數(shù)進(jìn)行統(tǒng)計(jì),再利用統(tǒng)計(jì)后的Web服務(wù)描述文檔集構(gòu)建領(lǐng)域關(guān)鍵詞排序表;
[0008]步驟2:利用所述的領(lǐng)域關(guān)鍵詞排序表,從Web服務(wù)的多種描述信息中進(jìn)行服務(wù)目標(biāo)抽取,得到Web服務(wù)的候選服務(wù)目標(biāo)集,然后對(duì)Web服務(wù)的候選服務(wù)目標(biāo)集依次進(jìn)行原型化、服務(wù)目標(biāo)替換和停用詞過濾處理,得到Web服務(wù)的服務(wù)目標(biāo)集;
[0009]步驟3:重復(fù)執(zhí)行所述的步驟2,獲得一個(gè)領(lǐng)域內(nèi)所有Web服務(wù)的服務(wù)目標(biāo)集,進(jìn)行領(lǐng)域服務(wù)目標(biāo)抽取,得到領(lǐng)域的候選領(lǐng)域服務(wù)目標(biāo)集,然后領(lǐng)域?qū)<铱梢岳煤蜻x領(lǐng)域服務(wù)目標(biāo)集進(jìn)行領(lǐng)域服務(wù)目標(biāo)知識(shí)庫的構(gòu)建或完善。
[0010]作為優(yōu)選,步驟I中所述的Web服務(wù)的描述信息包括文本描述信息和WSDL文檔信
肩、O
[0011]作為優(yōu)選,所述的步驟I的具體實(shí)現(xiàn)包括以下子步驟:
[0012]步驟1.1:對(duì)Web服務(wù)描述文檔進(jìn)行解析,抽取該文檔中包含的所有單詞;
[0013]步驟1.2:針對(duì)步驟1.1的結(jié)果,根據(jù)所述的單詞的詞性,將不屬于動(dòng)詞和名詞的單詞過濾掉,同時(shí)去掉對(duì)領(lǐng)域表征能力不強(qiáng)的動(dòng)詞和名詞,得到可以體現(xiàn)每個(gè)Web服務(wù)核心功能的關(guān)鍵詞集合;
[0014]步驟1.3:對(duì)步驟1.2的結(jié)果進(jìn)行關(guān)鍵詞的原型化處理;
[0015]步驟1.4:在步驟1.3的基礎(chǔ)上,統(tǒng)計(jì)Web服務(wù)描述文檔中每個(gè)關(guān)鍵詞的出現(xiàn)次數(shù);
[0016]步驟1.5:在步驟1.4的基礎(chǔ)上,通過計(jì)算領(lǐng)域Web服務(wù)描述文檔中每個(gè)關(guān)鍵詞對(duì)該領(lǐng)域的表征度構(gòu)建領(lǐng)域關(guān)鍵詞排序表。
[0017]作為優(yōu)選,以文本描述和WSDL文檔描述的Web服務(wù)而言,所述的步驟2的具體實(shí)現(xiàn)包括以下子步驟:
[0018]步驟2.1:從Web服務(wù)的文本描述中進(jìn)行服務(wù)目標(biāo)抽?。?br>
[0019]步驟2.2:從Web服務(wù)的WSDL文檔中進(jìn)行服務(wù)目標(biāo)抽??;
[0020]步驟2.3:在步驟2.1和步驟2.2的基礎(chǔ)上,對(duì)文本描述的候選服務(wù)目標(biāo)集與WSDL文檔的候選服務(wù)目標(biāo)集取并集,得到Web服務(wù)的候選服務(wù)目標(biāo)集;
[0021]步驟2.4:針對(duì)步驟2.3的結(jié)果,通過依次進(jìn)行原型化、服務(wù)目標(biāo)替換和停用詞過濾處理得到Web服務(wù)的服務(wù)目標(biāo)集;
[0022]步驟2.5:對(duì)步驟2.4的結(jié)果中存在包含關(guān)系的多個(gè)服務(wù)目標(biāo),僅保留語義信息最豐富的服務(wù)目標(biāo)。
[0023]作為優(yōu)選,步驟2.4中所述的服務(wù)目標(biāo)替換包括抽象名詞替換和等價(jià)動(dòng)詞替換。
[0024]作為優(yōu)選,步驟2.1所述的從Web服務(wù)的文本描述中進(jìn)行服務(wù)目標(biāo)抽取,其具體實(shí)現(xiàn)包括以下子步驟:
[0025]步驟2.1.1:對(duì)初始獲取的Web服務(wù)描述文檔中的每條語句進(jìn)行解析,得到各語句中詞匯間的語法依賴關(guān)系;
[0026]步驟2.1.2:在步驟2.1.1的基礎(chǔ)上,抽取各語句中的初始目標(biāo)集合;
[0027]步驟2.1.3:在步驟2.1.2的基礎(chǔ)上,獲取文本描述中包含的候選服務(wù)目標(biāo)集。
[0028]作為優(yōu)選,步驟2.2所述的從Web服務(wù)的WSDL文檔中進(jìn)行服務(wù)目標(biāo)抽取,其具體實(shí)現(xiàn)包括以下子步驟:
[0029]步驟2.2.1:對(duì)WSDL文檔進(jìn)行解析,得到能夠代表Web服務(wù)功能的所有操作名的集合;
[0030]步驟2.2.2:在步驟2.2.1的基礎(chǔ)上,對(duì)操作名進(jìn)行分解,得到WSDL文檔中包含的候選服務(wù)目標(biāo)集。
[0031]作為優(yōu)選,所述的步驟3的具體實(shí)現(xiàn)包括以下子步驟:
[0032]步驟3.1:在步驟2的基礎(chǔ)上,統(tǒng)計(jì)領(lǐng)域中每個(gè)服務(wù)目標(biāo)的出現(xiàn)次數(shù);
[0033]步驟3.2:在步驟3.1的基礎(chǔ)上,進(jìn)行領(lǐng)域服務(wù)目標(biāo)抽取,得到候選領(lǐng)域服務(wù)目標(biāo)集;
[0034]步驟3.3:對(duì)步驟3.2的基礎(chǔ)上,對(duì)候選領(lǐng)域服務(wù)目標(biāo)按照出現(xiàn)次數(shù)進(jìn)行降序排列,得到候選領(lǐng)域服務(wù)目標(biāo)排序列表;
[0035]步驟3.4:針對(duì)步驟3.3的結(jié)果,領(lǐng)域?qū)<铱梢赃x擇性地對(duì)重要的候選領(lǐng)域服務(wù)目標(biāo)通過簡單的手工處理實(shí)現(xiàn)領(lǐng)域服務(wù)目標(biāo)知識(shí)庫的構(gòu)建或完善。
[0036]作為優(yōu)選,步驟3.4中所述的重要的候選領(lǐng)域服務(wù)目標(biāo),其判斷標(biāo)準(zhǔn)是:候選領(lǐng)域服務(wù)目標(biāo)出現(xiàn)次數(shù)大于10或者候選領(lǐng)域服務(wù)目標(biāo)排序列表中的前20個(gè)。
[0037]作為優(yōu)選,步驟3.4中所述的領(lǐng)域?qū)<铱梢赃x擇性地對(duì)重要的候選領(lǐng)域服務(wù)目標(biāo)通過簡單的手工處理,其處理方法為:對(duì)不合適的服務(wù)目標(biāo)進(jìn)行濾除或改進(jìn)。
[0038]本發(fā)明所述的Web服務(wù)來源于可訪問的Web服務(wù)注冊(cè)中心或Web服務(wù)門戶網(wǎng)站。
[0039]本發(fā)明的有益效果如下:
[0040](I)可以對(duì)通過文本描述和WSDL文檔描述的Web服務(wù)進(jìn)行服務(wù)目標(biāo)抽取,并且該方法具有良好的可擴(kuò)展性,能夠容易地適用于其他Web服務(wù)描述方式的處理,從而為基于目標(biāo)的Web服務(wù)發(fā)現(xiàn)提供廣泛的支持;
[0041 ] (2)通過服務(wù)目標(biāo)替換處理,不僅可以精簡領(lǐng)域服務(wù)目標(biāo)集的規(guī)模,而且還可以消除不同服務(wù)目標(biāo)間的語義異構(gòu)問題,有助于提高Web服務(wù)發(fā)現(xiàn)的質(zhì)量;
[0042](3)構(gòu)建的領(lǐng)域服務(wù)目標(biāo)知識(shí)庫作為一種領(lǐng)域資產(chǎn),在面向領(lǐng)域知識(shí)的需求工程及其用戶服務(wù)需求的獲取與分析中,能夠提升用戶需求的豐富和完善度;
[0043](4)利用服務(wù)目標(biāo)可以提高服務(wù)標(biāo)注的準(zhǔn)確度,進(jìn)而有助于提高基于標(biāo)注信息的Web服務(wù)發(fā)現(xiàn)和服務(wù)推薦的質(zhì)量。
【專利附圖】
【附圖說明】
[0044]圖1:是本發(fā)明的方法流程示意圖。
[0045]圖2:是本發(fā)明的服務(wù)目標(biāo)抽取的流程示意圖。
【具體實(shí)施方式】
[0046]以下將結(jié)合附圖和具體實(shí)施例對(duì)本發(fā)明做進(jìn)一步的闡述。
[0047]請(qǐng)見圖1、圖2,本發(fā)明所采用的技術(shù)方案是:一種面向領(lǐng)域服務(wù)目標(biāo)的知識(shí)庫構(gòu)建方法,包括以下步驟:
[0048]步驟1:收集包括文本描述信息和WSDL文檔信息的Web服務(wù)的描述信息,將文本描述以文檔的形式存儲(chǔ),然后對(duì)收集的描述文檔進(jìn)行預(yù)處理,得到用戶所需要的Web服務(wù)描述文檔中的關(guān)鍵詞,并對(duì)每個(gè)關(guān)鍵詞在該文檔中的出現(xiàn)次數(shù)進(jìn)行統(tǒng)計(jì),再利用統(tǒng)計(jì)后的Web服務(wù)描述文檔集構(gòu)建領(lǐng)域關(guān)鍵詞排序表;其具體實(shí)現(xiàn)包括以下子步驟:[0049]步驟1.1:對(duì)Web服務(wù)描述文檔進(jìn)行解析,抽取該文檔中包含的所有單詞;
[0050]步驟1.2:針對(duì)步驟1.1的結(jié)果,根據(jù)所述的單詞的詞性,將不屬于動(dòng)詞和名詞的單詞過濾掉,同時(shí)去掉對(duì)領(lǐng)域表征能力不強(qiáng)的動(dòng)詞和名詞,,如英文的“are”、“l(fā)et”、“haVe”、“SerViCe”等,得到可以體現(xiàn)每個(gè)Web服務(wù)核心功能的關(guān)鍵詞集合;
[0051]步驟1.3:對(duì)步驟1.2的結(jié)果進(jìn)行關(guān)鍵詞的原型化處理,即將關(guān)鍵詞的多種詞型變換成基本原型,如英文的“retrieves”、“retrieved”、“retrieving”經(jīng)過處理后都變?yōu)椤皉etrieve,,;
[0052]步驟1.4:在步驟1.3的基礎(chǔ)上,統(tǒng)計(jì)Web服務(wù)描述文檔中每個(gè)關(guān)鍵詞的出現(xiàn)次數(shù);
[0053]步驟1.5:在步驟1.4的基礎(chǔ)上,通過計(jì)算領(lǐng)域Web服務(wù)描述文檔中每個(gè)關(guān)鍵詞對(duì)該領(lǐng)域的表征度(Degree of Representation,簡稱DR)構(gòu)建領(lǐng)域關(guān)鍵詞排序表。
[0054]領(lǐng)域關(guān)鍵詞排序表的構(gòu)建可以有多種方式,其基本思路是如果一個(gè)關(guān)鍵詞在指定領(lǐng)域中出現(xiàn)的次數(shù)很多,且在其它領(lǐng)域中很少出現(xiàn),則該關(guān)鍵詞對(duì)指定領(lǐng)域的表征度就很高,其在該領(lǐng)域的關(guān)鍵詞排序表中排序則靠前,反之則靠后。在具體實(shí)施中,可以采用如下方式進(jìn)行構(gòu)建。
[0055]首先,計(jì)算領(lǐng)域中的每個(gè)關(guān)鍵詞對(duì)該領(lǐng)域的DR,然后按DR進(jìn)行降序排列得到領(lǐng)域關(guān)鍵詞排序表。關(guān)于DR的計(jì)算方式如下:
【權(quán)利要求】
1.一種面向領(lǐng)域服務(wù)目標(biāo)的知識(shí)庫構(gòu)建方法,其特征在于,包括以下步驟: 步驟1:收集Web服務(wù)的描述信息,將文本描述以文檔的形式存儲(chǔ),然后對(duì)收集的描述文檔進(jìn)行預(yù)處理,得到用戶所需要的Web服務(wù)描述文檔中的關(guān)鍵詞,并對(duì)每個(gè)關(guān)鍵詞在該文檔中的出現(xiàn)次數(shù)進(jìn)行統(tǒng)計(jì),再利用統(tǒng)計(jì)后的Web服務(wù)描述文檔集構(gòu)建領(lǐng)域關(guān)鍵詞排序表; 步驟2:利用所述的領(lǐng)域關(guān)鍵詞排序表,從Web服務(wù)的多種描述信息中進(jìn)行服務(wù)目標(biāo)抽取,得到Web服務(wù)的候選服務(wù)目標(biāo)集,然后對(duì)Web服務(wù)的候選服務(wù)目標(biāo)集依次進(jìn)行原型化、服務(wù)目標(biāo)替換和停用詞過濾處理,得到Web服務(wù)的服務(wù)目標(biāo)集; 步驟3:重復(fù)執(zhí)行所述的步驟2,獲得一個(gè)領(lǐng)域內(nèi)所有Web服務(wù)的服務(wù)目標(biāo)集,進(jìn)行領(lǐng)域服務(wù)目標(biāo)抽取,得到領(lǐng)域的候選領(lǐng)域服務(wù)目標(biāo)集,然后領(lǐng)域?qū)<铱梢岳煤蜻x領(lǐng)域服務(wù)目標(biāo)集進(jìn)行領(lǐng)域服務(wù)目標(biāo)知識(shí)庫的構(gòu)建或完善。
2.根據(jù)權(quán)利要求1所述的面向領(lǐng)域服務(wù)目標(biāo)的知識(shí)庫構(gòu)建方法,其特征在于:步驟I中所述的Web服務(wù)的描述信息包括文本描述信息和WSDL文檔信息。
3.根據(jù)權(quán)利要求1所述的面向領(lǐng)域服務(wù)目標(biāo)的知識(shí)庫構(gòu)建方法,其特征在于:所述的步驟I的具體實(shí)現(xiàn)包括以下子步驟: 步驟1.1:對(duì)Web服務(wù)描述文檔進(jìn)行解析,抽取該文檔中包含的所有單詞; 步驟1.2:針對(duì)步驟1.1的結(jié)果,根據(jù)所述的單詞的詞性,將不屬于動(dòng)詞和名詞的單詞過濾掉,同時(shí)去掉對(duì)領(lǐng)域表征能力不強(qiáng)的動(dòng)詞和名詞,得到可以體現(xiàn)每個(gè)Web服務(wù)核心功能的關(guān)鍵詞集合; 步驟1.3:對(duì)步驟1.2的結(jié)果進(jìn)行關(guān)鍵詞的原型化處理; 步驟1.4:在步驟1.3的基礎(chǔ)上,統(tǒng)計(jì)Web服務(wù)描述文檔中每個(gè)關(guān)鍵詞的出現(xiàn)次數(shù);步驟1.5:在步驟1.4的基礎(chǔ)上,通過計(jì)算領(lǐng)域Web服務(wù)描述文檔中每個(gè)關(guān)鍵詞對(duì)該領(lǐng)域的表征度構(gòu)建領(lǐng)域關(guān)鍵詞排序表。
4.根據(jù)權(quán)利要求1所述的面向領(lǐng)域服務(wù)目標(biāo)的知識(shí)庫構(gòu)建方法,其特征在于:以文本描述和WSDL文檔描述的Web服務(wù)而言,所述的步驟2的具體實(shí)現(xiàn)包括以下子步驟: 步驟2.1:從Web服務(wù)的文本描述中進(jìn)行服務(wù)目標(biāo)抽??; 步驟2.2:從Web服務(wù)的WSDL文檔中進(jìn)行服務(wù)目標(biāo)抽??; 步驟2.3:在步驟2.1和步驟2.2的基礎(chǔ)上,對(duì)文本描述的候選服務(wù)目標(biāo)集與WSDL文檔的候選服務(wù)目標(biāo)集取并集,得到Web服務(wù)的候選服務(wù)目標(biāo)集; 步驟2.4:針對(duì)步驟2.3的結(jié)果,通過依次進(jìn)行原型化、服務(wù)目標(biāo)替換和停用詞過濾處理得到Web服務(wù)的服務(wù)目標(biāo)集; 步驟2.5:對(duì)步驟2.4的結(jié)果中存在包含關(guān)系的多個(gè)服務(wù)目標(biāo),僅保留語義信息最豐富的服務(wù)目標(biāo)。
5.根據(jù)權(quán)利要求4所述的面向領(lǐng)域服務(wù)目標(biāo)的知識(shí)庫構(gòu)建方法,其特征在于:步驟2.4中所述的服務(wù)目標(biāo)替換包括抽象名詞替換和等價(jià)動(dòng)詞替換。
6.根據(jù)權(quán)利要求4所述的面向領(lǐng)域服務(wù)目標(biāo)的知識(shí)庫構(gòu)建方法,其特征在于:步驟2.1所述的從Web服務(wù)的文本描述中進(jìn)行服務(wù)目標(biāo)抽取,其具體實(shí)現(xiàn)包括以下子步驟: 步驟2.1.1:對(duì)初始獲取的Web服務(wù)描述文檔中的每條語句進(jìn)行解析,得到各語句中詞匯間的語法依賴關(guān)系;步驟2.1.2:在步驟2.1.1的基礎(chǔ)上,抽取各語句中的初始目標(biāo)集合; 步驟2.1.3:在步驟2.1.2的基礎(chǔ)上,獲取文本描述中包含的候選服務(wù)目標(biāo)集。
7.根據(jù)權(quán)利要求4所述的面向領(lǐng)域服務(wù)目標(biāo)的知識(shí)庫構(gòu)建方法,其特征在于:步驟2.2所述的從Web服務(wù)的WSDL文檔中進(jìn)行服務(wù)目標(biāo)抽取,其具體實(shí)現(xiàn)包括以下子步驟: 步驟2.2.1:對(duì)WSDL文檔進(jìn)行解析,得到能夠代表Web服務(wù)功能的所有操作名的集合; 步驟2.2.2:在步驟2.2.1的基礎(chǔ)上,對(duì)操作名進(jìn)行分解,得到WSDL文檔中包含的候選服務(wù)目標(biāo)集。
8.根據(jù)權(quán)利要求1所述的面向領(lǐng)域服務(wù)目標(biāo)的知識(shí)庫構(gòu)建方法,其特征在于:所述的步驟3的具體實(shí)現(xiàn)包括以下子步驟: 步驟3.1:在步驟2的基礎(chǔ)上,統(tǒng)計(jì)領(lǐng)域中每個(gè)服務(wù)目標(biāo)的出現(xiàn)次數(shù); 步驟3.2:在步驟3.1的基礎(chǔ)上,進(jìn)行領(lǐng)域服務(wù)目標(biāo)抽取,得到候選領(lǐng)域服務(wù)目標(biāo)集; 步驟3.3:對(duì)步驟3.2的基礎(chǔ)上,對(duì)候選領(lǐng)域服務(wù)目標(biāo)按照出現(xiàn)次數(shù)進(jìn)行降序排列,得到候選領(lǐng)域服務(wù)目標(biāo)排序列表; 步驟3.4:針對(duì)步驟3.3的結(jié)果,領(lǐng)域?qū)<铱梢赃x擇性地對(duì)重要的候選領(lǐng)域服務(wù)目標(biāo)通過簡單的手工處理實(shí)現(xiàn)領(lǐng)域服務(wù)目標(biāo)知識(shí)庫的構(gòu)建或完善。
9.根據(jù)權(quán)利要求8所述的面向領(lǐng)域服務(wù)目標(biāo)的知識(shí)庫構(gòu)建方法,其特征在于:步驟3.4中所述的重要的候選領(lǐng)域服務(wù)目標(biāo),其判斷標(biāo)準(zhǔn)是:候選領(lǐng)域服務(wù)目標(biāo)出現(xiàn)次數(shù)大于10或者候選領(lǐng)域服務(wù)目標(biāo)排序列表中的前20個(gè)。
10.根據(jù)權(quán)利要求8所述的面向領(lǐng)域服務(wù)目標(biāo)的知識(shí)庫構(gòu)建方法,其特征在于:步驟3.4中所述的領(lǐng)域?qū)<铱梢赃x擇性地對(duì)重要的候選領(lǐng)域服務(wù)目標(biāo)通過簡單的手工處理,其處理方法為:對(duì)不合適的服務(wù)目標(biāo)進(jìn)行濾除或改進(jìn)。
【文檔編號(hào)】G06F17/30GK103440343SQ201310412162
【公開日】2013年12月11日 申請(qǐng)日期:2013年9月11日 優(yōu)先權(quán)日:2013年9月11日
【發(fā)明者】何克清, 張能, 王健, 李征 申請(qǐng)人:武漢大學(xué)