本發(fā)明屬于數(shù)據(jù)質(zhì)量評(píng)估,具體的為一種基于業(yè)務(wù)模型驅(qū)動(dòng)的垂直領(lǐng)域知識(shí)圖譜質(zhì)量評(píng)估方法。
背景技術(shù):
1、知識(shí)圖譜是一種基于圖的結(jié)構(gòu)化知識(shí)表現(xiàn)形式,可以對(duì)現(xiàn)實(shí)世界中的實(shí)體、概念、屬性以及它們之間的關(guān)系進(jìn)行建模。而垂直領(lǐng)域知識(shí)圖譜是針對(duì)特定行業(yè)或領(lǐng)域進(jìn)行建模和應(yīng)用的知識(shí)圖譜。它在常規(guī)知識(shí)圖譜的基礎(chǔ)上,進(jìn)一步聚焦于某個(gè)垂直領(lǐng)域,更加深入地刻畫該領(lǐng)域內(nèi)的實(shí)體、概念、屬性及其語義關(guān)系?,F(xiàn)有的研究工作側(cè)重于知識(shí)圖譜的構(gòu)建,包括信息抽取、知識(shí)融合等構(gòu)建技術(shù),但忽視了對(duì)知識(shí)圖譜質(zhì)量的評(píng)估。
2、不同的數(shù)據(jù)來源、構(gòu)建過程和更新維護(hù)的方式都有可能對(duì)知識(shí)圖譜的質(zhì)量產(chǎn)生影響,可能導(dǎo)致知識(shí)圖譜存在知識(shí)錯(cuò)誤、不完整、不一致等質(zhì)量問題。例如,在關(guān)聯(lián)開放數(shù)據(jù)云平臺(tái)lod?cloud中發(fā)布的數(shù)據(jù)集總體上有著不錯(cuò)的質(zhì)量,但是在一些維度上存在嚴(yán)重的問題。因?yàn)槭褂谜邿o法確定知識(shí)圖譜是否滿足質(zhì)量要求,所以這些問題可能會(huì)導(dǎo)致花費(fèi)大量成本構(gòu)建的知識(shí)圖譜難以被充分利用。
3、雖然傳統(tǒng)數(shù)據(jù)質(zhì)量評(píng)估的研究已經(jīng)取得了很大進(jìn)展,但是針對(duì)領(lǐng)域知識(shí)圖譜的質(zhì)量評(píng)估技術(shù)方法目前較為缺乏,并且當(dāng)前存在的對(duì)于領(lǐng)域知識(shí)圖譜質(zhì)量評(píng)估的研究多局限于某一特定維度,缺乏系統(tǒng)性,這樣得到的評(píng)估結(jié)果無法反映領(lǐng)域知識(shí)圖譜的整體質(zhì)量情況。因此,針對(duì)領(lǐng)域知識(shí)圖譜,在現(xiàn)有質(zhì)量維度的基礎(chǔ)上,構(gòu)建一個(gè)系統(tǒng)的質(zhì)量評(píng)估體系和有效的質(zhì)量評(píng)估方法,有助于全面了解領(lǐng)域知識(shí)圖譜的質(zhì)量情況,以便于使用者判斷該領(lǐng)域知識(shí)圖譜是否符合使用需求。
技術(shù)實(shí)現(xiàn)思路
1、有鑒于此,本發(fā)明的目的在于提供一種基于業(yè)務(wù)模型驅(qū)動(dòng)的垂直領(lǐng)域知識(shí)圖譜質(zhì)量評(píng)估方法,根據(jù)領(lǐng)域知識(shí)圖譜的各項(xiàng)性質(zhì),基于業(yè)務(wù)模型驅(qū)動(dòng)來評(píng)估該領(lǐng)域知識(shí)圖譜的質(zhì)量。
2、為達(dá)到上述目的,本發(fā)明提供如下技術(shù)方案:
3、一種基于業(yè)務(wù)模型驅(qū)動(dòng)的垂直領(lǐng)域知識(shí)圖譜質(zhì)量評(píng)估方法,包括如下步驟:
4、步驟一:建立面向垂直領(lǐng)域的業(yè)務(wù)模型
5、建立目標(biāo)領(lǐng)域的業(yè)務(wù)模型,所述業(yè)務(wù)模型用于描述和解釋該領(lǐng)域的運(yùn)作模式以及業(yè)務(wù)執(zhí)行流程,包含支撐業(yè)務(wù)的相關(guān)領(lǐng)域知識(shí),為領(lǐng)域知識(shí)圖譜提供數(shù)據(jù)支撐;
6、步驟二:導(dǎo)入待評(píng)估的領(lǐng)域知識(shí)圖譜
7、導(dǎo)入領(lǐng)域知識(shí)圖譜,提供領(lǐng)域知識(shí)圖譜中包含的業(yè)務(wù)相關(guān)知識(shí),以對(duì)質(zhì)量評(píng)估過程進(jìn)行知識(shí)支撐與數(shù)據(jù)準(zhǔn)備;
8、步驟三:確定知識(shí)圖譜評(píng)估維度
9、根據(jù)領(lǐng)域知識(shí)圖譜的性質(zhì),確定領(lǐng)域知識(shí)圖譜的質(zhì)量評(píng)估維度,并定義各維度的度量指標(biāo);所述質(zhì)量評(píng)估維度包括準(zhǔn)確性維度、完備性維度、一致性維度和魯棒性維;其中:
10、準(zhǔn)確性維度用于描述領(lǐng)域知識(shí)圖譜中知識(shí)正確、精準(zhǔn)反映領(lǐng)域客觀現(xiàn)實(shí)的情況,包括epv準(zhǔn)確性和ere準(zhǔn)確性;
11、完備性維度用于描述領(lǐng)域知識(shí)圖譜對(duì)領(lǐng)域知識(shí)的覆蓋程度,包括四個(gè)度量指標(biāo),分別為實(shí)體類完備性、實(shí)體類屬性完備性、實(shí)體完備性和實(shí)體屬性完備性;
12、一致性維度用于描述領(lǐng)域知識(shí)圖譜在邏輯上不存在矛盾的程度,包括實(shí)體類一致性和屬性類一致性;
13、魯棒性維度用于描述領(lǐng)域知識(shí)圖譜對(duì)領(lǐng)域知識(shí)的容納程度,包括epv魯棒性和ere魯棒性。
14、步驟四:建立業(yè)務(wù)驅(qū)動(dòng)的知識(shí)圖譜質(zhì)量評(píng)估模型
15、建立業(yè)務(wù)驅(qū)動(dòng)的知識(shí)圖譜質(zhì)量評(píng)估模型,利用評(píng)估模型計(jì)算領(lǐng)域知識(shí)圖譜中各質(zhì)量評(píng)估維度的度量指標(biāo)得分;
16、步驟五:知識(shí)圖譜質(zhì)量評(píng)估結(jié)果可靠性驗(yàn)證
17、通過對(duì)業(yè)務(wù)模型執(zhí)行具體任務(wù)進(jìn)行仿真,以驗(yàn)證領(lǐng)域知識(shí)圖譜質(zhì)量評(píng)估結(jié)果可靠性。
18、進(jìn)一步,所述步驟三中,各維度的度量指標(biāo)分別為:
19、(1)準(zhǔn)確性維度的度量指標(biāo)為:
20、epv準(zhǔn)確性定義為領(lǐng)域知識(shí)圖譜中含有的描述正確的實(shí)體-屬性-屬性值三元組占領(lǐng)域知識(shí)圖譜中實(shí)體-屬性-屬性值三元組的比例,表示為:
21、
22、式中:|epvcorrect-dkg|為領(lǐng)域知識(shí)圖譜中描述正確的實(shí)體-屬性-屬性值三元組個(gè)數(shù);|epvdkg|為領(lǐng)域知識(shí)圖譜中實(shí)體-屬性-屬性值三元組個(gè)數(shù)
23、ere準(zhǔn)確性定義為領(lǐng)域知識(shí)圖譜中含有的且描述正確的實(shí)體-關(guān)系-實(shí)體三元組占領(lǐng)域知識(shí)圖譜中實(shí)體-關(guān)系-實(shí)體三元組的比例,表示為:
24、
25、式中:|erecorrect-dkg|為領(lǐng)域知識(shí)圖譜中描述正確的實(shí)體-關(guān)系-實(shí)體三元組個(gè)數(shù);|eredkg|為領(lǐng)域知識(shí)圖譜中實(shí)體-關(guān)系-實(shí)體三元組個(gè)數(shù)。
26、(2)完備性維度的度量指標(biāo)為:
27、實(shí)體類完備性定義為領(lǐng)域知識(shí)圖譜中實(shí)體類占該領(lǐng)域中完整實(shí)體類的比例,表示為:
28、
29、式中:|ecdkg|為領(lǐng)域知識(shí)圖譜中實(shí)體類的個(gè)數(shù);|eccomplete|為該領(lǐng)域中完整的實(shí)體類的個(gè)數(shù);
30、實(shí)體類屬性完備性定義為領(lǐng)域知識(shí)圖譜中屬性類占該領(lǐng)域中完整屬性類的比例,表示為:
31、
32、式中:|pcec-dkg|為領(lǐng)域知識(shí)圖譜中屬于類ec的屬性類個(gè)數(shù);|pcec-complete|為該領(lǐng)域中屬于類ec的完整的屬性類個(gè)數(shù)。
33、實(shí)體完備性定義為領(lǐng)域知識(shí)圖譜中實(shí)體占該領(lǐng)域中完整實(shí)體的比例,表示為:
34、
35、式中:|eec-dkg|為領(lǐng)域知識(shí)圖譜中屬于類ec的實(shí)體的個(gè)數(shù);|eec-complete|為該領(lǐng)域中屬于類ec的完整實(shí)體個(gè)數(shù);
36、實(shí)體屬性完備性定義為知識(shí)圖譜中屬性占該領(lǐng)域中完整屬性的比例,表示為:
37、
38、式中:|pe-dkg|為領(lǐng)域知識(shí)圖譜中屬于實(shí)體e的實(shí)體屬性個(gè)數(shù);|pe-complete|為該領(lǐng)域中屬于實(shí)體e的完整屬性的個(gè)數(shù);|ecomplete|為該領(lǐng)域中完整的實(shí)體個(gè)數(shù);
39、(3)一致性維度的度量指標(biāo)為:
40、實(shí)體類一致性定義為在領(lǐng)域知識(shí)圖譜中正確實(shí)體與實(shí)體類對(duì)應(yīng)關(guān)系所占比例,表示為:
41、
42、式中:|eec-consistent-dkg|為領(lǐng)域知識(shí)圖譜中屬于類ec的正確實(shí)體與實(shí)體類對(duì)應(yīng)關(guān)系的個(gè)數(shù);
43、屬性類一致性定義為在領(lǐng)域知識(shí)圖譜中正確屬性與屬性類對(duì)應(yīng)關(guān)系所占比例,表示為:
44、
45、式中:|pe-consistent-dkg|為領(lǐng)域知識(shí)圖譜中屬于實(shí)體e的正確屬性與屬性類對(duì)應(yīng)關(guān)系的個(gè)數(shù);
46、(4)魯棒性維度的度量指標(biāo)為:
47、epv魯棒性定義為可填充至領(lǐng)域知識(shí)圖譜的實(shí)體-屬性-屬性值三元組占該領(lǐng)域中完整實(shí)體-屬性-屬性值三元組的比例,表示為:
48、
49、式中:|epvrefillable|表示可填充至領(lǐng)域知識(shí)圖譜的實(shí)體-屬性-屬性值三元組個(gè)數(shù);|epvcomplete|表示領(lǐng)域知識(shí)圖譜中完整實(shí)體-屬性-屬性值三元組個(gè)數(shù);
50、ere魯棒性定義為可填充至領(lǐng)域知識(shí)圖譜的實(shí)體-關(guān)系-實(shí)體三元組占該領(lǐng)域中完整實(shí)體-關(guān)系-實(shí)體三元組的比例,表示為:
51、
52、式中:|ererefillable|表示可填充至領(lǐng)域知識(shí)圖譜的實(shí)體-關(guān)系-實(shí)體三元組個(gè)數(shù);|erecomplete|表示領(lǐng)域知識(shí)圖譜中完整實(shí)體-關(guān)系-實(shí)體三元組個(gè)數(shù)。
53、進(jìn)一步,所述步驟四中,利用業(yè)務(wù)驅(qū)動(dòng)的知識(shí)圖譜質(zhì)量評(píng)估模型對(duì)各個(gè)維度的度量指標(biāo)得分進(jìn)行求解的步驟為:
54、41)執(zhí)行一次業(yè)務(wù)模型中描述的業(yè)務(wù)流程,獲取整合本次業(yè)務(wù)流程使用到的領(lǐng)域知識(shí),并統(tǒng)計(jì)業(yè)務(wù)流程知識(shí)中的度量指標(biāo)數(shù)據(jù);
55、42)利用導(dǎo)入的領(lǐng)域知識(shí)圖譜,查詢本次業(yè)務(wù)流程中的相關(guān)領(lǐng)域知識(shí),利用查詢結(jié)果統(tǒng)計(jì)與領(lǐng)域知識(shí)圖譜相關(guān)的相關(guān)度量指標(biāo)數(shù)據(jù);
56、43)利用業(yè)務(wù)驅(qū)動(dòng)的度量指標(biāo)近似計(jì)算公式與評(píng)估結(jié)果迭代公式近似計(jì)算領(lǐng)域知識(shí)圖譜的質(zhì)量評(píng)估結(jié)果,并判斷質(zhì)量評(píng)估結(jié)果是否穩(wěn)定:若是,則表明質(zhì)量評(píng)估結(jié)果穩(wěn)定,執(zhí)行步驟44),否則,則執(zhí)行步驟41);
57、44)輸出領(lǐng)域知識(shí)圖譜質(zhì)量評(píng)估結(jié)果,包括領(lǐng)域知識(shí)圖譜準(zhǔn)確性得分accuracyscore、完備性得分completenessscore、一致性得分consistencyscore和魯棒性得分robustnessscore。
58、進(jìn)一步,所述步驟43)中,度量指標(biāo)近似計(jì)算公式包括:
59、(1)準(zhǔn)確性維度度量指標(biāo)的近似計(jì)算公式
60、epv準(zhǔn)確性度量指標(biāo)的近似計(jì)算公式為:
61、
62、式中:|epvcorrect-query|表示查詢到的業(yè)務(wù)知識(shí)中準(zhǔn)確的實(shí)體-屬性-屬性值三元組個(gè)數(shù);|epvquery|表示查詢到的業(yè)務(wù)知識(shí)中實(shí)體-屬性-屬性值三元組個(gè)數(shù);
63、ere準(zhǔn)確性度量指標(biāo)的近似計(jì)算公式為:
64、
65、式中:|erecorrect-query|表示查詢到的業(yè)務(wù)知識(shí)中準(zhǔn)確的實(shí)體-關(guān)系-實(shí)體三元組個(gè)數(shù);|erequery|表示查詢到的業(yè)務(wù)知識(shí)中實(shí)體-關(guān)系-實(shí)體三元組個(gè)數(shù);
66、(2)完備性維度度量指標(biāo)的近似計(jì)算公式
67、實(shí)體類完備性度量指標(biāo)的近似計(jì)算公式為:
68、
69、式中:|ecquery|表示查詢到的業(yè)務(wù)知識(shí)中實(shí)體類個(gè)數(shù);|ecbusiness|表示業(yè)務(wù)知識(shí)中實(shí)體類的個(gè)數(shù);
70、實(shí)體類屬性完備性度量指標(biāo)的近似計(jì)算公式為:
71、
72、式中:|pcec-query|表示查詢到的業(yè)務(wù)知識(shí)中每個(gè)實(shí)體類包含的屬性類個(gè)數(shù);|pcec-business|表示業(yè)務(wù)知識(shí)中每一個(gè)實(shí)體類包含的屬性類的個(gè)數(shù);|ecbusiness|表示業(yè)務(wù)知識(shí)中實(shí)體類的個(gè)數(shù);
73、實(shí)體完備性度量指標(biāo)的近似計(jì)算公式為:
74、
75、式中:|eec-query|表示查詢到的業(yè)務(wù)知識(shí)中每個(gè)實(shí)體類包含的實(shí)體個(gè)數(shù);|eec-business|表示業(yè)務(wù)知識(shí)中每一個(gè)實(shí)體包含的實(shí)體的個(gè)數(shù);|ecbusiness|表示業(yè)務(wù)知識(shí)中實(shí)體類的個(gè)數(shù);
76、實(shí)體屬性完備性度量指標(biāo)的近似計(jì)算公式為:
77、
78、式中:|pe-query|表示查詢到的業(yè)務(wù)知識(shí)中每個(gè)實(shí)體包含的屬性個(gè)數(shù);|pe-business|表示業(yè)務(wù)知識(shí)中每一個(gè)實(shí)體包含的屬性的個(gè)數(shù);|ebusiness|表示業(yè)務(wù)知識(shí)中實(shí)體的個(gè)數(shù);
79、(3)一致性維度度量指標(biāo)的近似計(jì)算公式
80、實(shí)體類一致性度量指標(biāo)的近似計(jì)算公式為:
81、
82、式中:|eec-consistent-query|表示查詢到的業(yè)務(wù)知識(shí)中每個(gè)實(shí)體類中實(shí)體類關(guān)系一致的實(shí)體個(gè)數(shù);|eec-query|表示查詢到的業(yè)務(wù)知識(shí)中每個(gè)實(shí)體類包含的實(shí)體個(gè)數(shù);|ecbusiness|表示業(yè)務(wù)知識(shí)中實(shí)體類的個(gè)數(shù);
83、屬性類一致性度量指標(biāo)的近似計(jì)算公式為:
84、
85、式中:|pe-consistent-query|表示查詢到的業(yè)務(wù)知識(shí)中每個(gè)實(shí)體中屬性類關(guān)系一致的屬性個(gè)數(shù);|pe-query|表示查詢到的業(yè)務(wù)知識(shí)中每個(gè)實(shí)體包含的屬性個(gè)數(shù);|ebusiness|表示業(yè)務(wù)知識(shí)中實(shí)體的個(gè)數(shù);
86、(4)魯棒性維度度量指標(biāo)的近似計(jì)算公式
87、epv魯棒性度量指標(biāo)的近似計(jì)算公式為:
88、
89、式中:|epvquery|表示查詢到的業(yè)務(wù)知識(shí)中實(shí)體-屬性-屬性值三元組個(gè)數(shù);|epvbusiness|表示業(yè)務(wù)知識(shí)中實(shí)體-屬性-屬性值三元組的個(gè)數(shù);
90、ere魯棒性度量指標(biāo)的近似計(jì)算公式為:
91、
92、式中:|erequery|表示查詢到的業(yè)務(wù)知識(shí)中實(shí)體-關(guān)系-實(shí)體三元組個(gè)數(shù);|erebusiness|表示業(yè)務(wù)知識(shí)中實(shí)體-關(guān)系-實(shí)體三元組的個(gè)數(shù)。
93、進(jìn)一步,所述步驟43)中,評(píng)估結(jié)果迭代公式包括:
94、準(zhǔn)確性評(píng)估結(jié)果迭代公式:
95、
96、式中:accuracyk為執(zhí)行前k次業(yè)務(wù)后計(jì)算得到的領(lǐng)域知識(shí)圖譜準(zhǔn)確性的評(píng)估結(jié)果;
97、完備性評(píng)估結(jié)果迭代公式:
98、
99、式中:completenessk為執(zhí)行前k次業(yè)務(wù)后計(jì)算得到的領(lǐng)域知識(shí)圖譜完備性的評(píng)估結(jié)果;
100、一致性評(píng)估結(jié)果迭代公式:
101、
102、式中:consistencyk為執(zhí)行前k次業(yè)務(wù)后計(jì)算得到的領(lǐng)域知識(shí)圖譜一致性的評(píng)估結(jié)果;
103、魯棒性評(píng)估結(jié)果迭代公式:
104、
105、式中:robustnessk為執(zhí)行前k次業(yè)務(wù)后計(jì)算得到的領(lǐng)域知識(shí)圖譜魯棒性的評(píng)估結(jié)果。
106、進(jìn)一步,所述步驟43)中,質(zhì)量評(píng)估結(jié)果穩(wěn)定性判斷方法為:
107、準(zhǔn)確性質(zhì)量評(píng)估結(jié)果穩(wěn)定性判斷方法為:
108、|accuracyk+1-accuracyk|≤ε1
109、式中:ε1為準(zhǔn)確性質(zhì)量評(píng)估結(jié)果允許的最大偏差;
110、若相鄰兩次執(zhí)行業(yè)務(wù)后計(jì)算得到的領(lǐng)域知識(shí)圖譜準(zhǔn)確性的評(píng)估結(jié)果之差小于設(shè)定的最大偏差ε1,則表明準(zhǔn)確性質(zhì)量評(píng)估結(jié)果穩(wěn)定;否則,表明準(zhǔn)確性質(zhì)量評(píng)估結(jié)果不穩(wěn)定;
111、完備性質(zhì)量評(píng)估結(jié)果穩(wěn)定性判斷方法為:
112、|completenessk+1-completenessk|≤ε2
113、式中:ε2為完備性質(zhì)量評(píng)估結(jié)果允許的最大偏差;
114、若相鄰兩次執(zhí)行業(yè)務(wù)后計(jì)算得到的領(lǐng)域知識(shí)圖譜完備性的評(píng)估結(jié)果之差小于設(shè)定的最大偏差ε2,則表明完備性質(zhì)量評(píng)估結(jié)果穩(wěn)定;否則,表明完備性質(zhì)量評(píng)估結(jié)果不穩(wěn)定;
115、一致性質(zhì)量評(píng)估結(jié)果穩(wěn)定性判斷方法為:
116、|consistencyk+1-consistencyk|≤ε3
117、式中:ε3為一致性質(zhì)量評(píng)估結(jié)果允許的最大偏差;
118、若相鄰兩次執(zhí)行業(yè)務(wù)后計(jì)算得到的領(lǐng)域知識(shí)圖譜一致性的評(píng)估結(jié)果之差小于設(shè)定的最大偏差ε3,則表明一致性質(zhì)量評(píng)估結(jié)果穩(wěn)定;否則,表明一致性質(zhì)量評(píng)估結(jié)果不穩(wěn)定;
119、魯棒性質(zhì)量評(píng)估結(jié)果穩(wěn)定性判斷方法為:
120、|robustnessk+1-robustnessk|≤ε4
121、式中:ε4為魯棒性質(zhì)量評(píng)估結(jié)果允許的最大偏差;
122、若相鄰兩次執(zhí)行業(yè)務(wù)后計(jì)算得到的領(lǐng)域知識(shí)圖譜魯棒性的評(píng)估結(jié)果之差小于設(shè)定的最大偏差ε4,則表明魯棒性質(zhì)量評(píng)估結(jié)果穩(wěn)定;否則,表明魯棒性質(zhì)量評(píng)估結(jié)果不穩(wěn)定。
123、進(jìn)一步,所述步驟五中,通過業(yè)務(wù)仿真驗(yàn)證領(lǐng)域知識(shí)圖譜質(zhì)量評(píng)估結(jié)果可靠性的方法步驟為:
124、51)接收本次業(yè)務(wù)模型處理的具體任務(wù),并從領(lǐng)域知識(shí)圖譜中檢索獲取業(yè)務(wù)任務(wù)相關(guān)的領(lǐng)域知識(shí);
125、52)將檢索獲取的領(lǐng)域知識(shí)代入業(yè)務(wù)模型描述的業(yè)務(wù)過程中,計(jì)算領(lǐng)域知識(shí)圖譜對(duì)每個(gè)業(yè)務(wù)過程的支撐度supporti;
126、53)匯總領(lǐng)域知識(shí)圖譜對(duì)業(yè)務(wù)過程的支撐度計(jì)算結(jié)果,獲取領(lǐng)域知識(shí)圖譜對(duì)業(yè)務(wù)任務(wù)的支撐度support;
127、54)將領(lǐng)域知識(shí)圖譜對(duì)業(yè)務(wù)任務(wù)的支撐度support與領(lǐng)域知識(shí)圖譜的質(zhì)量評(píng)估綜合得分dkgscore進(jìn)行對(duì)比,判斷評(píng)價(jià)結(jié)果可靠性。
128、進(jìn)一步,所述步驟52)中,支撐度supporti為從領(lǐng)域知識(shí)圖譜中檢索到的與該業(yè)務(wù)過程相關(guān)的領(lǐng)域知識(shí)占執(zhí)行該業(yè)務(wù)過程所需要的領(lǐng)域知識(shí)的比例,表示為:
129、supporti=accuracys_i+completenesss_i+consistencys_i
130、式中:accuracys_i為檢索到的領(lǐng)域知識(shí)支撐第i個(gè)業(yè)務(wù)過程的準(zhǔn)確性;completenesss_i為檢索到的領(lǐng)域知識(shí)支撐第i個(gè)業(yè)務(wù)過程的完備性;consistencys_i為檢索到的領(lǐng)域知識(shí)支撐第i個(gè)業(yè)務(wù)過程的一致性。
131、進(jìn)一步,所述步驟53)中,支撐度support表示為:
132、
133、式中:n為該領(lǐng)域業(yè)務(wù)模型的業(yè)務(wù)流程個(gè)數(shù)。
134、進(jìn)一步,所述步驟54)中,質(zhì)量評(píng)估綜合得分dkgscore表示為:
135、dkgscore=accuracyscore+completenessscore+consistencyscore+robustnessscore
136、式中:accuracyscore表示領(lǐng)域知識(shí)圖譜準(zhǔn)確性得分;completenessscore表示領(lǐng)域知識(shí)圖譜完備性得分;consistencyscore表示領(lǐng)域知識(shí)圖譜一致性得分;robustnessscore表示領(lǐng)域知識(shí)圖譜魯棒性得分;
137、判斷評(píng)價(jià)結(jié)果可靠性的方法為:設(shè)定評(píng)估結(jié)果可靠性閾值ε,若|dkgscore-support|≤ε,則說明領(lǐng)域知識(shí)圖譜的評(píng)估結(jié)果可靠;若|dkgscore-support|>ε,則說明領(lǐng)域知識(shí)圖譜的評(píng)估結(jié)果不可靠。
138、本發(fā)明的有益效果在于:
139、本發(fā)明通過調(diào)研從傳統(tǒng)數(shù)據(jù)到知識(shí)圖譜的質(zhì)量研究工作中提出的各種質(zhì)量維度,通過整理和分析提出了一種基于業(yè)務(wù)模型驅(qū)動(dòng)的垂直領(lǐng)域知識(shí)圖譜質(zhì)量評(píng)估方法,包含了4個(gè)維度和10個(gè)評(píng)價(jià)指標(biāo),并建立了一種業(yè)務(wù)驅(qū)動(dòng)的知識(shí)圖譜質(zhì)量評(píng)估模型,用于計(jì)算領(lǐng)域知識(shí)圖譜各個(gè)維度度量指標(biāo)得分,根據(jù)領(lǐng)域知識(shí)圖譜的各項(xiàng)性質(zhì),基于業(yè)務(wù)模型驅(qū)動(dòng)來評(píng)估該領(lǐng)域知識(shí)圖譜的質(zhì)量;本發(fā)明方法能夠全面、高效、準(zhǔn)確地評(píng)價(jià)垂直領(lǐng)域知識(shí)圖譜的質(zhì)量,為構(gòu)建高質(zhì)量領(lǐng)域知識(shí)圖譜提供了有力支持。