本發(fā)明提出了一種基于貝葉斯網(wǎng)絡(luò)的智能系統(tǒng)開(kāi)發(fā)建模失效機(jī)理分析方法。它適用于智能軟件開(kāi)發(fā)建模階段的缺陷分析,獲取不同數(shù)據(jù)缺陷對(duì)智能軟件的影響程度,建立缺陷因素影響智能軟件故障的定量描述模型。本發(fā)明屬于人工智能領(lǐng)域。
背景技術(shù):
1、隨著信息技術(shù)和計(jì)算機(jī)應(yīng)用程度的不斷提高,人工智能技術(shù)被廣泛應(yīng)用在各個(gè)領(lǐng)域,智能軟件作為人工智能技術(shù)的應(yīng)用載體,帶來(lái)的故障隱患問(wèn)題也引起了越來(lái)越多的討論,而智能模型是智能軟件的大腦,其推理結(jié)果的可靠性也成為了值得關(guān)注的問(wèn)題。智能模型的可靠性不僅要保證正確實(shí)現(xiàn)了需求,更要確保模型不會(huì)產(chǎn)生負(fù)面作用或異常后果,進(jìn)而保證智能模型在其系統(tǒng)使用中不會(huì)影響功能的正常完成,否則就會(huì)出現(xiàn)智能模型故障。智能模型是從大量的訓(xùn)練樣本中學(xué)習(xí)到經(jīng)驗(yàn)和知識(shí),進(jìn)而完成任務(wù),訓(xùn)練樣本的質(zhì)量極大程度的影響了智能模型的質(zhì)量。
2、影響系統(tǒng)可靠性的模型內(nèi)部因素源自智能模型開(kāi)發(fā)階段的數(shù)據(jù)集構(gòu)建與設(shè)計(jì),這與智能模型的特征工程息息相關(guān)?,F(xiàn)有的關(guān)于特征工程階段影響因素的絕大多數(shù)研究,是針對(duì)某個(gè)具體的研究問(wèn)題,特定的結(jié)果,探究合適的特征工程方法,得到質(zhì)量更高樣本數(shù)據(jù)集,以便訓(xùn)練出更好的模型。本發(fā)明分析特征工程具體過(guò)程如何模型訓(xùn)練結(jié)果以及影響程度的大小,為數(shù)據(jù)集構(gòu)建和設(shè)計(jì)提供指導(dǎo)。
3、目前影響智能模型質(zhì)量的樣本缺陷因素主要包括樣本均衡性、樣本噪聲、樣本標(biāo)注質(zhì)量和其他特征工程手段等,目前使用者在構(gòu)建數(shù)據(jù)集時(shí),通過(guò)選擇樣本均衡、噪聲小、標(biāo)注質(zhì)量高的數(shù)據(jù)進(jìn)行構(gòu)建,而對(duì)于大規(guī)模的數(shù)據(jù)集,對(duì)所有缺陷因素進(jìn)行篩選成本過(guò)大,本發(fā)明通過(guò)敏感性分析,得到不同缺陷的敏感程度,在數(shù)據(jù)構(gòu)建過(guò)程中,側(cè)重于對(duì)敏感度大的缺陷因素的排除,提高數(shù)據(jù)集構(gòu)建效率的同時(shí)提高智能模型的效果。
4、在此基礎(chǔ)上,本發(fā)明針對(duì)智能軟件數(shù)據(jù)建模階段可能存在的數(shù)據(jù)缺陷提出一種敏感性分析方法,建立缺陷因素影響智能模型故障的定量描述模型。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明提出一種基于貝葉斯網(wǎng)絡(luò)的智能系統(tǒng)開(kāi)發(fā)建模失效機(jī)理分析方法,建立樣本缺陷因素影響模型故障的定量描述模型,確定影響智能模型的樣本數(shù)據(jù)缺陷的關(guān)鍵因素。具體包含以下步驟:
2、步驟1:采集并獲取與任務(wù)相關(guān)的原始數(shù)據(jù)集y,并確定關(guān)注的n種樣本缺陷因素,分別對(duì)n種缺陷因素進(jìn)行離散化,包括以下步驟:
3、步驟1.1:選取等距、二值化和k-means中的一種離散化方法對(duì)原始數(shù)據(jù)進(jìn)行離散化處理;
4、步驟1.2:利用離散化后的數(shù)據(jù)建立貝葉斯網(wǎng)絡(luò)模型;
5、步驟1.3:利用貝葉斯網(wǎng)絡(luò)模型進(jìn)行推理,分析系統(tǒng)內(nèi)部各變量的因果關(guān)系;
6、步驟1.4:判斷是否滿足預(yù)先設(shè)定的推理精度,如果滿足,則返回步驟1.1,離散化狀態(tài)值增加1;如果不滿足,則輸出最大離散化狀態(tài)數(shù)。
7、步驟2:確定模型的評(píng)價(jià)指標(biāo),建立樣本缺陷與評(píng)價(jià)指標(biāo)之間的貝葉斯網(wǎng)絡(luò),將樣本缺陷表示成貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)和參數(shù)約束,包括規(guī)范性約束、區(qū)間約束、分布內(nèi)約束、分布間約束,具體如下:
8、規(guī)范性約束表示父節(jié)點(diǎn)概率取值相同時(shí)的所有參數(shù)之和為1,如式(1)所示:
9、
10、θjk表示網(wǎng)絡(luò)第j個(gè)父節(jié)點(diǎn)的第k個(gè)子節(jié)點(diǎn)概率取值。
11、區(qū)間約束表示參數(shù)屬于給定的區(qū)間,如式(2)所示:
12、0≤αjk≤θjk≤βjk≤1?(2)
13、αjk和βjk表示子節(jié)點(diǎn)θjk的概率取值上下界。
14、分布內(nèi)約束表示父節(jié)點(diǎn)相同時(shí),同一分布內(nèi)參數(shù)之間的大小關(guān)系,如式(3)所示:
15、
16、θjk和θjk'分別表示同一父節(jié)點(diǎn)下不同的兩個(gè)子節(jié)點(diǎn)的概率取值。
17、分布間約束表示子節(jié)點(diǎn)概率取值相同時(shí),不同分布之間參數(shù)的大小關(guān)系,如式(4)所示:
18、
19、νj'k和νjk表示子節(jié)點(diǎn)取值相同的兩個(gè)不同父節(jié)點(diǎn)概率取值。
20、步驟3:根據(jù)貝葉斯網(wǎng)絡(luò)對(duì)缺陷進(jìn)行敏感性分析,具體步驟如下:
21、步驟3.1:定義各缺陷與評(píng)價(jià)指標(biāo)的響應(yīng)函數(shù)f(x)=g(x),x=x1,x2,...,xn,定義響應(yīng)函數(shù)對(duì)缺陷因素xi的偏導(dǎo)數(shù)為響應(yīng)函數(shù)對(duì)缺陷因素xi的靈敏度si,如式(5)所示。
22、
23、當(dāng)si>0時(shí),f(x)隨xi的增大而增大;si<0時(shí),f(x)隨xi的增大而減??;si=0時(shí),f(x)不隨xi的變化而變化。si絕對(duì)值的大小反映了f(x)隨xi變化的快慢程度,即函數(shù)f(x)對(duì)缺陷因素xi的靈敏度,進(jìn)而基于貝葉斯網(wǎng)絡(luò)的條件概率變化程度可以求得各缺陷因素xi取值變化對(duì)響應(yīng)函數(shù)f(x)變化的貢獻(xiàn)度。
24、步驟3.2:確定各缺陷因素的變化范圍,根據(jù)確定的離散化狀態(tài)數(shù),選取第i個(gè)缺陷因素構(gòu)建第j個(gè)樣本數(shù)據(jù)集yij。
25、步驟3.3:將構(gòu)建的數(shù)據(jù)集輸入到智能系統(tǒng)中直至其中的智能模型收斂,并利用同一測(cè)試集進(jìn)行測(cè)試得到數(shù)據(jù)集yij的評(píng)價(jià)指標(biāo)fij。
26、重復(fù)步驟3.2-3.3,直到所有的缺陷樣本數(shù)據(jù)集測(cè)試完畢。
27、步驟3.4:將所有結(jié)果輸入到貝葉斯網(wǎng)絡(luò)中,計(jì)算得到各缺陷因素的敏感性指標(biāo),確定各缺陷因素對(duì)模型評(píng)價(jià)指標(biāo)變化的貢獻(xiàn)度。
1.一種基于貝葉斯網(wǎng)絡(luò)的智能系統(tǒng)開(kāi)發(fā)建模失效機(jī)理分析方法,其特征在于包含以下步驟: