一種基于協(xié)同決策機(jī)制的試題難易度因子知識(shí)發(fā)現(xiàn)方法
【專利摘要】本發(fā)明涉及一種基于協(xié)同決策機(jī)制的試題難易度因子知識(shí)發(fā)現(xiàn)方法,屬于知識(shí)自動(dòng)化領(lǐng)域,其包括:提取教學(xué)相關(guān)數(shù)據(jù);對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,進(jìn)行課程達(dá)成度決策;用戶利用協(xié)同決策機(jī)制,根據(jù)第三方評(píng)分“改寫/通過(guò)”課程達(dá)成度決策服務(wù)提議的決策;通過(guò)機(jī)器學(xué)習(xí),獲取與課程達(dá)成度相關(guān)的試題難易度因子;將難易度因子形成的分析模型和專家知識(shí)封裝到同一知識(shí)庫(kù),供課程達(dá)成度決策服務(wù)調(diào)用;采用決策管理循環(huán)架構(gòu),利用試題難易因子重新循環(huán)對(duì)課程達(dá)成度進(jìn)行決策。本發(fā)明具有自主分析決策能力,能解決由于教學(xué)試卷難易度主觀性和不一致性,較為客觀地分析試卷難易度因子并提供課程達(dá)成度決策服務(wù)。
【專利說(shuō)明】
一種基于協(xié)同決策機(jī)制的試題難易度因子知識(shí)發(fā)現(xiàn)方法
技術(shù)領(lǐng)域
[0001] 本發(fā)明涉及知識(shí)自動(dòng)化領(lǐng)域,尤其設(shè)計(jì)一種基于協(xié)同決策機(jī)制的試題難易因子知 識(shí)發(fā)現(xiàn)方法?!颈尘凹夹g(shù)】 2015年3月,教育部推出國(guó)際實(shí)質(zhì)等效的《工程教育專業(yè)認(rèn)證標(biāo)準(zhǔn)》,其實(shí)際意義表現(xiàn) 在:密切工程教育與工業(yè)界的聯(lián)系,提高工程教育人才培養(yǎng)的產(chǎn)業(yè)適應(yīng)性;建立與注冊(cè)工程 師制度相銜接的工程教育專業(yè)認(rèn)證體系;促進(jìn)工程教育的國(guó)際交流,實(shí)現(xiàn)國(guó)際互認(rèn)。
[0002] 近年來(lái),教育教學(xué)過(guò)程中產(chǎn)生大量的數(shù)據(jù),不僅數(shù)量大,內(nèi)容豐富且較為完整,同 時(shí)具有相對(duì)統(tǒng)一的數(shù)據(jù)格式,十分適合利用數(shù)據(jù)挖掘展開專業(yè)認(rèn)證工作。數(shù)據(jù)挖掘不斷發(fā) 展,為從教育活動(dòng)獲取的數(shù)據(jù)中分析提出有價(jià)值的知識(shí)提供了有效的理論和工具支持。運(yùn) 用數(shù)據(jù)挖掘技術(shù)進(jìn)行教學(xué)行為綜合分析,能夠進(jìn)行高效、客觀、精確的業(yè)務(wù)數(shù)據(jù)處理,較于 傳統(tǒng)常規(guī)統(tǒng)計(jì)方法更為公正且靈活實(shí)用。
[0003] 專業(yè)認(rèn)證需要構(gòu)建畢業(yè)能力指標(biāo)點(diǎn)與課程的多對(duì)多映射,需要由多門課程和其他 教學(xué)活動(dòng)協(xié)同體現(xiàn)工程性和復(fù)雜性。指標(biāo)體系中各因素的相互影響、相互制約、相互驅(qū)動(dòng)的 定性和定量關(guān)系,建立知識(shí)模型,形成專業(yè)認(rèn)證知識(shí)體系模型。試題難易度存在主觀性,在 衡量課程達(dá)成度時(shí)需要綜合考慮試題難易度因子。
[0004] 因此,綜合分析第三方評(píng)價(jià),獲取試題難易度因子,協(xié)同解決課程達(dá)成度評(píng)價(jià)成為 亟待解決的問(wèn)題。
【發(fā)明內(nèi)容】
[0005] 鑒于此,本發(fā)明實(shí)施例提供了一種基于協(xié)同決策機(jī)制的試題難易因子知識(shí)發(fā)現(xiàn)方 法,解決現(xiàn)有考試難易度因子客觀計(jì)算的問(wèn)題,保證評(píng)價(jià)結(jié)論的客觀性、可信性。一種基于 協(xié)同決策機(jī)制的試題難易因子知識(shí)發(fā)現(xiàn)方法,屬于知識(shí)自動(dòng)化領(lǐng)域,具體包括如下步驟: 步驟S1提取相關(guān)教學(xué)數(shù)據(jù); 步驟S2對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,進(jìn)行課程達(dá)成度決策; 步驟S3用戶利用協(xié)同決策機(jī)制,根據(jù)第三方評(píng)分"改寫/通過(guò)"課程達(dá)成度決策服務(wù)提 議的決策; 步驟S4通過(guò)機(jī)器學(xué)習(xí),獲取與課程達(dá)成度相關(guān)的試題難易度因子; 步驟S5將難易度因子形成的分析模型和專家知識(shí)封裝到同一知識(shí)庫(kù),供課程達(dá)成度決 策服務(wù)調(diào)用; 步驟S6采用決策管理循環(huán)架構(gòu),利用試題難易因子重新循環(huán)對(duì)課程達(dá)成度進(jìn)行決策。
[0006] 所述步驟S1教學(xué)行為相關(guān)數(shù)據(jù)進(jìn)一步包括:試題成績(jī)、達(dá)成度評(píng)價(jià)方案、課程群支 撐度評(píng)分和問(wèn)卷調(diào)查評(píng)分。
[0007] 所述步驟S2對(duì)所述數(shù)據(jù)需進(jìn)行預(yù)處理進(jìn)一步包括:去除缺陷、冗余數(shù)據(jù),統(tǒng)一轉(zhuǎn)換 數(shù)據(jù)的名稱和定義,估計(jì)遺失數(shù)據(jù)的缺省值;利用處理之后的數(shù)據(jù),輸入與指標(biāo)點(diǎn)達(dá)成度相 關(guān)的每一門課程考試相關(guān)考試以及指標(biāo)點(diǎn)信息,具體為每一門考試抽取樣本的考試平均成 績(jī),進(jìn)行課程達(dá)成度決策。
[0008] 所述步驟S3進(jìn)一步包括:所述第三方評(píng)分包括:課程群支撐度評(píng)分和問(wèn)卷調(diào)查評(píng) 分;用戶根據(jù)課程群支撐度評(píng)分和問(wèn)卷調(diào)查評(píng)分的輸出,協(xié)同課程達(dá)成度決策,改寫或通過(guò) 課程指標(biāo)達(dá)成度決策服務(wù)提議的決策。
[0009] 根據(jù)權(quán)利要求4所述的基于協(xié)同決策機(jī)制的試題難易度因子知識(shí)發(fā)現(xiàn)方法,其特 征在于,所述步驟S4進(jìn)一步包括:難易度等級(jí)按照正太概率分布思想劃分,不同難易度等級(jí) 的值分別為:_2〇,-〇,〇,0,〇,2〇,分別取各塊所占面積的近似值,分別以百分制為例,系統(tǒng)為 這5個(gè)等級(jí)分配一組不同的估計(jì)系數(shù),其系數(shù)估計(jì)公式為:
其中,Yn表示第n等級(jí)的估計(jì)系數(shù),Xk表示第k等級(jí)在概率分布圖中所占的比重。
[0010]所述步驟S4機(jī)器學(xué)習(xí)進(jìn)一步包括:基于結(jié)合教育專業(yè)認(rèn)證指標(biāo),著眼于大量的歷 史數(shù)據(jù),對(duì)比分析輸入數(shù)據(jù)與其最終輸出結(jié)果之間的關(guān)系,獲取新的能夠通過(guò)用戶的試題 難易度因子,找出可最優(yōu)預(yù)測(cè)輸出結(jié)果的修正難易度等級(jí),將其表示于一個(gè)難易度調(diào)整決 策樹中,建立隨機(jī)森林模型的步驟具體包括: 讀入訓(xùn)練數(shù)據(jù)集作為初始訓(xùn)練集; 基于所述初始集采用預(yù)設(shè)bootstrap隨機(jī)抽樣方法獲取新的訓(xùn)練集來(lái)作為隨機(jī)森林的 訓(xùn)練集; 建立隨機(jī)森林訓(xùn)練集的決策樹模型; 利用遍歷法逐個(gè)訪問(wèn)所述決策樹模型中決策樹的分裂節(jié)點(diǎn); 刪除小于預(yù)設(shè)閾值的決策樹,統(tǒng)計(jì)各個(gè)節(jié)點(diǎn)所包含的樣本數(shù)量,利用多數(shù)投票機(jī)制作 確定最優(yōu)的決策樹子集作為最終難易度因子。
[0011] 所述步驟S5進(jìn)一步包括:專家知識(shí)可根據(jù)專家的需求可做出具體調(diào)整,決策針對(duì) 案例所用的預(yù)測(cè)分析模型判定的數(shù)據(jù)項(xiàng)必須是建模時(shí)所用的相同數(shù)據(jù); 將所述難易度因子表示在一個(gè)決策樹中與專家知識(shí)封裝在知識(shí)庫(kù)中,可被課程達(dá)成度 決策服務(wù)調(diào)用。
[0012] 所述步驟S6進(jìn)一步包括:所有業(yè)務(wù)知識(shí)必須都是經(jīng)過(guò)使用真實(shí)數(shù)據(jù)的決策進(jìn)行測(cè) 試,保證其有效性;基于最終難易度因子的課程達(dá)成度決策服務(wù)產(chǎn)生的數(shù)據(jù),存入歷史數(shù)據(jù) 庫(kù)中,作為下次機(jī)器學(xué)習(xí)的樣本庫(kù)。
[0013] 本發(fā)明從知識(shí)自動(dòng)化的視角出發(fā)提出了一種協(xié)同決策試題難易度因子知識(shí)發(fā)現(xiàn) 方法。本發(fā)明通過(guò)分析指標(biāo)體系中各因素的相互影響、相互制約、相互驅(qū)動(dòng)的定性和定量關(guān) 系,在此基礎(chǔ)上,形成機(jī)器表達(dá)機(jī)制,獲取考試難易度因子。從現(xiàn)有人工經(jīng)驗(yàn)和專業(yè)認(rèn)證數(shù) 據(jù)中獲取知識(shí),探索專業(yè)認(rèn)證各類知識(shí)適用的知識(shí)表示方法。該方法通過(guò)知識(shí)與數(shù)據(jù)挖掘 的繼承和人類智慧與數(shù)據(jù)之間的無(wú)縫連接,可實(shí)現(xiàn)獨(dú)立、自動(dòng)、高效專業(yè)認(rèn)證知識(shí)自動(dòng)化。 人機(jī)交互方式嵌入人工評(píng)價(jià)過(guò)程,服務(wù)于專業(yè)認(rèn)證課程達(dá)成度評(píng)價(jià),保證評(píng)價(jià)結(jié)論的客觀 性,可信性。
【附圖說(shuō)明】
[0014] 圖1為基于協(xié)同決策機(jī)制的試題難易度因子知識(shí)發(fā)現(xiàn)方法流程圖; 圖2為考試難易度評(píng)價(jià)協(xié)同決策機(jī)制系統(tǒng)框圖; 圖3為獲取試題難易度因子決策樹模型流程圖; 圖4為決策服務(wù)循環(huán)架構(gòu)圖。
【具體實(shí)施方式】
[0015] 為使本發(fā)明的技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面結(jié)合實(shí)施方式并參照附圖,對(duì)發(fā)明 技術(shù)方案進(jìn)行清楚描述。應(yīng)該指出的是下面說(shuō)明僅僅是示例性的,而不是為了限制本發(fā)明 的范圍以及其應(yīng)用。此外,在一下說(shuō)明中,省略了對(duì)公知知識(shí)和技術(shù)的描述,以避免不必要 地混淆本發(fā)明的概念。 實(shí)施例
[0016] 圖1示出了本發(fā)明的流程圖,基于協(xié)同決策機(jī)制的試題難易度因子知識(shí)發(fā)現(xiàn)方法, 具體實(shí)施步驟如下: 步驟S1提取相關(guān)教學(xué)數(shù)據(jù),形成數(shù)據(jù)集合。
[0017] 本實(shí)施例中所述課程為大學(xué)物理,相關(guān)數(shù)據(jù)包括:試題考試成績(jī)、達(dá)成度評(píng)價(jià)方 案、課程群支撐度評(píng)分和問(wèn)卷調(diào)查評(píng)分。
[0018] 步驟S2對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,進(jìn)行課程達(dá)成度決策;去除缺陷、冗余數(shù)據(jù),統(tǒng)一轉(zhuǎn)換 數(shù)據(jù)的名稱和定義,估計(jì)遺失數(shù)據(jù)的缺省值;利用處理之后的數(shù)據(jù),輸入與指標(biāo)點(diǎn)達(dá)成度相 關(guān)的每一門課程考試相關(guān)考試以及指標(biāo)點(diǎn)信息,具體為大學(xué)物理考試抽取樣本獲取考試平 均成績(jī),進(jìn)行課程達(dá)成度決策。
[0019] 本實(shí)施例中,預(yù)設(shè)達(dá)成度閾值取經(jīng)驗(yàn)值為0.7,采取隨機(jī)抽樣獲取30分試題樣本, 進(jìn)行課程達(dá)成度計(jì)算,對(duì)應(yīng)計(jì)算出課程達(dá)成度為〇. 75。
[0020] 圖2是考試難易度評(píng)價(jià)協(xié)同決策機(jī)制系統(tǒng)框圖。
[0021] 步驟S3用戶利用協(xié)同決策機(jī)制,根據(jù)第三方評(píng)分"改寫/通過(guò)"課程達(dá)成度決策服 務(wù)提議的決策;本實(shí)施例中第三方評(píng)分包括:課程群支撐度評(píng)分和問(wèn)卷調(diào)查評(píng)分;用戶根據(jù) 課程群支撐度評(píng)分和問(wèn)卷調(diào)查評(píng)分的輸出,協(xié)同課程達(dá)成度決策,改寫或通過(guò)課程指標(biāo)達(dá) 成度決策服務(wù)提議的決策。
[0022]本實(shí)施例中預(yù)設(shè)課程群支撐度為0.65,問(wèn)卷調(diào)查評(píng)分為0.67,用戶結(jié)合第三方評(píng) 分輸出,協(xié)同課程達(dá)成度決策,改寫課程指標(biāo)度成為不通過(guò)。
[0023]步驟S4通過(guò)機(jī)器學(xué)習(xí),獲取與課程達(dá)成度相關(guān)的試題難易度因子;難易度等級(jí)按 照正太概率分布思想劃分,不同難易度等級(jí)的值分別為:-2〇,-〇,〇,0, 〇,2〇,分別取各塊所 占面積的近似值,分別以百分制為例,系統(tǒng)為這5個(gè)等級(jí)分配一組不同的估計(jì)系數(shù),其系數(shù) 估計(jì)公式為:
其中,Yn表示第n等級(jí)的估計(jì)系數(shù),Xk表示第k等級(jí)在概率分布圖中所占的比重,本實(shí)施 例中,從左到右5個(gè)等級(jí)的估計(jì)系數(shù)分別為0.9875,0.917,0.51,0.0925,0.0125。
[0024]基于結(jié)合教育專業(yè)認(rèn)證指標(biāo),著眼于大量的歷史數(shù)據(jù),對(duì)比分析輸入數(shù)據(jù)與其最 終輸出結(jié)果之間的關(guān)系,獲取新的能夠通過(guò)用戶的試題難易度因子,找出可最優(yōu)預(yù)測(cè)輸出 結(jié)果的修正難易度等級(jí),將其表示于一個(gè)難易度調(diào)整決策樹中。
[0025] 圖3為本發(fā)明實(shí)施例提供的獲取試題難易度因子決策樹模型流程圖。參照?qǐng)D2所 不。
[0026] 本實(shí)施例中,建立隨機(jī)森林模型的步驟具體包括: 步驟S101讀入訓(xùn)練數(shù)據(jù)集作為初始訓(xùn)練集; 步驟S103基于所述初始集采用預(yù)設(shè)bootstrap隨機(jī)抽樣方法獲取新的訓(xùn)練集來(lái)作為隨 機(jī)森林的訓(xùn)練集;假設(shè)樣本數(shù)據(jù)預(yù)處理之后為S,隨機(jī)有放回地抽取k次,每次抽取樣本S的 三分之二,抽樣樣本集合為(s:
[0027]步驟S103建立隨機(jī)森林訓(xùn)練集的決策樹模型; 每一份抽樣樣本訓(xùn)練生成一個(gè)決策樹模型,一共生成k個(gè)決策樹模型。
[0028]步驟S104利用遍歷法逐個(gè)訪問(wèn)所述決策樹模型中決策樹的分裂節(jié)點(diǎn); 步驟S105刪除小于預(yù)設(shè)閾值的決策樹,統(tǒng)計(jì)各個(gè)節(jié)點(diǎn)所包含的樣本數(shù)量。
[0029]每一個(gè)樣本數(shù)據(jù)通過(guò)隨機(jī)森林的分類結(jié)果,即多個(gè)決策樹的投票結(jié)果RF為: 其中,n為決策樹模型數(shù)量,基于每個(gè)決策樹模型的投票權(quán)重,相應(yīng)輸出為yi。利用多 數(shù)投票機(jī)制作確定最優(yōu)的決策樹子集作為最終難易度因子為〇。
[0030] 步驟S5將難易度因子形成的分析模型和專家知識(shí)封裝到同一知識(shí)庫(kù),供課程達(dá)成 度決策服務(wù)調(diào)用;專家知識(shí)可根據(jù)專家的需求可做出具體調(diào)整,決策針對(duì)案例所用的預(yù)測(cè) 分析模型判定的數(shù)據(jù)項(xiàng)必須是建模時(shí)所用的相同數(shù)據(jù); 將所述難易度因子表示在一個(gè)決策樹中與專家知識(shí)封裝在知識(shí)庫(kù)中,可被課程達(dá)成度 決策服務(wù)調(diào)用。
[0031] 步驟S6采用決策管理循環(huán)架構(gòu),利用試題難易因子重新循環(huán)對(duì)課程達(dá)成度進(jìn)行決 策。
[0032]圖4是決策管理循環(huán)架構(gòu),經(jīng)過(guò)計(jì)算,大學(xué)物理課程達(dá)成度為0.73, 所有業(yè)務(wù)知識(shí)必須都是經(jīng)過(guò)使用真實(shí)數(shù)據(jù)的決策進(jìn)行測(cè)試,保證其有效性;基于最終 難易度因子的課程達(dá)成度決策服務(wù)產(chǎn)生的數(shù)據(jù),存入歷史數(shù)據(jù)庫(kù)中,作為下次機(jī)器學(xué)習(xí)的 樣本庫(kù)。
[0033]綜上,本發(fā)明從知識(shí)自動(dòng)化的視角出發(fā)提出了一種協(xié)同決策試題難易度因子知識(shí) 發(fā)現(xiàn)方法。本發(fā)明通過(guò)分析指標(biāo)體系中各因素的相互影響、相互制約、相互驅(qū)動(dòng)的定性和定 量關(guān)系,在此基礎(chǔ)上,形成機(jī)器表達(dá)機(jī)制,獲取考試難易度因子。從現(xiàn)有人工經(jīng)驗(yàn)和專業(yè)認(rèn) 證數(shù)據(jù)中獲取知識(shí),探索專業(yè)認(rèn)證各類知識(shí)適用的知識(shí)表示方法。該方法通過(guò)知識(shí)與數(shù)據(jù) 挖掘的繼承和人類智慧與數(shù)據(jù)之間的無(wú)縫連接,可實(shí)現(xiàn)獨(dú)立、自動(dòng)、高效專業(yè)認(rèn)證知識(shí)自動(dòng) 化。人機(jī)交互方式嵌入人工評(píng)價(jià)過(guò)程,服務(wù)于專業(yè)認(rèn)證課程達(dá)成度評(píng)價(jià),保證評(píng)價(jià)結(jié)論的客 觀性,可信性。
【主權(quán)項(xiàng)】
1. 一種基于協(xié)同決策機(jī)制的試題難易因子知識(shí)發(fā)現(xiàn)方法,屬于知識(shí)自動(dòng)化領(lǐng)域,具體 包括如下步驟: 步驟Sl提取相關(guān)教學(xué)數(shù)據(jù); 步驟S2對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,進(jìn)行課程達(dá)成度決策; 步驟S3用戶利用協(xié)同決策機(jī)制,根據(jù)第三方評(píng)分"改寫/通過(guò)"課程達(dá)成度決策服務(wù)提 議的決策; 步驟S4通過(guò)機(jī)器學(xué)習(xí),獲取與課程達(dá)成度相關(guān)的試題難易度因子; 步驟S5將難易度因子形成的分析模型和專家知識(shí)封裝到同一知識(shí)庫(kù),供課程達(dá)成度決 策服務(wù)調(diào)用; 步驟S6采用決策管理循環(huán)架構(gòu),利用試題難易因子重新循環(huán)對(duì)課程達(dá)成度進(jìn)行決策。2. 根據(jù)權(quán)利要求1所述的基于協(xié)同決策機(jī)制的試題難易度因子知識(shí)發(fā)現(xiàn)方法,提取教 學(xué)相關(guān)數(shù)據(jù),其特征在于,所述步驟Sl教學(xué)行為相關(guān)數(shù)據(jù)進(jìn)一步包括:試題成績(jī)、達(dá)成度評(píng) 價(jià)方案、課程群支撐度評(píng)分和問(wèn)卷調(diào)查評(píng)分。3. 根據(jù)權(quán)利要求2所述的基于協(xié)同決策機(jī)制的試題難易度因子知識(shí)發(fā)現(xiàn)方法,其特征 在于,所述步驟S2對(duì)所述數(shù)據(jù)需進(jìn)行預(yù)處理進(jìn)一步包括:去除缺陷、冗余數(shù)據(jù),統(tǒng)一轉(zhuǎn)換數(shù) 據(jù)的名稱和定義,估計(jì)遺失數(shù)據(jù)的缺省值;利用處理之后的數(shù)據(jù),輸入與指標(biāo)點(diǎn)達(dá)成度相關(guān) 的每一門課程考試相關(guān)考試以及指標(biāo)點(diǎn)信息,具體為每一門考試抽取樣本的考試平均成 績(jī),進(jìn)行課程達(dá)成度決策。4. 根據(jù)權(quán)利要求3所述的基于協(xié)同決策機(jī)制的試題難易度因子知識(shí)發(fā)現(xiàn)方法,其特征 在于,所述步驟S3進(jìn)一步包括:所述第三方評(píng)分包括:課程群支撐度評(píng)分和問(wèn)卷調(diào)查評(píng)分; 用戶根據(jù)課程群支撐度評(píng)分和問(wèn)卷調(diào)查評(píng)分的輸出,協(xié)同課程達(dá)成度決策,改寫或通過(guò)課 程指標(biāo)達(dá)成度決策服務(wù)提議的決策。5. 根據(jù)權(quán)利要求4所述的基于協(xié)同決策機(jī)制的試題難易度因子知識(shí)發(fā)現(xiàn)方法,其特征 在于,所述步驟S4進(jìn)一步包括:難易度等級(jí)按照正太概率分布思想劃分,不同難易度等級(jí)的 值分別為:_2〇,-σ,σ,〇,σ,2〇,分別取各塊所占面積的近似值,分別以百分制為例,系統(tǒng)為這 5個(gè)等級(jí)分配一組不同的估計(jì)系數(shù),其系數(shù)估計(jì)公式為:其中,Yn表示第η等級(jí)的估計(jì)系數(shù),Xk表示第k等級(jí)在概率分布圖中所占的比重。6. 根據(jù)權(quán)利要求4所述的基于協(xié)同決策機(jī)制的試題難易度因子知識(shí)發(fā)現(xiàn)方法,其特征 在于,所述步驟S4機(jī)器學(xué)習(xí)進(jìn)一步包括:基于結(jié)合教育專業(yè)認(rèn)證指標(biāo),著眼于大量的歷史數(shù) 據(jù),對(duì)比分析輸入數(shù)據(jù)與其最終輸出結(jié)果之間的關(guān)系,獲取新的能夠通過(guò)用戶的試題難易 度因子,找出可最優(yōu)預(yù)測(cè)輸出結(jié)果的修正難易度等級(jí),將其表示于一個(gè)難易度調(diào)整決策樹 中,建立隨機(jī)森林模型的步驟具體包括: 讀入訓(xùn)練數(shù)據(jù)集作為初始訓(xùn)練集; 基于所述初始集采用預(yù)設(shè)bootstrap隨機(jī)抽樣方法獲取新的訓(xùn)練集來(lái)作為隨機(jī)森林的 訓(xùn)練集; 建立隨機(jī)森林訓(xùn)練集的決策樹模型; 利用遍歷法逐個(gè)訪問(wèn)所述決策樹模型中決策樹的分裂節(jié)點(diǎn); 刪除小于預(yù)設(shè)閾值的決策樹,統(tǒng)計(jì)各個(gè)節(jié)點(diǎn)所包含的樣本數(shù)量,利用多數(shù)投票機(jī)制作 確定最優(yōu)的決策樹子集作為最終難易度因子。7. 根據(jù)權(quán)利要求6所述的基于協(xié)同決策機(jī)制的試題難易度因子知識(shí)發(fā)現(xiàn)方法,其特征 在于,所述步驟S5進(jìn)一步包括:專家知識(shí)可根據(jù)專家的需求可做出具體調(diào)整,決策針對(duì)案例 所用的預(yù)測(cè)分析模型判定的數(shù)據(jù)項(xiàng)必須是建模時(shí)所用的相同數(shù)據(jù); 將所述難易度因子表示在一個(gè)決策樹中與專家知識(shí)封裝在知識(shí)庫(kù)中,可被課程達(dá)成度 決策服務(wù)調(diào)用。8. 根據(jù)權(quán)利要求6所述的基于協(xié)同決策機(jī)制的試題難易度因子知識(shí)發(fā)現(xiàn)方法,其特征 在于,所述步驟S6進(jìn)一步包括:所有業(yè)務(wù)知識(shí)必須都是經(jīng)過(guò)使用真實(shí)數(shù)據(jù)的決策進(jìn)行測(cè)試, 保證其有效性;基于最終難易度因子的課程達(dá)成度決策服務(wù)產(chǎn)生的數(shù)據(jù),存入歷史數(shù)據(jù)庫(kù) 中,作為下次機(jī)器學(xué)習(xí)的樣本庫(kù)。
【文檔編號(hào)】G06N5/02GK105894091SQ201610194029
【公開日】2016年8月24日
【申請(qǐng)日】2016年3月31日
【發(fā)明人】段斌, 馮玉潔, 章兢
【申請(qǐng)人】湘潭大學(xué)