国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種電費(fèi)回收預(yù)測(cè)模型的構(gòu)建方法與流程

      文檔序號(hào):11143617閱讀:453來源:國(guó)知局
      本發(fā)明涉及電力系統(tǒng)
      技術(shù)領(lǐng)域
      :,特別是指一種電費(fèi)回收預(yù)測(cè)模型的構(gòu)建方法。
      背景技術(shù)
      ::供電公司電費(fèi)回收管理工作是保證供電公司電費(fèi)正?;厥铡?shí)現(xiàn)公司可持續(xù)發(fā)展的一項(xiàng)重要任務(wù)。隨著電力客戶用電量快速增加和外部壞境的不斷變化,供電公司面臨的電費(fèi)回收風(fēng)險(xiǎn)和不確定性也在逐年加大。對(duì)準(zhǔn)確預(yù)測(cè)用戶電費(fèi)回收不及時(shí)信息的研究依舊停留在片面預(yù)測(cè)、僅能預(yù)測(cè)用戶是否欠費(fèi)。技術(shù)實(shí)現(xiàn)要素:本發(fā)明要解決的技術(shù)問題是提供一種電費(fèi)回收預(yù)測(cè)模型的構(gòu)建方法,以解決現(xiàn)有技術(shù)所存在的僅能預(yù)測(cè)用戶是否欠費(fèi)的問題。為解決上述技術(shù)問題,本發(fā)明實(shí)施例提供一種電費(fèi)回收預(yù)測(cè)模型的構(gòu)建方法,包括:確定第一預(yù)測(cè)模型的指標(biāo)體系;根據(jù)確定的第一預(yù)測(cè)模型的指標(biāo)體系,獲取已欠費(fèi)用戶數(shù)據(jù)作為第一預(yù)測(cè)模型的訓(xùn)練測(cè)試集,其中,所述訓(xùn)練測(cè)試集包括:訓(xùn)練集和測(cè)試集;根據(jù)所述第一預(yù)測(cè)模型的訓(xùn)練集對(duì)第一預(yù)測(cè)模型進(jìn)行訓(xùn)練;根據(jù)訓(xùn)練后的第一預(yù)測(cè)模型預(yù)測(cè)已欠費(fèi)用戶的下次欠費(fèi)時(shí)間。進(jìn)一步地,所述第一預(yù)測(cè)模型的指標(biāo)體系包括:上級(jí)單位、供電單位、行業(yè)類別、用電類別、電壓等級(jí)、負(fù)荷重要等級(jí)、合同容量、運(yùn)行容量、檢查周期、停電標(biāo)志、立戶時(shí)長(zhǎng)、送電時(shí)長(zhǎng)、計(jì)量點(diǎn)個(gè)數(shù)、受電點(diǎn)個(gè)數(shù)、電源點(diǎn)個(gè)數(shù)、是否三方協(xié)議、停電次數(shù)、年用電量、年變損電量、年無功用電率、年線損率、年欠費(fèi)總次數(shù)、年均欠費(fèi)用電間隔、年最小欠費(fèi)用電間隔、最近一次欠費(fèi)用電距今間隔、年欠費(fèi)用電占比、月均欠費(fèi)電費(fèi)、2.5年欠費(fèi)總次數(shù)中的一種或多種。進(jìn)一步地,所述根據(jù)所述第一預(yù)測(cè)模型的訓(xùn)練集對(duì)第一預(yù)測(cè)模型進(jìn)行訓(xùn)練包括:根據(jù)所述第一預(yù)測(cè)模型的訓(xùn)練集,利用SVM算法對(duì)第一預(yù)測(cè)模型進(jìn)行訓(xùn)練。進(jìn)一步地,所述方法還包括:確定第二預(yù)測(cè)模型的指標(biāo)體系;根據(jù)確定的第二預(yù)測(cè)模型的指標(biāo)體系,獲取已欠費(fèi)用戶數(shù)據(jù)作為第二預(yù)測(cè)模型的訓(xùn)練測(cè)試集,其中,所述訓(xùn)練測(cè)試集包括:訓(xùn)練集和測(cè)試集;根據(jù)所述第二預(yù)測(cè)模型的訓(xùn)練集對(duì)第二預(yù)測(cè)模型進(jìn)行訓(xùn)練;根據(jù)訓(xùn)練后的第二預(yù)測(cè)模型預(yù)測(cè)已欠費(fèi)用戶的下次欠費(fèi)金額。進(jìn)一步地,所述第二預(yù)測(cè)模型的指標(biāo)體系包括:最近一年平均月欠費(fèi)用電電量、最近一年平均月欠費(fèi)用電次數(shù)、年均欠費(fèi)用電間隔、最近一年最小欠費(fèi)用電間隔、平均年欠費(fèi)用電間隔、最近一個(gè)欠費(fèi)用電距今間隔、欠費(fèi)用電占比、平均欠費(fèi)用電電費(fèi)、第一次欠費(fèi)用電距離開戶日期的時(shí)長(zhǎng)、第一次欠費(fèi)用電金額、最近一年欠費(fèi)用電電費(fèi)、最近三個(gè)月欠費(fèi)用電電費(fèi)、最近2年欠費(fèi)用電電費(fèi)、最近6個(gè)月欠費(fèi)用電電費(fèi)、年欠費(fèi)用電電費(fèi)增長(zhǎng)率、月欠費(fèi)用電電費(fèi)增長(zhǎng)率環(huán)比、季欠費(fèi)用電電費(fèi)增長(zhǎng)率、年最大欠費(fèi)用電電費(fèi)、年最小欠費(fèi)用電電費(fèi)、年最大欠費(fèi)用電電費(fèi)的月份、年最小欠費(fèi)用電電費(fèi)的月份、用戶分類、是否三方協(xié)議、是否分次劃撥、安全隱患間隔、月用電量、季用電量、年用電量、立戶時(shí)長(zhǎng)、送電時(shí)長(zhǎng)、合同容量、用電分類、高耗能行業(yè)類別、計(jì)量點(diǎn)數(shù)目、電源數(shù)目、月線損增長(zhǎng)率、年平均線損率、平均月無功利用率、當(dāng)前月有功利用率、當(dāng)前無功與有功占比率、當(dāng)月月峰/谷/平電比例、年峰/谷/平電比例、年預(yù)收電費(fèi)金額、停電次數(shù)、停電間隔、平均停電間隔、年停電頻度、今年上次欠費(fèi)電費(fèi)、今年上次欠費(fèi)電費(fèi)環(huán)比增長(zhǎng)率、本次欠費(fèi)電費(fèi)中的一種或多種。進(jìn)一步地,所述方法還包括:確定第三預(yù)測(cè)模型的指標(biāo)體系;根據(jù)確定的第三預(yù)測(cè)模型的指標(biāo)體系,獲取所有用戶數(shù)據(jù)作為第三預(yù)測(cè)模型的訓(xùn)練測(cè)試集,其中,所述訓(xùn)練測(cè)試集包括:訓(xùn)練集和測(cè)試集;根據(jù)所述第三預(yù)測(cè)模型的訓(xùn)練集對(duì)第三預(yù)測(cè)模型進(jìn)行訓(xùn)練;根據(jù)訓(xùn)練后的第三預(yù)測(cè)模型預(yù)測(cè)用戶下月是否欠費(fèi)。進(jìn)一步地,所述第三預(yù)測(cè)模型的指標(biāo)體系包括:行業(yè)類別、所在地區(qū)、用戶分類、是否三方協(xié)議、是否分次劃撥、安全隱患次數(shù)、年用電量、立戶時(shí)長(zhǎng)、送電時(shí)長(zhǎng)、合同容量、用電分類、高耗能行業(yè)類別、計(jì)量點(diǎn)數(shù)目、電源數(shù)目、月線損增長(zhǎng)率、年平均線損次數(shù)、平均月無功利用率、當(dāng)前月有功利用率、無功與有功占比率、月峰/谷/平電比例、年峰/谷/平電比例、年預(yù)收電費(fèi)金額、停電次數(shù)、停電間隔、平均停電間隔、年停電頻度、是否欠費(fèi)過中的一種或多種。進(jìn)一步地,生成訓(xùn)練測(cè)試集之前,所述方法還包括:對(duì)獲取的已欠費(fèi)用戶數(shù)據(jù)或所有用戶數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗、數(shù)據(jù)變換及數(shù)據(jù)歸一化處理。進(jìn)一步地,所述方法還包括:根據(jù)歸一化處理后的數(shù)據(jù),根據(jù)本次欠費(fèi)電費(fèi)/最近一次欠費(fèi)用電距今間隔/是否欠費(fèi)過分層取樣,生成第一預(yù)測(cè)模型、第二預(yù)測(cè)模型、第三預(yù)測(cè)模型的訓(xùn)練測(cè)試集。本發(fā)明的上述技術(shù)方案的有益效果如下:上述方案中,通過確定的第一預(yù)測(cè)模型的指標(biāo)體系,獲取已欠費(fèi)用戶數(shù)據(jù)作為第一預(yù)測(cè)模型的訓(xùn)練測(cè)試集,其中,所述訓(xùn)練測(cè)試集包括:訓(xùn)練集和測(cè)試集;根據(jù)所述第一預(yù)測(cè)模型的訓(xùn)練集對(duì)第一預(yù)測(cè)模型進(jìn)行訓(xùn)練;根據(jù)訓(xùn)練后的第一預(yù)測(cè)模型預(yù)測(cè)已欠費(fèi)用戶的下次欠費(fèi)時(shí)間,這樣,通過第一預(yù)測(cè)模型能夠預(yù)測(cè)已欠費(fèi)用戶的下次欠費(fèi)時(shí)間。附圖說明圖1為本發(fā)明實(shí)施例提供的電費(fèi)回收預(yù)測(cè)模型的構(gòu)建方法的流程示意圖;圖2為本發(fā)明實(shí)施例提供的電費(fèi)回收預(yù)測(cè)模型的構(gòu)建方法的原理示意圖;圖3為本發(fā)明實(shí)施例提供的用戶數(shù)據(jù)預(yù)處理的流程示意圖。具體實(shí)施方式為使本發(fā)明要解決的技術(shù)問題、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合附圖及具體實(shí)施例進(jìn)行詳細(xì)描述。本發(fā)明針對(duì)現(xiàn)有的僅能預(yù)測(cè)用戶是否欠費(fèi)的問題,提供一種電費(fèi)回收預(yù)測(cè)模型的構(gòu)建方法。參看圖1所示,本發(fā)明實(shí)施例提供的電費(fèi)回收預(yù)測(cè)模型的構(gòu)建方法,包括:S101,確定第一預(yù)測(cè)模型的指標(biāo)體系;S102,根據(jù)確定的第一預(yù)測(cè)模型的指標(biāo)體系,獲取已欠費(fèi)用戶數(shù)據(jù)作為第一預(yù)測(cè)模型的訓(xùn)練測(cè)試集,其中,所述訓(xùn)練測(cè)試集包括:訓(xùn)練集和測(cè)試集;S103,根據(jù)所述第一預(yù)測(cè)模型的訓(xùn)練集對(duì)第一預(yù)測(cè)模型進(jìn)行訓(xùn)練;S104,根據(jù)訓(xùn)練后的第一預(yù)測(cè)模型預(yù)測(cè)已欠費(fèi)用戶的下次欠費(fèi)時(shí)間。本發(fā)明實(shí)施例所述的電費(fèi)回收預(yù)測(cè)模型的構(gòu)建方法,通過確定的第一預(yù)測(cè)模型的指標(biāo)體系,獲取已欠費(fèi)用戶數(shù)據(jù)作為第一預(yù)測(cè)模型的訓(xùn)練測(cè)試集,其中,所述訓(xùn)練測(cè)試集包括:訓(xùn)練集和測(cè)試集;根據(jù)所述第一預(yù)測(cè)模型的訓(xùn)練集對(duì)第一預(yù)測(cè)模型進(jìn)行訓(xùn)練;根據(jù)訓(xùn)練后的第一預(yù)測(cè)模型預(yù)測(cè)已欠費(fèi)用戶的下次欠費(fèi)時(shí)間,這樣,通過第一預(yù)測(cè)模型能夠預(yù)測(cè)已欠費(fèi)用戶的下次欠費(fèi)時(shí)間。如圖2所示,本實(shí)施例中,根據(jù)用戶是否有欠費(fèi),可以將用戶分為已欠費(fèi)用戶和非欠費(fèi)用戶/未欠費(fèi)用戶這兩類,對(duì)已欠費(fèi)用戶,可以通過第一預(yù)測(cè)模型預(yù)測(cè)已欠費(fèi)用戶下次欠費(fèi)會(huì)在什么時(shí)候,圖2中的違約用戶指已欠費(fèi)用戶。本實(shí)施例中,為了得到第一預(yù)測(cè)模型,需先確定預(yù)測(cè)欠費(fèi)時(shí)間的直接有效指標(biāo)。由于,已經(jīng)欠費(fèi)的用戶是有極大可能會(huì)再次欠費(fèi)的,本實(shí)施例中,對(duì)已欠費(fèi)用戶,將預(yù)測(cè)用戶什么時(shí)候發(fā)生欠費(fèi)轉(zhuǎn)換為預(yù)測(cè)相鄰兩次欠費(fèi)的時(shí)間間隔。本實(shí)施例中,預(yù)測(cè)針對(duì)已經(jīng)有過欠費(fèi)的用戶設(shè)計(jì)指標(biāo),這樣就能利用其相鄰兩次欠費(fèi)(例如,第二次欠費(fèi)與第一次欠費(fèi))的時(shí)間間隔做一個(gè)驗(yàn)證。這里僅有一次欠費(fèi)記錄的用戶設(shè)置其違約間隔為30天。取全部欠費(fèi)過的用戶數(shù)據(jù),取涉及欠費(fèi)和基礎(chǔ)用電行為指標(biāo)的指標(biāo)作為第一預(yù)測(cè)模型的指標(biāo)體系,所述第一預(yù)測(cè)模型的指標(biāo)體系可以更精準(zhǔn)的找出用戶的用電欠費(fèi)行為特征,進(jìn)而更科學(xué)的預(yù)測(cè)欠費(fèi)的用戶再次欠費(fèi)的時(shí)間間隔,從而推斷出已欠費(fèi)用戶下次會(huì)在啥時(shí)候再次欠費(fèi)。本實(shí)施例中,所述第一預(yù)測(cè)模型的指標(biāo)體系包括:上級(jí)單位、供電單位、行業(yè)類別、用電類別、電壓等級(jí)、負(fù)荷重要等級(jí)、合同容量、運(yùn)行容量、檢查周期、停電標(biāo)志、立戶時(shí)長(zhǎng)、送電時(shí)長(zhǎng)、計(jì)量點(diǎn)個(gè)數(shù)、受電點(diǎn)個(gè)數(shù)、電源點(diǎn)個(gè)數(shù)、是否三方協(xié)議、停電次數(shù)、年用電量、年變損電量、年無功用電率、年線損率、年欠費(fèi)總次數(shù)、年均欠費(fèi)用電間隔、年最小欠費(fèi)用電間隔、最近一次欠費(fèi)用電距今間隔、年欠費(fèi)用電占比、月均欠費(fèi)電費(fèi)、2.5年欠費(fèi)總次數(shù)中的一種或多種。例如,若當(dāng)前時(shí)間為2016年7月,則第一預(yù)測(cè)模型的指標(biāo)體系如表1所示,以年用電量為例,年用電量的數(shù)據(jù)為3個(gè),分別為:2014年、2015年、2016年這3個(gè)相鄰年份的年用電量。表1第一預(yù)測(cè)模型的指標(biāo)體系本實(shí)施例中,遇到有些指標(biāo)時(shí)間周期不適用情況,以平均數(shù)補(bǔ)足。例如,年用電量這一指標(biāo),若用戶開戶不足一年,則將不足一年的部分用當(dāng)前開戶用電量/當(dāng)前開戶時(shí)長(zhǎng)代替。在前述電費(fèi)回收預(yù)測(cè)模型的構(gòu)建方法的具體實(shí)施方式中,進(jìn)一步地,所述根據(jù)所述第一預(yù)測(cè)模型的訓(xùn)練集對(duì)第一預(yù)測(cè)模型進(jìn)行訓(xùn)練包括:根據(jù)所述第一預(yù)測(cè)模型的訓(xùn)練集,利用SVM算法對(duì)第一預(yù)測(cè)模型進(jìn)行訓(xùn)練。本實(shí)施例中,根據(jù)所述第一預(yù)測(cè)模型的訓(xùn)練集,可以利用支持向量機(jī)(SupportVectorMachine,SVM)算法對(duì)第一預(yù)測(cè)模型進(jìn)行訓(xùn)練,得到訓(xùn)練后的第一預(yù)測(cè)模型,進(jìn)而根據(jù)訓(xùn)練后的訓(xùn)練后的第一預(yù)測(cè)模型預(yù)測(cè)第一預(yù)測(cè)模型的測(cè)試集中的已欠費(fèi)用戶或其他已欠費(fèi)用戶的下次欠費(fèi)時(shí)間。本實(shí)施例中,第一預(yù)測(cè)模型的測(cè)試集用于對(duì)訓(xùn)練后的第一預(yù)測(cè)模型進(jìn)行測(cè)試、檢測(cè)預(yù)測(cè)結(jié)果的準(zhǔn)確性。在前述電費(fèi)回收預(yù)測(cè)模型的構(gòu)建方法的具體實(shí)施方式中,進(jìn)一步地,所述方法還包括:確定第二預(yù)測(cè)模型的指標(biāo)體系;根據(jù)確定的第二預(yù)測(cè)模型的指標(biāo)體系,獲取已欠費(fèi)用戶數(shù)據(jù)作為第二預(yù)測(cè)模型的訓(xùn)練測(cè)試集,其中,所述訓(xùn)練測(cè)試集包括:訓(xùn)練集和測(cè)試集;根據(jù)所述第二預(yù)測(cè)模型的訓(xùn)練集對(duì)第二預(yù)測(cè)模型進(jìn)行訓(xùn)練;根據(jù)訓(xùn)練后的第二預(yù)測(cè)模型預(yù)測(cè)已欠費(fèi)用戶的下次欠費(fèi)金額。如圖2所示,本實(shí)施例中,對(duì)已欠費(fèi)用戶,可以通過第二預(yù)測(cè)模型預(yù)測(cè)已欠費(fèi)用戶下次可能會(huì)欠多少金額。本實(shí)施例中,用戶欠費(fèi)的金額在經(jīng)驗(yàn)方法中普遍認(rèn)為與歷史欠費(fèi)的金額是有很大關(guān)聯(lián)的。本實(shí)施例中,預(yù)測(cè)針對(duì)已經(jīng)欠費(fèi)的用戶設(shè)計(jì)指標(biāo),利用歷史數(shù)據(jù)及基礎(chǔ)的用電行為指標(biāo)作為第二預(yù)測(cè)模型的指標(biāo)體系。本實(shí)施例中,所述第二預(yù)測(cè)模型的指標(biāo)體系包括:最近一年平均月欠費(fèi)用電電量、最近一年平均月欠費(fèi)用電次數(shù)、年均欠費(fèi)用電間隔、最近一年最小欠費(fèi)用電間隔、平均年欠費(fèi)用電間隔、最近一個(gè)欠費(fèi)用電距今間隔、欠費(fèi)用電占比、平均欠費(fèi)用電電費(fèi)、第一次欠費(fèi)用電距離開戶日期的時(shí)長(zhǎng)、第一次欠費(fèi)用電金額、最近一年欠費(fèi)用電電費(fèi)、最近三個(gè)月欠費(fèi)用電電費(fèi)、最近2年欠費(fèi)用電電費(fèi)、最近6個(gè)月欠費(fèi)用電電費(fèi)、年欠費(fèi)用電電費(fèi)增長(zhǎng)率、月欠費(fèi)用電電費(fèi)增長(zhǎng)率環(huán)比、季欠費(fèi)用電電費(fèi)增長(zhǎng)率、年最大欠費(fèi)用電電費(fèi)、年最小欠費(fèi)用電電費(fèi)、年最大欠費(fèi)用電電費(fèi)的月份、年最小欠費(fèi)用電電費(fèi)的月份、用戶分類、是否三方協(xié)議、是否分次劃撥、安全隱患間隔、月用電量、季用電量、年用電量、立戶時(shí)長(zhǎng)、送電時(shí)長(zhǎng)、合同容量、用電分類、高耗能行業(yè)類別、計(jì)量點(diǎn)數(shù)目、電源數(shù)目、月線損增長(zhǎng)率、年平均線損率、平均月無功利用率、當(dāng)前月有功利用率、當(dāng)前無功與有功占比率、當(dāng)月月峰/谷/平電比例、年峰/谷/平電比例、年預(yù)收電費(fèi)金額、停電次數(shù)、停電間隔、平均停電間隔、年停電頻度、今年上次欠費(fèi)電費(fèi)、今年上次欠費(fèi)電費(fèi)環(huán)比增長(zhǎng)率、本次欠費(fèi)電費(fèi)中的一種或多種,所述第一預(yù)測(cè)模型的指標(biāo)體系如表2所示。表2第二預(yù)測(cè)模型的指標(biāo)體系本實(shí)施例中,確定第二預(yù)測(cè)模型的指標(biāo)體系后;根據(jù)確定的第二預(yù)測(cè)模型的指標(biāo)體系,獲取已欠費(fèi)用戶數(shù)據(jù)作為第二預(yù)測(cè)模型的訓(xùn)練測(cè)試集,其中,所述訓(xùn)練測(cè)試集包括:訓(xùn)練集和測(cè)試集;根據(jù)所述第二預(yù)測(cè)模型的訓(xùn)練集,可以利用SVM算法對(duì)第二預(yù)測(cè)模型進(jìn)行訓(xùn)練,得到第二預(yù)測(cè)模型,進(jìn)而根據(jù)訓(xùn)練后的第二預(yù)測(cè)模型預(yù)測(cè)第二預(yù)測(cè)模型的測(cè)試集中的已欠費(fèi)用戶或其他已欠費(fèi)用戶的下次欠費(fèi)金額。本實(shí)施例中,第二預(yù)測(cè)模型的測(cè)試集用于對(duì)訓(xùn)練后的第二預(yù)測(cè)模型進(jìn)行測(cè)試、檢測(cè)預(yù)測(cè)結(jié)果的準(zhǔn)確性。在前述電費(fèi)回收預(yù)測(cè)模型的構(gòu)建方法的具體實(shí)施方式中,進(jìn)一步地,所述方法還包括:確定第三預(yù)測(cè)模型的指標(biāo)體系;根據(jù)確定的第三預(yù)測(cè)模型的指標(biāo)體系,獲取所有用戶數(shù)據(jù)作為第三預(yù)測(cè)模型的訓(xùn)練測(cè)試集,其中,所述訓(xùn)練測(cè)試集包括:訓(xùn)練集和測(cè)試集;根據(jù)所述第三預(yù)測(cè)模型的訓(xùn)練集對(duì)第三預(yù)測(cè)模型進(jìn)行訓(xùn)練;根據(jù)訓(xùn)練后的第三預(yù)測(cè)模型預(yù)測(cè)用戶下月是否欠費(fèi)。如圖2所示,本實(shí)施例中,對(duì)所有用戶,可以通過第三預(yù)測(cè)模型預(yù)測(cè)用戶是否會(huì)欠費(fèi)。本實(shí)施例中,對(duì)所有用戶,預(yù)測(cè)用戶下個(gè)月欠費(fèi)的狀態(tài)??紤]到?jīng)]有欠費(fèi)的用戶不存在欠費(fèi)相關(guān)指標(biāo),為了找出相關(guān)特征模式,取全部用戶數(shù)據(jù),并取不涉及欠費(fèi)的指標(biāo)作為第三預(yù)測(cè)模型的指標(biāo)體系,所述第三預(yù)測(cè)模型的指標(biāo)體系可以更客觀的找出用戶的用電欠費(fèi)行為特征,進(jìn)而更科學(xué)的預(yù)測(cè)從未欠費(fèi)的用戶是否會(huì)有欠費(fèi)的可能。本實(shí)施例中,所述第三預(yù)測(cè)模型的指標(biāo)體系可以包括:行業(yè)類別、所在地區(qū)、用戶分類、是否三方協(xié)議、是否分次劃撥、安全隱患次數(shù)、年用電量、立戶時(shí)長(zhǎng)、送電時(shí)長(zhǎng)、合同容量、用電分類、高耗能行業(yè)類別、計(jì)量點(diǎn)數(shù)目、電源數(shù)目、月線損增長(zhǎng)率、年平均線損次數(shù)、平均月無功利用率、當(dāng)前月有功利用率、無功與有功占比率、月峰/谷/平電比例、年峰/谷/平電比例、年預(yù)收電費(fèi)金額、停電次數(shù)、停電間隔、平均停電間隔、年停電頻度、是否欠費(fèi)過中的一種或多種,如表3所示。表3第三預(yù)測(cè)模型的指標(biāo)體系本實(shí)施例中,確定第三預(yù)測(cè)模型的指標(biāo)體系后,可以根據(jù)確定的第三預(yù)測(cè)模型的指標(biāo)體系,獲取所有用戶數(shù)據(jù)作為第三預(yù)測(cè)模型的訓(xùn)練測(cè)試集,其中,所述訓(xùn)練測(cè)試集包括:訓(xùn)練集和測(cè)試集;根據(jù)所述第三預(yù)測(cè)模型的訓(xùn)練集,可以利用SVM算法對(duì)第三預(yù)測(cè)模型進(jìn)行訓(xùn)練,得到第三預(yù)測(cè)模型,進(jìn)而根據(jù)訓(xùn)練后的第三預(yù)測(cè)模型預(yù)測(cè)預(yù)測(cè)第三預(yù)測(cè)模型的測(cè)試集中的用戶或其他用戶下月是否欠費(fèi)。本實(shí)施例中,第三預(yù)測(cè)模型的測(cè)試集用于對(duì)訓(xùn)練后的第三預(yù)測(cè)模型進(jìn)行測(cè)試、檢測(cè)預(yù)測(cè)結(jié)果的準(zhǔn)確性。在前述電費(fèi)回收預(yù)測(cè)模型的構(gòu)建方法的具體實(shí)施方式中,進(jìn)一步地,生成訓(xùn)練測(cè)試集之前,所述方法還包括:對(duì)獲取的已欠費(fèi)用戶數(shù)據(jù)或所有用戶數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗、數(shù)據(jù)變換及數(shù)據(jù)歸一化處理。本實(shí)施例中,根據(jù)不同預(yù)測(cè)模型的指標(biāo)體系和用戶類型,可以從預(yù)先設(shè)定的營(yíng)銷系統(tǒng)中抽取相應(yīng)的用戶數(shù)據(jù)形成不同預(yù)測(cè)模型的訓(xùn)練測(cè)試集。本實(shí)施例中,從營(yíng)銷系統(tǒng)中抽取相應(yīng)的原始用戶數(shù)據(jù)后,還需對(duì)抽取的原始用戶數(shù)據(jù)進(jìn)行預(yù)處理和訓(xùn)練集、測(cè)試集的劃分工作。本實(shí)施例中,以獲取的原始用戶數(shù)據(jù)為基礎(chǔ),分析與目標(biāo)無關(guān)或預(yù)測(cè)模型需要處理的用戶數(shù)據(jù),針對(duì)此類用戶數(shù)據(jù)進(jìn)行預(yù)處理,所述預(yù)處理包括:數(shù)據(jù)清洗、數(shù)據(jù)變換及數(shù)據(jù)歸一化處理,如圖3所示。本實(shí)施例中,在數(shù)據(jù)分析過程中,發(fā)現(xiàn)與分析目標(biāo)無關(guān)的數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗,如圖3所示,所述數(shù)據(jù)清洗包括:清除重復(fù)數(shù)據(jù)、清除為空的數(shù)據(jù)、清除其他類型數(shù)據(jù)。本實(shí)施例中,如圖3所示,所述數(shù)據(jù)變換包括:字符型數(shù)據(jù)離散化、數(shù)據(jù)類型轉(zhuǎn)換、將NA數(shù)據(jù)轉(zhuǎn)換為0。例如,2014年3月份所有用戶的欠費(fèi)金額為0,屬于記錄為空數(shù)據(jù);平均年欠費(fèi)用電間隔(2.5年/總次數(shù)-1)中有很多NA值(因?yàn)橛械挠脩魶]有欠費(fèi)過),將NA值替換成0;又例如,將導(dǎo)入的用戶數(shù)據(jù)作數(shù)據(jù)類型轉(zhuǎn)換,轉(zhuǎn)換為num/int類型,轉(zhuǎn)換代碼如下:allData$上級(jí)單位<-as.numeric(as.factor(allData$上級(jí)單位))allData$行業(yè)類別<-as.numeric(as.factor(allData$行業(yè)類別))allData$供電單位<-as.numeric(as.factor(allData$供電單位))allData$用電類別<-as.numeric(as.factor(allData$用電類別))allData$高耗能用電行業(yè)類別<-as.numeric(as.factor(allData$高耗能用電行業(yè)類別))allData$是否三方協(xié)議<-as.numeric(as.factor(allData$是否三方協(xié)議))allData$電壓等級(jí)<-as.numeric(as.factor(allData$電壓等級(jí)))本實(shí)施例中,數(shù)據(jù)歸一化是指通過某種算法將數(shù)據(jù)限制在需要的范圍內(nèi)。首先歸一化是為了后面數(shù)據(jù)處理的方便,其次是保證程序運(yùn)行時(shí)收斂加快。歸一化的具體作用是歸納統(tǒng)一樣本的統(tǒng)計(jì)分布性。對(duì)數(shù)據(jù)做歸一化處理,能夠消除不同數(shù)據(jù)量級(jí)的影響。以R語言自帶的歸一化為例,其中,R語言自帶的歸一化為中心歸一,會(huì)將數(shù)據(jù)歸一成(-1:1)之間,allData1=as.data.frame(scale(allData))。為了消除負(fù)值造成的逆作用,可以使用最大最小值歸一法,其中,最大最小值歸一法的代碼如下:在前述電費(fèi)回收預(yù)測(cè)模型的構(gòu)建方法的具體實(shí)施方式中,進(jìn)一步地,所述方法還包括:根據(jù)歸一化處理后的數(shù)據(jù),根據(jù)本次欠費(fèi)電費(fèi)/最近一次欠費(fèi)用電距今間隔/是否欠費(fèi)過分層取樣,生成第一預(yù)測(cè)模型、第二預(yù)測(cè)模型、第三預(yù)測(cè)模型的訓(xùn)練測(cè)試集。本實(shí)施例中,對(duì)用戶數(shù)據(jù)進(jìn)行預(yù)處理后,得到三個(gè)數(shù)據(jù)集,每個(gè)預(yù)測(cè)模型對(duì)應(yīng)一個(gè)數(shù)據(jù)集,每個(gè)數(shù)據(jù)集作為一個(gè)訓(xùn)練測(cè)試集,每個(gè)訓(xùn)練測(cè)試集包括:訓(xùn)練集和測(cè)試集;將訓(xùn)練集和測(cè)試集的比例設(shè)為預(yù)定值,例如,0.10,且為根據(jù)本次欠費(fèi)電費(fèi)/最近一次欠費(fèi)用電距今間隔/是否欠費(fèi)過這三個(gè)指標(biāo)分層取樣,生成三種預(yù)測(cè)模型的訓(xùn)練測(cè)試集。本實(shí)施例中,為了更好地理解基于SVM算法的預(yù)測(cè)模型,以對(duì)已欠費(fèi)用戶,預(yù)測(cè)下次欠費(fèi)會(huì)在什么時(shí)候?yàn)槔?,即預(yù)測(cè)欠費(fèi)間隔為例子,詳細(xì)講解具體如何生成第一預(yù)測(cè)模型。S1,設(shè)置SVM參數(shù)S11,設(shè)置內(nèi)核函數(shù)設(shè)置SVM函數(shù)的內(nèi)核參數(shù)kernel="radial",其中,radial表示徑向基函數(shù),radial作為一個(gè)內(nèi)核函數(shù),可以通過設(shè)置內(nèi)核參數(shù)kernel作為“radial”來使用。當(dāng)使用一個(gè)帶有“radial”的內(nèi)核時(shí),結(jié)果中的超平面就不需要是一個(gè)線性的了。通常定義一個(gè)彎曲的區(qū)域來界定類別之間的分隔,這也往往導(dǎo)致相同的訓(xùn)練數(shù)據(jù),更高的準(zhǔn)確度。S12,類別輸出設(shè)置設(shè)置SVM函數(shù)的類別type="C-classification",這表示將結(jié)果作為一個(gè)類別來判斷而不是預(yù)測(cè)一個(gè)數(shù)值。S13,cost,gamma參數(shù)的選取經(jīng)過tune.svm()函數(shù),來尋找svm()函數(shù)的最優(yōu)參數(shù),其中,tune.svm()函數(shù)是用于svm算法的e1071包的一個(gè)自帶函數(shù),用于來尋找svm()函數(shù)的最優(yōu)參數(shù),經(jīng)過不同參數(shù)范圍的設(shè)定,可以得到不同的預(yù)測(cè)結(jié)果錯(cuò)誤率,進(jìn)而確定最優(yōu)參數(shù)。經(jīng)過篩選設(shè)置cost=10000,gamma=1e-5,其中,gamma是選擇徑向基函數(shù)radial作為kernel后,徑向基函數(shù)radial自帶的一個(gè)參數(shù),gamma隱含地決定了數(shù)據(jù)映射到新的特征空間后的分布。cost表示懲罰因子,cost越大,錯(cuò)分樣本越少,分類間距變小,泛化能力弱;cost越小,錯(cuò)分樣本越大,分類間距越大,泛化能力強(qiáng);,cost,gamma參數(shù)的選取過程及代碼如下:tuned<-tune.svm(最后一次欠費(fèi)間隔~.,data=train,gamma=10^(-10:-1),cost=10^(1:4)),其中,<-表示賦值;代碼執(zhí)行結(jié)果如表4所示。表4代碼執(zhí)行結(jié)果表4中,error表示錯(cuò)誤率,可以看出error最小時(shí),得到最好的參數(shù)值,如表5所示。表5gamma、cost的最優(yōu)參數(shù)值gammacost1e-07100S2,利用R語言自帶的包訓(xùn)練SVM模型將預(yù)測(cè)欠費(fèi)間隔的數(shù)據(jù)(第一預(yù)測(cè)模型的訓(xùn)練集)導(dǎo)入第一預(yù)測(cè)模型(svmfit預(yù)測(cè)模型)中,利用R語言做訓(xùn)練,代碼如下:可以看到得到的SVM分類器summary如下:本步驟中預(yù)測(cè)已欠費(fèi)用戶的欠費(fèi)間隔/下次欠費(fèi)時(shí)間的第一預(yù)測(cè)模型已經(jīng)訓(xùn)練好。S3,利用生成的分類器將第一預(yù)測(cè)模型的測(cè)試集數(shù)據(jù)輸入訓(xùn)練好的第一預(yù)測(cè)模型得到預(yù)測(cè)結(jié)果,并檢測(cè)預(yù)測(cè)結(jié)果的準(zhǔn)確性。將第一預(yù)測(cè)模型的測(cè)試集數(shù)據(jù)輸入訓(xùn)練好的svmfit預(yù)測(cè)模型中,得到預(yù)測(cè)的結(jié)果存儲(chǔ)在pred里。通過以下代碼,將預(yù)測(cè)的結(jié)果與真實(shí)結(jié)果形成混肴矩陣,如表6所示。>svm1=max.col(iris$targetsTest)>table(svm1,pred)表6混肴矩陣pre12345610252630110110100012010000000042000000001700000100001000100000001210000000001600000001002600000000103000000020060表6中,帶下劃線的單元格部分為預(yù)測(cè)結(jié)果和真實(shí)結(jié)果重疊的部分,單元格中的數(shù)字代表了預(yù)測(cè)正確的用戶個(gè)數(shù)。假設(shè)混肴矩陣的行坐標(biāo)為x,即原欠費(fèi)間隔的數(shù)值,縱坐標(biāo)為y,即預(yù)測(cè)出的欠費(fèi)間隔的數(shù)值。令混肴矩陣中的單元格的值為Px,y,其中,x表示這個(gè)單元格原來屬于什么間隔,y值表示被預(yù)測(cè)出什么間隔。例如神經(jīng)網(wǎng)絡(luò)的矩陣中,P1,1=2表示原來欠費(fèi)間隔為1最后被預(yù)測(cè)稱1的用戶有2個(gè);P12,30=1表示原來欠費(fèi)間隔為12被預(yù)測(cè)成30的用戶為1個(gè),其中,Px,y≠0且x=y(tǒng)為精準(zhǔn)預(yù)測(cè)正確的用戶數(shù)量。計(jì)算本次SVM的準(zhǔn)確性:>mean(svm2?。絧red)[1]0.1710526可以看到分類器一共預(yù)測(cè)出6種結(jié)果分別對(duì)應(yīng)欠費(fèi)間隔為1、2、3、4、5、6、15、26、30可以看到預(yù)測(cè)準(zhǔn)確率為82.89474%。本實(shí)施例中,可以通過第一預(yù)測(cè)模型預(yù)測(cè)已欠費(fèi)用戶的下次欠費(fèi)時(shí)間(下次欠費(fèi)與上次欠費(fèi)之間的時(shí)間間隔),通過第二預(yù)測(cè)模型預(yù)測(cè)已欠費(fèi)用戶的下次欠費(fèi)金額,通過第三預(yù)測(cè)模型預(yù)測(cè)用戶下月是否欠費(fèi),根據(jù)預(yù)測(cè)結(jié)果,對(duì)準(zhǔn)確率不足70%的預(yù)測(cè)模型調(diào)節(jié)他的設(shè)置參數(shù)和訓(xùn)練集,重新預(yù)測(cè)直到準(zhǔn)確率達(dá)到70%及以上。整合預(yù)測(cè)結(jié)果,可以得到:1、用戶下個(gè)月是否會(huì)欠費(fèi)2、對(duì)于已經(jīng)已欠費(fèi)用戶,下次欠費(fèi)在什么時(shí)候3、對(duì)已欠費(fèi)用戶,預(yù)測(cè)下次欠費(fèi)可能會(huì)欠費(fèi)多少金額這樣,從多方位多角度預(yù)測(cè)出電網(wǎng)用戶的電力回收的未來情況,能夠有效輔助電力企業(yè)制定用電和電費(fèi)預(yù)警策略。以上所述是本發(fā)明的優(yōu)選實(shí)施方式,應(yīng)當(dāng)指出,對(duì)于本
      技術(shù)領(lǐng)域
      :的普通技術(shù)人員來說,在不脫離本發(fā)明所述原理的前提下,還可以作出若干改進(jìn)和潤(rùn)飾,這些改進(jìn)和潤(rùn)飾也應(yīng)視為本發(fā)明的保護(hù)范圍。當(dāng)前第1頁1 2 3 當(dāng)前第1頁1 2 3 
      當(dāng)前第1頁1 2 3 
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1