一種交通安全隱性因子的信用評(píng)分方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及智慧交通領(lǐng)域范疇,尤其是涉及一種交通安全隱性因子的信用評(píng)分方 法。
【背景技術(shù)】
[0002] 隨著個(gè)人消費(fèi)信貸的發(fā)展,個(gè)人信用評(píng)分技術(shù)被高度重視,個(gè)人信用評(píng)分被廣泛 的應(yīng)用在消費(fèi)信貸領(lǐng)域。FICO(費(fèi)埃哲)作為信用評(píng)分的先驅(qū),是由美國個(gè)人消費(fèi)信用評(píng)估 公司開發(fā)出的一種個(gè)人信用評(píng)級(jí)法,已經(jīng)得到社會(huì)廣泛接受。FICO評(píng)分關(guān)注客戶的信用償 還歷史、信用賬號(hào)數(shù)、使用信用的年限、正在使用的信用類型、新開立的信用賬戶,由此來計(jì) 算信用評(píng)分。隨著大數(shù)據(jù)時(shí)代的來臨,互聯(lián)網(wǎng)金融行業(yè)的征信產(chǎn)品正在慢慢改變著征信業(yè) 的格局。芝麻信用基于阿里巴巴的電商交易數(shù)據(jù)和螞蟻金服的互聯(lián)網(wǎng)金融數(shù)據(jù),通過對(duì)海 量信息數(shù)據(jù)進(jìn)行綜合處理的和評(píng)估,幫助社會(huì)形成完整的信用體系,真正實(shí)現(xiàn)"讓守信者暢 通無阻,讓失信者寸步難行"。
[0003] 交通安全是困擾城市的主要問題之一。目前中國的道路交通安全形勢(shì)嚴(yán)峻,每年 道路交通安全事故傷亡人數(shù)超過20萬人。信用評(píng)分定量評(píng)估個(gè)人信用風(fēng)險(xiǎn),反映個(gè)人客戶 的信用狀況,為商業(yè)銀行的信貸提供可靠的依據(jù),由此來限制個(gè)人客戶的商業(yè)違約行為。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明所要解決的技術(shù)問題是提供一種交通安全隱性因子的信用評(píng)分方法,為車 輛保險(xiǎn)企業(yè)提供決策依據(jù),更重要的在于建立整個(gè)社會(huì)的交通安全信用體系。
[0005] 為此,本發(fā)明采用以下技術(shù)方案:
[0006] -種交通安全隱性因子的信用評(píng)分方法,所述方法包括以下步驟:
[0007] (1)采集交通安全隱性因子所對(duì)應(yīng)的數(shù)據(jù)源,搭建由交通安全隱性因子所組成的 數(shù)據(jù)庫,作為交通安全隱性因子的信用評(píng)分的輸入數(shù)據(jù);
[0008] (2)根據(jù)IV的值對(duì)影響交通安全的隱性因子進(jìn)行選取,然后基于WOE編碼,對(duì)選取 的隱性因子進(jìn)行單因子信用評(píng)分;
[0009] (3)基于熵理論對(duì)隱性因子的單因子信用評(píng)分的權(quán)重進(jìn)行確定;
[0010] (4)綜合步驟⑵和(3)的分析結(jié)果,得到交通安全隱性因子的信用評(píng)分。
[0011] 進(jìn)一步地,所述交通安全隱性因子包括人為方面因素、車輛方面因素和道路方面 因素。
[0012] 進(jìn)一步地,所述人為方面因素包括年齡、性別、駕駛年齡、受教育程度、個(gè)人年收入 和籍貫。
[0013] 進(jìn)一步地,所述車輛方面因素包括車輛類型、車輛使用年齡、車輛價(jià)格和車輛生產(chǎn) 產(chǎn)地。
[0014] 進(jìn)一步地,所述道路方面因素包括車輛行駛總里程和車輛在不同類型城市道路的 行駛總里程。
[0015] 進(jìn)一步地,步驟(2)中,影響交通安全的隱性因子的選取包括如下步驟:
[0016] (a)隱性因子值的區(qū)間劃分
[0017] 首先,假設(shè)Y1表示第i個(gè)駕駛員在最近一年內(nèi)的交通違章情況,Y1= 0表示第i 個(gè)駕駛員在最近一年內(nèi)沒有交通違章行為,稱為好駕駛員,反之Y1= 1表示第i個(gè)駕駛員 在最近一年內(nèi)具有交通違章行為,稱為壞駕駛員;
[0018] 其次,隨機(jī)變量X表示m個(gè)駕駛員隱性因子值的集合,X1表示第i個(gè)駕駛員的隱性 因子值。將X劃分成N個(gè)區(qū)間,即找到合理的分割點(diǎn) X〇3) (s = 1,2,…,N-1) ;GS、Bs分別表 示第s個(gè)區(qū)間好、壞駕駛員的個(gè)數(shù),G,B表示好、壞駕駛員總的個(gè)數(shù);
[0019] 根據(jù)WOE定義:
[0021] 上述分點(diǎn)χω的選擇需要保證W0Es(s = 1,2,···,Ν_1)是單調(diào)的,且各區(qū)間樣本分 布的均勻,每個(gè)區(qū)間樣本數(shù)量占總樣本數(shù)量的5%~30% ;
[0022] (b)影響交通安全的隱性因子的選取 [0023] 根據(jù)IV定義:
[0025] 根據(jù)IV的值對(duì)影響交通安全的隱性因子進(jìn)行選取,選取IV〉= 0. 1的影響交通安 全的隱性因子作為后續(xù)影響交通安全隱性因子的單因子信用評(píng)分的隱性因子。
[0026] 進(jìn)一步地,選取的影響交通安全隱性因子的單因子信用評(píng)分包括:
[0027] 根據(jù)IV的值對(duì)影響交通安全的隱性因子進(jìn)行選取之后,需要對(duì)影響交通安全的 隱性因子進(jìn)行單因子信用評(píng)分,
[0028] 影響交通安全信用的隱性因子的單因子信用評(píng)分卡函數(shù)為:
[0030] 其中,Γι為第i個(gè)駕駛員交通安全的單因子信用評(píng)分值,X O3 υ彡X X ω,
[0031] 進(jìn)一步地,步驟(3)中,基于熵理論對(duì)隱性因子值的權(quán)重進(jìn)行確定:
[0032] 基于步驟(2)中根據(jù)IV的值選取的影響交通安全的隱性因子,假設(shè)選取了 η個(gè)隱 性因子,有m個(gè)駕駛員,組成駕駛員的隱性因子的單因子信用評(píng)分矩陣R= (Γι])_;其中, Γι]表示第i個(gè)駕駛員第j個(gè)隱性因子的單因子信用評(píng)分;基于熵理論,隱性因子的單因子 信用評(píng)分的權(quán)重確定步驟如下:
[0033] (i)數(shù)據(jù)標(biāo)準(zhǔn)化處理
[0035] 其中,rmin= min Jri.) ;rmin= max ; IrijI ;i = 1,2,…,m ; j = 1,2,…,η ;
[0036] (ii)計(jì)算第i個(gè)駕駛員第j個(gè)指標(biāo)的比重
[0038] (iii)隱性因子的單因子信用評(píng)分的信息熵值e和信息效用值d的計(jì)算
[0039] 根據(jù)信息熵定義,第j個(gè)隱性因子的單因子信用評(píng)分的信息熵值如下:
[0041] 因此,第j個(gè)隱性因子的單因子信用評(píng)分的信息效用值d,= Ι-e
[0042] (iv)計(jì)算評(píng)價(jià)隱性因子的單因子信用評(píng)分的權(quán)重系數(shù)
[0044] 其中,ω ]為第j個(gè)隱性因子的單因子信用評(píng)分的權(quán)重。
[0045] 進(jìn)一步地,所述的步驟(4)中得到的隱性因子交通安全信用評(píng)分credit如下:
[0047] 其中,其中Credit1表示第i個(gè)駕駛員隱性因子評(píng)分值,η為影響交通安全信用的 隱性因子數(shù)量, Γι]為第i個(gè)駕駛員第j個(gè)影響交通安全信用隱性因子的單因子信用評(píng)分值, ω ,表示第j個(gè)隱性因子的單因子信用評(píng)分的權(quán)重。
[0048] 本發(fā)明具有以下有益技術(shù)效果:
[0049] (1)交通安全隱性因子的信用評(píng)分綜合考慮影響交通安全信用的隱性因子,客觀 地反映出駕駛員的交通安全信用;
[0050] (2)交通安全隱性因子的信用評(píng)分所需要采集的駕駛員信息,都可以很方便的收 集到,保證了實(shí)施的可行性;
[0051] (3)交通安全隱性因子的信用評(píng)分中的隱性因子集合支持動(dòng)態(tài)擴(kuò)展,隨著時(shí)間的 推移,隱性因子不斷的完善和更新,可以更加全面地反映出駕駛員的交通安全信用;
[0052] (4)基于交通安全隱性因子的信用評(píng)分可以為汽車保險(xiǎn)公司提供可靠的交通安全 信用評(píng)分,為汽車保險(xiǎn)公司提供決策依據(jù)。
【具體實(shí)施方式】
[0053] 為了更為具體地描述本發(fā)明,下面結(jié)合【具體實(shí)施方式】對(duì)本發(fā)明的技術(shù)方案進(jìn)行詳 細(xì)說明。
[0054] 本發(fā)明提供一種交通安全隱性因子的信用評(píng)分方法,所述方法包括以下步驟:
[0055] 步驟1 :采集交通安全隱性因子所對(duì)應(yīng)的數(shù)據(jù)源,搭建由交通安全隱性因子所組 成的數(shù)據(jù)庫,作為交通安全隱性因子的信用評(píng)分的輸入數(shù)據(jù);
[0056] 具體地,影響交通安全信用的隱性因素,包括以下三個(gè)方面:
[0057] 〈1>人為方面因素(年齡、性別、駕駛年齡、受教育程度、個(gè)人年收入、籍貫);
[0058] 〈2>車輛方面因素(車輛類型、車輛使用年齡、車輛價(jià)格、車輛生產(chǎn)產(chǎn)地);
[0059] 〈3>道路方面因素(車輛行駛總里程、車輛在不同類型城市道路(快速路、主干道、 次干路、支路)的行駛總里程);
[0060] 隱性因子數(shù)據(jù)庫包含如下屬性:駕駛員車牌號(hào)(主鍵)、年齡、性別、駕駛年齡、受 教育程度、個(gè)人年收入、籍貫、車輛類型、車輛使用年齡、車輛所屬品牌。其中,受教育程度包 含小學(xué)、初中、高中、本科、研究生和博士;籍貫包含23個(gè)省、5個(gè)自治區(qū)、4個(gè)直轄市、以及香 港、澳門2個(gè)特別行政區(qū);車輛類型包含《機(jī)動(dòng)車行駛證》上的所有車輛類型,例如:摩托車、 轎車、客車等;車輛生產(chǎn)產(chǎn)地包含中國、日本、美國、德國等。
[0061 ] 步驟2 :根據(jù)IV的值對(duì)影響交通安全的隱性因子進(jìn)行選取,然后基于WOE編碼,對(duì) 選取的隱性因子進(jìn)行單因子信用評(píng)分;
[0062] 影響交通安全的隱性因子的選取包括如下步驟:
[0063] (a)隱性因子值的區(qū)間劃分
[0064] 首先,假設(shè)Y1表示第i個(gè)駕駛員在最近一年內(nèi)的交通違章情況,Y 0表示第i 個(gè)駕駛員在最近一年內(nèi)沒有交通違章行為,稱為好駕駛員,反之Y1= 1表示第i個(gè)駕駛員 在最近一年內(nèi)具有交通違章行為,稱為壞駕駛員;
[