本發(fā)明涉及一種基于類別選擇的保險檢索方法,屬于數(shù)據(jù)庫檢索技術(shù)領(lǐng)域。
背景技術(shù):
由于生活質(zhì)量與教育水平的不斷提高,人們更愿意購買保險來保障自己的生命財產(chǎn)安全。隨著保險行業(yè)的蓬勃發(fā)展,保險的種類及數(shù)量的劇增,用戶越來越難以從名目繁多的保險險種中選擇自己心儀的或者適合自己的保險產(chǎn)品。如何快捷的檢索適合用戶的保險類型,對保險企業(yè)及用戶來書都是極大的挑戰(zhàn)。目前,有關(guān)保險類型檢索的系統(tǒng)非常少,保險推薦一般是根據(jù)保險銷售顧問根據(jù)經(jīng)驗向顧客介紹險種,或者是由顧客在門類繁多的產(chǎn)品中自己逐一對比選擇險種。這種方式不僅費時費力,且購買效率與顧客體驗都不高。但是,市面上的推薦或檢索方法一般都是對于電影、淘寶產(chǎn)品、音樂等做推薦,還未出現(xiàn)非常成熟的保險類型檢索方法。
技術(shù)實現(xiàn)要素:
本發(fā)明要解決的技術(shù)問題是提出一種基于類別選擇的保險檢索方法,用以解決上述問題。
本發(fā)明的技術(shù)方案是:一種基于類別選擇的保險檢索方法,其特征在于:首先對保險公司業(yè)務(wù)數(shù)據(jù)進行采集,建立原始數(shù)據(jù)庫;其次,對保險類別進行統(tǒng)一編碼,使用apriori算法對編碼后的數(shù)據(jù)庫中的信息進行處理,產(chǎn)生頻繁項集以及關(guān)聯(lián)關(guān)系集合,依據(jù)頻繁項集以及關(guān)聯(lián)關(guān)系集合分別建立頻繁項集以及關(guān)聯(lián)關(guān)系集保險檢索信息庫;再次,建立用戶匹配模式:對無購買歷史的客戶,建立檢索標(biāo)簽并按保險的基本大類類別,檢索匹配頻繁項集信息庫,產(chǎn)生檢索列表;對已有購買歷史的用戶,提取用戶購買信息,與關(guān)聯(lián)關(guān)系集信息庫中的信息做匹配,產(chǎn)生檢索列表;最后,選擇匹配模式,產(chǎn)生檢索列表信息。
2、根據(jù)權(quán)利要求1所述的基于類別選擇的保險檢索方法,其特征在于具體步驟為:
step1:建立原始保險信息數(shù)據(jù)庫:根據(jù)保險公司業(yè)務(wù)數(shù)據(jù)建立原始數(shù)據(jù)庫;
step1.1:建立保險險種信息表:根據(jù)保險公司業(yè)務(wù)范圍統(tǒng)計出所經(jīng)營的保險種類信息,建立保險險種信息表,保險險種信息表包括:險種名稱,編號,類別,詳細(xì)介紹四項(保險險種信息表中數(shù)據(jù)項結(jié)構(gòu)為【險種名稱編號類別詳細(xì)介紹】),保險險種信息表用于鏈接展示檢索結(jié)果列表中具體險種信息;
step1.2:建立保險信息表:根據(jù)保險公司保險業(yè)務(wù)數(shù)據(jù)建立保險信息表,保險信息表包括客戶編號,以及對應(yīng)編號客戶所購買的險種編號集合b(保險信息表中數(shù)據(jù)項的結(jié)構(gòu)為【客戶編號對應(yīng)編號客戶所購買險種的編號集合b】),保險信息表用于產(chǎn)生最終的檢索信息表;
其中:假設(shè)保險種類總數(shù)為n,n∈n*為非負(fù)整數(shù),ai表示某一種險種,其所對應(yīng)的險種編號為bi,bi∈(1,n),ai與bi為一一對應(yīng)的關(guān)系,險種集合a={ai|ai∈(1,n),i∈(1,n)},險種編號集合b={bi|bi∈(1,n),i∈(1,n)};
step2:建立保險檢索信息庫:依據(jù)step1.2中的保險信息表,使用apriori算法產(chǎn)生產(chǎn)生頻繁項集和關(guān)聯(lián)關(guān)系集合,由頻繁項集得到檢索信息表1,檢索信息表1包括保險類別集合、險種集合a、對應(yīng)險種編號集合b(包括2種以上險種的編號)、支持度(頻次)這幾個字段;由關(guān)聯(lián)關(guān)系集合得到檢索信息表2,檢索信息表2包括險類別集合,險種編號集合(包含一種或者多種險種編號),關(guān)聯(lián)險種編號集合(包含一種或者多種險種編號),將檢索信息表1與檢索信息表2作為保險檢索信息庫的表;
step2.1:使用apriori算法建立保險檢索信息庫:
產(chǎn)生頻繁一項集:遍歷step1.2中產(chǎn)生的保險信息表,根據(jù)每個客戶的險種集合統(tǒng)計,客戶購買過某種保險,則該險種對應(yīng)的頻次加1(每個險種的初始頻次為0);統(tǒng)計完所有客戶所購買的險種信息后,篩選出頻次高于最小支持度min_sup的險種產(chǎn)生頻繁一項集l1,l1即為對所有客戶數(shù)據(jù)中單種保險的頻次表中頻次高于最小支持度的險種,其格式為:【險種編號集合b|對應(yīng)頻次】;
產(chǎn)生頻繁k(k>1)項集:在k次掃描時,利用第k-1次得到的結(jié)果lk-1項集中子集,兩兩排列組合得到新子集,即候選項集ck,設(shè):ck∈ck,即ck是一個候選k項集,ck-1是ck的一個(k-1)項子集,若滿足
重復(fù)步驟2直至不能出現(xiàn)更大的頻繁項集;
由頻繁項集產(chǎn)生強關(guān)聯(lián)規(guī)則:對于k≥2頻繁項集的每個項集產(chǎn)生關(guān)聯(lián)規(guī)則,即求取每個子集頻次與其他所有子集的頻次之前的運算值是否滿足大于等于最小置信度min_conf,假設(shè)所求子集頻次為sup_l,該子集與其他某一子集同時出現(xiàn)的頻次為sup_s,如滿足(sup_lsup_s)≥min_conf則表明兩個子集具有強關(guān)聯(lián)關(guān)系,并將信息以【險種編號集合bi|關(guān)聯(lián)險種編號集合bj】的格式存儲;
step2.2:建立檢索信息庫:將step2.1中得到的lk項集中每一項集集合中的元素以編號遍歷從step1.1中的保險險種信息表檢索出對應(yīng)的類別及險種后以【險種類別集合|險種集合a|險種編號集b|對應(yīng)頻次】的格式存入檢索信息表1;將關(guān)聯(lián)關(guān)系集以每一項的格式為:【險種編號集合bi對應(yīng)類別集合|險種編號集合bi|關(guān)聯(lián)險種編號集合bj】的形式存入檢索信息表2;
step3:建立用戶匹配模式:對無保險購買歷史的客戶,建立檢索標(biāo)簽按保險的基本大類類別,即人身保險、人壽保險、人身意外傷害保險、健康保險、醫(yī)療保險、財產(chǎn)保險、車險分類;檢索匹配檢索信息表1,產(chǎn)生檢索列表;
該種方法也可以用于有購買歷史的用戶檢索了解信息;對已有購買歷史的用戶,提取用戶購買信息,與檢索信息表2中的信息做匹配,產(chǎn)生檢索列表,最后,由用戶或者業(yè)務(wù)人員選擇匹配模式,產(chǎn)生檢索列表信息;兩種檢索信息列表中得到的都是險種的編號,根據(jù)編號連接step1.1中的保險險種信息表,查看險種的具體信息;
step4:用戶檢索產(chǎn)生檢索列表:將用戶檢索標(biāo)簽的類別與提取到保險檢索信息庫中信息逐次對比,根據(jù)信息庫中的信息將列表呈現(xiàn)給用戶;
step5:保險檢索信息庫更新:分析保險公司具體業(yè)務(wù)量,定期更新保險檢索信息庫,即每周或者每月將業(yè)務(wù)數(shù)據(jù)加入保險原始數(shù)據(jù)庫,然后重復(fù)step1-step3的工作。
本發(fā)明的有益效果是:
1、本發(fā)明專利通過使用聯(lián)合網(wǎng)絡(luò),對用戶通訊錄網(wǎng)絡(luò)及通訊工具用戶網(wǎng)絡(luò)進行映射處理,根據(jù)用戶所熟悉的好友保險信息,建保險檢索信息庫,實現(xiàn)了用戶對保險險種的匹配。并且,在建立保險檢索信息庫時使用了apriori算法,提升了檢索效率。
2、本發(fā)明專利針對保險檢索現(xiàn)象,提供了保險險種實時檢索,極大的節(jié)省了用戶咨詢及查詢相關(guān)資料的時長,避免了時間資源的浪費,處理速度快,且能夠精確的滿足用戶需求。讓用戶可以更加精準(zhǔn)的檢索到適合的險種,提高了用戶體驗度。
附圖說明
圖1是本發(fā)明的流程圖;
圖2是本發(fā)明apriori算法實現(xiàn)流程圖;
圖3是本發(fā)明中實施例1生成檢索表的示意圖。
具體實施方式
下面結(jié)合附圖和具體實施方式,對本發(fā)明作進一步說明。
實施例1:如圖1-3所示,step1:建立原始保險信息數(shù)據(jù)庫:根據(jù)保險公司業(yè)務(wù)數(shù)據(jù)建立原始數(shù)據(jù)庫。
step1.1:建立保險險種信息表:根據(jù)該保險公司具體業(yè)務(wù)范圍統(tǒng)計出所經(jīng)營的保險種類信息,建立保險險種信息表。保險險種信息表包括:險種名稱,編號,類別,詳細(xì)介紹四項(保險險種信息表中數(shù)據(jù)項結(jié)構(gòu)為【險種名稱編號類別詳細(xì)介紹】)。保險險種信息表用于鏈接展示檢索結(jié)果列表中具體險種信息。
step1.2:建立保險信息表:根據(jù)該保險公司保險業(yè)務(wù)數(shù)據(jù)建立保險信息表。保險信息表包括客戶編號,以及對應(yīng)編號客戶所購買的險種編號集合b(保險信息表中數(shù)據(jù)項的結(jié)構(gòu)為【客戶編號對應(yīng)編號客戶所購買險種的編號集合b】)。保險信息表用于產(chǎn)生最終的檢索信息表。如圖3所示的保險信息表的示例中客戶1購買的險種有{15,6,3,5,11}。
其中:假設(shè)保險種類總數(shù)為22,示例中n為22,i∈(1,n),ai表示某一種險種,其所對應(yīng)的險種編號為bi,bi∈(1,n)。ai與bi為一一對應(yīng)的關(guān)系。險種集合a={ai|ai∈(1,n),i∈(1,n)},險種編號集合b={bi|bi∈(1,n),i∈(1,n)}。
step2:建立保險檢索信息庫:依據(jù)step1.2中的保險信息表,使用apriori算法產(chǎn)生產(chǎn)生頻繁項集和關(guān)聯(lián)關(guān)系集合。由頻繁項集得到檢索信息表1,檢索信息表1主要包括保險類別集合、險種集合a、對應(yīng)險種編號集合b(包括2種以上險種的編號)、支持度(頻次)這幾個字段;由關(guān)聯(lián)關(guān)系集合得到檢索信息表2,檢索信息表2包括險類別集合,險種編號集合(包含一種或者多種險種編號),關(guān)聯(lián)險種編號集合(包含一種或者多種險種編號)。將檢索信息表1與檢索信息表2作為保險檢索信息庫的表。
step2.1:使用apriori算法建立保險檢索信息庫:
(1)產(chǎn)生頻繁一項集:遍歷step1.2中產(chǎn)生的保險信息表,根據(jù)每個客戶的險種集合統(tǒng)計,如客戶有購買某種保險,則該險種對應(yīng)的頻次加1(每個險種的初始頻次為0)。統(tǒng)計完所有客戶所購買的險種信息后,篩選出頻次高于最小支持度min_sup的險種產(chǎn)生頻繁一項集l1。l1即為對所有客戶數(shù)據(jù)中單種保險的頻次表中頻次高于最小支持度的險種,其格式為【險種編號集合b|對應(yīng)頻次】。
(2)產(chǎn)生頻繁k(k>1)項集:在k次掃描時,利用第k-1次得到的結(jié)果lk-1項集中子集,兩兩排列組合得到新子集,即候選項集ck。設(shè):ck∈ck,即ck是一個候選k項集,ck-1是ck的一個(k-1)項子集,若滿足
(3)重復(fù)步驟2)直至不能出現(xiàn)更大的頻繁項集。
(4)由頻繁項集產(chǎn)生強關(guān)聯(lián)規(guī)則:對于k≥2頻繁項集的每個項集產(chǎn)生關(guān)聯(lián)規(guī)則,即求取每個子集頻次與其他所有子集的頻次之前的運算值是否滿足大于等于最小置信度min_conf。假設(shè)所求子集頻次為sup_l,該子集與其他某一子集同時出現(xiàn)的頻次為sup_s,如滿足(sup_l/sup_s)≥min_conf則表明兩個子集具有強關(guān)聯(lián)關(guān)系,并將信息以【險種編號集合bi|關(guān)聯(lián)險種編號集合bj】的格式存儲。
step2.2:建立檢索信息庫:將step2.1中得到的lk項集中每一項集集合中的元素以編號遍歷從step1.1中的保險險種信息表檢索出對應(yīng)的類別及險種后以【險種類別集合|險種集合a|險種編號集b|對應(yīng)頻次】的格式存入檢索信息表1;將關(guān)聯(lián)關(guān)系集以每一項的格式為:【險種編號集合bi對應(yīng)類別集合|險種編號集合bi|關(guān)聯(lián)險種編號集合bj】的形式存入檢索信息表2。
step3:建立用戶匹配模式:對無保險購買歷史的客戶,建立檢索標(biāo)簽按保險的基本大類類別,即人身保險、人壽保險、人身意外傷害保險、健康保險、醫(yī)療保險、財產(chǎn)保險、車險分類,檢索匹配檢索信息表1,產(chǎn)生檢索列表。該種方法也可以用于有購買歷史的用戶檢索了解信息;對已有購買歷史的用戶,提取用戶購買信息,與檢索信息表2中的信息做匹配,產(chǎn)生檢索列表。最后,由用戶或者業(yè)務(wù)人員選擇匹配模式,產(chǎn)生檢索列表信息。兩種檢索信息列表中得到的都是險種的編號,根據(jù)編號連接step1.1中的保險險種信息表,查看險種的具體信息。
step4:用戶檢索產(chǎn)生檢索列表:將用戶檢索標(biāo)簽的類別與提取到保險檢索信息庫中信息逐次對比,根據(jù)信息庫中的信息將列表呈現(xiàn)給用戶。
step5:保險檢索信息庫更新:分析保險公司具體業(yè)務(wù)量,定期更新保險檢索信息庫。即每周或者每月將業(yè)務(wù)數(shù)據(jù)加入保險原始數(shù)據(jù)庫,然后重復(fù)step1-step3的工作。
實施例2:一種基于類別選擇的保險檢索方法,首先針對保險公司業(yè)務(wù)數(shù)據(jù)進行采集,建立原始數(shù)據(jù)庫。其次,對保險類別進行統(tǒng)一編碼,使用apriori算法對編碼后的數(shù)據(jù)庫中的信息進行處理,產(chǎn)生頻繁項集以及關(guān)聯(lián)關(guān)系集合。依據(jù)頻繁項集以及關(guān)聯(lián)關(guān)系集合分別建立頻繁項集以及關(guān)聯(lián)關(guān)系集保險檢索信息庫。再次,建立用戶匹配模式:對無購買歷史的客戶,建立檢索標(biāo)簽按保險的基本大類類別,即人身保險、人壽保險、人身意外傷害保險、健康保險、醫(yī)療保險、財產(chǎn)保險、車險分類,檢索匹配頻繁項集信息庫,產(chǎn)生檢索列表;對已有購買歷史的用戶,提取用戶購買信息,與關(guān)聯(lián)關(guān)系集信息庫中的信息做匹配,產(chǎn)生檢索列表。最后,由用戶或者業(yè)務(wù)人員選擇匹配模式,產(chǎn)生檢索列表信息。
以上結(jié)合附圖對本發(fā)明的具體實施方式作了詳細(xì)說明,但是本發(fā)明并不限于上述實施方式,在本領(lǐng)域普通技術(shù)人員所具備的知識范圍內(nèi),還可以在不脫離本發(fā)明宗旨的前提下作出各種變化。