本發(fā)明涉及計(jì)算機(jī)處理技術(shù)領(lǐng)域,特別涉及一種文件比對(duì)方法及裝置。
背景技術(shù):
目前,用戶在到各個(gè)辦事機(jī)構(gòu)辦理業(yè)務(wù)時(shí),需要提供大量的證明文件或資料,且在辦理不同業(yè)務(wù)時(shí),可能會(huì)使用到相同文件。而用戶需要在辦理不同的業(yè)務(wù)時(shí),需要對(duì)相同文件分別進(jìn)行準(zhǔn)備,給用戶帶來(lái)了許多不便,降低了辦事效率。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明實(shí)施例提供了一種文件比對(duì)方法及裝置,以使提高辦事效率。
第一方面,本發(fā)明實(shí)施例提供了一種文件比對(duì)方法,包括:
確定目標(biāo)用戶當(dāng)前所需辦理的第一業(yè)務(wù),以及確定對(duì)應(yīng)所述第一業(yè)務(wù)的至少一個(gè)第一文件的名稱(chēng);
獲取與所述目標(biāo)用戶對(duì)應(yīng)的至少一個(gè)第二文件的名稱(chēng);
針對(duì)每一個(gè)第一文件的名稱(chēng),逐個(gè)確定與各個(gè)第二文件的名稱(chēng)的匹配度;
根據(jù)確定的各個(gè)匹配度,將匹配成功的第二文件進(jìn)行加載。
其中,進(jìn)一步包括:
獲取所述目標(biāo)用戶在辦理第二業(yè)務(wù)時(shí)提交的至少一個(gè)第二文件;
獲取每一個(gè)第二文件對(duì)應(yīng)的電子文件;
為每一個(gè)第二文件對(duì)應(yīng)的電子文件配置相應(yīng)的名稱(chēng);
并存儲(chǔ)每一個(gè)第二文件對(duì)應(yīng)的電子文件及其相應(yīng)的名稱(chēng)。
其中,所述針對(duì)每一個(gè)第一文件的名稱(chēng),逐個(gè)確定與各個(gè)第二文件的名稱(chēng)的匹配度,包括:
通過(guò)下述方式確定當(dāng)前第一文件的第一名稱(chēng)與當(dāng)前第二文件的第二名稱(chēng)的匹配度:
將所述第一名稱(chēng)和所述第二名稱(chēng)分別進(jìn)行分詞處理;
針對(duì)所述第一名稱(chēng)對(duì)應(yīng)的每一個(gè)分詞,分別與所述第二名稱(chēng)對(duì)應(yīng)的各個(gè)分詞進(jìn)行比對(duì),并根據(jù)下述公式計(jì)算所述第一名稱(chēng)與所述第二名稱(chēng)的匹配度:
S=(M1)/(M0)
其中,S用于表征所述第一名稱(chēng)與所述第二名稱(chēng)的匹配度,M0用于表征所述第一名稱(chēng)在與第二名稱(chēng)進(jìn)行分詞處理后分詞的總個(gè)數(shù),其中,所述總個(gè)數(shù)中包括的分詞兩兩各不相同,M1用于表征所述第一名稱(chēng)在與第二名稱(chēng)進(jìn)行比對(duì)時(shí)比對(duì)結(jié)果相同時(shí)對(duì)應(yīng)的次數(shù)。
其中,
進(jìn)一步包括:設(shè)定第一閾值范圍和第二閾值范圍;
進(jìn)一步包括:在匹配度位于所述第一閾值范圍時(shí),確定匹配成功;在匹配度位于所述第二閾值范圍時(shí),展示該匹配度對(duì)應(yīng)的第二文件,以供進(jìn)一步確認(rèn)該展示的第二文件是否為需要的第一文件。
其中,
所述第一閾值范圍包括:[90%,100%];
所述第一閾值范圍包括:[60%,90%)。
第二方面,本發(fā)明實(shí)施例還提供了一種文件比對(duì)裝置,包括:
第一確定單元,用于確定目標(biāo)用戶當(dāng)前所需辦理的第一業(yè)務(wù),以及確定對(duì)應(yīng)所述第一業(yè)務(wù)的至少一個(gè)第一文件的名稱(chēng);
第一獲取單元,用于獲取與所述目標(biāo)用戶對(duì)應(yīng)的至少一個(gè)第二文件的名稱(chēng);
第二確定單元,用于針對(duì)每一個(gè)第一文件的名稱(chēng),逐個(gè)確定與各個(gè)第二文件的名稱(chēng)的匹配度;
加載單元,用于根據(jù)確定的各個(gè)匹配度,將匹配成功的第二文件進(jìn)行加載。
其中,進(jìn)一步包括:
第二獲取單元,用于獲取所述目標(biāo)用戶在辦理第二業(yè)務(wù)時(shí)提交的至少一個(gè)第二文件,以及獲取每一個(gè)第二文件對(duì)應(yīng)的電子文件;
配置單元,用于為每一個(gè)第二文件對(duì)應(yīng)的電子文件配置相應(yīng)的名稱(chēng);
存儲(chǔ)單元,用于存儲(chǔ)每一個(gè)第二文件對(duì)應(yīng)的電子文件及其相應(yīng)的名稱(chēng)。
其中,所述第二確定單元,具體用于通過(guò)下述方式確定當(dāng)前第一文件的第一名稱(chēng)與當(dāng)前第二文件的第二名稱(chēng)的匹配度:
將所述第一名稱(chēng)和所述第二名稱(chēng)分別進(jìn)行分詞處理;
針對(duì)所述第一名稱(chēng)對(duì)應(yīng)的每一個(gè)分詞,分別與所述第二名稱(chēng)對(duì)應(yīng)的各個(gè)分詞進(jìn)行比對(duì),并根據(jù)下述公式計(jì)算所述第一名稱(chēng)與所述第二名稱(chēng)的匹配度:
S=(M1)/(M0)
其中,S用于表征所述第一名稱(chēng)與所述第二名稱(chēng)的匹配度,M0用于表征所述第一名稱(chēng)在與第二名稱(chēng)進(jìn)行分詞處理后分詞的總個(gè)數(shù),其中,所述總個(gè)數(shù)中包括的分詞兩兩各不相同,M1用于表征所述第一名稱(chēng)在與第二名稱(chēng)進(jìn)行比對(duì)時(shí)比對(duì)結(jié)果相同時(shí)對(duì)應(yīng)的次數(shù)。
其中,
進(jìn)一步包括:設(shè)定單元,用于設(shè)定第一閾值范圍和第二閾值范圍;
進(jìn)一步包括:處理單元,用于在匹配度位于所述第一閾值范圍時(shí),確定匹配成功;在匹配度位于所述第二閾值范圍時(shí),展示該匹配度對(duì)應(yīng)的第二文件,以供進(jìn)一步確認(rèn)該展示的第二文件是否為需要的第一文件。
其中,
所述第一閾值范圍包括:[90%,100%];
所述第一閾值范圍包括:[60%,90%)。
本發(fā)明實(shí)施例提供了一種文件比對(duì)方法及裝置,通過(guò)確定當(dāng)前所需辦理的第一業(yè)務(wù),以及對(duì)應(yīng)第一業(yè)務(wù)的至少一個(gè)第一文件的名稱(chēng),以及獲取與目標(biāo)用戶對(duì)應(yīng)的至少一個(gè)第二文件的名稱(chēng),通過(guò)針對(duì)每一個(gè)第一文件的名稱(chēng),逐個(gè)確定與各個(gè)第二文件的名稱(chēng)的匹配度,在匹配成功時(shí),將匹配成功的第二文件進(jìn)行加載,加載的該第二文件可以用在第一業(yè)務(wù)中,無(wú)需用戶提高該加載的第二文件,從而可以提高辦事效率。
附圖說(shuō)明
為了更清楚地說(shuō)明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見(jiàn)地,下面描述中的附圖是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1是本發(fā)明一個(gè)實(shí)施例提供的一種方法流程圖;
圖2是本發(fā)明一個(gè)實(shí)施例提供的另一種方法流程圖;
圖3是本發(fā)明一個(gè)實(shí)施例提供的每一個(gè)文件A的名稱(chēng)與各個(gè)文件B的名稱(chēng)進(jìn)行匹配的關(guān)系示意圖;
圖4是本發(fā)明一個(gè)實(shí)施例提供的裝置所在設(shè)備的硬件架構(gòu)圖;
圖5是本發(fā)明一個(gè)實(shí)施例提供的裝置結(jié)構(gòu)示意圖。
具體實(shí)施方式
為使本發(fā)明實(shí)施例的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例,基于本發(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有做出創(chuàng)造性勞動(dòng)的前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
如圖1所示,本發(fā)明實(shí)施例提供了一種文件比對(duì)方法,該方法可以包括以下步驟:
步驟101:確定目標(biāo)用戶當(dāng)前所需辦理的第一業(yè)務(wù),以及確定對(duì)應(yīng)所述第一業(yè)務(wù)的至少一個(gè)第一文件的名稱(chēng);
步驟102:獲取與所述目標(biāo)用戶對(duì)應(yīng)的至少一個(gè)第二文件的名稱(chēng);
步驟103:針對(duì)每一個(gè)第一文件的名稱(chēng),逐個(gè)確定與各個(gè)第二文件的名稱(chēng)的匹配度;
步驟104:根據(jù)確定的各個(gè)匹配度,將匹配成功的第二文件進(jìn)行加載。
根據(jù)上述本發(fā)明實(shí)施例,通過(guò)確定當(dāng)前所需辦理的第一業(yè)務(wù),以及對(duì)應(yīng)第一業(yè)務(wù)的至少一個(gè)第一文件的名稱(chēng),以及獲取與目標(biāo)用戶對(duì)應(yīng)的至少一個(gè)第二文件的名稱(chēng),通過(guò)針對(duì)每一個(gè)第一文件的名稱(chēng),逐個(gè)確定與各個(gè)第二文件的名稱(chēng)的匹配度,在匹配成功時(shí),將匹配成功的第二文件進(jìn)行加載,加載的該第二文件可以用在第一業(yè)務(wù)中,無(wú)需用戶提高該加載的第二文件,從而可以提高辦事效率。
用戶在辦事機(jī)構(gòu)辦理業(yè)務(wù)時(shí),需要提交至少一個(gè)文件,其中,該文件可以包括:身份證明、婚姻證明和房產(chǎn)證明中的至少一種。且用戶提交的文件可以為紙質(zhì)文件,也可以是紙質(zhì)文件掃描后的電子文件。且用戶在準(zhǔn)備每一個(gè)文件時(shí),均需要花費(fèi)大量的時(shí)間,因此,為了節(jié)省用戶的準(zhǔn)備時(shí)間,可以將用戶在之前辦理業(yè)務(wù)時(shí)提交的文件進(jìn)行存儲(chǔ),以供下一次辦理業(yè)務(wù)需要時(shí),無(wú)需重新準(zhǔn)備該文件,在本發(fā)明一個(gè)實(shí)施例中,可以進(jìn)一步包括:
獲取所述目標(biāo)用戶在辦理第二業(yè)務(wù)時(shí)提交的至少一個(gè)第二文件;
獲取每一個(gè)第二文件對(duì)應(yīng)的電子件;
為每一個(gè)第二文件對(duì)應(yīng)的電子件配置相應(yīng)的名稱(chēng);
并存儲(chǔ)每一個(gè)第二文件對(duì)應(yīng)的電子件及其相應(yīng)的名稱(chēng)。
其中,第一業(yè)務(wù)是指目標(biāo)用戶當(dāng)前所需辦理的業(yè)務(wù),該第二業(yè)務(wù)是指在第一業(yè)務(wù)辦理之前辦理完成的一次或多次業(yè)務(wù)。該第一業(yè)務(wù)和第二業(yè)務(wù)可以是同一個(gè)業(yè)務(wù),也可以是不同業(yè)務(wù),在此不作具體限定。
例如,目標(biāo)用戶在辦理第二業(yè)務(wù)時(shí)提交的至少一個(gè)第二文件可以包括:身份證明、婚姻證明、固定資產(chǎn)證明和流動(dòng)資產(chǎn)證明。
為了便于后續(xù)過(guò)程中能夠快速獲取到目標(biāo)用戶提交的至少一個(gè)第二文件,可以存儲(chǔ)電子版的第二文件。因此,若第二文件是紙質(zhì)文件,可以通過(guò)掃描設(shè)備掃描出每一個(gè)第二文件的電子文件,若第二文件是電子版的文件,可以直接獲取該第二文件。
由于一個(gè)辦事機(jī)構(gòu)每天有大量用戶來(lái)辦理業(yè)務(wù),因此,為了便于后續(xù)過(guò)程中可以快速獲取到目標(biāo)用戶提交的至少一個(gè)第二文件,在存儲(chǔ)時(shí),需要每一個(gè)第二文件與目標(biāo)用戶進(jìn)行關(guān)聯(lián),例如,以每一個(gè)第二文件攜帶該目標(biāo)用戶的標(biāo)識(shí)的方式,再如,存儲(chǔ)到目標(biāo)用戶對(duì)應(yīng)的文件夾下的方式。
進(jìn)一步地,為了便于后續(xù)過(guò)程中能夠快速確定該目標(biāo)用戶對(duì)應(yīng)第一業(yè)務(wù)的第一文件,是否在辦理第二業(yè)務(wù)時(shí)已經(jīng)提交過(guò),可以通過(guò)給每一個(gè)第二文件配置名稱(chēng)的方式來(lái)實(shí)現(xiàn)。例如,每一個(gè)第二文件的名稱(chēng)可以包括:身份證明、婚姻證明、固定資產(chǎn)證明和流動(dòng)資產(chǎn)證明。
在本發(fā)明一個(gè)實(shí)施例中,在針對(duì)每一個(gè)第一文件的名稱(chēng),逐個(gè)確定與各個(gè)第二文件的名稱(chēng)的匹配度時(shí),可以直接通過(guò)分析當(dāng)前第一文件的名稱(chēng)與當(dāng)前第二文件的名稱(chēng)是否相同來(lái)確定,若相同的字?jǐn)?shù)大于設(shè)定閾值時(shí),則確定該當(dāng)前第一文件與當(dāng)前第二文件匹配成功。例如,該設(shè)定閾值為90%。
由于存在不同的業(yè)務(wù),對(duì)同一個(gè)文件的命名不同,因此,不能夠完全靠名稱(chēng)完全相同來(lái)確定用戶是否已經(jīng)在辦理第二業(yè)務(wù)時(shí)提交了第一業(yè)務(wù)所需的文件,在本發(fā)明一個(gè)實(shí)施例中,所述針對(duì)每一個(gè)第一文件的名稱(chēng),逐個(gè)確定與各個(gè)第二文件的名稱(chēng)的匹配度,包括:
通過(guò)下述方式確定當(dāng)前第一文件的第一名稱(chēng)與當(dāng)前第二文件的第二名稱(chēng)的匹配度:
將所述第一名稱(chēng)和所述第二名稱(chēng)分別進(jìn)行分詞處理;
針對(duì)所述第一名稱(chēng)對(duì)應(yīng)的每一個(gè)分詞,分別與所述第二名稱(chēng)對(duì)應(yīng)的各個(gè)分詞進(jìn)行比對(duì),并根據(jù)下述公式計(jì)算所述第一名稱(chēng)與所述第二名稱(chēng)的匹配度:
S=(M1)/(M0)
其中,S用于表征所述第一名稱(chēng)與所述第二名稱(chēng)的匹配度,M0用于表征所述第一名稱(chēng)在與第二名稱(chēng)進(jìn)行分詞處理后分詞的總個(gè)數(shù),其中,所述總個(gè)數(shù)中包括的分詞兩兩各不相同,M1用于表征所述第一名稱(chēng)在與第二名稱(chēng)進(jìn)行比對(duì)時(shí)比對(duì)結(jié)果相同時(shí)對(duì)應(yīng)的次數(shù)。
為了保證加載的第二文件的正確性,在加載成功后,還需要對(duì)該第二文件進(jìn)行進(jìn)一步的確認(rèn),該確認(rèn)方式可以由工作人員來(lái)執(zhí)行。
在本發(fā)明一個(gè)實(shí)施例中,由于不同的業(yè)務(wù)對(duì)于同一個(gè)文件的命名不同,因此,即使文件A的名稱(chēng)與文件B的名稱(chēng)不是完全相同,也可以是同一個(gè)文件,因此,可以進(jìn)一步包括:設(shè)定第一閾值范圍和第二閾值范圍;例如,該第一閾值范圍可以包括:[90%,100%];該第一閾值范圍可以包括:[60%,90%)。
進(jìn)一步包括:在匹配度位于所述第一閾值范圍時(shí),確定匹配成功;在匹配度位于所述第二閾值范圍時(shí),展示該匹配度對(duì)應(yīng)的第二文件,以供進(jìn)一步確認(rèn)該展示的第二文件是否為需要的第一文件。
對(duì)于閾值范圍的設(shè)定,可以由軟件開(kāi)發(fā)人員根據(jù)經(jīng)驗(yàn)值來(lái)確定。
下面結(jié)合一個(gè)具體的例子,對(duì)本發(fā)明實(shí)施例的文件匹配方法進(jìn)行說(shuō)明。
請(qǐng)參考圖2,本發(fā)明實(shí)施例提供的一種文件匹配方法可以包括以下步驟:
步驟201:確定用戶A當(dāng)前辦理的業(yè)務(wù)所需提供的文件A。
例如,當(dāng)前辦理的業(yè)務(wù)所需提供的文件A包括:身份證復(fù)印件、婚姻證明和存款清單。那么,該文件A對(duì)應(yīng)的名稱(chēng)可以為身份證復(fù)印件、婚姻證明和存款清單。
步驟202:根據(jù)用戶A的標(biāo)識(shí),獲取當(dāng)前數(shù)據(jù)庫(kù)中存儲(chǔ)的用戶A在之前辦理業(yè)務(wù)時(shí)提交的文件B。
其中,該標(biāo)識(shí)用于標(biāo)識(shí)用戶的唯一性,例如,身份證號(hào)、護(hù)照號(hào)。
例如,用戶A在之前辦理業(yè)務(wù)時(shí)提交的文件B包括:身份證明、婚姻證明、固定資產(chǎn)證明和流動(dòng)資產(chǎn)證明,且這四個(gè)文件的名稱(chēng)分別為:身份證明、婚姻證明、固定資產(chǎn)證明和流動(dòng)資產(chǎn)證明。
步驟203:在文件A選擇一個(gè)未被進(jìn)行分詞處理過(guò)的文件的第一名稱(chēng),以及在文件B中逐個(gè)選擇未與文件A選擇的當(dāng)前文件的名稱(chēng)進(jìn)行匹配過(guò)的文件的第二名稱(chēng)。
請(qǐng)參考圖3,本實(shí)施例需要將每一個(gè)文件A的名稱(chēng),逐個(gè)與各個(gè)文件B的名稱(chēng)進(jìn)行匹配,以確定匹配度。
步驟204:將第一名稱(chēng)和第二名稱(chēng)分別進(jìn)行分詞處理。
以文件A的名稱(chēng)為身份證復(fù)印件、文件B的名稱(chēng)為身份證明為例,對(duì)確定的匹配度進(jìn)行說(shuō)明。
在本發(fā)明一個(gè)實(shí)施例中,可以直接比對(duì)兩個(gè)名稱(chēng),在比對(duì)名稱(chēng)時(shí),可以將兩個(gè)名稱(chēng)分別進(jìn)行分詞處理,其中,兩個(gè)名稱(chēng)可以分為相同個(gè)數(shù)的詞,也可以分為不同個(gè)數(shù)的詞,例如,將“身份證復(fù)印件”進(jìn)行分詞處理之后為“身份”“證”“復(fù)印”“件”,將“身份證明”進(jìn)行分詞處理之后為“身份”“證”“明”。
在本發(fā)明一個(gè)實(shí)施例中,在對(duì)文件A中選擇一個(gè)文件的名稱(chēng)進(jìn)行分詞處理之后,可以將該選擇的文件的名稱(chēng)進(jìn)行標(biāo)識(shí),以防止下一次選擇時(shí)再次選擇該文件的名稱(chēng)。
步驟205:針對(duì)第一名稱(chēng)對(duì)應(yīng)的每一個(gè)分詞,分別與第二名稱(chēng)對(duì)應(yīng)的各個(gè)分詞進(jìn)行比對(duì),并根據(jù)比對(duì)結(jié)果計(jì)算第一名稱(chēng)與第二名稱(chēng)的匹配度。
在對(duì)上述分詞處理后的兩個(gè)名稱(chēng)進(jìn)行比對(duì)時(shí),可以針對(duì)文件A的名稱(chēng)中每一個(gè)詞,與文件B的名稱(chēng)中的各個(gè)詞分別進(jìn)行比對(duì),以計(jì)算匹配度。其中,該匹配度的計(jì)算,可以根據(jù)平均值的方式來(lái)計(jì)算。其中,該計(jì)算公式可以包括:
S=(M1)/(M0) (1)
其中,S用于表征所述第一名稱(chēng)與所述第二名稱(chēng)的匹配度,M0用于表征所述第一名稱(chēng)在與第二名稱(chēng)進(jìn)行分詞處理后分詞的總個(gè)數(shù),其中,所述總個(gè)數(shù)中包括的分詞兩兩各不相同,M1用于表征所述第一名稱(chēng)在與第二名稱(chēng)進(jìn)行比對(duì)時(shí)比對(duì)結(jié)果相同時(shí)對(duì)應(yīng)的次數(shù)。
在本發(fā)明一個(gè)實(shí)施例中,在對(duì)文件B中選擇的一個(gè)文件的第二名稱(chēng)與文件A的第一名稱(chēng)進(jìn)行匹配過(guò)之后,對(duì)該第二名稱(chēng)進(jìn)行標(biāo)識(shí),以防止下一次在文件B中包括的各個(gè)名稱(chēng)中進(jìn)行選擇時(shí),再次選擇該第二名稱(chēng)。
步驟206:確定匹配度與第一閾值范圍和第二閾值范圍的關(guān)系,在匹配度位于第一閾值范圍時(shí),執(zhí)行步驟207;在匹配度位于第二閾值范圍時(shí),執(zhí)行步驟208;在匹配度均不位于第一閾值范圍和第二閾值范圍時(shí),確定匹配失敗。
在本發(fā)明一個(gè)實(shí)施例中,由于不同的業(yè)務(wù)對(duì)于同一個(gè)文件的命名不同,因此,即使文件A的名稱(chēng)與文件B的名稱(chēng)不是完全相同,也可以是同一個(gè)文件,因此,可以進(jìn)一步包括:設(shè)定第一閾值范圍和第二閾值范圍;例如,該第一閾值范圍可以包括:[90%,100%];該第二閾值范圍可以包括:[60%,90%)。
對(duì)于閾值范圍的設(shè)定,可以由軟件開(kāi)發(fā)人員根據(jù)經(jīng)驗(yàn)值來(lái)確定。
根據(jù)上述公式可知,M0=5,M1=2,S=40%。那么可以確定“身份證復(fù)印件”和“身份證明”的匹配度為40%,既不位于第一閾值范圍,也未位于第二閾值范圍,因此,可以確定該文件B中的“身份證明”不是當(dāng)前業(yè)務(wù)所需的文件,因此,匹配失敗。
以文件A的名稱(chēng)為“婚姻證明”,文件B的名稱(chēng)為“婚姻證明”為例,可以在進(jìn)行分詞處理后,根據(jù)上式(1)計(jì)算兩個(gè)名稱(chēng)的匹配度時(shí),可以計(jì)算得到匹配度S=100%,因此,可以確定該文件B中的“婚姻證明”為當(dāng)前辦理業(yè)務(wù)所需的文件,因此,匹配成功。
步驟207:確定匹配成功,則加載該匹配成功的第二名稱(chēng)對(duì)應(yīng)的文件B,并執(zhí)行步驟203,直到文件A中的所有文件的名稱(chēng)均被分詞處理過(guò),執(zhí)行步驟209。
為了保證加載的第二文件的正確性,在加載成功后,還需要對(duì)該第二文件進(jìn)行進(jìn)一步的確認(rèn),該確認(rèn)方式可以由工作人員來(lái)執(zhí)行。
步驟208:展示該匹配度對(duì)應(yīng)第二名稱(chēng)對(duì)應(yīng)的文件B,進(jìn)一步確認(rèn)該文件B是否為當(dāng)前業(yè)務(wù)所需的文件,若是,則執(zhí)行步驟207。
在該步驟中,可以由辦事機(jī)構(gòu)的工作人員來(lái)確定該展示的文件B是否為當(dāng)前業(yè)務(wù)所需的文件。
步驟209:根據(jù)未匹配成功的文件A的第三名稱(chēng),通知用戶A提交該第三名稱(chēng)的文件。
其中,該未匹配成功的文件A為:身份證復(fù)印件和存款清單。
步驟210:對(duì)用戶A提交的該第三名稱(chēng)的文件進(jìn)行掃描,得到電子版的文件,并將電子版的文件與該用戶A相關(guān)聯(lián),并根據(jù)每一個(gè)第三名稱(chēng),對(duì)電子版的文件進(jìn)行存儲(chǔ)。
在對(duì)用戶A提交的身份證復(fù)印件和存款清單進(jìn)行存儲(chǔ)時(shí),將該身份證復(fù)印件和存款清單與用戶A的標(biāo)識(shí)相關(guān)聯(lián),以保證可以根據(jù)用戶A的標(biāo)識(shí)查找到身份證復(fù)印件和存款清單。該標(biāo)識(shí)可以包括:身份證號(hào)或護(hù)照號(hào)。
如圖4、圖5所示,本發(fā)明實(shí)施例提供了一種文件比對(duì)裝置。裝置實(shí)施例可以通過(guò)軟件實(shí)現(xiàn),也可以通過(guò)硬件或者軟硬件結(jié)合的方式實(shí)現(xiàn)。從硬件層面而言,如圖4所示,為本發(fā)明實(shí)施例提供的文件比對(duì)裝置所在設(shè)備的一種硬件結(jié)構(gòu)圖,除了圖4所示的處理器、內(nèi)存、網(wǎng)絡(luò)接口、以及非易失性存儲(chǔ)器之外,實(shí)施例中裝置所在的設(shè)備通常還可以包括其他硬件,如負(fù)責(zé)處理報(bào)文的轉(zhuǎn)發(fā)芯片等等。以軟件實(shí)現(xiàn)為例,如圖5所示,作為一個(gè)邏輯意義上的裝置,是通過(guò)其所在設(shè)備的CPU將非易失性存儲(chǔ)器中對(duì)應(yīng)的計(jì)算機(jī)程序指令讀取到內(nèi)存中運(yùn)行形成的。本實(shí)施例提供的文件比對(duì)裝置,包括:
第一確定單元501,用于確定目標(biāo)用戶當(dāng)前所需辦理的第一業(yè)務(wù),以及確定對(duì)應(yīng)所述第一業(yè)務(wù)的至少一個(gè)第一文件的名稱(chēng);
第一獲取單元502,用于獲取與所述目標(biāo)用戶對(duì)應(yīng)的至少一個(gè)第二文件的名稱(chēng);
第二確定單元503,用于針對(duì)每一個(gè)第一文件的名稱(chēng),逐個(gè)確定與各個(gè)第二文件的名稱(chēng)的匹配度;
加載單元504,用于根據(jù)確定的各個(gè)匹配度,將匹配成功的第二文件進(jìn)行加載。
在本發(fā)明一個(gè)實(shí)施例中,可以進(jìn)一步包括:
第二獲取單元,用于獲取所述目標(biāo)用戶在辦理第二業(yè)務(wù)時(shí)提交的至少一個(gè)第二文件,以及獲取每一個(gè)第二文件對(duì)應(yīng)的電子文件;
配置單元,用于為每一個(gè)第二文件對(duì)應(yīng)的電子文件配置相應(yīng)的名稱(chēng);
存儲(chǔ)單元,用于存儲(chǔ)每一個(gè)第二文件對(duì)應(yīng)的電子文件及其相應(yīng)的名稱(chēng)。
在本發(fā)明一個(gè)實(shí)施例中,所述第二確定單元,具體用于通過(guò)下述方式確定當(dāng)前第一文件的第一名稱(chēng)與當(dāng)前第二文件的第二名稱(chēng)的匹配度:
將所述第一名稱(chēng)和所述第二名稱(chēng)分別進(jìn)行分詞處理;
針對(duì)所述第一名稱(chēng)對(duì)應(yīng)的每一個(gè)分詞,分別與所述第二名稱(chēng)對(duì)應(yīng)的各個(gè)分詞進(jìn)行比對(duì),并根據(jù)下述公式計(jì)算所述第一名稱(chēng)與所述第二名稱(chēng)的匹配度:
S=(M1)/(M0)
其中,S用于表征所述第一名稱(chēng)與所述第二名稱(chēng)的匹配度,M0用于表征所述第一名稱(chēng)在與第二名稱(chēng)進(jìn)行分詞處理后分詞的總個(gè)數(shù),其中,所述總個(gè)數(shù)中包括的分詞兩兩各不相同,M1用于表征所述第一名稱(chēng)在與第二名稱(chēng)進(jìn)行比對(duì)時(shí)比對(duì)結(jié)果相同時(shí)對(duì)應(yīng)的次數(shù)。
在本發(fā)明一個(gè)實(shí)施例中,進(jìn)一步包括:設(shè)定單元,用于設(shè)定第一閾值范圍和第二閾值范圍;
進(jìn)一步包括:處理單元,用于在匹配度位于所述第一閾值范圍時(shí),確定匹配成功;在匹配度位于所述第二閾值范圍時(shí),展示該匹配度對(duì)應(yīng)的第二文件,以供進(jìn)一步確認(rèn)該展示的第二文件是否為需要的第一文件。
在本發(fā)明一個(gè)實(shí)施例中,所述第一閾值范圍包括:[90%,100%];
所述第一閾值范圍包括:[60%,90%)。
綜上,本發(fā)明各個(gè)實(shí)施例具體如下有益效果:
1、在本發(fā)明實(shí)施例中,通過(guò)確定當(dāng)前所需辦理的第一業(yè)務(wù),以及對(duì)應(yīng)第一業(yè)務(wù)的至少一個(gè)第一文件的名稱(chēng),以及獲取與目標(biāo)用戶對(duì)應(yīng)的至少一個(gè)第二文件的名稱(chēng),通過(guò)針對(duì)每一個(gè)第一文件的名稱(chēng),逐個(gè)確定與各個(gè)第二文件的名稱(chēng)的匹配度,在匹配成功時(shí),將匹配成功的第二文件進(jìn)行加載,加載的該第二文件可以用在第一業(yè)務(wù)中,無(wú)需用戶提高該加載的第二文件,從而可以提高辦事效率。
2、在本發(fā)明實(shí)施例中,通過(guò)設(shè)定第一閾值范圍和第二閾值范圍,可以確定在匹配度位于第一閾值范圍時(shí),確定匹配成功。而由于不同的業(yè)務(wù)對(duì)同一個(gè)文件的命名不同,因此,即使匹配度位于第二閾值范圍,也可能是同一個(gè)文件,因此,對(duì)于匹配度位于第二閾值范圍內(nèi)時(shí),可以展示該匹配度對(duì)應(yīng)的第二文件,以供進(jìn)一步的確定,從而可以進(jìn)一步提高匹配成功的概率。
上述裝置內(nèi)的各單元之間的信息交互、執(zhí)行過(guò)程等內(nèi)容,由于與本發(fā)明方法實(shí)施例基于同一構(gòu)思,具體內(nèi)容可參見(jiàn)本發(fā)明方法實(shí)施例中的敘述,此處不再贅述。
需要說(shuō)明的是,在本文中,諸如第一和第二之類(lèi)的關(guān)系術(shù)語(yǔ)僅僅用來(lái)將一個(gè)實(shí)體或者操作與另一個(gè)實(shí)體或操作區(qū)分開(kāi)來(lái),而不一定要求或者暗示這些實(shí)體或操作之間存在任何這種實(shí)際的關(guān)系或者順序。而且,術(shù)語(yǔ)“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過(guò)程、方法、物品或者設(shè)備不僅包括那些要素,而且還包括沒(méi)有明確列出的其他要素,或者是還包括為這種過(guò)程、方法、物品或者設(shè)備所固有的要素。在沒(méi)有更多限制的情況下,由語(yǔ)句“包括一個(gè)······”限定的要素,并不排除在包括所述要素的過(guò)程、方法、物品或者設(shè)備中還存在另外的相同因素。
本領(lǐng)域普通技術(shù)人員可以理解:實(shí)現(xiàn)上述方法實(shí)施例的全部或部分步驟可以通過(guò)程序指令相關(guān)的硬件來(lái)完成,前述的程序可以存儲(chǔ)在計(jì)算機(jī)可讀取的存儲(chǔ)介質(zhì)中,該程序在執(zhí)行時(shí),執(zhí)行包括上述方法實(shí)施例的步驟;而前述的存儲(chǔ)介質(zhì)包括:ROM、RAM、磁碟或者光盤(pán)等各種可以存儲(chǔ)程序代碼的介質(zhì)中。
最后需要說(shuō)明的是:以上所述僅為本發(fā)明的較佳實(shí)施例,僅用于說(shuō)明本發(fā)明的技術(shù)方案,并非用于限定本發(fā)明的保護(hù)范圍。凡在本發(fā)明的精神和原則之內(nèi)所做的任何修改、等同替換、改進(jìn)等,均包含在本發(fā)明的保護(hù)范圍內(nèi)。