一種識(shí)別預(yù)設(shè)地址的方法及裝置制造方法
【專利摘要】本公開提供了一種識(shí)別預(yù)設(shè)地址的方法及裝置,屬于計(jì)算機(jī)【技術(shù)領(lǐng)域】。所述方法包括:將待識(shí)別的地址在預(yù)先生成的詞匯樹中進(jìn)行遍歷查詢;根據(jù)待識(shí)別的地址在詞匯樹中匹配到的詞匯的相似值,計(jì)算待識(shí)別的地址與匹配到的詞匯對應(yīng)的至少一個(gè)預(yù)設(shè)地址之間的相似值;當(dāng)待識(shí)別的地址對應(yīng)的相似值大于預(yù)設(shè)相似值時(shí),則確定待識(shí)別的地址為預(yù)設(shè)地址。本公開預(yù)先生成的詞匯樹,對待識(shí)別的地址進(jìn)行遍歷查詢,并根據(jù)查詢到的詞匯的相似值計(jì)算待識(shí)別地址的相似值,以根據(jù)待識(shí)別的地址的相似值最終確定識(shí)別該待識(shí)別的地址是否屬于預(yù)設(shè)地址。避免了待識(shí)別的地址中增加了阻礙識(shí)別的字符后無法識(shí)別出預(yù)設(shè)地址的缺陷,提高了識(shí)別預(yù)設(shè)地址的準(zhǔn)確率。
【專利說明】一種識(shí)別預(yù)設(shè)地址的方法及裝置
【技術(shù)領(lǐng)域】
[0001]本公開涉及計(jì)算機(jī)【技術(shù)領(lǐng)域】,特別涉及一種識(shí)別預(yù)設(shè)地址的方法及裝置。
【背景技術(shù)】
[0002]隨著電子商務(wù)的發(fā)展,網(wǎng)絡(luò)購物已經(jīng)在人們的生活中越來越普及。在網(wǎng)絡(luò)購物中緊俏的商品會(huì)被不良用戶大量購入,從而影響正常用戶的購物體驗(yàn)。因此,電子商務(wù)網(wǎng)站有必要提供一種對大量購入的不良用戶進(jìn)行識(shí)別,以保護(hù)正常用戶購物體驗(yàn)的方法。
【發(fā)明內(nèi)容】
[0003]為了解決上述技術(shù)的問題,本公開實(shí)施例提供了一種識(shí)別預(yù)設(shè)地址的方法及裝置。所述技術(shù)方案如下:
[0004]一方面,提供了一種識(shí)別預(yù)設(shè)地址的方法,所述方法包括:
[0005]將待識(shí)別的地址在預(yù)先生成的詞匯樹中進(jìn)行遍歷查詢,其中所述詞匯樹中包含預(yù)先存儲(chǔ)的預(yù)設(shè)地址進(jìn)行分詞處理后的所有詞匯;
[0006]根據(jù)所述待識(shí)別的地址在所述詞匯樹中查詢到的詞匯的相似值,計(jì)算所述待識(shí)別的地址對應(yīng)的相似值;
[0007]當(dāng)所述待識(shí)別的地址對應(yīng)的相似值大于預(yù)設(shè)相似度時(shí),則確定所述待識(shí)別的地址為預(yù)設(shè)地址。
[0008]另一方面,提供了一種識(shí)別預(yù)設(shè)地址的裝置,所述裝置包括:
[0009]查詢模塊,用于將待識(shí)別的地址在預(yù)先生成的詞匯樹中進(jìn)行遍歷查詢,其中所述詞匯樹中包含預(yù)先存儲(chǔ)的預(yù)設(shè)地址進(jìn)行分詞處理后的所有詞匯;
[0010]第一計(jì)算模塊,用于根據(jù)所述待識(shí)別的地址在所述詞匯樹中查詢到的詞匯的相似值,計(jì)算所述待識(shí)別的地址對應(yīng)的相似值;
[0011]識(shí)別模塊,用于當(dāng)所述待識(shí)別的地址對應(yīng)的相似值大于預(yù)設(shè)相似度時(shí),則確定所述待識(shí)別的地址為預(yù)設(shè)地址。
[0012]還一方面,提供了一種服務(wù)器,其特征在于,包括有存儲(chǔ)器,以及一個(gè)或者一個(gè)以上的程序,其中一個(gè)或者一個(gè)以上程序存儲(chǔ)于存儲(chǔ)器中,且經(jīng)配置以由一個(gè)或者一個(gè)以上處理器執(zhí)行所述一個(gè)或者一個(gè)以上程序包含用于進(jìn)行以下操作的指令:
[0013]將待識(shí)別的地址在預(yù)先生成的詞匯樹中進(jìn)行遍歷查詢,其中所述詞匯樹中包含預(yù)先存儲(chǔ)的至少一個(gè)預(yù)設(shè)地址進(jìn)行分詞處理后的詞匯以及詞匯對應(yīng)的相似值;
[0014]根據(jù)所述待識(shí)別的地址在所述詞匯樹中匹配到的詞匯的相似值,計(jì)算所述待識(shí)別的地址與所述匹配到的詞匯對應(yīng)的至少一個(gè)預(yù)設(shè)地址之間的相似值;
[0015]當(dāng)所述待識(shí)別的地址對應(yīng)的相似值大于預(yù)設(shè)相似值時(shí),則確定所述待識(shí)別的地址為預(yù)設(shè)地址。
[0016]本公開實(shí)施例提供的技術(shù)方案帶來的有益效果是:
[0017]通過預(yù)先生成的詞匯樹,對待識(shí)別的地址進(jìn)行遍歷查詢,并根據(jù)查詢到的詞匯的相似值計(jì)算待識(shí)別地址的相似值,以根據(jù)待識(shí)別的地址的相似值最終確定識(shí)別該待識(shí)別的地址是否屬于預(yù)設(shè)地址。避免了待識(shí)別的地址中增加了阻礙識(shí)別的字符后無法識(shí)別出預(yù)設(shè)地址的缺陷,提高了識(shí)別預(yù)設(shè)地址的準(zhǔn)確率。
【專利附圖】
【附圖說明】
[0018]為了更清楚地說明本公開實(shí)施例中的技術(shù)方案,下面將對實(shí)施例描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本公開的一些實(shí)施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
[0019]圖1是本公開實(shí)施例一提供的識(shí)別預(yù)設(shè)地址的方法流程圖;
[0020]圖2是本公開實(shí)施例二提供的識(shí)別預(yù)設(shè)地址的方法中在歷史地址集合中確定預(yù)設(shè)地址的流程圖;
[0021]圖3是本公開實(shí)施例二提供的識(shí)別預(yù)設(shè)地址的方法中生成詞匯樹的流程圖;
[0022]圖4是本公開實(shí)施例二提供的識(shí)別預(yù)設(shè)地址的方法中生成的詞匯樹的結(jié)構(gòu)示意圖;
[0023]圖5是本公開實(shí)施例三提供的識(shí)別預(yù)設(shè)地址的方法流程圖;
[0024]圖6是本公開實(shí)施例四提供的識(shí)別預(yù)設(shè)地址的裝置結(jié)構(gòu)示意圖;
[0025]圖7是本公開實(shí)施例四提供的服務(wù)器設(shè)備的結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0026]為使本公開的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合附圖對本公開實(shí)施方式作進(jìn)一步地詳細(xì)描述。
[0027]實(shí)施例一
[0028]本公開實(shí)施例提供了一種識(shí)別預(yù)設(shè)地址的方法,參見圖1,方法流程包括:
[0029]在步驟101中,將待識(shí)別的地址在預(yù)先生成的詞匯樹中進(jìn)行遍歷查詢,其中所述詞匯樹中包含預(yù)先存儲(chǔ)的至少一個(gè)預(yù)設(shè)地址進(jìn)行分詞處理后的詞匯以及詞匯對應(yīng)的相似值,本實(shí)施例的方法用于服務(wù)器中;
[0030]在步驟102中,根據(jù)所述待識(shí)別的地址在所述詞匯樹中匹配到的詞匯的相似值,計(jì)算所述待識(shí)別的地址與所述匹配到的詞匯對應(yīng)的至少一個(gè)預(yù)設(shè)地址之間的相似值,本實(shí)施例的方法用于服務(wù)器中;
[0031]在步驟103中,當(dāng)所述待識(shí)別的地址對應(yīng)的相似值大于預(yù)設(shè)相似值時(shí),則確定所述待識(shí)別的地址為預(yù)設(shè)地址,本實(shí)施例的方法用于服務(wù)器中。
[0032]本公開實(shí)施例通過預(yù)先生成的詞匯樹,對待識(shí)別的地址進(jìn)行遍歷查詢,并根據(jù)查詢到的詞匯的相似值計(jì)算待識(shí)別地址的相似值,以根據(jù)待識(shí)別的地址的相似值最終確定識(shí)別該待識(shí)別的地址是否屬于預(yù)設(shè)地址。避免了待識(shí)別的地址中增加了阻礙識(shí)別的字符后無法識(shí)別出預(yù)設(shè)地址的缺陷,提高了識(shí)別預(yù)設(shè)地址的準(zhǔn)確率。
[0033]實(shí)施例二
[0034]本公開實(shí)施例提供了一種識(shí)別預(yù)設(shè)地址的方法中在歷史地址集合中確定預(yù)設(shè)地址的方法,參見圖2。[0035]其中,方法流程包括:
[0036]在步驟201中,在預(yù)先存儲(chǔ)的歷史地址集合中選取第一地址和第二地址,本實(shí)施例的方法用于服務(wù)器中。
[0037]首先,根據(jù)預(yù)設(shè)的區(qū)域信息和文字排列順序,對記錄的歷史地址集合中的地址進(jìn)行排序。
[0038]其中,歷史地址集合為歷史訂單中對應(yīng)的所有收貨地址的集合。地址是由省、市、區(qū)、街道、樓宇、門牌號等地址基礎(chǔ)信息,并按照當(dāng)前排列的地址基礎(chǔ)信息的排列順序組成的。
[0039]在生成詞匯樹的過程中,首先需要在歷史地址集合中對所有歷史地址進(jìn)行排序。由于省、市、區(qū)這幾個(gè)地址基礎(chǔ)信息中的區(qū)域信息是可以被標(biāo)準(zhǔn)化的,可以按照預(yù)設(shè)的省市區(qū)對應(yīng)的區(qū)域信息排列順序進(jìn)行排序,以表1為例,表1中描述的為預(yù)設(shè)的區(qū)域信息排列順序。
[0040]
【權(quán)利要求】
1.一種識(shí)別預(yù)設(shè)地址的方法,其特征在于,所述方法包括: 將待識(shí)別的地址在預(yù)先生成的詞匯樹中進(jìn)行遍歷查詢,其中所述詞匯樹中包含預(yù)先存儲(chǔ)的至少一個(gè)預(yù)設(shè)地址進(jìn)行分詞處理后的詞匯以及詞匯對應(yīng)的相似值; 根據(jù)所述待識(shí)別的地址在所述詞匯樹中匹配到的詞匯的相似值,計(jì)算所述待識(shí)別的地址與所述匹配到的詞匯對應(yīng)的至少一個(gè)預(yù)設(shè)地址之間的相似值; 當(dāng)所述待識(shí)別的地址對應(yīng)的相似值大于預(yù)設(shè)相似值時(shí),則確定所述待識(shí)別的地址為預(yù)設(shè)地址。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述將待識(shí)別的地址在預(yù)先生成的詞匯樹中進(jìn)行遍歷查詢之前,所述方法還包括: 將預(yù)先建立的預(yù)設(shè)地址庫中的預(yù)設(shè)地址進(jìn)行分詞處理,并記錄分詞后每個(gè)詞匯與其對應(yīng)的預(yù)設(shè)地址的對應(yīng)關(guān)系; 根據(jù)所述預(yù)設(shè)地址的字?jǐn)?shù)和所述每個(gè)詞匯的字?jǐn)?shù),計(jì)算所述每個(gè)詞匯在對應(yīng)的所述預(yù)設(shè)地址中的相似值; 根據(jù)預(yù)設(shè)的多模匹配算法,構(gòu)造包含所有詞匯的詞匯樹,其中所述詞匯樹中每個(gè)分支對應(yīng)每個(gè)詞匯,所述每個(gè)詞匯中的每個(gè)文字按順序作為每個(gè)分支中的每層節(jié)點(diǎn),所述每個(gè)詞匯的最后一個(gè)文字帶有結(jié)束狀態(tài)標(biāo)記點(diǎn)并指向所述詞匯樹的根節(jié)點(diǎn)。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述將待識(shí)別的地址在預(yù)先生成的詞匯樹中進(jìn)行遍歷查詢,包括: 根據(jù)所述待識(shí)別的地址中文字的排列順序,將所述待識(shí)別的地址中文字在所述詞匯樹中進(jìn)行遍歷查詢;` 當(dāng)在所述詞匯樹中遍歷到的文字帶有結(jié)束狀態(tài)標(biāo)記點(diǎn)時(shí),則確定當(dāng)前遍歷到的分支對應(yīng)的詞匯為匹配到的詞匯。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述根據(jù)所述待識(shí)別的地址在所述詞匯樹中匹配到的詞匯的相似值,計(jì)算所述待識(shí)別的地址與所述匹配到的詞匯對應(yīng)的至少一個(gè)預(yù)設(shè)地址之間相似值,包括: 根據(jù)預(yù)先存儲(chǔ)的每個(gè)詞匯與其對應(yīng)的預(yù)設(shè)地址的對應(yīng)關(guān)系,分別確定所述匹配到的詞匯所對應(yīng)的一個(gè)或多個(gè)預(yù)設(shè)地址,并確定所述匹配到的詞匯在所述一個(gè)或多個(gè)預(yù)設(shè)地址中的相似值; 計(jì)算所述待識(shí)別的地址在屬于同一個(gè)預(yù)設(shè)地址中匹配到的詞匯的相似值之和,并在計(jì)算后將相似值之和中的最大值確定為所述待識(shí)別的地址對應(yīng)的相似值。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述將待識(shí)別的地址在預(yù)先生成的詞匯樹中進(jìn)行遍歷查詢之前,所述方法還包括: 在預(yù)先存儲(chǔ)的歷史地址集合中選取第一地址和第二地址; 計(jì)算所述第一地址和所述第二地址之間的相似度; 當(dāng)所述第一地址和第二地址之間的相似度大于或等于預(yù)設(shè)相似度時(shí),則將所述第一地址和第二地址合并,并記錄合并后的地址的合并次數(shù); 當(dāng)所述合并后的地址的合并次數(shù)大于預(yù)設(shè)數(shù)值時(shí),則確定所述合并后的地址為預(yù)設(shè)地址,并將所述合并后的地址加入預(yù)先建立的預(yù)設(shè)地址庫中。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述將所述第一地址和第二地址合并,包括: 將所述第一地址和所述第二地址中字?jǐn)?shù)最多的地址作為合并后的地址。
7.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述將所述合并后的地址加入預(yù)先建立的預(yù)設(shè)地址庫中之后,所述方法還包括: 在所述預(yù)設(shè)地址庫中的預(yù)設(shè)地址中去除預(yù)設(shè)的門牌號信息和預(yù)設(shè)長度的數(shù)字。
8.一種識(shí)別預(yù)設(shè)地址的裝置,其特征在于,所述裝置包括: 查詢模塊,用于將待識(shí)別的地址在預(yù)先生成的詞匯樹中進(jìn)行遍歷查詢,其中所述詞匯樹中包含預(yù)先存儲(chǔ)的至少一個(gè)預(yù)設(shè)地址進(jìn)行分詞處理后的詞匯以及詞匯對應(yīng)的相似值;第一計(jì)算模塊,用于根據(jù)所述待識(shí)別的地址在所述詞匯樹中匹配到的詞匯的相似值,計(jì)算所述待識(shí)別的地址與所述匹配到的詞匯對應(yīng)的至少一個(gè)預(yù)設(shè)地址之間的相似值; 第一確定模塊,用于當(dāng)所述待識(shí)別的地址對應(yīng)的相似值大于預(yù)設(shè)相似值時(shí),則確定所述待識(shí)別的地址為預(yù)設(shè)地址。
9.根據(jù)權(quán)利要求8所述的裝置,其特征在于,所述裝置還包括: 分詞模塊,用于將預(yù)先建立的預(yù)設(shè)地址庫中的預(yù)設(shè)地址進(jìn)行分詞處理,并記錄分詞后每個(gè)詞匯與其對應(yīng)的預(yù)設(shè)地址的對應(yīng)關(guān)系; 第二計(jì)算模塊,用于根據(jù)所述預(yù)設(shè)地址的字?jǐn)?shù)和所述每個(gè)詞匯的字?jǐn)?shù),計(jì)算所述每個(gè)詞匯在對應(yīng)的所述預(yù)設(shè)地址中的相似值; 詞匯樹構(gòu)造模塊,用于根據(jù)預(yù)設(shè)的多模匹配算法,構(gòu)造包含所有詞匯的詞匯樹,其中所述詞匯樹中每個(gè)分支對應(yīng)每個(gè)詞匯,所述每個(gè)詞匯中的每個(gè)文字按順序作為每個(gè)分支中的每層節(jié)點(diǎn),所述每個(gè)詞匯的最后一個(gè)文字帶有結(jié)束狀態(tài)標(biāo)記點(diǎn)并指向所述詞匯樹的根節(jié)點(diǎn)。`
10.根據(jù)權(quán)利要求9所述的裝置,其特征在于,所述查詢模塊,包括: 查詢單元,用于根據(jù)所述待識(shí)別的地址中文字的排列順序,將所述待識(shí)別的地址中文字在所述詞匯樹中進(jìn)行遍歷查詢; 第一確定單元,用于當(dāng)在所述詞匯樹中遍歷到的文字帶有結(jié)束狀態(tài)標(biāo)記點(diǎn)時(shí),則確定當(dāng)前遍歷到的分支對應(yīng)的詞匯為匹配到的詞匯。
11.根據(jù)權(quán)利要求10所述的裝置,其特征在于,所述第一計(jì)算模塊,包括: 第二確定單元,用于根據(jù)預(yù)先存儲(chǔ)的每個(gè)詞匯與其對應(yīng)的預(yù)設(shè)地址的對應(yīng)關(guān)系,分別確定所述匹配到的詞匯所對應(yīng)的一個(gè)或多個(gè)預(yù)設(shè)地址,并確定所述匹配到的詞匯在所述一個(gè)或多個(gè)預(yù)設(shè)地址中的相似值; 計(jì)算單元,用于計(jì)算所述待識(shí)別的地址在屬于同一個(gè)預(yù)設(shè)地址中匹配到的詞匯的相似值之和,并在計(jì)算后將相似值之和中的最大值確定為所述待識(shí)別的地址對應(yīng)的相似值。
12.根據(jù)權(quán)利要求8所述的裝置,其特征在于,所述裝置還包括: 選取模塊,用于在預(yù)先存儲(chǔ)的歷史地址集合中選取第一地址和第二地址; 第三計(jì)算模塊,用于計(jì)算所述第一地址和所述第二地址之間的相似度; 合并模塊,用于當(dāng)所述第一地址和第二地址之間的相似度大于或等于預(yù)設(shè)相似度時(shí),則將所述第一地址和第二地址合并,并記錄合并后的地址的合并次數(shù); 第二確定模塊,用于當(dāng)所述合并后的地址的合并次數(shù)大于預(yù)設(shè)數(shù)值時(shí),則確定所述合并后的地址為預(yù)設(shè)地址,并將所述合并后的地址加入預(yù)先建立的預(yù)設(shè)地址庫中。
13.根據(jù)權(quán)利要求12所述的裝置,其特征在于,所述合并模塊用于: 將所述第一地址和所述第二地址中字?jǐn)?shù)最多的地址作為合并后的地址。
14.根據(jù)權(quán)利要求12所述的裝置,其特征在于,所述裝置還包括: 去除模塊,用于在所述預(yù)設(shè)地址庫中的預(yù)設(shè)地址中去除預(yù)設(shè)的門牌號信息和預(yù)設(shè)長度的數(shù)字。
15.一種服務(wù)器,其特征在于,包括有存儲(chǔ)器,以及一個(gè)或者一個(gè)以上的程序,其中一個(gè)或者一個(gè)以上程序存儲(chǔ)于存儲(chǔ)器中,且經(jīng)配置以由一個(gè)或者一個(gè)以上處理器執(zhí)行所述一個(gè)或者一個(gè)以上程序包含用于進(jìn)行以下操作的指令: 將待識(shí)別的地址在預(yù)先生成的詞匯樹中進(jìn)行遍歷查詢,其中所述詞匯樹中包含預(yù)先存儲(chǔ)的至少一個(gè)預(yù)設(shè)地址進(jìn)行分詞處理后的詞匯以及詞匯對應(yīng)的相似值; 根據(jù)所述待識(shí)別的地址在所述詞匯樹中匹配到的詞匯的相似值,計(jì)算所述待識(shí)別的地址與所述匹配到的詞匯對應(yīng)的至少一個(gè)預(yù)設(shè)地址之間的相似值; 當(dāng)所述待識(shí)別的地址對應(yīng)的相似值大于預(yù)設(shè)相似值時(shí),則確定所述待識(shí)別的地址為預(yù)設(shè)地址。`
【文檔編號】G06F17/30GK103678708SQ201310746785
【公開日】2014年3月26日 申請日期:2013年12月30日 優(yōu)先權(quán)日:2013年12月30日
【發(fā)明者】黃柏林, 李名進(jìn), 張曄 申請人:小米科技有限責(zé)任公司