基于關(guān)鍵詞數(shù)據(jù)庫檢索的快遞分揀裝置及方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及快遞分揀技術(shù)領(lǐng)域,具體地說,涉及一種基于關(guān)鍵詞數(shù)據(jù)庫檢索的快遞分揀裝置及方法。
【背景技術(shù)】
[0002]現(xiàn)有的快遞分揀多為人工分揀,由工作人員根據(jù)快遞面單地址來手工分配快遞的中轉(zhuǎn)或末端派件站點??爝f分揀人員不但需要記憶大量地址信息,還要根據(jù)城市和站點變化隨時更新,記憶難度之大,可想而知。所以,不可避免的有分揀錯誤、效率低下且覆蓋面窄的問題。另一些為半自動分揀,既通過人工設(shè)定一些地址關(guān)鍵詞數(shù)據(jù),采用基于詞典的字符串匹配分詞算法,關(guān)鍵詞作為詞典的部分或全部,借助計算機(jī)輔助進(jìn)行派件站點識別。在這類半自動分揀中,由于實際快遞地址規(guī)模龐大且書寫方式多樣,需要大量的人力和時間來整理關(guān)鍵詞數(shù)據(jù),維護(hù)開銷大、變更不及時且容易出錯。
【發(fā)明內(nèi)容】
[0003]為了克服現(xiàn)有技術(shù)的上述缺陷,本發(fā)明提供了一種快遞分揀裝置。根據(jù)本發(fā)明的快遞分揀裝置,其包括:
[0004]歷史派件地址數(shù)據(jù)庫,其用于記載歷史派件地址信息,歷史派件地址信息包括由至少一個歷史派件地址組成的歷史派件地址集合;
[0005]站點派送區(qū)域數(shù)據(jù)庫,其用于記載由至少一個投遞站點組成的投遞站點集合,任一投遞站點均包括由與該投遞站點對應(yīng)的至少一個派件點組成的派件點集合;
[0006]經(jīng)瑋度解析模塊,其用于將所述至少一個歷史派件地址對應(yīng)解析為至少一個歷史派件地址經(jīng)瑋度信息,并用于將所有派件點對應(yīng)解析成所有派件點經(jīng)瑋度信息;
[0007]映射處理模塊,其用于對所述至少一個歷史派件地址經(jīng)瑋度信息與所有派件點經(jīng)瑋度信息進(jìn)行處理,以得到歷史派件地址集合到投遞站點集合的映射;
[0008]第一分詞模塊,其用于對所述至少一個歷史派件地址進(jìn)行分詞以對應(yīng)得到至少一個關(guān)鍵詞集合,任一關(guān)鍵詞集合均包括至少一個關(guān)鍵詞,所有關(guān)鍵詞經(jīng)映射處理模塊進(jìn)行處理以得到所有關(guān)鍵詞在所述至少一個投遞站點中的關(guān)鍵詞分布信息;
[0009]統(tǒng)計處理模塊,其用于對關(guān)鍵詞分布信息進(jìn)行處理以得到所有關(guān)鍵詞在任一投遞站點中的出現(xiàn)頻率,并將在任一投遞站點處出現(xiàn)概率不低于設(shè)定第一閾值的關(guān)鍵詞作為該投遞站點的有效關(guān)鍵詞;
[0010]檢索數(shù)據(jù)庫,其用于記載所有有效關(guān)鍵詞和所述至少一個投遞站點的信息,并建立所有有效關(guān)鍵詞到所述至少一個投遞站點的映射;
[0011 ] 地址采集模塊,其用于采集待派件地址;
[0012]第二分詞模塊,其用于對待派件地址進(jìn)行分詞以得到至少一個檢索關(guān)鍵詞,并將所述至少一個檢索關(guān)鍵詞發(fā)送至檢索數(shù)據(jù)庫以對應(yīng)得到的至少一個待篩選投遞站點;
[0013]解析模塊,其用于對所述至少一個待篩選投遞站點進(jìn)行處理以得到任一待篩選投遞站點的出現(xiàn)頻率,并將出現(xiàn)概率不低于設(shè)定第二閾值的待篩選投遞站點作為待投遞投遞站點;以及
[0014]輸出模塊,其用于輸出待投遞投遞站點。
[0015]本發(fā)明的快遞分揀裝置中,能夠根據(jù)歷史派件地址而建立檢索數(shù)據(jù)庫,由于歷史派件地址能夠存儲在歷史派件地址數(shù)據(jù)庫中,而地址采集模塊處采集的當(dāng)前派件地址信息也能夠發(fā)送給歷史派件地址數(shù)據(jù)庫,故歷史派件地址數(shù)據(jù)庫由能夠?qū)崟r更新歷史派件地址,使得檢索數(shù)據(jù)庫也能夠?qū)崟r進(jìn)行更新,從而使得檢索數(shù)據(jù)庫具備較佳地實時性,進(jìn)而較佳地提高了分揀準(zhǔn)確率。
[0016]其次,檢索數(shù)據(jù)庫中能夠?qū)﹃P(guān)鍵詞和所有投遞站點進(jìn)行映射,從而能夠根據(jù)關(guān)鍵詞得到待投遞投遞站點,進(jìn)而大大簡化了分揀操作,能夠得到較佳的分揀效率。
[0017]本發(fā)明的快遞分揀裝置中,第一分詞模塊和第二分詞模塊均能夠包括兩個分別用于定義分詞的最長字串和最短字段的定義模塊,從而較佳地保證了能夠找到派件地址的所有可能的字串,提尚了檢索數(shù)據(jù)庫建立和分棟的準(zhǔn)確性。
[0018]作為優(yōu)選,設(shè)定第一閾值為65%?95%。
[0019]本發(fā)明的快遞分揀裝置中,第一閾值能夠設(shè)為65%?95%,從而能夠較多的較準(zhǔn)確的獲取有效關(guān)鍵詞,進(jìn)而較佳地保證了分揀的準(zhǔn)確性。
[0020]作為優(yōu)選,設(shè)定第二閾值為60%?85%。
[0021]本發(fā)明的快遞分揀裝置中,第二閾值能夠設(shè)為60%?85%,從而能夠在保證較為精準(zhǔn)獲取待投遞投遞站點的同時,也較佳地減少了因待篩選投遞站點的數(shù)量較少而導(dǎo)致的解析失敗。
[0022]作為優(yōu)選,地址采集模塊包括用于提取電子面單中派件地址信息的第一輸入模塊,用于提取手寫面單中地址信息的第二輸入模塊,以及用于識別文字的第三輸入模塊。
[0023]本發(fā)明的快遞分揀裝置中,地址采集模塊能夠包括多種類型的輸入模塊,從而能夠較佳地適應(yīng)多種不同類型的快遞面單。
[0024]本發(fā)明提供了一種基于上述任一快遞分揀裝置的快遞分揀方法。根據(jù)本發(fā)明的快遞分揀方法,其包括以下步驟:
[0025]—、構(gòu)建關(guān)鍵詞與投遞站點映射的檢索數(shù)據(jù)庫;
[0026]二、對待派件地址進(jìn)行分詞以得到檢索關(guān)鍵詞;
[0027]三、將檢索關(guān)鍵詞發(fā)送至檢索數(shù)據(jù)庫中,進(jìn)而得到與待派件地址對應(yīng)的待投遞投遞站點。
[0028]本發(fā)明的快遞分揀方法中,能夠以向檢索數(shù)據(jù)庫內(nèi)查詢檢索關(guān)鍵詞的方式而獲取待派件地址,從而能夠較佳地提高分揀效率。其次,由于檢索數(shù)據(jù)庫能夠自動建立,從而使得檢索數(shù)據(jù)庫便于維護(hù)且能夠?qū)崟r更新,進(jìn)而保證了分揀的準(zhǔn)確性和及時性。
[0029]作為優(yōu)選,步驟一包括以下步驟,
[0030](I)從歷史派件地址數(shù)據(jù)庫中提取所有歷史派件地址信息;
[0031](2)從站點派送區(qū)域數(shù)據(jù)庫中提取所有投遞站點信息;
[0032](3)采用經(jīng)瑋度解析模塊對所有歷史派件地址信息和所有投遞站點的投遞區(qū)域信息進(jìn)行經(jīng)瑋度解析,從而得到所有歷史派件地址經(jīng)瑋度信息和所有投遞站點的投遞區(qū)域經(jīng)瑋度信息;
[0033](4)采用映射處理模塊對所有歷史派件地址經(jīng)瑋度信息和所有投遞站點的投遞區(qū)域經(jīng)瑋度信息進(jìn)行處理,從而得到所有歷史派件地址與所有投遞站點間的映射關(guān)系;
[0034](5)采用第一分詞模塊逐個對所有歷史派件地址進(jìn)行分詞以對應(yīng)得到至少一個關(guān)鍵詞;
[0035](6)根據(jù)步驟(4)中所有歷史派件地址與所有投遞站點間的映射關(guān)系,得到所有關(guān)鍵詞在所述所有投遞站點中的關(guān)鍵詞分布信息;
[0036](7)采用統(tǒng)計處理模塊對關(guān)鍵詞分布信息進(jìn)行處理以得到所有關(guān)鍵詞在任一投遞站點中的出現(xiàn)頻率,并將在任一投遞站點處出現(xiàn)概率不低于設(shè)定第一閾值的關(guān)鍵詞作為該投遞站點的有效關(guān)鍵詞;
[0037](8)建立所有有效關(guān)鍵詞到所有投遞站點的映射,從而得到檢索數(shù)據(jù)庫。
[0038]本發(fā)明的快遞分揀方法中,站點派送區(qū)域數(shù)據(jù)庫能夠用于記載由所有投遞站點組成的投遞站點集合,任一投遞站點均能夠包括由與該投遞站點對應(yīng)的所有派件點組成的派件點集合,而經(jīng)瑋度解析模塊能夠采用提供API接口的第三方GIS引擎,例如百度地圖、高德地圖、MAPABC等,從而通過API接口向第三方GIS引擎中輸入地址信息即可得到與該地址信息對應(yīng)的經(jīng)瑋度信息,從而大大簡化了檢索數(shù)據(jù)庫的建立難度。另外,通過判定經(jīng)瑋度的方法將所有歷史派件地址與所有投遞站點進(jìn)行對應(yīng)時,能夠較為準(zhǔn)確地獲取對應(yīng)關(guān)系。
[0039]其次,第一分詞模塊能夠采用隨意分詞方法,即能夠?qū)Ψ衷~的最長字串和最短字段依次進(jìn)行定義,從而較佳地保證了能夠找到派件地址的所有可能的字串,提高了檢索數(shù)據(jù)庫的建立準(zhǔn)確性。
[0040]作為優(yōu)選,步驟(7)中,設(shè)定第一閾值為65%?95%。
[0041]本發(fā)明的快遞分揀方法中,第一閾值能夠設(shè)為65%?95%,從而能夠較多的較準(zhǔn)確的獲取有效關(guān)鍵詞,進(jìn)而較佳地保證了分揀的準(zhǔn)確性。
[0042]作為優(yōu)選,步驟二包括以下步驟,
[0043]A、獲取待派件地址;
[0044]B、對待派件地址進(jìn)行分詞以獲得至少一個檢索關(guān)鍵詞。
[0045]本發(fā)明的快遞分揀方法中,待派件地址進(jìn)行分詞的分詞方法能夠采用隨意分詞方法,即能夠?qū)Ψ衷~的最長字串和最短字段依次進(jìn)行定義,從而較佳地保證了能夠找到派件地址的所有可能的字串,提高了分揀的準(zhǔn)確性。
[0046]作為優(yōu)選,步驟三包括以下步驟,
[0047]C、將所述至少一個檢索關(guān)鍵詞發(fā)送給檢索數(shù)據(jù)庫,以對應(yīng)得到至少一個待篩選投遞站點;
[0048]D、將在所述至少一個待篩選投遞站點中出現(xiàn)概率不低于設(shè)定第二閾值的待篩選投遞站點作為待投遞投遞站點,并經(jīng)輸出模塊輸出。
[0049]本發(fā)明的快遞分揀方法中,能夠基于檢索數(shù)據(jù)庫對待投遞投遞站點進(jìn)行查詢,從而大大簡化了分揀過程并具備較佳的分揀準(zhǔn)確性。
[0050]作為優(yōu)選,步驟D中,設(shè)定第二閾值為60 %?85 %。
[0051]本發(fā)明的快遞分揀方法中,第二閾值能夠設(shè)為60%?85%,從而能夠在保證較為精準(zhǔn)獲取待投遞投遞站點的同時,也較佳地減少了因待篩選投遞站點的數(shù)量較少而導(dǎo)致的解析失敗。
【附圖說明】
[0052]圖1為實施例1中一種快遞分