一種確定商品配送范圍的方法和裝置制造方法
【專利摘要】本發(fā)明提供一種確定商品配送范圍的方法和裝置,能夠比較高效地確定各個配送員的配送范圍,有助于提高配送速度。本發(fā)明的確定商品配送范圍的方法包括:步驟A:對于預選的包含配送員信息的多個歷史配送地址,使用查找重復串的方式確定初始詞庫;步驟B:對所述初始詞庫進行過濾得到過濾詞庫;其中,使該過濾詞庫中的各個代表詞分別對應一個或幾個配送地址,并且每個代表詞所在的配送地址由一個配送員配送;步驟C:對于所述過濾詞庫中的各個代表詞,按其對應的配送地址的地理位置接近的原則對這些代表詞進行聚類;步驟D:對于聚類得到的各類的代表詞,將每一類代表詞對應的多個配送地址作為一個商品配送范圍。
【專利說明】一種確定商品配送范圍的方法和裝置
【技術領域】
[0001]本發(fā)明涉及計算機【技術領域】,特別地涉及一種確定商品配送范圍的方法和裝置。
【背景技術】
[0002]隨著電子商務的不斷發(fā)展,網(wǎng)上購物成為越來越常見的購物方式。在網(wǎng)上購物之后,商品將被配送員送達用戶指定的配送地址。各個配送員各自負責不同的配送范圍,配送范圍是多個配送地址組成的集合。商品在配送站要經(jīng)過人工分揀,使配送員確定屬于自己負責的配送范圍的商品。這種人工分揀的效率比較低,影響了配送速度。
【發(fā)明內(nèi)容】
[0003]有鑒于此,本發(fā)明提供一種確定商品配送范圍的方法和裝置,能夠比較高效地確定各個配送員的配送范圍,有助于提高配送速度。
[0004]為實現(xiàn)上述目的,根據(jù)本發(fā)明的一個方面,提供了一種確定商品配送范圍的方法。
[0005]本發(fā)明的確定商品配送范圍的方法包括:步驟A:對于預選的包含配送員信息的多個歷史配送地址,使用查找重復串的方式確定初始詞庫;步驟B:對所述初始詞庫進行過濾得到過濾詞庫;其中,使該過濾詞庫中的各個代表詞分別對應一個或幾個配送地址,并且每個代表詞所在的配送地址由一個配送員配送;步驟C:對于所述過濾詞庫中的各個代表詞,按其對應的配送地址的地理位置接近的原則對這些代表詞進行聚類;步驟D:對于聚類得到的各類的代表詞,將每一類代表詞對應的多個配送地址作為一個商品配送范圍。
[0006]可選地,在所述步驟B之前,還包括:對步驟A中確定出的初始詞庫進行去重處理。
[0007]可選地,所述步驟B中的過濾包括第一級過濾和第二級過濾;所述第一級過濾包括:計算所述初始詞庫中各個詞在所述初始詞庫中的詞頻與該詞在指定城市的所有地址中出現(xiàn)的詞頻的比值,取該比值大于預設閾值的詞構成中間過濾詞庫;所述第二級過濾包括:按如下步驟I至步驟3進行計算代表詞對應的平均值,若步驟3中計算得到的平均值小于預選閾值,則舍棄該平均值大于預選閾值的代表詞并且再次執(zhí)行步驟I至步驟3,直至選擇的每個代表詞對應的所述平均值小于所述預選閾值,然后將選擇的代表詞組成所述過濾詞庫:步驟1:從每一個所述歷史配送地址中選擇代表詞,該代表詞屬于所述中間過濾詞庫,并且是該代表詞所在地址中的在所述中間過濾詞庫中詞頻最高的詞;步驟2:對每個選擇的代表詞,按如下公式計算一日的熵:
【權利要求】
1.一種確定商品配送范圍的方法,其特征在于,包括: 步驟A:對于預選的包含配送員信息的多個歷史配送地址,使用查找重復串的方式確定初始詞庫; 步驟B:對所述初始詞庫進行過濾得到過濾詞庫;其中,使該過濾詞庫中的各個代表詞分別對應一個或幾個配送地址,并且每個代表詞所在的配送地址由一個配送員配送; 步驟C:對于所述過濾詞庫中的各個代表詞,按其對應的配送地址的地理位置接近的原則對這些代表詞進行聚類; 步驟D:對于聚類得到的各類的代表詞,將每一類代表詞對應的多個配送地址作為一個商品配送范圍。
2.根據(jù)權利要求1所述的方法,其特征在于,在所述步驟B之前,還包括:對步驟A中確定出的初始詞庫進行去重處理。
3.根據(jù)權利要求1所述的方法,其特征在于,所述步驟B中的過濾包括第一級過濾和第二級過濾; 所述第一級過濾包括: 計算所述初始詞庫中各個詞在所述初始詞庫中的詞頻與該詞在指定城市的所有地址中出現(xiàn)的詞頻的比值,取該比值大于預設閾值的詞構成中間過濾詞庫; 所述第二級過濾包括: 按如下步驟I至步驟3進行計算代表詞對應的平均值,若步驟3中計算得到的平均值小于預選閾值,則舍棄該平均值大于預選閾值的代表詞并且再次執(zhí)行步驟I至步驟3,直至選擇的每個代表詞對應的所述平均值小于所述預選閾值,然后將選擇的代表詞組成所述過濾詞庫: 步驟1:從每一個所述歷史配送地址中選擇代表詞,該代表詞屬于所述中間過濾詞庫,并且是該代表詞所在地址中的在所述中間過濾詞庫中詞頻最高的詞; 步驟2:對每個選擇的代表詞,按如下公式計算一日的熵:
其中τ表示包含該選擇的代表詞的所有配送地址在該日對應的配送員數(shù)目,P表示所述對應的配送員中每個配送員在該日的配送地址數(shù)占該所有地址的比例; 步驟3:對每個選擇的代表詞,計算預設數(shù)目的多日的熵的平均值并作為該代表詞對應的平均值。
4.根據(jù)權利要求1至3中任一項所述的方法,其特征在于,所述步驟C包括: 根據(jù)如下公式計算所述過濾詞庫中的所有代表詞兩兩之間的權重:
其中表示第I1個代表詞和第i2個代表詞之間的權重,L表示釆樣天數(shù),M表示在L天內(nèi)所述過濾詞庫中的所有代表詞所在的配送地址對應的所有配送員的數(shù)目,aijk表示第k天,第i個代表詞所在的配送地址由第j個配送員配送的數(shù)量; 對所述過濾詞庫中的所有詞按所述權重構成鄰接矩陣,然后得出該鄰接矩陣對應的拉普拉斯矩陣; 將所述拉普拉斯矩陣的前K個最小的特征值對應的特征向量排列組成NXK的矩陣,其中N表示所述過濾詞庫中的代表詞的數(shù)量; 采用K-mans算法對所述NXK的矩陣按行進行聚類,將聚類之后的同一類的行對應的代表詞作為同一類的代表詞。
5.一種確定商品配送范圍的裝置,其特征在于,包括: 初始詞庫模塊,用于對于預選的包含配送員信息的多個歷史配送地址,使用查找重復串的方式確定多個代表詞得到初始詞庫; 過濾模塊,用于對所述初始詞庫進行過濾得到過濾詞庫;其中,使該過濾詞庫中的各個代表詞分別對應一個或幾個配送地址,并且每個代表詞所在的配送地址由一個配送員配送; 聚類模塊,用于對于所述過濾詞庫中的各個代表詞,按其對應的配送地址的地理位置接近的原則對這些代表詞進行聚類; 確定模塊,用于對于聚類得到的各類的代表詞,將每一類代表詞對應的多個配送地址作為一個商品配送范圍。
6.根據(jù)權利要求5所述的裝置,其特征在于,還包括去重模塊,用于對所述初始詞庫模塊得到的詞庫中的多個代表詞進行去重處理。
7.根據(jù)權利要求5所述的裝置,其特征在于,所述過濾模塊還用于對所述初始詞庫進行第一級過濾和第二級過濾; 所述第一級過濾包括: 計算所述初始詞庫中各個詞在所述初始詞庫中的詞頻與該詞在指定城市的所有地址中出現(xiàn)的詞頻的比值,取該比值大于預設閾值的詞構成中間過濾詞庫; 所述第二級過濾包括: 按如下步驟I至步驟3進行計算代表詞對應的平均值,若步驟3中計算得到的平均值小于預選閾值,則舍棄該平均值大于預選閾值的代表詞并且再次執(zhí)行步驟I至步驟3,直至選擇的每個代表詞對應的所述平均值小于所述預選閾值,然后將選擇的代表詞組成所述過濾詞庫: 步驟1:從每一個所述歷史配送地址中選擇代表詞,該代表詞屬于所述中間過濾詞庫,并且是該代表詞所在地址中的在所述中間過濾詞庫中詞頻最高的詞; 步驟2:對每個選擇的代表詞,按如下公式計算一日的熵:
其中T表示包含該選擇的代表詞的所有配送地址在該日對應的配送員數(shù)目,P表示所述對應的配送員中每個配送員在該日的配送地址數(shù)占該所有地址的比例; 步驟3:對每個選擇的代表詞,計算預設數(shù)目的多日的熵的平均值并作為該代表詞對應的平均值。
8.根據(jù)權利要求5所述的裝置,其特征在于,所述聚類模塊還用于:根據(jù)如下公式計算所述過濾詞庫中的所有代表詞兩兩之間的權重:
其中WV2表示第I1個代表詞和第J個代表詞之間的權重,L表示采樣天數(shù),M表示在L天內(nèi)所述過濾詞庫中的所有代表詞所在的配送地址對應的所有配送員的數(shù)目,a,Jk表示第k天,第i個代表詞所在的配送地址由第j個配送員配送的數(shù)量; 對所述過濾詞庫中的所有詞按所述權重構成鄰接矩陣,然后得出該鄰接矩陣對應的拉普拉斯矩陣; 將所述拉普拉斯矩陣的前K個最小的特征值對應的特征向量排列組成NX K的矩陣,其中N表示所述過濾詞庫中的代表詞的數(shù)量; 采用K-mans算法對所述NXK的矩陣按行進行聚類,將聚類之后的同一類的行對應的代表詞作為同一類的代表詞。
【文檔編號】G06F17/30GK104200369SQ201410427376
【公開日】2014年12月10日 申請日期:2014年8月27日 優(yōu)先權日:2014年8月27日
【發(fā)明者】布如國, 牟川, 鐘超 申請人:北京京東尚科信息技術有限公司, 北京京東世紀貿(mào)易有限公司