專利名稱:一種更新互聯(lián)網(wǎng)協(xié)議ip地址庫的方法和裝置的制作方法
技術領域:
本申請涉及網(wǎng)絡技術領域,特別是涉及一種更新互聯(lián)網(wǎng)協(xié)議IP地址庫的方法和裝置。
背景技術:
hternet (互聯(lián)網(wǎng))依靠 TCP (Transmission Control Protocol,傳輸控制協(xié)議)/ IP (Internet Protocol,互聯(lián)網(wǎng)協(xié)議),在全球范圍內(nèi)實現(xiàn)不同硬件結構、不同操作系統(tǒng)、不 同網(wǎng)絡系統(tǒng)的互聯(lián)。在hternet上,每一個節(jié)點都依靠唯一的IP地址互相區(qū)分和相互聯(lián) 系。每一臺聯(lián)網(wǎng)的計算機無權自行設定IP地址,由互聯(lián)網(wǎng)數(shù)字分配機構(IANA,Internet Assigned Numbers Authority) : IP jfttlt白勺iSS。IP地址庫顧名思義就是存儲了 IP地址的數(shù)據(jù)庫,從理論上說,一個全面、準確的 IP地址庫能夠幫助使用者正確識別hternet上的每臺計算機。然而,目前網(wǎng)上IP地址庫 數(shù)據(jù)不是從IANA直接獲得,大都從民間搜集而來,IP地址信息不全、沒有詳細的實際地址 數(shù)據(jù)、實際地址只到省、市一級,因此,存在IP地址粒度較粗、實際地址錯誤的情況?,F(xiàn)有技術中,通常采用人工收集的方法對IP地址庫進行補充和校正。在實現(xiàn)本申請的過程中,發(fā)明人發(fā)現(xiàn)現(xiàn)有技術至少存在如下問題由于現(xiàn)有的IP地址庫采用人工收集的方法,因此不僅費時、費力,而且所能補充 和校正的數(shù)據(jù)量有限。
發(fā)明內(nèi)容
本申請?zhí)峁┮环N更新互聯(lián)網(wǎng)協(xié)議IP地址庫的方法和裝置,以提高IP地址的實際 地址的準確性和覆蓋率。本申請?zhí)岢鲆环N更新互聯(lián)網(wǎng)協(xié)議IP地址庫的方法,包括以下步驟獲取交易信息數(shù)據(jù)庫中的郵寄地址數(shù)據(jù),所述郵寄地址數(shù)據(jù)包括IP地址和地址 fn息;掃描所述郵寄地址數(shù)據(jù),獲取地址信息相同且IP地址連續(xù)的郵寄地址數(shù)據(jù)對應 的IP地址區(qū)段,以及所述IP地址區(qū)段對應的實際地址;根據(jù)所述IP地址區(qū)段對應的實際地址,更新IP地址庫。優(yōu)選地,所述獲取地址信息相同且IP地址連續(xù)的郵寄地址數(shù)據(jù)對應的IP地址區(qū) 段,以及所述IP地址區(qū)段對應的實際地址,具體包括獲取地址信息相同且IP地址連續(xù)的郵寄地址數(shù)據(jù)的個數(shù);判斷所述地址信息相同且IP地址連續(xù)的郵寄地址數(shù)據(jù)的個數(shù)是否大于預設閾 值;如果所述郵寄地址數(shù)據(jù)的個數(shù)大于所述預設閾值,則將所述郵寄地址數(shù)據(jù)的IP 地址合并到一個IP地址區(qū)段,并將所述郵寄地址數(shù)據(jù)中的相同的地址信息作為所述IP地 址區(qū)段對應的實際地址。
優(yōu)選地,所述掃描郵寄地址數(shù)據(jù)之前,還包括獲取IP地址庫數(shù)據(jù),IP地址庫數(shù)據(jù)包括IP地址和對應的地名信息;將所述IP地址庫數(shù)據(jù)和所述郵寄地址數(shù)據(jù)按照IP地址遞增或遞減的順序排列;根據(jù)所述IP地址庫數(shù)據(jù)的地名信息過濾所述郵寄地址數(shù)據(jù),刪除地址信息與對 應的IP地址庫數(shù)據(jù)的地名信息不匹配的郵寄地址數(shù)據(jù)。優(yōu)選地,所述地名信息包括以下內(nèi)容中的任意一項
國家地址、省級地址、市級地址和縣級地址。優(yōu)選地,所述根據(jù)IP地址區(qū)段對應的實際地址,更新IP地址庫,具體包括使用所述IP地址區(qū)段對應的實際地址,替換所述IP地址區(qū)段在所述IP地址庫中 對應的地名信息。本申請還提出一種更新IP地址庫的裝置,包括獲取模塊,用于獲取交易信息數(shù)據(jù)庫中的郵寄地址數(shù)據(jù),所述郵寄地址數(shù)據(jù)包括 IP地址和地址信息;掃描模塊,用于掃描所述獲取模塊獲取的郵寄地址數(shù)據(jù),獲取地址信息相同且IP 地址連續(xù)的郵寄地址數(shù)據(jù)對應的IP地址區(qū)段,以及所述IP地址區(qū)段對應的實際地址;更新模塊,用于根據(jù)所述掃描模塊獲取的IP地址區(qū)段對應的實際地址,更新IP地址庫。優(yōu)選地,所述的裝置,還包括過濾模塊,用于獲取IP地址庫數(shù)據(jù),IP地址庫數(shù)據(jù)包括IP地址和對應的地名信 息;將所述IP地址庫數(shù)據(jù)和所述郵寄地址數(shù)據(jù)按照IP地址遞增或遞減的順序排列,根據(jù)所 述IP地址庫數(shù)據(jù)的地名信息過濾所述獲取模塊獲取的郵寄地址數(shù)據(jù),刪除地址信息與對 應的IP地址庫數(shù)據(jù)的地名信息不匹配的郵寄地址數(shù)據(jù)。優(yōu)選地,所述過濾模塊,具體用于根據(jù)所述IP地址庫數(shù)據(jù)的以下地名信息的任意 一項過濾所述郵寄地址數(shù)據(jù) 國家地址、省級地址、市級地址和縣級地址。優(yōu)選地,所述掃描模塊,具體包括獲取子模塊,用于獲取地址信息相同且IP地址連續(xù)的郵寄地址數(shù)據(jù)的個數(shù);判斷子模塊,用于判斷所述獲取子模塊獲取的地址信息相同且IP地址連續(xù)的郵 寄地址數(shù)據(jù)的個數(shù)是否大于預設閾值;合并子模塊,用于在所述判斷子模塊判斷所述郵寄地址數(shù)據(jù)的個數(shù)大于所述預設 閾值時,將所述郵寄地址數(shù)據(jù)的IP地址合并到一個IP地址區(qū)段,并將所述郵寄地址數(shù)據(jù)中 的相同的地址信息作為所述IP地址區(qū)段對應的實際地址。優(yōu)選地,所述更新模塊,具體用于使用所述IP地址區(qū)段對應的實際地址,替換所 述IP地址區(qū)段在所述IP地址庫中對應的地名信息。本申請包括以下優(yōu)點,使用大量的郵寄地址數(shù)據(jù)對現(xiàn)有的IP地址庫中的實際地 址進行自動補充和校驗,準確性和覆蓋率較高;整個過程只需要對IP地址庫數(shù)據(jù)和郵寄地 址數(shù)據(jù)進行兩次掃描,不需要人工收集,補充和校驗的效率高。當然,實施本申請的任一產(chǎn) 品并不一定需要同時達到以上所述的所有優(yōu)點。
為了更清楚地說明本申請或現(xiàn)有技術中的技術方案,下面將對本申請或現(xiàn)有技術 描述中所需要使用的附圖作簡單的介紹,顯而易見地,下面描述中的附圖僅僅是本申請的 一些實施例,對于本領域普通技術人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這 些附圖獲得其他的附圖。圖1為本申請實施例一中的一種更新IP地址庫的方法流程圖;圖2為本申請實施例二中的一種更新IP地址庫的方法流程圖;圖3為本申請實施例三中的一種更新IP地址庫的裝置結構示意圖;圖4為本申請實施例四中的一種更新IP地址庫的裝置結構示意圖。
具體實施例方式本申請的主要思想包括,從用戶的電子商務交易信息中獲取郵寄地址數(shù)據(jù),對該 郵寄地址數(shù)據(jù)進行掃描,獲取地址信息相同且IP地址連續(xù)的郵寄地址數(shù)據(jù)對應的IP地址 區(qū)段,以及該IP地址區(qū)段對應的實際地址,并根據(jù)該IP地址區(qū)段對應的實際地址,更新IP 地址庫。下面將結合本申請中的附圖,對本申請中的技術方案進行清楚、完整的描述,顯 然,所描述的實施例是本申請的一部分實施例,而不是全部的實施例?;诒旧暾堉械膶嵤?例,本領域普通技術人員在沒有作出創(chuàng)造性勞動的前提下所獲得的所有其他實施例,都屬 于本申請保護的范圍。如圖1所示,為本申請實施例一中的一種更新IP地址庫的方法流程圖,包括以下 步驟步驟101,獲取交易信息數(shù)據(jù)庫中的郵寄地址數(shù)據(jù)。用戶使用互聯(lián)網(wǎng)中的計算機在參與網(wǎng)絡活動時,會登陸一些電子商務網(wǎng)站,并通 過電子商務網(wǎng)站達成網(wǎng)絡交易,從而在電子商務網(wǎng)站服務器的數(shù)據(jù)庫中留下各種交易信 息,例如購買的商品名稱、價格、商品的郵寄地址、達成交易的該臺計算機的IP地址等。本 實施例通過建立一交易信息數(shù)據(jù)庫用于收集郵寄地址數(shù)據(jù)。其中,郵寄地址數(shù)據(jù)包括IP地 址和地址信息。步驟102,掃描郵寄地址數(shù)據(jù),獲取地址信息相同且IP地址連續(xù)的郵寄地址數(shù)據(jù) 對應的IP地址區(qū)段,以及該IP地址區(qū)段對應的實際地址。具體地,上述獲取地址信息相同且IP地址連續(xù)的郵寄地址數(shù)據(jù)對應的IP地址區(qū) 段,以及所述IP地址區(qū)段對應的實際地址,具體包括獲取地址信息相同且IP地址連續(xù)的郵寄地址數(shù)據(jù)的個數(shù);判斷所述地址信息相 同且IP地址連續(xù)的郵寄地址數(shù)據(jù)的個數(shù)是否大于預設閾值;如果所述郵寄地址數(shù)據(jù)的個 數(shù)大于預設閾值,則將所述郵寄地址數(shù)據(jù)的IP地址合并到一個IP地址區(qū)段,并將所述郵寄 地址數(shù)據(jù)中的相同的地址信息作為所述IP地址區(qū)段對應的實際地址。上述掃描郵寄地址數(shù)據(jù)之前,還可以獲取IP地址庫數(shù)據(jù);將所述IP地址庫數(shù)據(jù)和 所述郵寄地址數(shù)據(jù)按照IP地址遞增或遞減的順序排列;根據(jù)所述IP地址庫數(shù)據(jù)的地名信 息過濾所述郵寄地址數(shù)據(jù),刪除地址信息與對應的IP地址庫數(shù)據(jù)的地名信息不匹配的郵 寄地址數(shù)據(jù)。
其中,IP地址庫數(shù)據(jù)包括IP地址和對應的地名信息,該地名信息包括以下內(nèi)容中 的任意一項國家地址、省級地址、市級地址和縣級地址。步驟103,根據(jù)IP地址區(qū)段對應的實際地址,更新IP地址庫。具體地,上述根據(jù)IP地址區(qū)段對應的實際地址,更新IP地址庫,具體包括使用 IP地址區(qū)段對應的實際地址,替換該IP地址區(qū)段在IP地址庫中對應的地名信息。本申請包括以下優(yōu)點,使用大量的郵寄地址數(shù)據(jù)對現(xiàn)有的IP地址庫中的實際地 址進行自動補充和校驗,準確性和覆蓋率較高;整個過程只需要對IP地址庫數(shù)據(jù)和郵寄地 址數(shù)據(jù)進行兩次掃描,不需要人工收集,補充和校驗的效率高。當然,實施本申請的任一產(chǎn) 品并不一定需要同時達到以上所述的所有優(yōu)點。如圖2所示,為本申請實施例二中的一種更新IP地址庫的方法流程圖,包括以下 步驟步驟201,獲取IP地址庫數(shù)據(jù)和交易信息數(shù)據(jù)庫中的郵寄地址數(shù)據(jù),將IP地址庫 數(shù)據(jù)和郵寄地址數(shù)據(jù)按照IP地址遞增或遞減的順序排列。其中,IP地址庫數(shù)據(jù)包括IP地址和對應的地名信息,通常IP地址的一個區(qū)段對應 一個地名信息,例如,從192. 168. 0. 1到192. 169. 5. 252的IP地址的區(qū)段對應的地名信息 為中國湖北省武漢市。IP地址庫數(shù)據(jù)通常會在網(wǎng)絡上公開,可以直接下載得到。目前,較為 常用的IP地址庫數(shù)據(jù)為純真版的IP地址庫數(shù)據(jù),純真版的IP地址庫只用一個文件QQWry. dat就包含了與IP地址相關的所有記錄,方便嵌入到其他程序中,也便于升級。交易信息數(shù)據(jù)庫位于購物網(wǎng)站的服務器中,用于存儲客戶端的IP地址以及客戶 端使用者進行購物交易留下的地址信息等。郵寄地址數(shù)據(jù)包括IP地址和地址信息,其中, 地址信息為用戶進行購物交易時留下的郵寄地址。具體地,客戶在網(wǎng)上購物時,例如在淘寶網(wǎng)上購物時,成交時會填寫郵寄地址,通 過記錄客戶的IP地址及其郵寄地址,可以獲取IP地址庫數(shù)據(jù)和郵寄地址數(shù)據(jù)。例如,郵寄 地址數(shù)據(jù)可以是一年內(nèi)登錄淘寶網(wǎng)的IP地址以及各個IP地址對應的郵寄地址。步驟202,根據(jù)IP地址庫數(shù)據(jù)的地名信息過濾郵寄地址數(shù)據(jù),刪除地址信息與對 應的IP地址庫數(shù)據(jù)的地名信息不匹配的郵寄地址數(shù)據(jù)。其中,IP地址庫數(shù)據(jù)的地名信息包括以下內(nèi)容中的任意一項國家地址、省級地 址、市級地址和縣級地址。由于IP地址是按照區(qū)段分配到不同的地域的,因此同一個地域 的IP地址具有臨近性,一般在一個或者多個連續(xù)的區(qū)段內(nèi)。現(xiàn)有的IP地址庫數(shù)據(jù)的地名 信息多到省級,粒度較粗,但是對于省級地址的判斷,正確性一般較高;而郵寄地址數(shù)據(jù)則 細到了街道、門牌號,單條郵寄地址往往噪音較大,并不能有效的地說明IP的實際地址,因 此需要對郵寄地址數(shù)據(jù)進行過濾。在具體實現(xiàn)過程中,可以判斷郵寄地址數(shù)據(jù)的地址信息與對應的IP地址庫數(shù) 據(jù)的地名信息是否匹配,如果不匹配,則刪除該郵寄地址數(shù)據(jù)??梢匀P地址庫數(shù)據(jù) 的地名信息的省級地址作為標準,過濾郵寄地址數(shù)據(jù)中與IP地址庫數(shù)據(jù)中的IP地址 一樣但省級地址不一致的數(shù)據(jù)。例如,某條郵寄地址數(shù)據(jù)的IP地址為192. 168. 0.2,地 址信息為中國江蘇省南京市XX區(qū)XX路XX號;而IP地址192. 168. 0. 2所在的IP區(qū)段 192. 168. 0. 1-192. 169. 5. 252映射到的IP地址庫數(shù)據(jù)的地名信息為中國湖北省武漢市,因 此,上述郵寄地址數(shù)據(jù)地址信息與對應的IP地址庫數(shù)據(jù)的地名信息不匹配,需要刪除該郵寄地址數(shù)據(jù)。當然,可以取IP地址庫數(shù)據(jù)的地名信息的國家地址、市級地址或縣級地址作為標 準,過濾郵寄地址數(shù)據(jù),其方法與上述流程類似。另外,如果某個IP區(qū)段在IP地址庫數(shù)據(jù)中沒有對應的地名信息,但是存在對應的 郵寄地址數(shù)據(jù),則保留該郵寄地址數(shù)據(jù)。步驟203,掃描郵寄地址數(shù)據(jù),根據(jù)預設的地址信息的精度,獲取地址信息相同且 IP地址連續(xù)的郵寄地址數(shù)據(jù)的個數(shù)。具體地,可以設定地址信息的精度,根據(jù)該精度判斷郵寄地址數(shù)據(jù)的地址信息是 否相同。預先設定的地址信息的精度可以為市級、縣級、區(qū)級甚至更加細化的級別,郵寄地 址數(shù)據(jù)的地址信息是否相同取決于地址信息的精度。例如,兩條IP地址連續(xù)的郵寄地址數(shù) 據(jù)的地址信息分別為A省B市C縣和A省B市D縣,如果預先設定的地址信息的精度為市 級,則上述兩條郵寄地址數(shù)據(jù)的地址信息相同;如果預先設定的地址信息的精度為縣級,則 上述兩條郵寄地址數(shù)據(jù)的地址信息不同。同一 IP地址和相鄰的IP地址往往對應在一定精度上相同的地址信息,從大量郵 寄地址數(shù)據(jù)中,能夠有效地定位IP區(qū)段對應的市、縣級實際地址。步驟204,判斷地址信息相同且IP地址連續(xù)的郵寄地址數(shù)據(jù)的個數(shù)是否大于預設 閾值,如果大于該預設閾值,則執(zhí)行步驟205 ;否則,則結束流程。步驟205,將地址信息相同且IP地址連續(xù)的郵寄地址數(shù)據(jù)的IP地址合并到一個 IP地址區(qū)段,并將上述郵寄地址數(shù)據(jù)中的相同的地址信息作為該IP地址區(qū)段對應的實際 地址。在具體實現(xiàn)過程中,設郵寄地址數(shù)據(jù)共有η條,對郵寄地址數(shù)據(jù)從第r+Ι條開始向 第n-r條掃描(其中,r為變量,可以設置為20)。假設當前掃描到第i條郵寄地址數(shù)據(jù),在 [i-r,i+r]的范圍內(nèi),有χ條郵寄地址數(shù)據(jù)的地址信息相同且IP地址連續(xù)。如果x<預設 閾值δ,則判斷當前區(qū)域地址信息相同的記錄數(shù)過少,地址信息不足以說明當前IP地址的 實際地址;如果χ彡S,則根據(jù)預設的地址信息的精度,確定第i條郵寄地址數(shù)據(jù)的IP地 址對應的實際地址,該實際地址可以是第i條郵寄地址數(shù)據(jù)的地址信息到省、市或縣級的 地址。如果兩條郵寄地址數(shù)據(jù)的實際地址相同,則它們的IP地址可以合并為一個區(qū)段。 一直往下掃描郵寄地址數(shù)據(jù),直至出現(xiàn)實際地址不同的郵寄地址數(shù)據(jù),將從第一條至最后 一條實際地址相同的IP地址用一個區(qū)段表示,將該區(qū)段作為最大的實際地址相同的連續(xù) IP區(qū)段。步驟206,根據(jù)合并得到的IP地址區(qū)段對應的實際地址,更新IP地址庫。具體地,可以使用合并得到的IP地址區(qū)段對應的實際地址,替換該IP地址區(qū)段在 IP地址庫中對應的地名信息;對于IP地址庫中該IP地址區(qū)段之外的IP地址對應的地名 信息,不進行任何操作。此外,還可以判斷IP地址區(qū)段對應的實際地址是否比該IP地址區(qū)段在IP地址庫 中對應的地名信息詳細,當郵寄地址數(shù)據(jù)中沒有判別結果的IP區(qū)段時,則以IP地址庫數(shù)據(jù) 中的實際地址作為對應IP地址的實際地址;當郵寄地址數(shù)據(jù)中有判別結果的IP區(qū)段時, 則以郵寄地址數(shù)據(jù)中的實際地址作為對應IP地址的實際地址。當IP地址庫數(shù)據(jù)和郵寄地
8址數(shù)據(jù)中均有判別結果的IP區(qū)段時,如果IP地址區(qū)段對應的實際地址比該IP地址區(qū)段在 IP地址庫中對應的地名信息郵寄地址數(shù)據(jù)的實際地址比IP地址庫數(shù)據(jù)的實際地址詳細, 則以IP地址區(qū)段對應的實際地址替換該IP地址區(qū)段在IP地址庫中對應的地名信息郵寄 地址的實際地址為準;否則,不對該IP地址區(qū)段在IP地址庫中對應的地名信息進行任何操 作以IP地址庫數(shù)據(jù)的實際地址為準。本申請包括以下優(yōu)點,使用大量的郵寄地址數(shù)據(jù)對現(xiàn)有的IP地址庫中的實際地 址進行自動補充和校驗,準確性和覆蓋率較高;整個過程只需要對IP地址庫數(shù)據(jù)和郵寄地 址數(shù)據(jù)進行兩次掃描,不需要人工收集,補充和校驗的效率高。當然,實施本申請的任一產(chǎn) 品并不一定需要同時達到以上所述的所有優(yōu)點。本申請上述實施例提供了獲取IP地址的實際地址的方法和應用場景,相應地,本 申請還通過以下實施例提供了應用上述方法的裝置。如圖3所示,為本申請實施例三中的一種獲取IP地址的實際地址的裝置結構示意 圖,包括獲取模塊310,用于獲取交易信息數(shù)據(jù)庫中的郵寄地址數(shù)據(jù),所述郵寄地址數(shù)據(jù)包 括IP地址和地址信息。掃描模塊320,用于掃描獲取模塊310獲取的郵寄地址數(shù)據(jù),獲取地址信息相同且 IP地址連續(xù)的郵寄地址數(shù)據(jù)對應的IP地址區(qū)段,以及所述IP地址區(qū)段對應的實際地址。更新模塊330,用于根據(jù)掃描模塊320獲取的IP地址區(qū)段對應的實際地址,更新 IP地址庫。上述更新模塊330,具體用于使用所述IP地址區(qū)段對應的實際地址,替換所述IP 地址區(qū)段在所述IP地址庫中對應的地名信息。本申請包括以下優(yōu)點,使用大量的郵寄地址數(shù)據(jù)對現(xiàn)有的IP地址庫中的實際地 址進行自動補充和校驗,準確性和覆蓋率較高;整個過程只需要對IP地址庫數(shù)據(jù)和郵寄地 址數(shù)據(jù)進行兩次掃描,不需要人工收集,補充和校驗的效率高。當然,實施本申請的任一產(chǎn) 品并不一定需要同時達到以上所述的所有優(yōu)點。如圖4所示,為本申請實施例四中的一種更新IP地址庫的裝置結構示意圖,包 括獲取模塊410,用于獲取交易信息數(shù)據(jù)庫中的郵寄地址數(shù)據(jù),所述郵寄地址數(shù)據(jù)包 括IP地址和地址信息。掃描模塊420,用于掃描所述獲取模塊獲取的郵寄地址數(shù)據(jù),獲取地址信息相同且 IP地址連續(xù)的郵寄地址數(shù)據(jù)對應的IP地址區(qū)段,以及所述IP地址區(qū)段對應的實際地址。上述掃描模塊420,具體包括獲取子模塊421,用于獲取地址信息相同且IP地址連續(xù)的郵寄地址數(shù)據(jù)的個數(shù)。判斷子模塊422,用于判斷獲取子模塊421獲取的地址信息相同且IP地址連續(xù)的 郵寄地址數(shù)據(jù)的個數(shù)是否大于預設閾值。合并子模塊423,用于在判斷子模塊422判斷所述郵寄地址數(shù)據(jù)的個數(shù)大于所述 預設閾值時,將所述郵寄地址數(shù)據(jù)的IP地址合并到一個IP地址區(qū)段,并將所述郵寄地址數(shù) 據(jù)中的相同的地址信息作為所述IP地址區(qū)段對應的實際地址。更新模塊430,用于根據(jù)所述掃描模塊獲取的IP地址區(qū)段對應的實際地址,更新IP地址庫。上述更新模塊430,具體用于使用所述IP地址區(qū)段對應的實際地址,替換所述IP 地址區(qū)段在所述IP地址庫中對應的地名信息。過濾模塊440,用于獲取IP地址庫數(shù)據(jù),IP地址庫數(shù)據(jù)包括IP地址和對應的地名 信息;將所述IP地址庫數(shù)據(jù)和所述郵寄地址數(shù)據(jù)按照IP地址遞增或遞減的順序排列,根據(jù) 所述IP地址庫數(shù)據(jù)的地名信息過濾獲取模塊410獲取的郵寄地址數(shù)據(jù),刪除地址信息與對 應的IP地址庫數(shù)據(jù)的地名信息不匹配的郵寄地址數(shù)據(jù)。上述過濾模塊440,具體用于根據(jù)所述IP地址庫數(shù)據(jù)的以下地名信息的任意一項 過濾所述郵寄地址數(shù)據(jù)國家地址、省級地址、市級地址和縣級地址。本申請包括以下優(yōu)點,使用大量的郵寄地址數(shù)據(jù)對現(xiàn)有的IP地址庫中的實際地 址進行自動補充和校驗,準確性和覆蓋率較高;整個過程只需要對IP地址庫數(shù)據(jù)和郵寄地 址數(shù)據(jù)進行兩次掃描,不需要人工收集,補充和校驗的效率高。當然,實施本申請的任一產(chǎn) 品并不一定需要同時達到以上所述的所有優(yōu)點。通過以上的實施方式的描述,本領域的技術人員可以清楚地了解到本申請可借助 軟件加必需的通用硬件平臺的方式來實現(xiàn),當然也可以通過硬件,但很多情況下前者是更 佳的實施方式。基于這樣的理解,本申請的技術方案本質(zhì)上或者說對現(xiàn)有技術做出貢獻的 部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計算機軟件產(chǎn)品存儲在一個存儲介質(zhì)中,包括若 干指令用以使得一臺終端設備(可以是手機,個人計算機,服務器,或者網(wǎng)絡設備等)執(zhí)行 本申請各個實施例所述的方法。以上所述僅是本申請的優(yōu)選實施方式,應當指出,對于本技術領域的普通技術人 員來說,在不脫離本申請原理的前提下,還可以做出若干改進和潤飾,這些改進和潤飾也應 視本申請的保護范圍。本領域技術人員可以理解實施例中的裝置中的模塊可以按照實施例描述進行分 布于實施例的裝置中,也可以進行相應變化位于不同于本實施例的一個或多個裝置中。上 述實施例的模塊可以集成于一體,也可以分離部署;可以合并為一個模塊,也可以進一步拆 分成多個子模塊。上述本申請實施例序號僅僅為了描述,不代表實施例的優(yōu)劣。以上公開的僅為本申請的幾個具體實施例,但是,本申請并非局限于此,任何本領 域的技術人員能思之的變化都應落入本申請的保護范圍。
權利要求
1.一種更新互聯(lián)網(wǎng)協(xié)議IP地址庫的方法,其特征在于,包括以下步驟獲取交易信息數(shù)據(jù)庫中的郵寄地址數(shù)據(jù),所述郵寄地址數(shù)據(jù)包括IP地址和地址信息; 掃描所述郵寄地址數(shù)據(jù),獲取地址信息相同且IP地址連續(xù)的郵寄地址數(shù)據(jù)對應的IP 地址區(qū)段,以及所述IP地址區(qū)段對應的實際地址;根據(jù)所述IP地址區(qū)段對應的實際地址,更新IP地址庫。
2.如權利要求1所述的方法,其特征在于,所述獲取地址信息相同且IP地址連續(xù)的郵 寄地址數(shù)據(jù)對應的IP地址區(qū)段,以及所述IP地址區(qū)段對應的實際地址,具體包括獲取地址信息相同且IP地址連續(xù)的郵寄地址數(shù)據(jù)的個數(shù); 判斷所述地址信息相同且IP地址連續(xù)的郵寄地址數(shù)據(jù)的個數(shù)是否大于預設閾值; 如果所述郵寄地址數(shù)據(jù)的個數(shù)大于所述預設閾值,則將所述郵寄地址數(shù)據(jù)的IP地址 合并到一個IP地址區(qū)段,并將所述郵寄地址數(shù)據(jù)中的相同的地址信息作為所述IP地址區(qū) 段對應的實際地址。
3.如權利要求1所述的方法,其特征在于,所述掃描郵寄地址數(shù)據(jù)之前,還包括 獲取IP地址庫數(shù)據(jù),IP地址庫數(shù)據(jù)包括IP地址和對應的地名信息;將所述IP地址庫數(shù)據(jù)和所述郵寄地址數(shù)據(jù)按照IP地址遞增或遞減的順序排列; 根據(jù)所述IP地址庫數(shù)據(jù)的地名信息過濾所述郵寄地址數(shù)據(jù),刪除地址信息與對應的 IP地址庫數(shù)據(jù)的地名信息不匹配的郵寄地址數(shù)據(jù)。
4.如權利要求3所述的方法,其特征在于,所述地名信息包括以下內(nèi)容中的任意一項 國家地址、省級地址、市級地址和縣級地址。
5.如權利要求1所述的方法,其特征在于,所述根據(jù)IP地址區(qū)段對應的實際地址,更新 IP地址庫,具體包括使用所述IP地址區(qū)段對應的實際地址,替換所述IP地址區(qū)段在所述IP地址庫中對應 的地名信息。
6.一種更新IP地址庫的裝置,其特征在于,包括獲取模塊,用于獲取交易信息數(shù)據(jù)庫中的郵寄地址數(shù)據(jù),所述郵寄地址數(shù)據(jù)包括IP地 址和地址信息;掃描模塊,用于掃描所述獲取模塊獲取的郵寄地址數(shù)據(jù),獲取地址信息相同且IP地址 連續(xù)的郵寄地址數(shù)據(jù)對應的IP地址區(qū)段,以及所述IP地址區(qū)段對應的實際地址;更新模塊,用于根據(jù)所述掃描模塊獲取的IP地址區(qū)段對應的實際地址,更新IP地址庫。
7.如權利要求6所述的裝置,其特征在于,還包括過濾模塊,用于獲取IP地址庫數(shù)據(jù),IP地址庫數(shù)據(jù)包括IP地址和對應的地名信息;將 所述IP地址庫數(shù)據(jù)和所述郵寄地址數(shù)據(jù)按照IP地址遞增或遞減的順序排列,根據(jù)所述IP 地址庫數(shù)據(jù)的地名信息過濾所述獲取模塊獲取的郵寄地址數(shù)據(jù),刪除地址信息與對應的IP 地址庫數(shù)據(jù)的地名信息不匹配的郵寄地址數(shù)據(jù)。
8.如權利要求7所述的裝置,其特征在于,所述過濾模塊,具體用于根據(jù)所述IP地址庫數(shù)據(jù)的以下地名信息的任意一項過濾所 述郵寄地址數(shù)據(jù)國家地址、省級地址、市級地址和縣級地址。
9.如權利要求6所述的裝置,其特征在于,所述掃描模塊,具體包括獲取子模塊,用于獲取地址信息相同且IP地址連續(xù)的郵寄地址數(shù)據(jù)的個數(shù); 判斷子模塊,用于判斷所述獲取子模塊獲取的地址信息相同且IP地址連續(xù)的郵寄地 址數(shù)據(jù)的個數(shù)是否大于預設閾值;合并子模塊,用于在所述判斷子模塊判斷所述郵寄地址數(shù)據(jù)的個數(shù)大于所述預設閾值 時,將所述郵寄地址數(shù)據(jù)的IP地址合并到一個IP地址區(qū)段,并將所述郵寄地址數(shù)據(jù)中的相 同的地址信息作為所述IP地址區(qū)段對應的實際地址。
10.如權利要求6所述的裝置,其特征在于,所述更新模塊,具體用于使用所述IP地址區(qū)段對應的實際地址,替換所述IP地址區(qū)段 在所述IP地址庫中對應的地名信息。
全文摘要
本申請公開了一種更新互聯(lián)網(wǎng)協(xié)議IP地址庫的方法和裝置,該方法包括以下步驟獲取交易信息數(shù)據(jù)庫中的郵寄地址數(shù)據(jù),所述郵寄地址數(shù)據(jù)包括IP地址和地址信息;掃描所述郵寄地址數(shù)據(jù),獲取地址信息相同且IP地址連續(xù)的郵寄地址數(shù)據(jù)對應的IP地址區(qū)段,以及所述IP地址區(qū)段對應的實際地址;根據(jù)所述IP地址區(qū)段對應的實際地址,更新IP地址庫。本申請?zhí)岣吡双@取IP地址的實際地址的準確性和覆蓋率。
文檔編號H04L29/12GK102104635SQ20091025923
公開日2011年6月22日 申請日期2009年12月17日 優(yōu)先權日2009年12月17日
發(fā)明者彭翔 申請人:阿里巴巴集團控股有限公司