5將大寫字母更換成小寫字母,并且在430將非字母數(shù)字字符除去。
[0068]接下來,該方法包括在435利用字符的清理后的多片段集合計算距離分?jǐn)?shù)。應(yīng)理解的是,距離分?jǐn)?shù)表示字符的清理后的多片段集合中的字符之間的差異。在圖5中示出并且描述了用于計算距離分?jǐn)?shù)的示例性方法。
[0069]參考圖5,示出了用于計算標(biāo)準(zhǔn)化編輯距離(NLD)的方法。該方法包括在505接收第一清理后的字符串和第二清理后的字符串(例如,清理后的字符串)。在一些實(shí)施方式中,該方法包括在510計算第一字符串和第二字符串兩者的編輯距離。該方法還包括515確定第一字符串和第二字符串中的每個的字符長度并且利用該字符長度計算NLD ALD可利用以上更詳細(xì)描述的式I計算。
[0070]如上所述,NLD是根據(jù)字符內(nèi)容表示字符串的“接近程度”的百分比分?jǐn)?shù)。例如,“1234mainst” 和 “1234mainst” 的NLD是 100 %,然而 “10avedereubl icamadrid” 和“l(fā)OOrepublicaavemadrid” 的NLD是61.9%。
[0071]該方法還包括在520將NLD與閾值比較,并且在525如果NLD不滿足或超過閾值時,實(shí)施第一字符串和第二字符串之間的物理距離計算。例如,61.9 %的NLD可以與80%的閾值比較。由于NLD不滿足閾值,所以服務(wù)器105可實(shí)施物理距離計算。
[0072]例如,服務(wù)器可將第一字符串和第二字符串標(biāo)繪在地圖上,并且更具體地,標(biāo)繪第一字符串和第二字符串的街道地址。在其它實(shí)施方式中,如果第一字符串和第二字符串包括坐標(biāo),則第一字符串和第二字符串可利用坐標(biāo)標(biāo)繪。標(biāo)繪的點(diǎn)之間的距離可被確定并且與距離閾值比較。例如,如果距離小于100英尺,則標(biāo)繪的點(diǎn)可被認(rèn)為是表示同一 P0L。
[0073]圖4和圖5的流程圖可包括與流程圖中所描述的那些步驟相比更少或者更多的步驟。另外,流程圖的方法步驟可根據(jù)說明書或本文中提供的示例進(jìn)行替代。
[0074]圖6是用于建立并且使用地理數(shù)據(jù)實(shí)例的片段/字段的置換以及計算并且比較為成對的地理數(shù)據(jù)實(shí)例生成的NLD值的方法的流程圖。如上所述,以下的示例會將地理數(shù)據(jù)實(shí)例稱為“字符的多片段集合”。
[0075]首先,選擇出字符的兩個多片段集合中的第一個。字符的兩個多片段集合中的第二個保持不變。在選擇了字符的兩個多片段集合中的第一個后,該方法包括在605根據(jù)字符的兩個多片段集合中的第一個建立字符的多個置換的多片段集合。這個過程包括將字符的兩個多片段集合中的這一個集合的多個片段中的片段的字符重新排序,以建立置換的片段。重新排列的步驟對于字符的第一個多片段集合發(fā)生多次以建立字符的多個置換的多片段集合。
[0076]接下來,該方法包括建立字符的成對的多片段集合。這些對包括字符的多個置換的多片段集合中的一個和字符的兩個多片段集合中的第二個。例如,第一對將包括字符的多片段集合“Hotel California,Los Angeles downtown”和字符的第二多片段集合“LosAngeles California hotel”。在第二配對中,字符的置換的多片段集合“CaliforniaHotel Los Angeles downtown” 與字符的第二多片段集合“Los Angeles Californiahotel”配對。在第三配對中,字符的另一置換的多片段集合“Los Angeles CaliforniaHotel downtown”與字符的第二多片段集合“Los Angeles California hote”配對。
[0077]接下來,該方法包括在610使字符的成對的多片段集合標(biāo)準(zhǔn)化。此外,字符的成對的多片段集合包括多個置換的多片段集合的各種組合以及如上所述的字符的兩個多片段集合中的第二個。
[0078]在一個實(shí)施方式中,該方法包括在615為字符的成對的多片段集合中的每對計算標(biāo)準(zhǔn)化編輯距離(NLD)。
[0079]在一些實(shí)施方式中,該方法包括確定字符的所有成對的多片段集合中最高排序的NLD0
[0080]在另一實(shí)施方式中,該方法包括在620從字符的所有成對的多片段集合中確定最小NLD ο具有最小NLD的一對被認(rèn)為是地理編碼的實(shí)例(例如,字符的成對的多片段集合)中最佳匹配的一對。
[0081]圖7是以計算機(jī)系統(tǒng)I的形式的示例性設(shè)備的圖形表示,在計算機(jī)系統(tǒng)I中,可執(zhí)行用于使得設(shè)備執(zhí)行本文中所討論的方法中的任何一個或更多個的指令的集合。在不同的實(shí)施方式中,設(shè)備作為獨(dú)立的裝置操作或可連接(例如,網(wǎng)絡(luò)連接)至其它設(shè)備。在網(wǎng)絡(luò)連接的部署中,設(shè)備可以在服務(wù)器-客戶網(wǎng)絡(luò)環(huán)境中作為服務(wù)器或客戶設(shè)備操作,或者可在對等(或分布式)網(wǎng)絡(luò)環(huán)境中作為對等設(shè)備操作。設(shè)備可以是個人電腦(PC)、平板PC、機(jī)頂盒(STB)、個人數(shù)字助理(PDA)、蜂窩式電話、便攜式音樂播放器(例如便攜式硬盤音頻設(shè)備例如活動圖像專家組音頻層3(MP3)播放器)、環(huán)球網(wǎng)設(shè)備、網(wǎng)絡(luò)路由器、開關(guān)或電橋,或者可以是能夠執(zhí)行指明將由該設(shè)備采取的行動的一組指令(按順序的或不按順序的)的任何設(shè)備。而且,雖然僅示出了一個設(shè)備,但是詞語“設(shè)備”還應(yīng)理解為包括設(shè)備的任何集合,這些設(shè)備單獨(dú)或共同執(zhí)行一組(或多組)指令以實(shí)施本文中所討論的方法中的任何一個或更多個。
[0082]示例性計算機(jī)系統(tǒng)I包括一個處理器或多個處理器5(例如,中央處理器(CPU)、圖形處理單元(GPU)或者這兩者)以及主存儲器10和靜態(tài)存儲器15,主存儲器10和靜態(tài)存儲器15通過總線20互相通信。計算機(jī)系統(tǒng)I可進(jìn)一步包括視頻顯示器35(例如,液晶顯示器(LCD))。計算機(jī)系統(tǒng)I還可包括一個(多個)字母-數(shù)字輸入裝置30(例如,鍵盤)、光標(biāo)控制裝置(例如鼠標(biāo))、語音識別或生物特征測量驗(yàn)證單元(未顯示)、驅(qū)動單元37(也稱為磁盤驅(qū)動器單元)、信號生成裝置40(例如,揚(yáng)聲器)和網(wǎng)絡(luò)接口裝置45。計算機(jī)系統(tǒng)I還可包括數(shù)據(jù)加密模塊(未顯示)以將數(shù)據(jù)加密。
[0083]磁盤驅(qū)動單元37包括計算機(jī)或設(shè)備可讀介質(zhì)50,在計算機(jī)或設(shè)備可讀介質(zhì)50上存儲了指令的一個或多個集合和包括或利用本文中所描述的方法或功能中的任何一個或多個的數(shù)據(jù)結(jié)構(gòu)(例如,指令55)。指令55在其通過計算機(jī)系統(tǒng)I的執(zhí)行期間還可完全或至少部分地歸于主存儲器10內(nèi)和/或歸于處理器5內(nèi)。主存儲器10和處理器5也可構(gòu)成設(shè)備可讀介質(zhì)。
[0084 ]指令5 5還可利用多個公知的傳送協(xié)議中的任何一個(例如,超文本傳送協(xié)議(HTTP))經(jīng)由網(wǎng)絡(luò)接口裝置45通過網(wǎng)絡(luò)140(見圖2)傳輸或接收。雖然在示例性實(shí)施方式中示出了設(shè)備可讀介質(zhì)50是單個介質(zhì),但是詞語“計算機(jī)可讀介質(zhì)”應(yīng)被理解為存儲指令的一個或多個集合的一個介質(zhì)或多個介質(zhì)(例如,集中式或分布式數(shù)據(jù)和/或相關(guān)的緩存或服務(wù)器)。詞語“計算機(jī)可讀介質(zhì)”也應(yīng)被考慮成包括能夠存儲、編碼或攜帶指令的集合的任何介質(zhì),或者包括能夠被指令的集合使用或與指令的集合相關(guān)的數(shù)據(jù)結(jié)構(gòu)的任何介質(zhì),其中指令的集合用于通過設(shè)備執(zhí)行并且引起設(shè)備實(shí)施本應(yīng)用的方法中的一個或多個。詞語“計算機(jī)可讀介質(zhì)”應(yīng)相應(yīng)地被理解成但不限于固態(tài)存儲器、光學(xué)和磁性介質(zhì)以及載波信號。這種介質(zhì)在沒有限制的情況下還可包括硬盤、軟盤、快擦寫存儲卡、數(shù)字視頻磁盤、隨機(jī)存取存儲器(RAM)、只讀存儲器(ROM)等等。本文中所描述的示例性實(shí)施方式可在包括安裝在計算機(jī)上的軟件的操作環(huán)境中、在硬件中或在硬件與軟件的組合中實(shí)現(xiàn)。
[0085]本領(lǐng)域技術(shù)人員應(yīng)認(rèn)識到的是,網(wǎng)絡(luò)服務(wù)可配置為提供接入連接至網(wǎng)絡(luò)服務(wù)的一個或多個計算裝置的網(wǎng)絡(luò),而且該計算裝置可包括一個或多個處理器、總線、存儲裝置、顯示裝置、輸入/輸出裝置等等。此外,本領(lǐng)域技術(shù)人員能夠理解的是,網(wǎng)絡(luò)服務(wù)可聯(lián)接至可以用于實(shí)現(xiàn)如本文中所描述的公開的實(shí)施方式中的任一個的一個或多個數(shù)據(jù)庫、資源庫、月艮務(wù)器等等。
[0086]在以下權(quán)利要求中的所有功能性描述的裝置或步驟的對應(yīng)結(jié)構(gòu)、材料、過程和等同意在包括用于與如具體要求的其它要求的元件共同執(zhí)行功能的任何結(jié)構(gòu)、材料或動作。本技術(shù)的描述為了說明和描述的目的而被提供,其并不是窮盡的,也不限于所公開的形式中的本技術(shù)。在不背離本技術(shù)的范圍和精神的情況下,諸多修改和變化將對本領(lǐng)域普通技術(shù)人員顯而易見。選擇了示例性實(shí)施方式并且對其進(jìn)行了描述,以便充分解釋本技術(shù)的原則以及其實(shí)際應(yīng)用,并且使本領(lǐng)域普通技術(shù)人員中的其他人員能夠理解本技術(shù),本技術(shù)用于具有如適于所預(yù)期的特定應(yīng)用的各種修改的各種實(shí)施方式。
[0087]在上文中,根據(jù)本技術(shù)的實(shí)施方式,參考流程圖和/或方法、設(shè)備(系統(tǒng))和計算機(jī)程序產(chǎn)品的方塊圖對本技術(shù)的多方面進(jìn)行了說明。應(yīng)理解的是,流程圖圖例和/或方框圖中的每塊或者流程圖圖例和/或方框圖中的方塊的組合可通過計算機(jī)程序指令實(shí)現(xiàn)。這些計算機(jī)程序指令可設(shè)置到通用計算機(jī)的處理器、專用計算機(jī)或其它可編程數(shù)據(jù)處理設(shè)備以產(chǎn)生設(shè)備,以使得通過計算機(jī)的處理器或其它可編程數(shù)據(jù)處理設(shè)備執(zhí)行的指令產(chǎn)生用于實(shí)現(xiàn)流程圖和/或方塊圖塊或多個塊中所規(guī)定的功能/動作的裝置。
[0088]這些計算機(jī)程序指令還可儲存在可引導(dǎo)計算機(jī)、其它可編程數(shù)據(jù)處理設(shè)備或其它裝置以特定方式運(yùn)行