国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      探測地址更新的方法及裝置的制作方法

      文檔序號:6436990閱讀:202來源:國知局
      專利名稱:探測地址更新的方法及裝置的制作方法
      技術(shù)領(lǐng)域
      本發(fā)明涉及數(shù)據(jù)處理技術(shù),尤其是,涉及通過對數(shù)據(jù)信息進行處理探測地址更新的方法和裝置。
      背景技術(shù)
      隨著互聯(lián)網(wǎng)業(yè)務(wù)的不斷發(fā)展,各種電子地圖成為輔助人們生活工作的重要工具,而其所提供的電子地圖數(shù)據(jù)信息會因地址的變更、新建建筑、城市規(guī)劃、道路規(guī)劃等原因而變得過時。通常,地圖數(shù)據(jù)提供商定期對數(shù)據(jù)進行更新,然而,這種定期更新費時費力,特別是對于一些新發(fā)生的地址變更信息不會被及時發(fā)現(xiàn)或者被及時的更新到電子地圖數(shù)據(jù)庫中,這種過期的地圖數(shù)據(jù)會影響用戶的使用?,F(xiàn)有技術(shù)中還存在基于用戶主動遞交的信息對地圖數(shù)據(jù)進行更新的技術(shù)方案,然而,該種方法并不能基于散落在網(wǎng)絡(luò)各處的網(wǎng)頁信息進行地址更新信息的發(fā)現(xiàn)。因此,用戶會因為陳舊的地圖數(shù)據(jù)而造成不便,故需要改進已有的技術(shù),至少在某種程度上改善現(xiàn)有的對地址信息進行更新的技術(shù)方案。

      發(fā)明內(nèi)容
      根據(jù)本發(fā)明的第一個方面,提供一種用于獲取地址更新信息的方法,包括:獲取與命名實體的地址更新相關(guān)的網(wǎng)頁信息;從所述網(wǎng)頁信息中抽取所述命名實體的地址更新線索;確定所述地址更新線索的時間及可信度;根據(jù)所述時間及可信度確定出有效的地址更新線索。根據(jù)本發(fā)明的第二個方面,提供一種用于獲取地址更新信息的裝置,包括:用于獲取與命名實體的地址更新相關(guān)的網(wǎng)頁信息的部件;用于從所述網(wǎng)頁信息中抽取所述命名實體的地址更新線索的部件;用于確定所述地址更新線索的時間及可信度的部件;用于根據(jù)所述時間及可信度確定出有效的地址更新線索的部件。本發(fā)明可以改善現(xiàn)有的對地址信息進行更新的方案。


      所附權(quán)利要求中闡述了被認為是本發(fā)明的特點的創(chuàng)造性特征。但是,通過參照附圖閱讀下面對說明性的實施例的詳細說明可更好地理解發(fā)明本身以及其優(yōu)選使用模式、目標、特征以及優(yōu)點,在附圖中:圖1示出了用來實現(xiàn)本發(fā)明實施方式的示例性計算系統(tǒng)。圖2示出了用于獲取命名實體的地址變化的方法流程圖。圖3示出了圖2所示的步驟203的確定時間的流程圖。圖4示出了用于獲取命名實體的地址變化的裝置示意圖。
      具體實施例
      所屬技術(shù)領(lǐng)域的技術(shù)人員知道,本發(fā)明可以體現(xiàn)為系統(tǒng)、方法或計算機程序產(chǎn)品。因此,本發(fā)明可以具體實現(xiàn)為以下形式,即,可以是完全的硬件、完全的軟件(包括固件、駐留軟件、微代碼等)、或者本文一般稱為“電路”、“模塊”或“系統(tǒng)”的軟件部分與硬件部分的組合。此外,本發(fā)明還可以采取體現(xiàn)在任何有形的表達介質(zhì)(medium of expression)中的計算機程序產(chǎn)品的形式,該介質(zhì)中包含計算機可用的程序碼。可以使用一個或多個計算機可讀介質(zhì)的任何組合。計算機可讀介質(zhì)可以是計算機可讀信號介質(zhì)或計算機可讀存儲介質(zhì),計算機可讀存儲介質(zhì)例如可以是一但不限于一電的、磁的、光的、電磁的、紅外線的、或半導(dǎo)體的系統(tǒng)、裝置、器件或傳播介質(zhì)、或前述各項的任何適當(dāng)?shù)慕M合。計算機可讀存儲介質(zhì)的更具體的例子(非窮舉的列表)包括以下:有一個或多個導(dǎo)線的電連接、便攜式計算機磁盤、硬盤、隨機存取存儲器(RAM)、只讀存儲器(ROM)、可擦式可編程只讀存儲器(EPR0M或閃存)、光纖、便攜式緊湊磁盤只讀存儲器(CD-ROM)、光存儲器件、磁存儲器件、或前述各項的任何適當(dāng)?shù)慕M合。在本文語境中,計算機可讀存儲介質(zhì)可以是任何含有或存儲供指令執(zhí)行系統(tǒng)、裝置或器件使用的或與指令執(zhí)行系統(tǒng)、裝置或器件相聯(lián)系的程序的有形介質(zhì)。計算機可讀信號介質(zhì)可以包括例如在基帶中或作為載波的一部分傳播的帶有計算機可讀程序代碼的數(shù)據(jù)信號。這樣一種傳播信號可以采取任何適當(dāng)?shù)男问?,包括一但不限于一電磁的、光的或其任何適當(dāng)?shù)慕M合。計算機可讀信號介質(zhì)可以是不同于計算機可讀存儲介質(zhì)的、可以傳達、傳播或傳輸供指令執(zhí)行系統(tǒng)、裝置或器件使用的或與指令執(zhí)行系統(tǒng)、裝置或器件相聯(lián)系的程序的任何一種計算機可讀介質(zhì)。包含在計算機可讀介質(zhì)中的程序代碼可以采用任何適當(dāng)?shù)慕橘|(zhì)傳輸,包括-但不限于-無線、有線、光纜、射頻等等、或上述各項的任何適當(dāng)?shù)慕M合。用于執(zhí)行本發(fā)明的操作的計算機程序碼,可以以一種或多種程序設(shè)計語言的任何組合來編寫,所述程序設(shè)計語言包括面向?qū)ο蟮某绦蛟O(shè)計語言一諸如Java、Smalltalk、C++之類,還包括常規(guī)的過程式程序設(shè)計語言一諸如”C”程序設(shè)計語言或類似的程序設(shè)計語言。程序碼可以完全地在用戶的計算上執(zhí)行、部分地在用戶的計算機上執(zhí)行、作為一個獨立的軟件包執(zhí)行、部分在用戶的計算機上部分在遠程計算機上執(zhí)行、或者完全在遠程計算機或服務(wù)器上執(zhí)行。在后一種情形中,遠程計算機可以通過任何種類的網(wǎng)絡(luò)一包括局域網(wǎng)(LAN)或廣域網(wǎng)(WAN) —連接到用戶的計算機,或者,可以(例如利用因特網(wǎng)服務(wù)提供商來通過因特網(wǎng))連接到外部計算機。以下參照按照本發(fā)明實施例的方法、裝置(系統(tǒng))和計算機程序產(chǎn)品的流程圖和/或框圖描述本發(fā)明。要明白的是,流程圖和/或框圖的每個方框以及流程圖和/或框圖中各方框的組合,都可以由計算機程序指令實現(xiàn)。這些計算機程序指令可以提供給通用計算機、專用計算機或其它可編程數(shù)據(jù)處理裝置的處理器,從而生產(chǎn)出一種機器,使得通過計算機或其它可編程數(shù)據(jù)處理裝置執(zhí)行的這些指令,產(chǎn)生實現(xiàn)流程圖和/或框圖中的方框中規(guī)定的功能/操作的裝置。也可以把這些計算機程序指令存儲在能指令計算機或其它可編程數(shù)據(jù)處理裝置以特定方式工作的計算機可讀介質(zhì)中,這樣,存儲在計算機可讀介質(zhì)中的指令產(chǎn)生一個包括實現(xiàn)流程圖和/或框圖中的方框中規(guī)定的功能/操作的指令裝置(instruction means)的制造品。
      也可以把計算機程序指令加載到計算機或其它可編程數(shù)據(jù)處理裝置上,使得在計算機或其它可編程數(shù)據(jù)處理裝置上執(zhí)行一系列操作步驟,以產(chǎn)生計算機實現(xiàn)的過程,從而在計算機或其它可編程裝置上執(zhí)行的指令就提供實現(xiàn)流程圖和/或框圖中的方框中規(guī)定的功能/操作的過程?,F(xiàn)參看圖1,示出了適于用來實現(xiàn)本發(fā)明實施方式的示例性計算系統(tǒng)100的框圖。如所示,計算機系統(tǒng)100可以包括:CPU(中央處理單元)101、RAM(隨機存取存儲器)102、ROM(只讀存儲器)103、系統(tǒng)總線104、硬盤控制器105、鍵盤控制器106、串行接口控制器107、并行接口控制器108、顯示控制器109、硬盤110、鍵盤111、串行外部設(shè)備112、并行外部設(shè)備113和顯示器114。在這些設(shè)備中,與系統(tǒng)總線104耦合的有CPU 101、RAM 102、ROM103、硬盤控制器105、鍵盤控制器106、串行控制器107、并行控制器108和顯示控制器109。硬盤110與硬盤控制器105耦合,鍵盤111與鍵盤控制器106耦合,串行外部設(shè)備112與串行接口控制器107耦合,并行外部設(shè)備113與并行接口控制器108耦合,以及顯示器114與顯示控制器109耦合。應(yīng)當(dāng)理解,圖1所述的結(jié)構(gòu)框圖僅僅為了示例的目的而示出的,而不是對本發(fā)明范圍的限制。在某些情況下,可以根據(jù)具體情況而增加或者減少某些設(shè)備。參看圖2,示出了在一個實施例中用于獲取命名實體的地址變化的方法流程圖,包括以下步驟:在步驟201中,獲取與命名實體的地址相關(guān)的數(shù)據(jù)信息。數(shù)據(jù)信息包括任何形式存在的 目息,例如來自網(wǎng)絡(luò)的網(wǎng)頁 目息或者存儲于各種存儲介質(zhì)中的任何 目息。本申請是以網(wǎng)頁信息為例進行說明,但不是對本申請的限定,此處的網(wǎng)頁信息特指通過各種設(shè)備在網(wǎng)絡(luò)上隨時發(fā)布的消息,可通過網(wǎng)絡(luò)在各個網(wǎng)站上獲得。這種來自網(wǎng)站的網(wǎng)頁信息包括但不限于門戶網(wǎng)站所提供的新聞、政府機構(gòu)的公告、公司主頁信息、還包括微博等類型的網(wǎng)頁信息。隨時發(fā)布的網(wǎng)頁信息通常具有非結(jié)構(gòu)化的特征,并散布于各個網(wǎng)站之上,這不同于用戶按照規(guī)定的格式在固定的網(wǎng)站上所提交結(jié)構(gòu)化信息,在信息的處理上存在著困難。其中,命名實體(named entity)是人名、機構(gòu)名、地名、地址以及其他所有以名稱為標識的實體。命名實體識別是指在網(wǎng)頁信息等文檔集合中識別出特定類型的事物名稱的過程,主要通過以下三個方面實現(xiàn):識別出文本中的命名實體;確定該實體的類型;對于多個實體表示同一事物時,選擇其中的一個實體作為該組實體的代表??刹捎萌魏维F(xiàn)有的方式來實現(xiàn),在此不作贅述。根據(jù)本發(fā)明的一個實施例,根據(jù)所述網(wǎng)頁信息中包括命名實體以及至少一個與地址變化相關(guān)的關(guān)鍵詞確定所述網(wǎng)頁信息是與所述命名實體的地址相關(guān)的網(wǎng)頁信息。在這個實施例中,步驟201可以包括兩個子步驟:子步驟一,在所述網(wǎng)頁信息中探測表示地名、機構(gòu)名等的命名實體并進行標記;子步驟二,在所述網(wǎng)頁信息中探測地址更新關(guān)鍵詞并進行標記??蓱?yīng)用以下兩種實施例在網(wǎng)頁信息的文本中探測表示地址更新的關(guān)鍵詞。在第一個實施例中,應(yīng)用基于字典的匹配方法探測所述地址更新關(guān)鍵詞,該字典中包括的關(guān)鍵詞例如是{錯誤地址、地址更新、糾正、正確地址、新地址,開發(fā)、建成、通車、
      合并,落戶,喬遷.......}, 通過匹配其中的一個或多個關(guān)鍵詞在所述網(wǎng)頁信息中探測地址
      更新關(guān)鍵詞。在第二個實施例中,通過統(tǒng)計學(xué)習(xí)模型探測所述地址更新關(guān)鍵詞。例如,抽取訓(xùn)練樣本中詞單元,詞性、詞的語義分類等上下文分布特征,構(gòu)建地址更新關(guān)鍵詞識別的特征向量,利用已有的機器學(xué)習(xí)統(tǒng)計方法,訓(xùn)練出地址更新關(guān)鍵詞識別模型。該識別模型在應(yīng)用時根據(jù)當(dāng)前給定文本的分布特征(如詞單元、詞性、詞的語義分類)識別出文本中的地址更新關(guān)鍵詞。在步驟202中,從所述網(wǎng)頁信息中抽取所述命名實體的地址更新線索。更新線索通常由多個更新信息條目組成,例如包括{地址發(fā)生更新的命名實體,地址更新關(guān)鍵詞,目標地址}等條目,在有些情形下,目標地址可能會缺失,但這并不影響這樣的地址更新線索的價值??筛鶕?jù)下述方式之一確定所述地址更新線索:在第一種實施方式中,根據(jù)具有明示的地址更新關(guān)鍵詞確定地址更新線索,由于明示的地址更新關(guān)鍵詞本身的含義可以明確的表達出地址發(fā)生了變化,例如{錯誤地址、地址更新、糾正、正確地址、新地址}中的至少一個。例如,所獲取的網(wǎng)頁消息中包括文本{新辦公地址更新如下:公司名稱:北京ABC有限公司;公司辦公地址:北京市海淀區(qū)中關(guān)村大街XXX號寫字樓XXX層},在該網(wǎng)頁消息以及對該消息回復(fù)鏈中,根據(jù)位于所探測到的地址更新關(guān)鍵詞周圍的命名實體以及地址信息可確定出地址更新線索:{地址更新關(guān)鍵詞:“地址更新”;地址發(fā)生更新的命名實體:“北京ABC有限公司”;目標地址:“北京市海淀區(qū)中關(guān)村大街XXX號寫字樓XXX層”}。在第二種實施方式中,根據(jù)隱含的地址更新關(guān)鍵詞確定,這類關(guān)鍵詞隱含的表達了地址的變化,舉例而言,包括{開發(fā)、建成、通車、合并,落戶,喬遷,...}中的至少一個。通過在更新關(guān)鍵詞周圍探測有關(guān)的地址變更事件以及與該事件相關(guān)的命名實體,從而抽取暗示的更新線索。例如,網(wǎng)頁消息文本={2011年5月25日上午,北京中關(guān)村西區(qū)的XXX街8號,兩棟設(shè)計雅致的辦公大樓前,眾聲喧騰,喜氣洋洋。這里正在舉行一個隆重的喬遷慶祝儀式——EFG研發(fā)集團的新大樓啟用儀式。}在該例子中,確定的地址更新線索是暗示的,包括的條目是{地址更新關(guān)鍵詞:喬遷,新大樓啟用儀式;命名實體:EFG研發(fā)集團;目標地址:北京中關(guān)村西區(qū),XXX街8號}。在第三個實施方式中,根據(jù)上下文信息中包括的與所述命名實體共同出現(xiàn)的其它地名,周邊建筑、企業(yè)或區(qū)域以及與所述命名實體的相對位置關(guān)系來確定等等。例如:我在HIJ中國公司,大廈左邊就是水立方和鳥巢??纱_定出地址更新線索={命名實體:HIJ中國公司;上下文線索:大廈左邊,水立方,鳥巢}。從而可以根據(jù)上下文線索中所包括的方位詞以及同時出現(xiàn)的其它地名、建筑等獲知HIJ公司的地址更新信息。步驟203,確定所述地址更新線索的時間及可信度。在該步驟中重點關(guān)注的是網(wǎng)頁信息中所記載的地址更新線索對應(yīng)的地址更新事件發(fā)生的時間,而不是信息發(fā)布的時間。在該步驟中,可通過以下幾種實施方式之一或其組合確定所述地址更新線索的可信度:在第一種實施方式中,根據(jù)網(wǎng)頁信息作者的行動確定可信度。當(dāng)所述網(wǎng)頁信息中的地址更新事件被證實過,則認為具有較高的可信度;未經(jīng)驗證的新聞或信息可認為具有較低的可信度,例如,轉(zhuǎn)發(fā)他人的消息,或其它網(wǎng)站的新聞。舉例而言,假如所獲取的網(wǎng)頁信息是“我昨天去了 XXX飯店,地址變了,現(xiàn)在在XXX路口 了”。如何通過句式的分析判斷地址更新事件是否被證實過是現(xiàn)有技術(shù),具體可通過以下步驟完成可信度的檢驗:
      A)通過分詞獲得詞單元={ “我”,“昨天”,“去”,“了”,“XXX飯店” };B)對部分詞單元進行詞性標注={我(代詞),昨天(副詞),去(動詞),XXX飯店(組織)};C)進行語法分析后獲得語法樹={謂語:去;主語:我,時間狀語:昨天,地點狀語:xxx飯店};D)根據(jù)語法樹抽取出驗證行為:通過主語“我”以及謂語“去”可以認為該網(wǎng)頁信息是經(jīng)過驗證過的信息,具有較高的可信度。在第二種實施方式中,還可根據(jù)所述網(wǎng)頁信息作者的權(quán)威性確定,所述權(quán)威性可通過作者的身份、名聲或者其歷史等因素進行確定。例如公司自身作為公開其地址變更新聞的作者,視為具有較高的可信度。在第三種實施方式中,根據(jù)針對所述網(wǎng)頁信息的回復(fù)或評論中表示同意或不同意的表達,確定回復(fù)鏈中的支持度。具體是通過對表示認同的關(guān)鍵詞,例如,“同意”,“不同意”,“支持”,“反對”,“不對”,“錯誤”,“對”,“正確”,“認同”等,或表示認同的句式進行分析獲得。步驟204,根據(jù)所述時間和可信度,確定有效的地址更新線索作為所述地址更新信息。通過選擇所述在預(yù)定時間段內(nèi)可信度較高的地址變化信息,或者在可信度較高的多個地址變化信息中選擇時間較近的。還可以選擇所述時間在預(yù)定時間段內(nèi)所述可信度最高的地址更新線索,或者選擇所述可信度在預(yù)定范圍內(nèi)的并且所述時間最新的地址更新線索。進一步,作為非必選的步驟,還在步驟204之后根據(jù)有效的地址更新線索中的地址更新關(guān)鍵詞確定地址修正操作,地址修正操作類型例如是修改地址、增加新地址、刪除地址中的一種或多種。在一個實施例中,根據(jù)關(guān)鍵詞“新建”(道路、大廈),確定修正操作是“增加新地址”;根據(jù)關(guān)鍵詞“錯誤地址”,確定修正操作是“刪除地址”;根據(jù)關(guān)鍵詞“合并、地址更新、糾正、正確地址”等,確定修正操作是“修改地址”,所屬領(lǐng)域技術(shù)人員可建立其它地址更新關(guān)鍵詞與地址修正操作的對應(yīng)關(guān)系。可以根據(jù)所述有效的地址更新線索提供地址變更警報,或者根據(jù)所述有效的地址更新線索直接進行地圖數(shù)據(jù)的更新。圖3示出了本發(fā)明公開的一個實施例,示出了圖2所示的步驟203的流程圖??梢园ㄒ韵虏襟E:在步驟301中,探測網(wǎng)頁信息中與所述地址更新線索相關(guān)的時間短語;在步驟302中,將所述時間短語轉(zhuǎn)變?yōu)榻^對時間。按照一個實施方式,步驟302可由以下步驟實現(xiàn):在步驟3021中,判斷所述作為時間線索的時間短語是否為絕對時間,響應(yīng)于時間短語是絕對時間,在步驟3025中直接將其確定為所述地址更新事件的時間。此處的明確的絕對時間指的是各種格式的時間信息。舉例而言:對于網(wǎng)頁消息“2011年5月25日上午,北京中關(guān)村西區(qū)的XXX街8號,兩棟設(shè)計雅致的辦公大樓前,眾聲喧騰,喜氣洋洋。這里正在舉行一個隆重的喬遷慶祝儀式——EFG研發(fā)集團的新大樓啟用儀式”而言,2011年5月25日就是一個表示清楚的絕對時間。在步驟3022中,判斷所述作為時間線索的時間短語是否為相對時間,響應(yīng)于所述時間關(guān)鍵詞是隱含的相對時間,在步驟3023中轉(zhuǎn)換為絕對時間,進而在步驟3025中將其作為所述地址更新事件的時間。響應(yīng)于所述時間關(guān)鍵詞不是相對時間,進入步驟3024中。例如,今天,昨天,上周等等表述的是一種相對的時間。在這種情形下,可根據(jù)所發(fā)布信息的上下文,回復(fù)鏈以及評論歷史中可獲取的其它絕對時間,將所述隱含的相對時間線索轉(zhuǎn)變?yōu)樗龅刂犯率录臅r間戳。舉例而言,今天是EFG亞洲研究院在新大樓辦公的第一天,一上午同事們都在各自的嶄新座位上忙著收拾東西,若遇到在樓道里轉(zhuǎn)悠參觀的同事,也不忘寒暄著問對方新的位置。從今天開始,我們將牢記一個新地址..#海淀區(qū)XXX街8號#,XXX大廈XXX號樓,這就是EFG亞洲研究院.......
      在步驟3024中,可認為是未探測到時間術(shù)語,提取將所述網(wǎng)頁信息發(fā)布的時間,進而在步驟3025中將其作為所述地址更新線索的時間。通過在圖1所示的計算機系統(tǒng)中實現(xiàn)前述公開的方法流程,本申請還可體現(xiàn)為一種用于獲取命名實體地址更新信息的裝置,圖4示出了該裝置的框架示意圖,主要包括:獲取部件401,被配置為獲取與命名實體地址更新相關(guān)的數(shù)據(jù)信息;地址更新線索抽取部件402,被配置為用于從所述網(wǎng)頁信息中抽取所述命名實體的地址更新線索;時間及可信度確定部件403,被配置為確定所述地址更新線索的時間及可信度;地址更新信息確定部件404,被配置為根據(jù)所述時間及可信度確定有效的地址更新線索作為所述地址更新信息。在一個實施例中,所述獲取部件根據(jù)所述數(shù)據(jù)信息中包括命名實體以及至少一個地址更新關(guān)鍵詞,獲取與所述命名實體的地址更新相關(guān)的數(shù)據(jù)信息。在一個實施例中,所述地址更新線索包括發(fā)生地址更新的命名實體,地址更新關(guān)鍵詞以及目標地址。在一個實施例中,所述地址更新線索抽取部件包括:用于探測所述數(shù)據(jù)信息中與所述地址更新線索相關(guān)的時間短語的部件;用于根據(jù)所述時間短語的探測結(jié)果確定出所述地址更新線索的絕對時間的部件。在一個實施例中,所述根據(jù)所述時間短語的探測結(jié)果確定出所述地址更新線索的絕對時間包括:用于響應(yīng)于所述時間短語是絕對時間,直接將其確定為所述地址更新線索的時間的部件;用于響應(yīng)于所述時間短語是相對時間,將其轉(zhuǎn)換為絕對時間作為所確定的地址更新線索的時間的部件;用于響應(yīng)于未探測到時間術(shù)語,直接將所述網(wǎng)頁信息發(fā)布的時間確定為所述地址更新線索的時間的部件。在一個實施例中,所述時間及可信度確定部件至少包括以下幾種部件之一:用于根據(jù)所述數(shù)據(jù)信息被證實的程度進行確定的部件,當(dāng)所述數(shù)據(jù)信息被證實過,則具有較高的可信度,當(dāng)所述數(shù)據(jù)信息僅被轉(zhuǎn)發(fā)時,則具有較低的可信度;用于根據(jù)對所述數(shù)據(jù)信息的評論獲取的支持度信息進行確定的部件;用于根據(jù)所述數(shù)據(jù)信息作者的權(quán)威程度進行確定的部件。在一個實施例中,所述地址更新信息確定部件包括:用于選擇所述時間在預(yù)定時間段內(nèi)所述可信度最高的地址更新線索的部件,或者用于選擇所述可信度在預(yù)定范圍內(nèi)的并且所述時間最新的地址更新線索的部件。在一個實施例中,進一步包括用于根據(jù)所述有效的地址更新線索中的地址更新關(guān)鍵詞確定地址修正操作的部件。在一個實施例中,所述地址修正操作是修改地址、增加新地址、刪除地址中的一種或多種。在一個實施例中,進一步包括:用于根據(jù)所述地址更新信息提供地址變更警報或者直接進行地圖數(shù)據(jù)的更新的部件。應(yīng)指出的是,以上描述僅為示例,而不是對本發(fā)明的限制。附圖中的流程圖和框圖,圖示了按照本發(fā)明各種實施例的系統(tǒng)、方法和計算機程序產(chǎn)品的可能實現(xiàn)的體系架構(gòu)、功能和操作。在這點上,流程圖或框圖中的每個方框可以代表一個模塊、程序段、或代碼的一部分,所述模塊、程序段、或代碼的一部分包含一個或多個用于實現(xiàn)規(guī)定的邏輯功能的可執(zhí)行指令。也應(yīng)當(dāng)注意,在有些作為替換的實現(xiàn)中,方框中所標注的功能也可以以不同于附圖中所標注的順序發(fā)生。例如,兩個接連地表示的方框?qū)嶋H上可以基本并行地執(zhí)行,它們有時也可以按相反的順序執(zhí)行,這依所涉及的功能而定。也要注意的是,框圖和/或流程圖中的每個方框、以及框圖和/或流程圖中的方框的組合,可以用執(zhí)行規(guī)定的功能或操作的專用的基于硬件的系統(tǒng)來實現(xiàn),或者可以用專用硬件與計算機指令的組合來實現(xiàn)。
      權(quán)利要求
      1.一種用于獲取地址更新信息的方法,包括: 獲取與命名實體的地址更新相關(guān)的數(shù)據(jù)信息; 從所述數(shù)據(jù)信息中抽取所述命名實體的地址更新線索; 確定所述地址更新線索的時間及可信度; 根據(jù)所述時間及可信度確定有效的地址更新線索作為所述地址更新信息。
      2.按權(quán)利要求1所述的方法,其特征在于,根據(jù)所述數(shù)據(jù)信息中包括命名實體以及至少一個地址更新關(guān)鍵詞,獲取與所述命名實體的地址更新相關(guān)的數(shù)據(jù)信息。
      3.按權(quán)利要求1所述的方法,其特征在于,所述地址更新線索包括發(fā)生地址更新的命名實體,地址更新關(guān)鍵詞以及目標地址。
      4.按權(quán)利要求1所示的方法,其特征在于,所述確定地址更新線索的時間包括: 探測所述數(shù)據(jù)信息中與所述地址更新線索相關(guān)的時間短語; 根據(jù)所述時間短語的探測結(jié)果確定所述地址更新線索的絕對時間。
      5.按權(quán)利要求4所示的方法,其特征在于,所述根據(jù)所述時間短語的探測結(jié)果確定出所述地址更新線索的絕對時間包括: 響應(yīng)于所述時間短語是絕對時間,直接將其確定為所述地址更新線索的時間; 響應(yīng)于所述時間短語是相對時間,將其轉(zhuǎn)換為絕對時間后確定為所述地址更新線索的時間; 響應(yīng)于未探測到與所述地址更新線索相關(guān)時間術(shù)語,直接將所述數(shù)據(jù)信息發(fā)布的時間確定為所述地址更新線索的時間。
      6.按權(quán)利要求1所述的方法,其特征在于,至少根據(jù)以下方式之一確定所述可信度: 根據(jù)所述數(shù)據(jù)信息被證實的程度確定,當(dāng)所述數(shù)據(jù)信息被證實過,則具有較高的可信度,當(dāng)所述數(shù)據(jù)信息僅被轉(zhuǎn)發(fā)時,則具有較低的可信度; 根據(jù)對所述數(shù)據(jù)信息的評論獲取的支持度信息確定; 根據(jù)所述數(shù)據(jù)信息作者的權(quán)威程度確定。
      7.按權(quán)利要求1所述的方法,其特征在于,根據(jù)所述時間及所述可信度確定出有效的地址更新線索包括: 選擇所述時間在預(yù)定時間段內(nèi)所述可信度最高的地址更新線索,或者 選擇所述可信度在預(yù)定范圍內(nèi)的并且所述時間最新的地址更新線索。
      8.按權(quán)利要求1所述的方法,其特征在于,進一步包括根據(jù)所述有效的地址更新線索中的地址更新關(guān)鍵詞確定地址修正操作。
      9.按權(quán)利要求8所述的方法,其特征在于,所述地址修正操作是修改地址、增加新地址、刪除地址中的一種或多種。
      10.按權(quán)利要求1所述的方法,進一步包括:根據(jù)所述地址更新信息提供地址變更警報,或者直接進行地圖數(shù)據(jù)的更新。
      11.一種用于獲取地址更新信息的裝置,包括: 獲取部件,被配置為獲取與命名實體地址更新相關(guān)的數(shù)據(jù)信息; 地址更新線索抽取部件,被配置為用于從所述網(wǎng)頁信息中抽取所述命名實體的地址更新線索; 時間及可信度確定部件,被配置為確定所述地址更新線索的時間及可信度;地址更新信息確定部件,被配置為根據(jù)所述時間及可信度確定有效的地址更新線索作為所述地址更新信息。
      12.按權(quán)利要求11所述的裝置,其特征在于,所述獲取部件根據(jù)所述數(shù)據(jù)信息中包括命名實體以及至少一個地址更新關(guān)鍵詞,獲取與所述命名實體的地址更新相關(guān)的數(shù)據(jù)信肩、O
      13.按權(quán)利要求11所述的裝置,其特征在于,所述地址更新線索包括發(fā)生地址更新的命名實體,地址更新關(guān)鍵詞以及目標地址。
      14.按權(quán)利要求11所示的裝置,其特征在于,所述地址更新線索抽取部件包括: 用于探測所述數(shù)據(jù)信息中與所述地址更新線索相關(guān)的時間短語的部件; 用于根據(jù)所述時間短語的探測結(jié)果確定出所述地址更新線索的絕對時間的部件。
      15.按權(quán)利要求14所示的裝置,其特征在于,所述根據(jù)所述時間短語的探測結(jié)果確定出所述地址更新線索的絕對時間包括: 用于響應(yīng)于所述時間短語是絕對時間,直接將其確定為所述地址更新線索的時間的部件; 用于響應(yīng)于所述時間短語是相對時間,將其轉(zhuǎn)換為絕對時間作為所確定的地址更新線索的時間的部件; 用于響應(yīng)于未探測到時間術(shù)語,直接將所述網(wǎng)頁信息發(fā)布的時間確定為所述地址更新線索的時間的部件。
      16.按權(quán)利要求11所述的裝置,其特征在于,所述時間及可信度確定部件至少包括以下幾種部件之一: 用于根據(jù)所述數(shù)據(jù)信息被證實的程度進行確定的部件,當(dāng)所述數(shù)據(jù)信息被證實過,則具有較高的可信度,當(dāng)所述數(shù)據(jù)信息僅被轉(zhuǎn)發(fā)時,則具有較低的可信度; 用于根據(jù)對所述數(shù)據(jù)信息的評論獲取的支持度信息進行確定的部件; 用于根據(jù)所述數(shù)據(jù)信息作者的權(quán)威程度進行確定的部件。
      17.按權(quán)利要求11所述的裝置,其特征在于,所述地址更新信息確定部件包括: 用于選擇所述時間在預(yù)定時間段內(nèi)所述可信度最高的地址更新線索的部件,或者 用于選擇所述可信度在預(yù)定范圍內(nèi)的并且所述時間最新的地址更新線索的部件。
      18.按權(quán)利要求11所述的裝置,其特征在于,進一步包括用于根據(jù)所述有效的地址更新線索中的地址更新關(guān)鍵詞確定地址修正操作的部件。
      19.按權(quán)利要求18所述的裝置,其特征在于,所述地址修正操作是修改地址、增加新地址、刪除地址中的一種或多種。
      20.按權(quán)利要求11所述的裝置,進一步包括:用于根據(jù)所述地址更新信息提供地址變更警報或者直接進行地圖數(shù)據(jù)的更新的部件。
      全文摘要
      本發(fā)明提出了一種用于獲取地址更新信息的方法和裝置,包括獲取與命名實體的地址更新相關(guān)的網(wǎng)頁信息;從所述網(wǎng)頁信息中抽取表示所述命名實體地址更新線索的關(guān)鍵詞;確定所述地址更新的時間及可信度;根據(jù)所述時間及可信度確定所述地址更新信息。采用本發(fā)明的方案可以通過獲取的網(wǎng)站信息確定地址更新信息。
      文檔編號G06F17/30GK103092855SQ20111033845
      公開日2013年5月8日 申請日期2011年10月31日 優(yōu)先權(quán)日2011年10月31日
      發(fā)明者郭宏蕾, 蔡柯柯, ?;奂? 張俐, 蘇中 申請人:國際商業(yè)機器公司
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1