国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      基于互聯(lián)網(wǎng)的事件發(fā)生時(shí)間采集方法

      文檔序號(hào):9489454閱讀:273來源:國(guó)知局
      基于互聯(lián)網(wǎng)的事件發(fā)生時(shí)間采集方法
      【技術(shù)領(lǐng)域】
      [0001]本發(fā)明涉及互聯(lián)網(wǎng)的技術(shù)領(lǐng)域,具體說是一種基于互聯(lián)網(wǎng)的事件發(fā)生時(shí)間采集方法。
      【背景技術(shù)】
      [0002]事件通常是指在某一特定時(shí)間和特定地點(diǎn)的特定事情,在互聯(lián)網(wǎng)相對(duì)較為發(fā)達(dá)的今天,與各種事件相關(guān)聯(lián)的網(wǎng)絡(luò)新聞或文本信息不斷通過互聯(lián)網(wǎng)對(duì)外發(fā)布,而互聯(lián)網(wǎng)的快速傳播、迅速更新的特性使得網(wǎng)絡(luò)與新聞的結(jié)合得到了巨大的成功。
      [0003]將網(wǎng)絡(luò)中發(fā)布的事件按照時(shí)間順序進(jìn)行記錄匯總即可得到某一時(shí)間階段內(nèi)的某一事件或某類時(shí)間動(dòng)態(tài)發(fā)展的走向,從而能夠挖據(jù)出事件的發(fā)展脈絡(luò),從而分析得到重大事件的內(nèi)因和外果,具有一定的指導(dǎo)意義。但為了追求時(shí)效性,大部分網(wǎng)絡(luò)新聞和事件相關(guān)文本并不存在明確的點(diǎn)時(shí)間,而多采用段時(shí)間或時(shí)間偏移量的方式對(duì)事件進(jìn)行描述,而新聞本身的受眾為自然人,人可以通過新聞文本中的描述直接理解得到事件的發(fā)生時(shí)間,而計(jì)算機(jī)對(duì)新聞進(jìn)行匯總時(shí)則不能對(duì)點(diǎn)時(shí)間之外的描述方式做出相對(duì)正確地記錄反應(yīng)。

      【發(fā)明內(nèi)容】

      [0004]
      本發(fā)明要解決的技術(shù)問題是提供一種基于互聯(lián)網(wǎng)的事件發(fā)生時(shí)間采集方法。
      [0005]本發(fā)明為解決公知技術(shù)中存在的技術(shù)問題所采取的技術(shù)方案是:
      本發(fā)明的基于互聯(lián)網(wǎng)的事件發(fā)生時(shí)間采集方法,包括以下步驟:
      A、采集事件相關(guān)文檔;
      B、將文檔分割,提取文檔內(nèi)明確時(shí)間信息,判斷該時(shí)間信息是否合法,并將明確時(shí)間信息整理格式,即得事件發(fā)生時(shí)間;
      C、文檔中未提取到上述明確時(shí)間信息時(shí),將采集到該文檔的時(shí)間定義為基準(zhǔn)時(shí)間;
      D、對(duì)文檔進(jìn)行文字識(shí)別,提取文檔中與時(shí)間描述相對(duì)應(yīng)的時(shí)間詞;
      E、將時(shí)間詞與上述基準(zhǔn)時(shí)間進(jìn)行關(guān)聯(lián),對(duì)基準(zhǔn)時(shí)間按時(shí)間詞進(jìn)行相應(yīng)修正,修正后的時(shí)間整理格式即得事件發(fā)生時(shí)間。
      [0006]本發(fā)明還可以采用以下技術(shù)措施:
      步驟B中,先提取文檔內(nèi)與年、月、日、時(shí)、分或秒各對(duì)應(yīng)的明確時(shí)間信息;如由文檔內(nèi)未提取到年對(duì)應(yīng)的明確時(shí)間信息時(shí),將采集時(shí)對(duì)應(yīng)年的信息補(bǔ)入;如由文檔內(nèi)未提取到年、月對(duì)應(yīng)的明確時(shí)間信息時(shí),將采集時(shí)對(duì)應(yīng)年、月的信息補(bǔ)入;如由文檔內(nèi)未提取到年、月、日對(duì)應(yīng)的明確時(shí)間信息時(shí),將采集時(shí)對(duì)應(yīng)年、月、日的信息補(bǔ)入。
      [0007]如由文檔內(nèi)未提取到時(shí)、分、秒對(duì)應(yīng)的明確時(shí)間信息時(shí),將時(shí)、分、秒位置分別補(bǔ)零。
      [0008]文檔中未提取到明確時(shí)間信息時(shí),文檔出現(xiàn)在互聯(lián)網(wǎng)上的時(shí)間定義為采集到該文檔的時(shí)間。
      [0009]文檔中提取的時(shí)間詞為距離基準(zhǔn)時(shí)間的時(shí)間偏移量。
      [0010]本發(fā)明具有的優(yōu)點(diǎn)和積極效果是:
      本發(fā)明的基于互聯(lián)網(wǎng)的事件發(fā)生時(shí)間采集方法中,如能提取事件相關(guān)文檔中的明確時(shí)間信息,則以整理格式后的明確時(shí)間信息作為事件發(fā)生時(shí)間,當(dāng)明確時(shí)間信息無法獲取,則通過文檔中的時(shí)間詞對(duì)基準(zhǔn)時(shí)間即文檔采集時(shí)間進(jìn)行修正,以修正后的時(shí)間作為事件發(fā)生時(shí)間。通過本發(fā)明能夠通過文檔采集將互聯(lián)網(wǎng)中記錄的事件形成與時(shí)間對(duì)應(yīng)相關(guān)聯(lián)的事件列表,從而便于對(duì)事件記錄進(jìn)行后續(xù)的處理和應(yīng)用。
      【具體實(shí)施方式】
      [0011]本發(fā)明的基于互聯(lián)網(wǎng)的事件發(fā)生時(shí)間采集方法,包括以下步驟:
      A、采集事件相關(guān)文檔;
      B、將文檔分割,提取文檔內(nèi)明確時(shí)間信息,判斷該時(shí)間信息是否合法,并將明確時(shí)間信息整理格式,即得事件發(fā)生時(shí)間;整理時(shí)間格式這一步驟中包括將文檔中的時(shí)間描述方式修改為統(tǒng)一的格式,例如將“02:00ΡΜ”修改為“ 14:00”等;
      C、文檔中未提取到上述明確時(shí)間信息時(shí),將采集到該文檔的時(shí)間定義為基準(zhǔn)時(shí)間;
      D、對(duì)文檔進(jìn)行文字識(shí)別,提取文檔中與時(shí)間描述相對(duì)應(yīng)的時(shí)間詞;時(shí)間詞一般對(duì)應(yīng)描述性的詞匯,通常為距離基準(zhǔn)時(shí)間的時(shí)間偏移量,如“幾天前”、“幾小時(shí)前”等;
      E、將時(shí)間詞與上述基準(zhǔn)時(shí)間進(jìn)行關(guān)聯(lián),對(duì)基準(zhǔn)時(shí)間按時(shí)間詞進(jìn)行相應(yīng)修正,修正后的時(shí)間整理格式即得事件發(fā)生時(shí)間。
      [0012]步驟B中,先提取文檔內(nèi)與年、月、日、時(shí)、分或秒各對(duì)應(yīng)的明確時(shí)間信息;如由文檔內(nèi)未提取到年對(duì)應(yīng)的明確時(shí)間信息時(shí),將采集時(shí)對(duì)應(yīng)年的信息補(bǔ)入;如由文檔內(nèi)未提取至IJ年、月對(duì)應(yīng)的明確時(shí)間信息時(shí),將采集時(shí)對(duì)應(yīng)年、月的信息補(bǔ)入;如由文檔內(nèi)未提取到年、月、日對(duì)應(yīng)的明確時(shí)間信息時(shí),將采集時(shí)對(duì)應(yīng)年、月、日的信息補(bǔ)入。
      [0013]如由文檔內(nèi)未提取到時(shí)、分、秒對(duì)應(yīng)的明確時(shí)間信息時(shí),將時(shí)、分、秒位置分別補(bǔ)零。
      [0014]當(dāng)對(duì)基準(zhǔn)時(shí)間通過時(shí)間詞進(jìn)行修正時(shí),對(duì)時(shí)分秒的修正仍按照以上規(guī)則。
      [0015]文檔中未提取到明確時(shí)間信息時(shí),文檔出現(xiàn)在互聯(lián)網(wǎng)上的時(shí)間定義為采集到該文檔的時(shí)間。
      [0016]以上所述,僅是本發(fā)明的較佳實(shí)施例而已,并非對(duì)本發(fā)明作任何形式上的限制,雖然本發(fā)明已以較佳實(shí)施例公開如上,然而,并非用以限定本發(fā)明,任何熟悉本專業(yè)的技術(shù)人員,在不脫離本發(fā)明技術(shù)方案范圍內(nèi),當(dāng)然會(huì)利用揭示的技術(shù)內(nèi)容作出些許更動(dòng)或修飾,成為等同變化的等效實(shí)施例,但凡是未脫離本發(fā)明技術(shù)方案的內(nèi)容,依據(jù)本發(fā)明的技術(shù)實(shí)質(zhì)對(duì)以上實(shí)施例所作的任何簡(jiǎn)單修改、等同變化與修飾,均屬于本發(fā)明技術(shù)方案的范圍內(nèi)。
      【主權(quán)項(xiàng)】
      1.一種基于互聯(lián)網(wǎng)的事件發(fā)生時(shí)間采集方法,包括以下步驟: A、采集事件相關(guān)文檔; B、將文檔分割,提取文檔內(nèi)明確時(shí)間信息,判斷該時(shí)間信息是否合法,并將明確時(shí)間信息整理格式,即得事件發(fā)生時(shí)間; C、文檔中未提取到上述明確時(shí)間信息時(shí),將采集到該文檔的時(shí)間定義為基準(zhǔn)時(shí)間; D、對(duì)文檔進(jìn)行文字識(shí)別,提取文檔中與時(shí)間描述相對(duì)應(yīng)的時(shí)間詞; E、將時(shí)間詞與上述基準(zhǔn)時(shí)間進(jìn)行關(guān)聯(lián),對(duì)基準(zhǔn)時(shí)間按時(shí)間詞進(jìn)行相應(yīng)修正,修正后的時(shí)間整理格式即得事件發(fā)生時(shí)間。2.根據(jù)權(quán)利要求1所述的基于互聯(lián)網(wǎng)的事件發(fā)生時(shí)間采集方法,其特征在于:步驟B中,先提取文檔內(nèi)與年、月、日、時(shí)、分或秒各對(duì)應(yīng)的明確時(shí)間信息;如由文檔內(nèi)未提取到年對(duì)應(yīng)的明確時(shí)間信息時(shí),將采集時(shí)對(duì)應(yīng)年的信息補(bǔ)入;如由文檔內(nèi)未提取到年、月對(duì)應(yīng)的明確時(shí)間信息時(shí),將采集時(shí)對(duì)應(yīng)年、月的信息補(bǔ)入;如由文檔內(nèi)未提取到年、月、日對(duì)應(yīng)的明確時(shí)間信息時(shí),將采集時(shí)對(duì)應(yīng)年、月、日的信息補(bǔ)入。3.根據(jù)權(quán)利要求2所述的基于互聯(lián)網(wǎng)的事件發(fā)生時(shí)間采集方法,其特征在于:如由文檔內(nèi)未提取到時(shí)、分、秒對(duì)應(yīng)的明確時(shí)間信息時(shí),將時(shí)、分、秒位置分別補(bǔ)零。4.根據(jù)權(quán)利要求1、2或3所述的基于互聯(lián)網(wǎng)的事件發(fā)生時(shí)間采集方法,其特征在于:文檔中未提取到明確時(shí)間信息時(shí),文檔出現(xiàn)在互聯(lián)網(wǎng)上的時(shí)間定義為采集到該文檔的時(shí)間。5.根據(jù)權(quán)利要求1、2或3所述的基于互聯(lián)網(wǎng)的事件發(fā)生時(shí)間采集方法,其特征在于:文檔中提取的時(shí)間詞為距離基準(zhǔn)時(shí)間的時(shí)間偏移量。
      【專利摘要】一種基于互聯(lián)網(wǎng)的事件發(fā)生時(shí)間采集方法,包括以下步驟:采集事件相關(guān)文檔;將文檔分割,提取文檔內(nèi)明確時(shí)間信息,判斷該時(shí)間信息是否合法,并將明確時(shí)間信息整理格式,即得事件發(fā)生時(shí)間;文檔中未提取到上述明確時(shí)間信息時(shí),將采集到該文檔的時(shí)間定義為基準(zhǔn)時(shí)間;對(duì)文檔進(jìn)行文字識(shí)別,提取文檔中與時(shí)間描述相對(duì)應(yīng)的時(shí)間詞;將時(shí)間詞與上述基準(zhǔn)時(shí)間進(jìn)行關(guān)聯(lián),對(duì)基準(zhǔn)時(shí)間按時(shí)間詞進(jìn)行相應(yīng)修正,修正后的時(shí)間整理格式即得事件發(fā)生時(shí)間。通過本發(fā)明能夠通過文檔采集將互聯(lián)網(wǎng)中記錄的事件形成與時(shí)間對(duì)應(yīng)相關(guān)聯(lián)的事件列表,從而便于對(duì)事件記錄進(jìn)行后續(xù)的處理和應(yīng)用。
      【IPC分類】G06F17/30
      【公開號(hào)】CN105243092
      【申請(qǐng)?zhí)枴緾N201510576507
      【發(fā)明人】龐曉曦, 楊偉峰, 張作職
      【申請(qǐng)人】天津海量信息技術(shù)有限公司
      【公開日】2016年1月13日
      【申請(qǐng)日】2015年9月11日
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1