国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      日歷提醒生成方法和裝置制造方法

      文檔序號:6512402閱讀:186來源:國知局
      日歷提醒生成方法和裝置制造方法
      【專利摘要】本發(fā)明公開了一種日歷提醒生成方法和裝置,涉及移動互聯(lián)網(wǎng)【技術(shù)領(lǐng)域】。該方法通過自然語言處理技術(shù)和分類器,自動判斷郵件是否為日程類郵件,進而從非結(jié)構(gòu)化郵件文本中自動提取日程詳情,并最終自動設(shè)置日歷提醒。本發(fā)明降低了用戶使用郵件系統(tǒng)的復(fù)雜性,提升用戶使用體驗,同時電子日歷產(chǎn)品可以利用本發(fā)明技術(shù)實現(xiàn)從郵件中自動提取日程信息,豐富日程內(nèi)容來源,提升產(chǎn)品的用戶使用率和活躍度。
      【專利說明】日歷提醒生成方法和裝置

      【技術(shù)領(lǐng)域】
      [0001]本發(fā)明涉及移動互聯(lián)網(wǎng)【技術(shù)領(lǐng)域】,特別涉及一種日歷提醒生成方法和裝置。

      【背景技術(shù)】
      [0002]電子郵件正越來越多的被人們使用,隨著互聯(lián)網(wǎng)的快速發(fā)展,電子郵件的內(nèi)容也越來越豐富,海量信息需要用戶通過郵件處理,其中較多的一類郵件即為包含日程信息的郵件,如:會議通知、賬單截止日通知、酒店、機票訂單確認等等。
      [0003]當(dāng)前,用戶通常的做法是:收取郵件,人工在海量郵件中找到每個日程類郵件,手動將日程的主題、時間、地點、參與者等信息添加到日程管理軟件中。
      [0004]Gmail在郵件中提供了創(chuàng)建日程活動的快捷方式,但是Gmail并且只提供了日程活動的模板,無法自動判斷該郵件是否包含日程信息,而無法自動將日程內(nèi)容添加。


      【發(fā)明內(nèi)容】

      [0005]本發(fā)明的發(fā)明人發(fā)現(xiàn)上述現(xiàn)有技術(shù)中存在問題,并因此針對所述問題中的至少一個問題提出了一種新的技術(shù)方案。
      [0006]本發(fā)明的一個目的是提供一種用于日歷提醒自動生成的技術(shù)方案。
      [0007]根據(jù)本發(fā)明的第一方面,提供了一種日歷提醒生成方法,包括:
      [0008]從郵件中提取出郵件內(nèi)容,所述郵件內(nèi)容包括郵件正文;
      [0009]利用自然語言處理工具對所述郵件正文進行分詞、詞性標(biāo)注和命名實體識別、去除停用詞并統(tǒng)計非停用詞的詞頻;
      [0010]通過分類器將所述郵件劃分為非日程郵件、創(chuàng)建類日程郵件、修改類日程郵件、取消類日程郵件;
      [0011]對于日程類郵件,根據(jù)所述命名實體識別結(jié)果與規(guī)則模板匹配結(jié)合確定日程活動的時間、地點、主題、參與者信息;
      [0012]根據(jù)所述日程主題、時間、地點、參與者信息色生成日歷提醒。
      [0013]可選地,通過分類器將所述郵件劃分為非日程郵件、創(chuàng)建類日程郵件、修改類日程郵件、取消類日程郵件包括:選取郵件正文長度、關(guān)鍵詞的TFIDF (Term Frequency -1nverse Document Frequency,詞頻-反文檔頻率)、詞頻、詞性、關(guān)鍵詞左右各一個窗口的詞及其詞性作為日程郵件特征構(gòu)建分類器的特征向量,通過支持向量機SVM分類器將所述郵件劃分為非日程郵件、創(chuàng)建類日程郵件、修改類日程郵件、取消類日程郵件。
      [0014]可選地,該方法還包括:預(yù)先利用人工標(biāo)注的日程郵件語料訓(xùn)練所述SVM分類器。
      [0015]可選地,郵件內(nèi)容還包括郵件主題、郵件發(fā)送方、接收方和時間。
      [0016]可選地,從郵件中提取出郵件內(nèi)容包括:利用所述郵件中的TAG標(biāo)簽去除掉所述郵件冗余信息,提取出所述郵件的主題、發(fā)送方、接收方、時間、郵件正文信息。
      [0017]根據(jù)本發(fā)明的另一方面,提供一種日歷提醒生成裝置,包括:
      [0018]郵件內(nèi)容提取模塊,用于從郵件中提取出郵件內(nèi)容,所述郵件內(nèi)容包括郵件正文;
      [0019]語言分析處理模塊,用于利用自然語言處理工具對所述郵件正文進行分詞、詞性標(biāo)注和命名實體識別;去除停用詞并統(tǒng)計非停用詞的詞頻;
      [0020]郵件分類模塊,用于通過分類器將所述郵件劃分為非日程郵件、創(chuàng)建類日程郵件、修改類日程郵件、取消類日程郵件;
      [0021]日程信息提取模塊,用于對于日程類郵件,根據(jù)所述命名實體識別結(jié)果與規(guī)則模板匹配結(jié)合確定日程活動的時間、地點、主題、參與者信息;
      [0022]日歷提醒生成模塊,用于根據(jù)所述日程主題、時間、地點、參與者信息色生成日歷提醒。
      [0023]可選地,郵件分類模塊包括:特征向量構(gòu)建單元,用于選取郵件正文長度、關(guān)鍵詞的TFIDF、詞頻、詞性、關(guān)鍵詞左右各一個窗口的詞及其詞性作為日程郵件特征構(gòu)建分類器的特征向量;日程郵件分類單元,用于根據(jù)所述特征向量通過SVM (Support VectorMachine,支持向量機)分類器將所述郵件劃分為非日程郵件、創(chuàng)建類日程郵件、修改類日程郵件、取消類日程郵件。
      [0024]可選地,該裝置還包括:分類器訓(xùn)練模塊,用于預(yù)先利用人工標(biāo)注的日程郵件語料訓(xùn)練所述SVM分類器。
      [0025]可選地,郵件內(nèi)容還包括郵件主題、郵件發(fā)送方、接收方和時間。
      [0026]可選地,郵件內(nèi)容提取模塊利用所述郵件中的TAG標(biāo)簽去除掉所述郵件冗余信息,提取出所述郵件的主題、發(fā)送方、接收方、時間、郵件正文信息。
      [0027]本發(fā)明的一個優(yōu)點在于,利用自然語言處理技術(shù)自動判斷郵件是否為日程類郵件,進一步自動提取日程內(nèi)容并設(shè)置日程提醒,整個過程自動完成,實現(xiàn)了日程內(nèi)容的自動添加。
      [0028]通過以下參照附圖對本發(fā)明的示例性實施例的詳細描述,本發(fā)明的其它特征及其優(yōu)點將會變得清楚。

      【專利附圖】

      【附圖說明】
      [0029]構(gòu)成說明書的一部分的附圖描述了本發(fā)明的實施例,并且連同說明書一起用于解釋本發(fā)明的原理。
      [0030]參照附圖,根據(jù)下面的詳細描述,可以更加清楚地理解本發(fā)明,其中:
      [0031]圖1示出根據(jù)本發(fā)明的日歷提醒生成方法的一個實施例的流程圖。
      [0032]圖2示出根據(jù)本發(fā)明的日歷提醒生成方法的另一個實施例的流程示意圖。
      [0033]圖3示出根據(jù)本發(fā)明的日歷提醒生成裝置的一個實施例的結(jié)構(gòu)圖。
      [0034]圖4示出根據(jù)本發(fā)明的日歷提醒生成裝置的另一個實施例的結(jié)構(gòu)圖。
      [0035]圖5示出根據(jù)本發(fā)明的日歷提醒生成系統(tǒng)的一個實施例的結(jié)構(gòu)圖。

      【具體實施方式】
      [0036]現(xiàn)在將參照附圖來詳細描述本發(fā)明的各種示例性實施例。應(yīng)注意到:除非另外具體說明,否則在這些實施例中闡述的部件和步驟的相對布置、數(shù)字表達式和數(shù)值不限制本發(fā)明的范圍。
      [0037]同時,應(yīng)當(dāng)明白,為了便于描述,附圖中所示出的各個部分的尺寸并不是按照實際的比例關(guān)系繪制的。
      [0038]以下對至少一個示例性實施例的描述實際上僅僅是說明性的,決不作為對本發(fā)明及其應(yīng)用或使用的任何限制。
      [0039]對于相關(guān)領(lǐng)域普通技術(shù)人員已知的技術(shù)、方法和設(shè)備可能不作詳細討論,但在適當(dāng)情況下,所述技術(shù)、方法和設(shè)備應(yīng)當(dāng)被視為授權(quán)說明書的一部分。
      [0040]在這里示出和討論的所有示例中,任何具體值應(yīng)被解釋為僅僅是示例性的,而不是作為限制。因此,示例性實施例的其它示例可以具有不同的值。
      [0041]應(yīng)注意到:相似的標(biāo)號和字母在下面的附圖中表示類似項,因此,一旦某一項在一個附圖中被定義,則在隨后的附圖中不需要對其進行進一步討論。
      [0042]圖1示出根據(jù)本發(fā)明的日歷提醒生成方法的一個實施例的流程圖。
      [0043]如圖1所示,步驟102,從接收的郵件中提取出郵件內(nèi)容,郵件內(nèi)容包括郵件主題和郵件正文。
      [0044]步驟104,利用自然語言處理工具對郵件正文進行分詞、詞性標(biāo)注和命名實體識別;去除停用詞并統(tǒng)計非停用詞的詞頻。
      [0045]分詞(Word Segmentat1n)指的是將一個文字序列切分成一個一個單獨的詞。對于輸入的一段文字,成功的進行分詞,以進一步達到自動識別語句含義的效果。
      [0046]詞性標(biāo)注指標(biāo)注文本中詞的詞性,如動詞V、名詞N等,可以通過詞性標(biāo)注工具實現(xiàn)詞性標(biāo)注。命名實體一般是指人名、地名、機構(gòu)名,如“張三”、“李四”、“天安門”、“中國電信”等,可以通過命名實體識別工具來實現(xiàn)。一般詞性標(biāo)注和命名實體工具集成在一起統(tǒng)一提供,可采用現(xiàn)有的工具獲得;對郵件正文分詞后,例如“的”、“ 了 ”等對文本內(nèi)容無意義的虛詞或者系統(tǒng)中其他限定為沒有意義的詞,可以預(yù)先生成停用詞表,通過停用詞表可以過濾掉停用詞。對于去除停用詞后剩下的非停用詞的詞,統(tǒng)計這些詞的詞頻,即該詞在整個文本中出現(xiàn)的次數(shù),出現(xiàn)一次則詞頻加一。
      [0047]步驟106,通過分類器將郵件劃分為非日程郵件、創(chuàng)建類日程郵件、修改類日程郵件、取消類日程郵件。
      [0048]步驟108,對于日程類郵件,根據(jù)命名實體識別結(jié)果與規(guī)則模板匹配結(jié)合確定日程活動的時間、地點、主題、參與者信息;
      [0049]步驟110,根據(jù)日程主題、時間、地點、參與者信息色生成日歷提醒。
      [0050]上述實施例中,可以通過自然語言技術(shù)自動進行分詞,并進行詞性標(biāo)注和識別命名實體,并根據(jù)訓(xùn)練好的分類器自動將郵件分為日程郵件和非日程郵件,再結(jié)合規(guī)則模板確定日程活動的時間、地點、主題和參與者信息,從而自動生成日歷提醒信息。整個過程自動完成,實現(xiàn)了日程內(nèi)容的自動添加。此外,日程郵件還可以自動分為創(chuàng)建類日程郵件、修改類日程郵件、取消類日程郵件,使得識別更準(zhǔn)確,自動添加成功率高。
      [0051]圖2示出根據(jù)本發(fā)明的日歷提醒生成方法的另一個實施例的流程示意圖。
      [0052]如圖2所示,步驟201,郵件預(yù)處理步驟。系統(tǒng)接收到新郵件,分析郵件源文件,利用郵件中的TAG標(biāo)簽去除掉冗余信息,提取出郵件主題、發(fā)送方、接收方、時間、郵件正文等內(nèi)容;利用自然語言處理工具對郵件正文進行分詞、去除停用詞、統(tǒng)計詞頻、詞性標(biāo)注、命名實體識別等工作。
      [0053]步驟202,郵件分類步驟。經(jīng)過預(yù)處理的郵件到達SVM分類器將郵件分為四個類別:非日程郵件、創(chuàng)建類日程郵件、修改類日程郵件、取消類日程郵件。利用人工標(biāo)注的日程郵件語料訓(xùn)練SVM分類器(例如,使用開源的WEKA機器學(xué)習(xí)工具集)。選取郵件正文長度、關(guān)鍵詞的TFIDF、詞頻、詞性、關(guān)鍵詞左右各一個窗口的詞及其詞性等作為日程郵件特征構(gòu)建分類器的特征向量,經(jīng)過預(yù)處理的郵件到達時,訓(xùn)練好的SVM分類器自動將郵件劃分到四個類別中的某一類。關(guān)鍵詞指非停用詞之外的所有出現(xiàn)過的詞。TFIDF是信息檢索領(lǐng)域的專業(yè)詞匯,是衡量一個詞在文本中重要性的指標(biāo)。TF-1DF主要意義在于,如果某個詞或短語在一篇文章中出現(xiàn)的頻率TF高,并且在其他文章中很少出現(xiàn),則認為此詞或者短語具有很好的類別區(qū)分能力,適合用來分類。TF (Term Frequency,詞頻)指的是某一個給定的詞語在該文件中出現(xiàn)的次數(shù)。IDF (Inverse Document Frequency,反文檔頻率)指的如果包含詞條的文檔越少,IDF越大,則說明詞條具有很好的類別區(qū)分能力。
      [0054]步驟203,日歷詳情提取步驟。對于劃分到三種日程類郵件的內(nèi)容,通過日程詳情提取子模塊提取日程詳情。例如,利用步驟201中預(yù)處理的命名實體識別結(jié)果(包括:人名、地名、機構(gòu)名、時間等)與從訓(xùn)練語料中提取出的規(guī)則模板匹配結(jié)合的方法,如:[會議地點=XXX ;],則可提取出XXX為會議地點;定于[TIME]在[LOCAT1N]舉行[SUBJECT];請于[TIME]之前還款;[--ΜΕ1]中國國航CA1832 [LOCAT1N]-北京[TIME2]等模板,確定日程活動的時間、地點、主題、參與者等內(nèi)容。日程活動的時間、地點、主題等均對應(yīng)一系列規(guī)貝U,這些規(guī)則可以從訓(xùn)練語料中提取或者人為制定,通過模板匹配可以提取出上述信息,再結(jié)合命名實體和詞性標(biāo)注結(jié)果可以獲得時間、地點、主題等信息。
      [0055]步驟204,日歷提醒設(shè)置步驟。創(chuàng)建新日程,將步驟203中提取的日程主題、時間、地點、參與者等信息添加到日程提醒中,并發(fā)送給日程服務(wù)器。
      [0056]上述實施例中,通過訓(xùn)練的SVM分類器,結(jié)合經(jīng)過自然語言處理后獲得的關(guān)鍵詞的特征向量,自動實現(xiàn)了郵件的分類和識別,較好地匹配了日程郵件的特點,成功率高。
      [0057]圖3示出根據(jù)本發(fā)明的日歷提醒生成裝置的一個實施例的結(jié)構(gòu)圖。如圖3所示,該日歷提醒生成裝置300,包括:郵件內(nèi)容提取模塊31,用于從郵件中提取出郵件內(nèi)容,郵件內(nèi)容包括郵件正文;語言分析處理模塊32,用于利用自然語言處理工具對郵件正文進行分詞、詞性標(biāo)注和命名實體識別、去除停用詞并統(tǒng)計去除停用詞后剩余詞的詞頻;郵件分類模塊33,用于通過分類器將郵件劃分為非日程郵件、創(chuàng)建類日程郵件、修改類日程郵件、取消類日程郵件;日程信息提取模塊34,用于對于日程類郵件,根據(jù)命名實體識別結(jié)果與規(guī)則模板匹配結(jié)合確定日程活動的時間、地點、主題、參與者信息;日歷提醒生成模塊35,用于根據(jù)日程主題、時間、地點、參與者信息色生成日歷提醒。郵件內(nèi)容還可以包括郵件主題、郵件發(fā)送方、接收方和時間。郵件內(nèi)容提取模塊31利用所述郵件中的TAG標(biāo)簽去除掉郵件冗余信息,提取出郵件的主題、發(fā)送方、接收方、時間、郵件正文信息。
      [0058]圖4示出根據(jù)本發(fā)明的日歷提醒生成裝置的另一個實施例的結(jié)構(gòu)圖。如圖4所示,該實施例中日歷提醒生成裝置400的郵件分類模塊43包括:特征向量構(gòu)建單元431,用于選取郵件正文長度、關(guān)鍵詞的TFIDF、詞頻、詞性、關(guān)鍵詞左右各一個窗口的詞及其詞性作為日程郵件特征構(gòu)建分類器的特征向量;日程郵件分類單元432,用于根據(jù)構(gòu)建的特征向量通過支持向量機SVM分類器將郵件劃分為非日程郵件、創(chuàng)建類日程郵件、修改類日程郵件、取消類日程郵件。
      [0059]在一個實施例中,日歷提醒生成裝置還包括:分類器訓(xùn)練模塊40,用于預(yù)先利用人工標(biāo)注的日程郵件語料訓(xùn)練SVM分類器。
      [0060]圖3和圖4實施例中各個模塊和單元的功能和作用可以參見上述方法實施例中的對應(yīng)描述,為簡潔起見在此不再詳細描述。
      [0061]圖5示出根據(jù)本發(fā)明的日歷提醒生成系統(tǒng)的一個實施例的結(jié)構(gòu)圖。如圖5所示,相比傳統(tǒng)的郵件系統(tǒng),該系統(tǒng)在原有的網(wǎng)絡(luò)、郵件服務(wù)器51、日程服務(wù)器52、郵件客戶端53之夕卜,在郵件服務(wù)器51中增加了日歷提醒生成裝置511。日歷提醒生成裝置511可以參見圖3、圖4及上文實施例中的描述。在原有電子郵件系統(tǒng)的基礎(chǔ)上,增加了日歷提醒生成裝置,通過上述日歷提醒生成裝置以及對應(yīng)的模塊可以實現(xiàn)日程類郵件的自動分類,日程詳情的自動提取以及日程提醒的自動添加。通過在現(xiàn)有郵件架構(gòu)中增加日歷提醒生成裝置,實現(xiàn)自動判斷郵件是否為日程類郵件,進而從非結(jié)構(gòu)化郵件文本中自動提取日程詳情,并最終自動設(shè)置日歷提醒。
      [0062]本公開面向電子郵件應(yīng)用提出一種從郵件中自動生成日歷提醒的系統(tǒng)和方法,利用自然語言處理技術(shù)自動判斷郵件是否為日程類郵件,進一步自動提取日程內(nèi)容(主題、時間、地點、參與者等)并設(shè)置日程提醒的系統(tǒng)和方法。
      [0063]本公開的技術(shù)方案降低了用戶使用郵件系統(tǒng)的復(fù)雜性,提升用戶使用體驗,同時電子日歷產(chǎn)品可以利用本專利技術(shù)實現(xiàn)從郵件中自動提取日程信息,豐富日程內(nèi)容來源,提升產(chǎn)品的用戶使用率和活躍度。
      [0064]本公開適用于現(xiàn)有郵箱系統(tǒng)的功能改進,可以實現(xiàn)日程郵件的自動篩選;同時適用于優(yōu)化現(xiàn)有電子日歷軟件,可實現(xiàn)日程來源的自動獲取。
      [0065]至此,已經(jīng)詳細描述了根據(jù)本發(fā)明的日歷提醒生成方法和裝置。為了避免遮蔽本發(fā)明的構(gòu)思,沒有描述本領(lǐng)域所公知的一些細節(jié)。本領(lǐng)域技術(shù)人員根據(jù)上面的描述,完全可以明白如何實施這里公開的技術(shù)方案。
      [0066]可能以許多方式來實現(xiàn)本發(fā)明的方法和系統(tǒng)。例如,可通過軟件、硬件、固件或者軟件、硬件、固件的任何組合來實現(xiàn)本發(fā)明的方法和系統(tǒng)。用于所述方法的步驟的上述順序僅是為了進行說明,本發(fā)明的方法的步驟不限于以上具體描述的順序,除非以其它方式特別說明。此外,在一些實施例中,還可將本發(fā)明實施為記錄在記錄介質(zhì)中的程序,這些程序包括用于實現(xiàn)根據(jù)本發(fā)明的方法的機器可讀指令。因而,本發(fā)明還覆蓋存儲用于執(zhí)行根據(jù)本發(fā)明的方法的程序的記錄介質(zhì)。
      [0067]雖然已經(jīng)通過示例對本發(fā)明的一些特定實施例進行了詳細說明,但是本領(lǐng)域的技術(shù)人員應(yīng)該理解,以上示例僅是為了進行說明,而不是為了限制本發(fā)明的范圍。本領(lǐng)域的技術(shù)人員應(yīng)該理解,可在不脫離本發(fā)明的范圍和精神的情況下,對以上實施例進行修改。本發(fā)明的范圍由所附權(quán)利要求來限定。
      【權(quán)利要求】
      1.一種日歷提醒生成方法,其特征在于,包括: 從郵件中提取出郵件內(nèi)容,所述郵件內(nèi)容包括郵件正文; 利用自然語言處理工具對所述郵件正文進行分詞、詞性標(biāo)注、命名實體識別;去除停用詞并統(tǒng)計非停用詞的詞頻; 通過分類器將所述郵件劃分為非日程郵件、創(chuàng)建類日程郵件、修改類日程郵件、取消類日程郵件; 對于日程類郵件,根據(jù)所述命名實體識別結(jié)果與規(guī)則模板匹配結(jié)合確定日程活動的時間、地點、主題、參與者信息; 根據(jù)所述日程主題、時間、地點、參與者信息色生成日歷提醒。
      2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述通過分類器將所述郵件劃分為非日程郵件、創(chuàng)建類日程郵件、修改類日程郵件、取消類日程郵件包括: 選取郵件正文長度、關(guān)鍵詞的詞頻-反文檔頻率、詞頻、詞性、關(guān)鍵詞左右各一個窗口的詞及其詞性作為日程郵件特征構(gòu)建分類器的特征向量,通過支持向量機分類器將所述郵件劃分為非日程郵件、創(chuàng)建類日程郵件、修改類日程郵件、取消類日程郵件。
      3.根據(jù)權(quán)利要求2所述的方法,其特征在于,還包括: 預(yù)先利用人工標(biāo)注的日程郵件語料訓(xùn)練所述支持向量機分類器。
      4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述郵件內(nèi)容還包括郵件主題、郵件發(fā)送方、接收方和時間。
      5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述從郵件中提取出郵件內(nèi)容包括: 利用所述郵件中的TAG標(biāo)簽去除掉所述郵件冗余信息,提取出所述郵件的主題、發(fā)送方、接收方、時間、郵件正文信息。
      6.一種日歷提醒生成裝置,其特征在于,包括: 郵件內(nèi)容提取模塊,用于從郵件中提取出郵件內(nèi)容,所述郵件內(nèi)容包括郵件正文; 語言分析處理模塊,用于利用自然語言處理工具對所述郵件正文進行分詞、詞性標(biāo)注和命名實體識別;去除停用詞并統(tǒng)計非停用詞的詞頻; 郵件分類模塊,用于通過分類器將所述郵件劃分為非日程郵件、創(chuàng)建類日程郵件、修改類日程郵件、取消類日程郵件; 日程信息提取模塊,用于對于日程類郵件,根據(jù)所述命名實體識別結(jié)果與規(guī)則模板匹配結(jié)合確定日程活動的時間、地點、主題、參與者信息; 日歷提醒生成模塊,用于根據(jù)所述日程主題、時間、地點、參與者信息色生成日歷提醒。
      7.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述郵件分類模塊包括: 特征向量構(gòu)建單元,用于選取郵件正文長度、關(guān)鍵詞的詞頻-反文檔頻率、詞頻、詞性、關(guān)鍵詞左右各一個窗口的詞及其詞性作為日程郵件特征構(gòu)建分類器的特征向量; 日程郵件分類單元,用于根據(jù)所述特征向量通過支持向量機分類器將所述郵件劃分為非日程郵件、創(chuàng)建類日程郵件、修改類日程郵件、取消類日程郵件。
      8.根據(jù)權(quán)利要求7所述的裝置,其特征在于,還包括: 分類器訓(xùn)練模塊,用于預(yù)先利用人工標(biāo)注的日程郵件語料訓(xùn)練所述支持向量機分類器。
      9.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述郵件內(nèi)容還包括郵件主題、郵件發(fā)送方、接收方和時間。
      10.根據(jù)權(quán)利要求9所述的裝置,其特征在于,所述郵件內(nèi)容提取模塊利用所述郵件中的TAG標(biāo)簽去除掉所述郵件冗余信息,提取出所述郵件的主題、發(fā)送方、接收方、時間、郵件正文信息。
      【文檔編號】G06Q10/10GK104463552SQ201310430849
      【公開日】2015年3月25日 申請日期:2013年9月22日 優(yōu)先權(quán)日:2013年9月22日
      【發(fā)明者】康為 申請人:中國電信股份有限公司
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1