專利名稱:利用元數(shù)據(jù)優(yōu)化歸檔電子郵件的效率的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及歸檔電子郵件消息。
背景技術(shù):
電子消息或電子郵件服務(wù)器系統(tǒng)可以被配置成提供由服務(wù)器系統(tǒng)的用戶發(fā)送和接收的電子郵件消息(電子郵件)的日志。電子郵件的日志通常包括在電子郵件傳送過程中將利用服務(wù)器發(fā)送或接收的電子郵件的單獨(dú)副本放置在專用郵箱或數(shù)據(jù)庫日志中。日志中的電子郵件是分發(fā)給收件人的電子郵件的副本,也可能包含,像電子郵件元數(shù)據(jù)(例如,“To(送往)”、“Cc (抄送)”和“Bcc (密件抄送)”首標(biāo)字段中的電子郵件地址)中的所有電子郵件收件人的列表以及分解的組那樣的,單個(gè)收件人不可獲得的附加信息。歸檔電子郵件的例子包括一但不限于一由于合規(guī)性的原因而歸檔來自日志的電子郵件,以及由于節(jié)省空間的原因而歸檔來自單個(gè)用戶郵箱的電子郵件。消息的歸檔通常按如下操作順序進(jìn)行:-識(shí)別由于節(jié)省空間的目的而應(yīng)該歸檔電子郵件的一個(gè)或多個(gè)郵箱;-搜索和識(shí)別有資格歸檔(稱為爬過)的消息;-提取特定用戶郵箱中有資格歸檔的消息;以及-將提取的消息存儲(chǔ)在檔案中。為了合規(guī)性而歸檔通常在電子郵件服務(wù)器中為郵箱發(fā)送或接收到電子郵件之后馬上或不久在日志內(nèi)進(jìn)行。通常在可以歸檔日志中的所有消息的短間隔上爬過日志。為了節(jié)省用戶郵箱中的空間而歸檔通常根據(jù)經(jīng)過的時(shí)段來進(jìn)行,也可以包括其他限制(例如,只歸檔具有某種存儲(chǔ)大小的消息)。歸檔用戶郵箱的典型例子可以是歸檔郵箱中4個(gè)星期之前接收到的所有消息,如果這樣的消息仍然存在于郵箱之中的話(即,郵箱用戶還未刪除這樣的消息)。爬過的操作過程可以給服務(wù)器造成較大負(fù)擔(dān),增加了歸檔電子郵件的費(fèi)用。因此,重要的是要避免爬過還沒有足夠的有資格歸檔的合格消息的郵箱。典型的電子郵件歸檔系統(tǒng)使用說明性手段(例如,根據(jù)用戶郵箱中的內(nèi)容量或時(shí)間)來確定應(yīng)該在什么時(shí)候在郵箱中搜索需要?dú)w檔的電子郵件。例如,確定哪些電子郵件要?dú)w檔的爬過操作可能要求每所選時(shí)段(例如,每所選分鐘數(shù),每所選天數(shù)等)搜索特定服務(wù)器的所有郵箱,以便在所選時(shí)間跨度內(nèi)歸檔特定用戶郵箱的每個(gè)有資格的郵件。當(dāng)將說明性手段用于電子郵件歸檔時(shí),系統(tǒng)管理員通常編制用于通過在郵箱中搜索有資格處理的郵件來周期性檢驗(yàn)是否有必要處理的時(shí)間表。另外,通常對(duì)所有郵箱一視同仁,以及處理郵箱的順序可以是隨機(jī)的。這可能導(dǎo)致某些用戶郵箱在超過與這樣的郵箱相關(guān)聯(lián)的郵箱配額之前未處理歸檔電子郵件。另外,這可以導(dǎo)致存儲(chǔ)空間的預(yù)留不足,因?yàn)橐恍┯脩羿]箱可能比其他用戶郵箱更迅速地充滿電子郵件內(nèi)容。更進(jìn)一步,系統(tǒng)管理員試圖根據(jù)不同郵箱如何使用為不同郵箱配制單獨(dú)歸檔時(shí)間表既太困難又太費(fèi)時(shí)。
發(fā)明內(nèi)容
本發(fā)明提供了如要求保護(hù)的在電子郵件系統(tǒng)中歸檔電子郵件的計(jì)算機(jī)實(shí)現(xiàn)的方法、歸檔電子郵件的計(jì)算機(jī)程序產(chǎn)品以及歸檔電子郵件的系統(tǒng)。于是,本發(fā)明的實(shí)施例包括歸檔電子郵件的方法、計(jì)算機(jī)程序產(chǎn)品以及系統(tǒng)。該電子郵件系統(tǒng)包括至少一個(gè)用戶郵箱,并被配置成接收電子郵件和將電子郵件存儲(chǔ)在用戶郵箱內(nèi)以及從所述用戶郵箱發(fā)送電子郵件。收集與每個(gè)用戶郵箱接收和發(fā)送的電子郵件相對(duì)應(yīng)的特定于用戶的元數(shù)據(jù)。分析已收集特定于用戶的元數(shù)據(jù),以為每個(gè)用戶郵箱提供將什么時(shí)候歸檔電子郵件和歸檔哪些電子郵件的預(yù)測(cè)指示,并根據(jù)每個(gè)用戶郵箱的預(yù)測(cè)指示為用戶郵箱歸檔電子郵件。一旦研究了如下詳細(xì)描述,尤其當(dāng)結(jié)合各種圖形中的相同標(biāo)號(hào)用于表示相同部件的附圖時(shí),本發(fā)明實(shí)施例的上述和進(jìn)一步特征和優(yōu)點(diǎn)將變得顯而易見。
圖1是例示包括依照本發(fā)明歸檔電子郵件的部件的電子郵件系統(tǒng)的示范性實(shí)施例的框圖;以及圖2提供了描述按照本發(fā)明的實(shí)施例和利用圖1的電子郵件系統(tǒng)歸檔電子郵件的示范性方法的流程圖。
具體實(shí)施例方式依照本發(fā)明的示范性實(shí)施例的方法、系統(tǒng)以及計(jì)算機(jī)程序產(chǎn)品通過利用電子郵件系統(tǒng)中的單個(gè)用戶郵箱的已收集元數(shù)據(jù)和使用模式確定什么時(shí)候爬過和歸檔郵箱,以及可選地,在系統(tǒng)內(nèi)也提供什么時(shí)候爬過和處理用戶郵箱加以歸檔的排名功能,來優(yōu)化歸檔電子郵件消息(電子郵件)的效率。已收集元數(shù)據(jù)是從電子郵件系統(tǒng)處理的電子郵件中獲得的。如本文所使用,與電子郵件消息有關(guān)的“已處理”指的是與每個(gè)用戶郵箱有關(guān)的電子郵件服務(wù)器的進(jìn)來和出去的電子郵件以及在電子郵件服務(wù)器內(nèi)部的一個(gè)或多個(gè)用戶郵箱之間傳送的電子郵件。進(jìn)一步如本文所使用,與元數(shù)據(jù)有關(guān)的“已收集”指的是以任何適當(dāng)方式從每個(gè)已處理電子郵件中提取、復(fù)制、計(jì)算或獲取的元數(shù)據(jù)。在將日志系統(tǒng)用于復(fù)制已處理電子郵件(例如,為了合規(guī)性的目的)的示范性實(shí)施例中,可以從與電子郵件系統(tǒng)中的每個(gè)用戶郵件相關(guān)聯(lián)的每個(gè)已處理電子郵件消息的日志副本中收集元數(shù)據(jù)。但是,值得注意的是,元數(shù)據(jù)可以由電子郵件服務(wù)器利用任何其他適當(dāng)過程從已處理電子郵件中收集。在日志數(shù)據(jù)庫中,幾乎在將這樣的電子郵件存儲(chǔ)在日志數(shù)據(jù)庫中之后立刻或不久就歸檔每個(gè)電子郵件。日志數(shù)據(jù)庫中與每個(gè)郵箱相關(guān)聯(lián)的電子郵件的已收集元數(shù)據(jù)可以用于為每個(gè)郵箱生成統(tǒng)計(jì)信息(例如,統(tǒng)計(jì)模型),其中該統(tǒng)計(jì)信息被用于預(yù)測(cè)與每個(gè)郵箱有關(guān)的某些特征,包括一但不限于一預(yù)測(cè)可以在特定郵箱中的消息的最大數(shù)量,預(yù)測(cè)特定郵箱內(nèi)有資格歸檔的合格的電子郵件內(nèi)容,以及什么時(shí)候爬過并歸檔特定郵箱內(nèi)的電子郵件。尤其,使用來自日志數(shù)據(jù)庫的已收集元數(shù)據(jù)為每個(gè)用戶郵箱生成的統(tǒng)計(jì)信息可以用于預(yù)測(cè)像與指定限制(例如,用戶郵件的大小限制)匹配的、將在用戶郵箱中獲得的消息的最大數(shù)量那樣的特征。在電子郵件中存在可以在用在生成統(tǒng)計(jì)模型中的過程中收集以確定什么時(shí)候?yàn)殡娮余]件歸檔處理用戶郵箱的各種類型元數(shù)據(jù)。電子郵件中可以收集的多種類型元數(shù)據(jù)的例子包括一但不限于一寄件人信息、收件人信息(例如,電子郵件的“To”字段以及“Ce”和“Bcc”字段中的收件人)、主題信息(例如,來自電子郵件的主題字段的信息)、有關(guān)電子郵件的存儲(chǔ)大小的信息、有關(guān)存儲(chǔ)大小的信息、電子郵件的附件的數(shù)量和/或類型、發(fā)送、交付和/或觀看消息的時(shí)間和日期等。可以從電子郵件元數(shù)據(jù)中獲得一種或多種任何適當(dāng)組合或類型的信息來生成預(yù)測(cè)特定用戶郵箱中的內(nèi)容的統(tǒng)計(jì)模型,以便為用戶郵箱內(nèi)的電子郵件的爬過和歸檔確定適當(dāng)時(shí)段。用戶郵箱的爬過指的是搜索特定用戶郵箱以識(shí)別郵箱中的明_電子郵件有資格歸檔。從歸檔在日志數(shù)據(jù)庫中的電子郵件中收集以便為每個(gè)用戶郵箱生成統(tǒng)計(jì)信息的元數(shù)據(jù)的類型將取決于特定電子郵件系統(tǒng)中歸檔電子郵件的資格標(biāo)準(zhǔn)。用于歸檔電子郵件并包括日志系統(tǒng)的示范性電子郵件系統(tǒng)示意性地描繪在圖1的框圖中。具體地,電子郵件系統(tǒng)2包括電子郵件服務(wù)器4,該電子郵件服務(wù)器4包括用戶郵箱。電子郵件服務(wù)器4可操作地與任何其他服務(wù)器和/或聯(lián)網(wǎng)系統(tǒng)耦合,以便于向和從與電子郵件服務(wù)器相關(guān)聯(lián)的用戶郵箱發(fā)送和接收電子郵件。另外,電子郵件服務(wù)器4有助于在電子郵件服務(wù)器內(nèi)的用戶郵箱之間傳送電子郵件消息。電子郵件服務(wù)器4還可操作地與用戶郵箱歸檔系統(tǒng)6耦合。用戶郵箱歸檔系統(tǒng)6可操作地與電子郵件檔案存儲(chǔ)系統(tǒng)8耦合,該電子郵件檔案存儲(chǔ)系統(tǒng)8為用戶郵箱存儲(chǔ)已歸檔電子郵件。用戶郵箱歸檔系統(tǒng)6進(jìn)一步包括處理器,該處理器利用以下述的方式獲得的統(tǒng)計(jì)信息以確定什么時(shí)候爬過并歸檔用戶郵箱中的電子郵件。電子郵件服務(wù)器4進(jìn)一步可操作地與日志數(shù)據(jù)庫10耦合。如上所述,將來自用戶郵箱的所有已處理電子郵件同與這樣的電子郵件相關(guān)聯(lián)的元數(shù)據(jù)一起復(fù)制到日志數(shù)據(jù)庫10中。日志數(shù)據(jù)庫10進(jìn)一步可操作地與日志歸檔系統(tǒng)12耦合。日志歸檔系統(tǒng)12幾乎在將這樣的電子郵件存儲(chǔ)在日志數(shù)據(jù)庫10中之后立刻或不久就歸檔電子郵件消息(然后從日志數(shù)據(jù)庫10中移除這樣的電子郵件以節(jié)省存儲(chǔ)空間)。日志歸檔系統(tǒng)12進(jìn)一步可操作地與日志檔案存儲(chǔ)系統(tǒng)14和元數(shù)據(jù)數(shù)據(jù)庫16耦合。將來自日志數(shù)據(jù)庫10的已歸檔電子郵件消息存儲(chǔ)在日志檔案存儲(chǔ)系統(tǒng)14內(nèi),將來自日志歸檔系統(tǒng)12處理的電子郵件的已收集元數(shù)據(jù)存儲(chǔ)在元數(shù)據(jù)數(shù)據(jù)庫16中。元數(shù)據(jù)數(shù)據(jù)庫16進(jìn)一步可操作地與用戶郵箱歸檔系統(tǒng)6耦合,以便用戶郵箱歸檔系統(tǒng)6的處理器可以訪問存儲(chǔ)的元數(shù)據(jù)來生成或更新與每個(gè)用戶郵箱相關(guān)聯(lián)的統(tǒng)計(jì)信息。電子郵件服務(wù)器4、用戶郵箱歸檔系統(tǒng)6、電子郵件檔案存儲(chǔ)系統(tǒng)8、日志數(shù)據(jù)庫
10、日志歸檔系統(tǒng)12、日志檔案存儲(chǔ)系統(tǒng)14和元數(shù)據(jù)數(shù)據(jù)庫16的每一個(gè)可以實(shí)現(xiàn)成分立單元,或可替代地,與單個(gè)單元中的任何一個(gè)或多個(gè)其他部件組合。例如,用戶郵箱歸檔系統(tǒng)6和日志歸檔系統(tǒng)12可以與配置成進(jìn)行歸檔來自日志數(shù)據(jù)庫和用戶郵箱的電子郵件的操作的一個(gè)或多個(gè)處理器實(shí)現(xiàn)成單個(gè)歸檔系統(tǒng)。系統(tǒng)2的電子郵件服務(wù)器、歸檔系統(tǒng)和數(shù)據(jù)庫存儲(chǔ)系統(tǒng)可以是通過任何類型的硬件和/或其他處理電路實(shí)現(xiàn)的任何適當(dāng)計(jì)算機(jī)系統(tǒng)。具體地,服務(wù)器和數(shù)據(jù)庫可以通過任何數(shù)量的傳統(tǒng)或其他計(jì)算機(jī)系統(tǒng)或設(shè)備(例如,計(jì)算機(jī)終端、個(gè)人計(jì)算機(jī)(例如,IBM兼容的、蘋果公司的Macintosh,平板電腦,膝上型電腦等)等)、蜂窩式電話、個(gè)人數(shù)字助理(例如,Palm Pre> Droid、iPhone等)等來實(shí)現(xiàn),可以包括任何商用操作系統(tǒng)(例如,AIX、Android、Linux、OSX> Sun Solaris、Unix、Windows等)和任何商用或定制軟件(例如,瀏覽器軟件、通信軟件、字處理軟件等)。這些系統(tǒng)可以包括各種類型的顯示器和輸入設(shè)備(例如,鍵盤、鼠標(biāo)、語音識(shí)別等)以便輸入和/或觀看信息。另外,電子郵件可以由電子郵件服務(wù)器發(fā)送或接收并通過數(shù)據(jù)庫以任何適當(dāng)方式保留。下面參照?qǐng)D2的流程圖描述利用圖1的系統(tǒng)的示范性方法。參照?qǐng)D2,日志數(shù)據(jù)庫10連續(xù)復(fù)制與電子郵件服務(wù)器4的每個(gè)用戶郵箱相關(guān)聯(lián)、包括每個(gè)電子郵件消息的元數(shù)據(jù)的每個(gè)已處理電子郵件消息(即,電子郵件服務(wù)器的進(jìn)來或出去的消息,或在電子郵件服務(wù)器的內(nèi)部傳送給用戶郵箱或從用戶郵箱傳送的電子郵件消息)(步驟110)。存儲(chǔ)在日志數(shù)據(jù)庫10中的電子郵件由日志歸檔系統(tǒng)12連接歸檔,以便存儲(chǔ)在日志檔案存儲(chǔ)系統(tǒng)14中(步驟120)。日志數(shù)據(jù)庫10中的電子郵件的歸檔可以在將這樣的電子郵件存儲(chǔ)在日志數(shù)據(jù)庫10中之后馬上或在某個(gè)適當(dāng)時(shí)段上進(jìn)行。為每個(gè)用戶郵箱收集來自日志歸檔系統(tǒng)12正在處理的日志數(shù)據(jù)庫郵件的元數(shù)據(jù)并將其存儲(chǔ)在元數(shù)據(jù)數(shù)據(jù)庫16中(步驟130)。組織已收集和存儲(chǔ)的元數(shù)據(jù)以便成為特定于用戶的。換句話說,將存儲(chǔ)的元數(shù)據(jù)識(shí)別成從與特定用戶郵箱相關(guān)聯(lián)的電子郵件中收集的。值得注意的是,元數(shù)據(jù)的收集和存儲(chǔ)(步驟130)可以在日志檔案存儲(chǔ)系統(tǒng)14中的日志數(shù)據(jù)庫電子郵件的歸檔(步驟120)之前、之后或與之并行地進(jìn)行。存儲(chǔ)的元數(shù)據(jù)可由用戶郵箱歸檔系統(tǒng)6的處理器訪問,這種元數(shù)據(jù)用于為每個(gè)用戶郵箱生成以及也更新統(tǒng)計(jì)信息。處理器周期性地查詢?cè)獢?shù)據(jù)數(shù)據(jù)庫16,以便為每個(gè)用戶郵箱生成或更新統(tǒng)計(jì)信息,該統(tǒng)計(jì)信息由用戶郵箱歸檔系統(tǒng)6用于確定是否或在什么時(shí)候爬過每個(gè)用戶郵箱。有關(guān)是否或在什么時(shí)候爬過每個(gè)用戶郵箱以歸檔電子郵件的確定可以基于單個(gè)的(即,基于與每個(gè)郵箱相關(guān)聯(lián)的統(tǒng)計(jì)信息),基于組的(即,通過利用生成的統(tǒng)計(jì)信息分組具有相似簡(jiǎn)檔的郵箱),或以任何其他適當(dāng)方式。存儲(chǔ)在元數(shù)據(jù)數(shù)據(jù)庫16中的元數(shù)據(jù)使用戶郵箱中合格的或有資格歸檔的內(nèi)容能夠得到預(yù)測(cè)。例如,歸檔準(zhǔn)則可以基于包括一但不限于一以下中的一個(gè)或多個(gè)資格因素:總郵箱存儲(chǔ)大小限制、對(duì)具有一定年限的電子郵件(例如,用戶郵箱中接收日期比當(dāng)前日期早任何所選天數(shù)的電子郵件)的存儲(chǔ)大小限制、對(duì)帶有一個(gè)或多個(gè)附件的特定電子郵件的存儲(chǔ)大小限制。要收集并存儲(chǔ)在元數(shù)據(jù)數(shù)據(jù)庫16中的元數(shù)據(jù)的選擇和/或由用戶郵箱歸檔系統(tǒng)6的處理器選來生成統(tǒng)計(jì)信息的元數(shù)據(jù)的類型將基于使電子郵件有資格歸檔的特定電子郵件系統(tǒng)的資格認(rèn)證標(biāo)準(zhǔn)。通過用戶郵箱歸檔系統(tǒng)處理器根據(jù)歸檔資格標(biāo)準(zhǔn)針對(duì)每個(gè)郵箱的信息來查詢?cè)獢?shù)據(jù)數(shù)據(jù)庫16,并使用查詢的元數(shù)據(jù)生成統(tǒng)計(jì)信息。為每個(gè)用戶郵箱生成的統(tǒng)計(jì)信息可以用于建立爬過和歸檔用戶郵箱的排名次序(步驟150)??梢詫⒕哂心撤N統(tǒng)計(jì)信息的郵箱設(shè)置成具有比其他郵箱高的排名次序,其中該統(tǒng)計(jì)信息提供該郵箱具有大量和/或大存儲(chǔ)大小的有資格歸檔的電子郵件的預(yù)測(cè)。例如,可以將排名次序或評(píng)分系統(tǒng)設(shè)置成歸檔與他們的配額較接近的郵箱(例如,其中配額對(duì)應(yīng)于超過某個(gè)年限的電子郵件的數(shù)量、整個(gè)電子郵件內(nèi)容的大小、郵箱內(nèi)或有資格歸檔的電子郵件的數(shù)量等中的一種或多種),和/或通過在更遠(yuǎn)離他們的配額或在分配給郵箱的系統(tǒng)存儲(chǔ)空間方面的壓力較輕的其他郵箱之前節(jié)省存儲(chǔ)空間使系統(tǒng)受益。也可以根據(jù)預(yù)測(cè)要對(duì)特定郵箱歸檔的電子郵件的數(shù)量和/或存儲(chǔ)大小不超過歸檔所需的預(yù)定閾值的統(tǒng)計(jì)信息將某些郵箱排除在歸檔之外(例如,如果要?dú)w檔的電子郵件數(shù)據(jù)的大小小于IMB的閾值量,或如果郵箱大小還未達(dá)到其配額的某個(gè)百分比,則不處理郵箱來歸檔)。具體地,用戶郵箱歸檔系統(tǒng)處理器可以過濾掉還未達(dá)到如通過與這些郵箱相關(guān)聯(lián)的預(yù)測(cè)統(tǒng)計(jì)信息所確定的最小閾值準(zhǔn)則的郵箱,以便只讓有資格歸檔的郵箱通過過濾器和得到處理以歸檔。這樣,通過減少某些用戶郵箱的不必要爬過和電子郵件服務(wù)器訪問,有助于電子郵件系統(tǒng)更有效地工作。在為郵箱建立了排名次序(和可選地,過濾掉未滿足有資格歸檔的最小閾值的郵箱)之后,周期性地爬過郵箱,并且從郵箱中實(shí)際提取有資格歸檔的實(shí)際電子郵件,加以歸檔并存儲(chǔ)在電子郵件檔案存儲(chǔ)系統(tǒng)8中(步驟160)。為了為每個(gè)郵箱盡可能準(zhǔn)確地保持預(yù)測(cè)統(tǒng)計(jì)信息,通過移除與每個(gè)郵箱已經(jīng)歸檔的電子郵件相對(duì)應(yīng)的元數(shù)據(jù)來更新元數(shù)據(jù)數(shù)據(jù)庫,并且還根據(jù)元數(shù)據(jù)數(shù)據(jù)庫這樣的變化為每個(gè)郵箱更新統(tǒng)計(jì)信息(步驟170)。于是,元數(shù)據(jù)數(shù)據(jù)庫和統(tǒng)計(jì)信息不包含有關(guān)每個(gè)用戶郵箱已經(jīng)歸檔的電子郵件的信息。每個(gè)郵箱的統(tǒng)計(jì)信息也可以通過提供其中周期性比較由每個(gè)郵箱的電子郵件的預(yù)測(cè)歸檔負(fù)載(利用統(tǒng)計(jì)信息確定)與每個(gè)郵箱的電子郵件的實(shí)際歸檔負(fù)載(從爬過中確定)構(gòu)成的反饋回路來更新。存儲(chǔ)在元數(shù)據(jù)數(shù)據(jù)庫16中的元數(shù)據(jù)和統(tǒng)計(jì)信息提供如果爬過郵箱就會(huì)找到的電子郵件服務(wù)器4的每個(gè)郵箱中歸檔的合格的電子郵件內(nèi)容的預(yù)測(cè)。這是因?yàn)榻y(tǒng)計(jì)信息和元數(shù)據(jù)基于復(fù)制到日志數(shù)據(jù)庫10中的電子郵件,而不是在給定時(shí)間上處在用戶郵箱中的實(shí)際電子郵件消息。每個(gè)郵箱實(shí)際上可以具有比取決于許多因素預(yù)測(cè)的電子郵件更多或少的電子郵件,這些因素包括一但不限于一是從特定郵箱中刪除了電子郵件還是在日志數(shù)據(jù)庫中還未計(jì)及加入郵箱中的電子郵件(例如,用戶可能將內(nèi)容從本地電子郵件檔案存儲(chǔ)系統(tǒng)8復(fù)制或拖回到用戶的郵箱中)。因此,可以根據(jù)實(shí)際數(shù)據(jù)自動(dòng)改變用于為每個(gè)用戶郵箱提供是否或在什么時(shí)候歸檔電子郵件(和歸檔哪些電子郵件)的預(yù)測(cè)指示的統(tǒng)計(jì)信息的更新。可能會(huì)出現(xiàn)對(duì)特定郵箱實(shí)際歸檔比如通過這個(gè)郵箱的統(tǒng)計(jì)信息所預(yù)測(cè)的有資格電子郵件的數(shù)量少的電子郵件(例如,用戶可能在爬過用戶郵箱和歸檔電子郵件的時(shí)段之間刪除了許多消息)的某些情形??梢愿鶕?jù)要?dú)w檔的預(yù)測(cè)電子郵件與要?dú)w檔的電子郵件的實(shí)際數(shù)量的比較(根據(jù)郵箱的爬過)為每個(gè)郵箱生成校正因子。例如,校正因子可以是如下的比值:(如通過爬過找到的要?dú)w檔的電子郵件)/ (要?dú)w檔的預(yù)測(cè)電子郵件)。對(duì)于用戶在用戶郵箱的歸檔處理之間的時(shí)段期間從用戶郵箱中刪除許多電子郵件的情形,這個(gè)用戶郵箱的校正因子可能小于I (例如,如果在實(shí)際爬過和歸檔處理步驟之前從用戶郵箱中刪除了有資格歸檔的電子郵件)??梢詫⒚總€(gè)用戶郵箱的校正因子作為元數(shù)據(jù)存儲(chǔ)在元數(shù)據(jù)數(shù)據(jù)庫12中,并且可以將其用于更新或修正包括與用戶郵箱相關(guān)聯(lián)的評(píng)分/排名和過濾的、每個(gè)用戶郵箱的統(tǒng)計(jì)信息。校正因子可以實(shí)現(xiàn)成根據(jù)單個(gè)用戶的刪除模式自動(dòng)改善單個(gè)郵箱的預(yù)測(cè)指示。在一個(gè)示范性實(shí)施例中,系統(tǒng)的一般規(guī)則可以提供普通用戶郵箱具有在前一輪爬過和歸檔與后一輪爬過和歸檔之間刪除的電子郵件的10%的假設(shè)。對(duì)于特定郵箱,預(yù)測(cè)指示可以根據(jù)如通過校正因子和/或任何其他因素確定的、這個(gè)特定郵箱的用戶模式的歷史假設(shè)刪除了較大數(shù)量的電子郵件(例如,20%或更大)。因此,可以通過應(yīng)用將預(yù)測(cè)指示與有資格歸檔的實(shí)際電子郵件相比較的反饋回路來實(shí)現(xiàn)為每個(gè)用戶郵箱什么時(shí)候歸檔電子郵件或歸檔哪些電子郵件的預(yù)測(cè)指示的自動(dòng)優(yōu)化。另外,可以周期性地監(jiān)視每個(gè)用戶郵箱,以保證用戶郵箱不會(huì)迅速接近或超過它的配額。例如,在用戶將大量已歸檔電子郵件從電子郵件檔案存儲(chǔ)系統(tǒng)拖回到用戶郵箱中的情形下,在用戶郵箱的實(shí)際配額可能接近它的極限的時(shí)候,該預(yù)測(cè)(基于用戶郵箱的當(dāng)前統(tǒng)計(jì)信息)可能指示用戶郵箱未接近它的配額。可以將電子郵件服務(wù)器配置成周期性地檢驗(yàn)每個(gè)用戶郵箱內(nèi)的電子郵件的存儲(chǔ)大小,如果在用戶郵箱的實(shí)際存儲(chǔ)大小與用戶郵箱的預(yù)測(cè)存儲(chǔ)大小(如從當(dāng)前統(tǒng)計(jì)信息中所確定的)之間存在超過閾值量的差異,則可以設(shè)置用戶郵箱以便馬上爬過和歸檔。可替代地,可以調(diào)整電子郵件的排名,以便在下一次爬過和歸檔處理會(huì)話中這個(gè)用戶郵箱的爬過和歸檔優(yōu)先于其他用戶郵箱。因此,在上述和描述在圖2的流程圖中的方法中,隨著電子郵件服務(wù)器的每個(gè)用戶郵箱處理進(jìn)來和出去的電子郵件連續(xù)地執(zhí)行步驟110-130 (將進(jìn)來/出去的電子郵件復(fù)制到日志數(shù)據(jù)庫中,在日志數(shù)據(jù)庫中歸檔這樣的電子郵件,以及為這樣歸檔的電子郵件提取元數(shù)據(jù))。涉及為每個(gè)用戶郵箱生成或更新統(tǒng)計(jì)信息,為用戶郵箱確定排名次序(和可選過濾),以及根據(jù)排名次序爬過和歸檔用戶郵箱的步驟140-160可以在電子郵件系統(tǒng)根據(jù)特定情形和系統(tǒng)的預(yù)期電子郵件歸檔負(fù)載而設(shè)置的所選處理間隔上進(jìn)行。另外,可以將用戶郵箱的排名次序設(shè)置成可以在相同或相似時(shí)間間隔上和/或以相同或相似排名次序爬過具有如通過用戶郵箱的統(tǒng)計(jì)信息確定的、相似歸檔需要或歸檔負(fù)載簡(jiǎn)檔的郵箱的組或群集。當(dāng)分析如存儲(chǔ)在元數(shù)據(jù)數(shù)據(jù)庫中的用戶郵箱的元數(shù)據(jù)時(shí),可以利用像k_均值聚類技術(shù)那樣的聚類算法。聚類算法可以用于根據(jù)為這些郵箱生成/更新的統(tǒng)計(jì)信息找出具有相同簡(jiǎn)檔的用戶郵箱的組或群集。因此,電子郵件系統(tǒng)可以被配置成使用戶郵箱的處理間隔自動(dòng)化,其中在相同處理會(huì)話期間爬過具有相似負(fù)載簡(jiǎn)檔的用戶郵箱的組以歸檔電子郵件。使用適當(dāng)?shù)木垲愃惴ㄌ峁┯脩羿]箱的自動(dòng)聚類簡(jiǎn)化了歸檔電子郵件的過程,因?yàn)橄到y(tǒng)管理員只需指定歸檔政策(即,在用戶郵箱內(nèi)歸檔電子郵件的一組規(guī)則),電子郵件系統(tǒng)將根據(jù)為每個(gè)用戶郵箱生成的統(tǒng)計(jì)信息自動(dòng)設(shè)置用戶郵箱或用戶郵箱組內(nèi)的電子郵件的爬過和歸檔。另外,任何用戶郵箱或用戶郵箱組的歸檔處理間隔可以利用如上所述和描述在圖2的流程圖中的過程根據(jù)統(tǒng)計(jì)信息的更新以自動(dòng)方式變化。使用已收集元數(shù)據(jù)為郵箱確定什么時(shí)候歸檔電子郵件和歸檔什么類型的電子郵件的例子可以提供用戶郵箱增長(zhǎng)得有多快和有多少電子郵件數(shù)據(jù)可用于歸檔的預(yù)測(cè)指示。在這個(gè)例子中,可以為用戶郵箱監(jiān)視與電子郵件的數(shù)量和大小相關(guān)聯(lián)的元數(shù)據(jù)。為了歸檔而可以對(duì)用戶郵箱的排名,例如,根據(jù)每個(gè)用戶郵箱指示在所選時(shí)段(例如,可以通過分析用戶郵箱的校正因子來確定)上哪些用戶郵箱刪除大多數(shù)電子郵件的統(tǒng)計(jì)信息,來設(shè)置??梢詫v史上刪除比平均數(shù)少的電子郵件的用戶郵箱設(shè)置成比刪除比平均數(shù)多的電子郵件的那些用戶郵箱高的排名,以便在排名低的用戶郵箱之前爬過和歸檔排名高的用戶郵箱。將從已收集元數(shù)據(jù)中獲得的和提供什么時(shí)候歸檔用戶郵箱的預(yù)測(cè)指示的統(tǒng)計(jì)信息與與用戶郵箱中有資格歸檔的實(shí)際電子郵件有關(guān)的信息相比較的反饋回路可以用于改變歸檔用戶郵箱的排名次序。如上所述,雖然上面示范性實(shí)施例描述了從日志數(shù)據(jù)庫歸檔的電子郵件中收集元數(shù)據(jù),但本發(fā)明不局限于以這種方式從電子郵件中獲取元數(shù)據(jù)。本發(fā)明包含以任何適當(dāng)方式從已處理電子郵件中收集元數(shù)據(jù)。例如,可以在向或從處在一個(gè)或多個(gè)電子郵件服務(wù)器上的一個(gè)或多個(gè)用戶郵箱傳送電子郵件期間的任何點(diǎn)上收集元數(shù)據(jù)。所屬技術(shù)領(lǐng)域的技術(shù)人員知道,本發(fā)明的各個(gè)方面可以實(shí)現(xiàn)為系統(tǒng)、方法或計(jì)算機(jī)程序產(chǎn)品。因此,本發(fā)明的各個(gè)方面可以具體實(shí)現(xiàn)為以下形式,即:完全的硬件實(shí)施方式、完全的軟件實(shí)施方式(包括固件、駐留軟件、微代碼等),或硬件和軟件方面結(jié)合的實(shí)施方式,這里可以統(tǒng)稱為“電路”、“模塊”或“系統(tǒng)”。此外,在一些實(shí)施例中,本發(fā)明的各個(gè)方面還可以實(shí)現(xiàn)為在一個(gè)或多個(gè)計(jì)算機(jī)可讀介質(zhì)中的計(jì)算機(jī)程序產(chǎn)品的形式,該計(jì)算機(jī)可讀介質(zhì)中包含計(jì)算機(jī)可讀的程序代碼??梢圆捎靡粋€(gè)或多個(gè)計(jì)算機(jī)可讀介質(zhì)的任意組合。計(jì)算機(jī)可讀介質(zhì)可以是計(jì)算機(jī)可讀信號(hào)介質(zhì)或者計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)。計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)例如可以是一但不限于——電、磁、光、電磁、紅外線、或半導(dǎo)體的系統(tǒng)、裝置或器件,或者任意以上的組合。計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)的更具體的例子(非窮舉的列表)包括:具有一個(gè)或多個(gè)導(dǎo)線的電連接、便攜式計(jì)算機(jī)盤、硬盤、隨機(jī)存取存儲(chǔ)器(RAM)、只讀存儲(chǔ)器(ROM)、可擦式可編程只讀存儲(chǔ)器(EPR0M或閃存)、光纖、便攜式緊湊盤只讀存儲(chǔ)器(CD-ROM)、光存儲(chǔ)器件、磁存儲(chǔ)器件、或者上述的任意合適的組合。在本文件中,計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)可以是任何包含或存儲(chǔ)程序的有形介質(zhì),該程序可以被指令執(zhí)行系統(tǒng)、裝置或者器件使用或者與其結(jié)合使用。計(jì)算機(jī)可讀的信號(hào)介質(zhì)可以包括在基帶中或者作為載波一部分傳播的數(shù)據(jù)信號(hào),其中承載了計(jì)算機(jī)可讀的程序代碼。這種傳播的數(shù)據(jù)信號(hào)可以采用多種形式,包括——但不限于——電磁信號(hào)、光信號(hào)或上述的任意合適的組合。計(jì)算機(jī)可讀的信號(hào)介質(zhì)還可以是計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)以外的任何計(jì)算機(jī)可讀介質(zhì),該計(jì)算機(jī)可讀介質(zhì)可以發(fā)送、傳播或者傳輸用于由指令執(zhí)行系統(tǒng)、裝置或者器件使用或者與其結(jié)合使用的程序。計(jì)算機(jī)可讀介質(zhì)上包含的程序代碼可以用任何適當(dāng)?shù)慕橘|(zhì)傳輸,包括一但不限于一無線、有線、光纜、RF等等,或者上述的任意合適的組合??梢砸砸环N或多種程序設(shè)計(jì)語言的任意組合來編寫用于執(zhí)行本發(fā)明操作的計(jì)算機(jī)程序代碼,所述程序設(shè)計(jì)語言包括面向?qū)ο蟮某绦蛟O(shè)計(jì)語言一諸如Java、Smalltalk、C++等,還包括常規(guī)的過程式程序設(shè)計(jì)語言一諸如“C”語言或類似的程序設(shè)計(jì)語言。程序代碼可以完全地在用戶計(jì)算機(jī)上執(zhí)行、部分地在用戶計(jì)算機(jī)上執(zhí)行、作為一個(gè)獨(dú)立的軟件包執(zhí)行、部分在用戶計(jì)算機(jī)上部分在遠(yuǎn)程計(jì)算機(jī)上執(zhí)行、或者完全在遠(yuǎn)程計(jì)算機(jī)或服務(wù)器上執(zhí)行。在涉及遠(yuǎn)程計(jì)算機(jī)的情形中,遠(yuǎn)程計(jì)算機(jī)可以通過任意種類的網(wǎng)絡(luò)一包括局域網(wǎng)(LAN)或廣域網(wǎng)(WAN)—連接到用戶計(jì)算機(jī),或者,可以連接到外部計(jì)算機(jī)(例如利用因特網(wǎng)服務(wù)提供商來通過因特網(wǎng)連接)。下面將參照根據(jù)本發(fā)明實(shí)施例的方法、裝置(系統(tǒng))和計(jì)算機(jī)程序產(chǎn)品的流程圖和/或框圖描述本發(fā)明。應(yīng)當(dāng)理解,流程圖和/或框圖的每個(gè)方框以及流程圖和/或框圖中各方框的組合,都可以由計(jì)算機(jī)程序指令實(shí)現(xiàn)。這些計(jì)算機(jī)程序指令可以提供給通用計(jì)算機(jī)、專用計(jì)算機(jī)或其它可編程數(shù)據(jù)處理裝置的處理器,從而生產(chǎn)出一種機(jī)器,使得這些計(jì)算機(jī)程序指令在通過計(jì)算機(jī)或其它可編程數(shù)據(jù)處理裝置的處理器執(zhí)行時(shí),產(chǎn)生了實(shí)現(xiàn)流程圖和/或框圖中的一個(gè)或多個(gè)方框中規(guī)定的功能/動(dòng)作的裝置。也可以把這些計(jì)算機(jī)程序指令存儲(chǔ)在計(jì)算機(jī)可讀介質(zhì)中,這些指令使得計(jì)算機(jī)、其它可編程數(shù)據(jù)處理裝置、或其他設(shè)備以特定方式工作,從而,存儲(chǔ)在計(jì)算機(jī)可讀介質(zhì)中的指令就產(chǎn)生出包括實(shí)現(xiàn)流程圖和/或框圖中的一個(gè)或多個(gè)方框中規(guī)定的功能/動(dòng)作的指令的制造品(article of manufacture) 也可以將計(jì)算機(jī)程序指令裝載到計(jì)算機(jī)、其他可編程數(shù)據(jù)處理裝置或其他設(shè)備中,使一系列操作步驟在計(jì)算機(jī)、其他可編程裝置或其他設(shè)備上執(zhí)行,以形成計(jì)算機(jī)實(shí)現(xiàn)的進(jìn)程,以便在計(jì)算機(jī)或其他可編程裝置上執(zhí)行的指令提供實(shí)現(xiàn)在流程圖和/或一個(gè)或多個(gè)框圖方框中規(guī)定的功能/動(dòng)作的進(jìn)程。附圖中的流程圖和框圖顯示了根據(jù)本發(fā)明的多個(gè)實(shí)施例的系統(tǒng)、方法和計(jì)算機(jī)程序產(chǎn)品的可能實(shí)現(xiàn)的體系架構(gòu)、功能和操作。在這點(diǎn)上,流程圖或框圖中的每個(gè)方框可以代表一個(gè)模塊、程序段或代碼的一部分,所述模塊、程序段或代碼的一部分包含一個(gè)或多個(gè)用于實(shí)現(xiàn)規(guī)定的邏輯功能的可執(zhí)行指令。也應(yīng)當(dāng)注意,在有些作為替換的實(shí)現(xiàn)中,方框中所標(biāo)注的功能也可以以不同于附圖中所標(biāo)注的順序發(fā)生。例如,兩個(gè)連續(xù)的方框?qū)嶋H上可以基本并行地執(zhí)行,它們有時(shí)也可以按相反的順序執(zhí)行,這依所涉及的功能而定。也要注意的是,框圖和/或流程圖中的每個(gè)方框、以及框圖和/或流程圖中的方框的組合,可以用執(zhí)行規(guī)定的功能或動(dòng)作的專用的基于硬件的系統(tǒng)來實(shí)現(xiàn),或者可以用專用硬件與計(jì)算機(jī)指令的組合來實(shí)現(xiàn)。本文使用的術(shù)語只是為了描述特定實(shí)施例的目的,而不是打算限制本發(fā)明。如本文所使用,單數(shù)形式“一個(gè)”、“一種”和“該”也有意包括復(fù)數(shù)形式,除非上下文另有清楚指示。還要進(jìn)一步理解,用在本說明書中的動(dòng)詞術(shù)語“包含/包括”和/或動(dòng)名詞術(shù)語“包含的/包括的”表示了所述特征、整數(shù)、步驟、操作、元件和/或部件的存在,但不排除一個(gè)或多個(gè)其它特征、整數(shù)、步驟、操作、元件、部件和/或它們的組的存在或添加。所附權(quán)利要求書中的所有裝置或步驟以及功能元件的相應(yīng)結(jié)構(gòu)、材料、動(dòng)作和等效物都有意包括如具體要求的那樣與其它所要求元件組合執(zhí)行功能的任何結(jié)構(gòu)、材料或動(dòng)作。對(duì)本發(fā)明的描述是為了例示和描述的目的給出,而不是打算窮舉或以所公開的形式限制本發(fā)明。許多變型和變體對(duì)于所屬技術(shù)領(lǐng)域的普通技術(shù)人員來說是顯而易見的,而不偏離本發(fā)明的范圍和精神。選 擇和描述實(shí)施例是為了最佳地說明本發(fā)明的原理及其實(shí)際應(yīng)用,使所屬技術(shù)領(lǐng)域的普通技術(shù)人員能夠針對(duì)各種實(shí)施例以及如適合所設(shè)想的特定使用的各種變型來理解本發(fā)明。
權(quán)利要求
1.一種在電子郵件系統(tǒng)中歸檔電子郵件的計(jì)算機(jī)實(shí)現(xiàn)的方法,所述電子郵件系統(tǒng)包含至少一個(gè)用戶郵箱,并被配置成接收電子郵件和將電子郵件存儲(chǔ)在所述用戶郵箱內(nèi)以及從所述用戶郵箱發(fā)送電子郵件,所述方法包括: 收集與每個(gè)用戶郵箱接收和發(fā)送的電子郵件相對(duì)應(yīng)的特定于用戶的元數(shù)據(jù); 分析已收集特定于用戶的元數(shù)據(jù),以為每個(gè)用戶郵箱提供將什么時(shí)候歸檔電子郵件和歸檔哪些電子郵件的預(yù)測(cè)指示;以及 根據(jù)每個(gè)用戶郵箱的預(yù)測(cè)指示為用戶郵箱歸檔電子郵件。
2.如權(quán)利要求1所述的方法,其中,所述電子郵件系統(tǒng)進(jìn)一步包含日志數(shù)據(jù)庫,所述方法進(jìn)一步包括: 將每個(gè)用戶郵箱從至少一個(gè)其他用戶郵箱接收的任何電子郵件和每個(gè)用戶郵箱發(fā)送給至少一個(gè)其他用戶郵箱的任何電子郵件復(fù)制到所述日志數(shù)據(jù)庫內(nèi),其中,每個(gè)發(fā)送或接收的電子郵件包括也存儲(chǔ)在所述日志數(shù)據(jù)庫內(nèi)的元數(shù)據(jù); 其中,從復(fù)制到所述日志數(shù)據(jù)庫中的發(fā)送和接收電子郵件中收集特定于用戶的元數(shù)據(jù),其中,預(yù)測(cè)指示最好包括歸檔用戶郵箱的排名次序,以及最好進(jìn)一步包含: 響應(yīng)已收集特定于用戶的元數(shù)據(jù)的變化改變歸檔用戶郵箱的排名次序和預(yù)測(cè)指示,其中,所述次序最好包括將用戶郵箱排序成組,以及根據(jù)已收集特定于用戶的元數(shù)據(jù)按排名次序歸檔所述組。
3.如權(quán)利要求1或2所述的方法,其中,將所述已收集特定于用戶的元數(shù)據(jù)存儲(chǔ)在存儲(chǔ)地點(diǎn)中,所述方法進(jìn)一步包括: 從所述存儲(chǔ)地點(diǎn)中刪除與已從用戶郵箱中提取并歸檔的電子郵件相對(duì)應(yīng)的已存儲(chǔ)元數(shù)據(jù)。
4.如權(quán)利要求2或3所述的方法,進(jìn)一步包括: 根據(jù)所述預(yù)測(cè)信息對(duì)一組用戶郵箱進(jìn)行一輪檔案處理,其中,該輪檔案處理包括: 爬過所述組中的每個(gè)用戶郵箱以確定用戶郵箱中的哪些電子郵件有資格歸檔;以及從用戶郵箱中提取有資格的電子郵件并將已提取電子郵件存儲(chǔ)在歸檔地點(diǎn)中,最好進(jìn)一步包括: 根據(jù)來自該輪檔案處理的有資格的電子郵件與每個(gè)用戶郵箱要?dú)w檔的電子郵件的預(yù)測(cè)指示的比較為該組中的每個(gè)用戶郵箱確定校正因子;以及 通過結(jié)合該組中的每個(gè)用戶郵箱的已收集特定于用戶的元數(shù)據(jù)分析校正因子,在后一輪檔案處理中修正該組中的每個(gè)用戶郵箱要?dú)w檔的電子郵件的預(yù)測(cè)指示。
5.如權(quán)利要求到1-4的任何一項(xiàng)所述的方法,進(jìn)一步包括: 根據(jù)與所選郵箱相關(guān)聯(lián)的特定于用戶的元數(shù)據(jù),過濾掉所選用戶郵箱以免在該輪檔案處理中受到處理。
6.一種在電子郵件系統(tǒng)中歸檔電子郵件的計(jì)算機(jī)程序產(chǎn)品,所述電子郵件系統(tǒng)包含至少一個(gè)用戶郵箱,并被配置成接收電子郵件和將電子郵件存儲(chǔ)在所述用戶郵箱內(nèi)以及從所述用戶郵箱發(fā)送電子郵件,所述計(jì)算機(jī)程序產(chǎn)品包括: 具有具體化計(jì)算機(jī)可讀程序代碼的計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述計(jì)算機(jī)可讀程序代碼被配置成: 收集與每個(gè)用戶郵箱接收和發(fā)送的電子郵件相對(duì)應(yīng)的特定于用戶的元數(shù)據(jù);分析已收集特定于用戶的元數(shù)據(jù),以為每個(gè)用戶郵箱提供將什么時(shí)候歸檔電子郵件和歸檔哪些電子郵件的預(yù)測(cè)指示;以及 根據(jù)每個(gè)用戶郵箱的預(yù)測(cè)指示為用戶郵箱歸檔電子郵件。
7.如權(quán)利要求6所述的計(jì)算機(jī)程序產(chǎn)品,其中,所述電子郵件系統(tǒng)進(jìn)一步包括日志數(shù)據(jù)庫,以及所述計(jì)算機(jī)可讀程序代碼被進(jìn)一步配置成將每個(gè)用戶郵箱從至少一個(gè)其他用戶郵箱接收的任何電子郵件和每個(gè)用戶郵箱發(fā)送給至少一個(gè)其他用戶郵箱的任何電子郵件復(fù)制到所述日志數(shù)據(jù)庫內(nèi),其中,每個(gè)發(fā)送或接收的電子郵件包括也存儲(chǔ)在所述日志數(shù)據(jù)庫內(nèi)的元數(shù)據(jù),以及從復(fù)制到所述日志數(shù)據(jù)庫中的發(fā)送和接收電子郵件中收集特定于用戶的元數(shù)據(jù)。
8.如權(quán)利要求6或7所述的計(jì)算機(jī)程序產(chǎn)品,其中,預(yù)測(cè)指示包括要?dú)w檔用戶郵箱的排名次序,其中,所述計(jì)算機(jī)可讀程序代碼最好進(jìn)一步配置成響應(yīng)已收集特定于用戶的元數(shù)據(jù)的變化改變歸檔用戶郵箱的排名次序和預(yù)測(cè)指示,其中,所述排名次序包括將用戶郵箱排序成組,以及根據(jù)已收集特定于用戶的元數(shù)據(jù)按排名次序歸檔所述組。
9.如權(quán)利要求6到8的任何一項(xiàng)所述的計(jì)算機(jī)程序產(chǎn)品,其中,所述計(jì)算機(jī)可讀程序代碼被進(jìn)一步配置成將所述已收集特定于用戶的元數(shù)據(jù)存儲(chǔ)在存儲(chǔ)地點(diǎn)中,以及還從所述存儲(chǔ)地點(diǎn)中刪除與已從用戶郵箱中提取和歸檔的電子郵件相對(duì)應(yīng)的已存儲(chǔ)元數(shù)據(jù)。
10.如權(quán)利要求6到9的任何一項(xiàng)所述的計(jì)算機(jī)程序產(chǎn)品,其中,所述計(jì)算機(jī)可讀程序代碼被進(jìn)一步配置成根據(jù)所述預(yù)測(cè)信息對(duì)一組用戶郵箱進(jìn)行一輪檔案處理,其中,該輪檔案處理包括: 爬過所述組中的每個(gè)用戶郵箱以確定用戶郵箱中的哪些電子郵件有資格歸檔;以及從用戶郵箱中提取有資格的電子郵件并將已提取電子郵件存儲(chǔ)在歸檔地點(diǎn)中,其中,所述計(jì)算機(jī)可讀程序代碼最好進(jìn)一步配置成: 根據(jù)來自該輪檔案處理的有資格`電子郵件與每個(gè)用戶郵箱要?dú)w檔的電子郵件的預(yù)測(cè)指示的比較為該組中的每個(gè)用戶郵箱確定校正因子;以及 通過結(jié)合該組中的每個(gè)用戶郵箱的已收集特定于用戶的元數(shù)據(jù)分析校正因子,在后一輪檔案處理中修正該組中的每個(gè)用戶郵箱要?dú)w檔的電子郵件的預(yù)測(cè)指示。
11.如權(quán)利要求6到10的任何一項(xiàng)所述的計(jì)算機(jī)程序產(chǎn)品,其中,所述計(jì)算機(jī)可讀程序代碼被進(jìn)一步配置成: 根據(jù)與所選郵箱相關(guān)聯(lián)的特定于用戶的元數(shù)據(jù),過濾掉所選用戶郵箱以免在該輪檔案處理中受到處理。
12.—種在電子郵件系統(tǒng)中歸檔電子郵件的系統(tǒng),所述電子郵件系統(tǒng)包括: 電子郵件服務(wù)器,包括至少一個(gè)用戶郵箱,并接收電子郵件和將電子郵件存儲(chǔ)在所述用戶郵箱內(nèi)以及從所述用戶郵箱發(fā)送電子郵件; 電子郵件檔案存儲(chǔ)系統(tǒng);以及 處理器,其利用邏輯配置成: 收集與每個(gè)用戶郵箱接收和發(fā)送的電子郵件相對(duì)應(yīng)的特定于用戶的元數(shù)據(jù); 分析已收集特定于用戶的元數(shù)據(jù),以為每個(gè)用戶郵箱提供將什么時(shí)候歸檔電子郵件和歸檔哪些電子郵件的預(yù)測(cè)指示;以及 根據(jù)每個(gè)用戶郵箱的預(yù)測(cè)指示為電子郵件檔案存儲(chǔ)系統(tǒng)中的用戶郵箱歸檔電子郵件。
13.如權(quán)利要求12所述的系統(tǒng),進(jìn)一步包括: 日志數(shù)據(jù)庫,被配置成將每個(gè)用戶郵箱從至少一個(gè)其他用戶郵箱接收的任何電子郵件和每個(gè)用戶郵箱發(fā)送給至少一個(gè)其他用戶郵箱的任何電子郵件復(fù)制到所述日志數(shù)據(jù)庫內(nèi),其中,每個(gè)發(fā)送或接收的電子郵件包括也存儲(chǔ)在所述日志數(shù)據(jù)庫內(nèi)的元數(shù)據(jù); 其中,從復(fù)制到日志數(shù)據(jù)庫中的發(fā)送和接收電子郵件中收集特定于用戶的元數(shù)據(jù)。
14.如權(quán)利要求12或13所述的系統(tǒng),其中,所述預(yù)測(cè)指示包括要?dú)w檔用戶郵箱的排名次序。
15.如權(quán)利要求12、13或14所述的系統(tǒng),其中,所述處理器被進(jìn)一步配置成響應(yīng)已收集特定于用戶的元數(shù)據(jù)的變化改變歸檔用戶郵箱的排名次序和預(yù)測(cè)指示,和/或進(jìn)一步包括配置成存儲(chǔ)已收集特定于用戶的元數(shù)據(jù)的元數(shù)據(jù)數(shù)據(jù)庫,其中,所述系統(tǒng)被配置成從所述元數(shù)據(jù)數(shù)據(jù)庫中刪除與已從用戶郵箱中提取和歸檔的電子郵件相對(duì)應(yīng)的已存儲(chǔ)元數(shù)據(jù),和/或其中,所述處理器被進(jìn)一步配置成根據(jù)所述預(yù)測(cè)信息對(duì)一組用戶郵箱進(jìn)行一輪檔案處理,其中,該輪檔案處理包括: 爬過所述組中的每個(gè)用戶郵箱以確定用戶郵箱中的哪些電子郵件有資格歸檔; 從用戶郵箱中提取有資 格的電子郵件并將已提取電子郵件存儲(chǔ)在歸檔地點(diǎn)中;和/或其中,所述處理器被進(jìn)一步配置成: 根據(jù)來自該輪檔案處理的有資格的電子郵件與每個(gè)用戶郵箱要?dú)w檔的電子郵件的預(yù)測(cè)指示的比較為該組中的每個(gè)用戶郵箱確定校正因子;以及 通過結(jié)合該組中的每個(gè)用戶郵箱的已收集特定于用戶的元數(shù)據(jù)分析校正因子,在后一輪檔案處理中修正該組中的每個(gè)用戶郵箱要?dú)w檔的電子郵件的預(yù)測(cè)指示。
全文摘要
本發(fā)明涉及利用元數(shù)據(jù)優(yōu)化歸檔電子郵件的效率,具體提供了歸檔電子郵件的方法、計(jì)算機(jī)程序產(chǎn)品和系統(tǒng),其中該電子郵件系統(tǒng)包含至少一個(gè)用戶郵箱,并被配置成接收電子郵件和將電子郵件存儲(chǔ)在用戶郵箱內(nèi)以及從所述用戶郵箱發(fā)送電子郵件。收集與每個(gè)用戶郵箱接收和發(fā)送的電子郵件相對(duì)應(yīng)的特定于用戶的元數(shù)據(jù)。分析已收集特定于用戶的元數(shù)據(jù),以便為每個(gè)用戶郵箱提供將什么時(shí)候歸檔電子郵件和歸檔哪些電子郵件的預(yù)測(cè)指示,并根據(jù)每個(gè)用戶郵箱的預(yù)測(cè)指示為用戶郵箱歸檔電子郵件。
文檔編號(hào)G06Q10/10GK103201756SQ201180052411
公開日2013年7月10日 申請(qǐng)日期2011年10月21日 優(yōu)先權(quán)日2010年11月1日
發(fā)明者D·皮藤訥, D·塞德爾, M·貝斯勒, M·洛爾西, K·普法依爾, J·馬萊茨 申請(qǐng)人:國(guó)際商業(yè)機(jī)器公司