国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種大數(shù)據(jù)挖掘方法及裝置制造方法

      文檔序號(hào):6629269閱讀:289來(lái)源:國(guó)知局
      一種大數(shù)據(jù)挖掘方法及裝置制造方法
      【專利摘要】本發(fā)明提供一種大數(shù)據(jù)挖掘方法及裝置,該方法在進(jìn)行大數(shù)據(jù)挖掘時(shí),對(duì)原始數(shù)據(jù)進(jìn)行預(yù)處理,將原始數(shù)據(jù)拆分為多個(gè)字段;根據(jù)拆分后的每個(gè)字段,確定每個(gè)counter;根據(jù)確定的每個(gè)counter,計(jì)算每個(gè)績(jī)效指標(biāo)KPI。本發(fā)明實(shí)施例還提供了相應(yīng)的一種大數(shù)據(jù)挖掘裝置。由于在本發(fā)明實(shí)施例中將原始數(shù)據(jù)預(yù)處理,確定每個(gè)counter,從而確定每個(gè)KPI,實(shí)現(xiàn)對(duì)大數(shù)據(jù)的挖掘,而且該方法較簡(jiǎn)單,無(wú)需大量的計(jì)算機(jī),節(jié)省了資源。
      【專利說(shuō)明】一種大數(shù)據(jù)挖掘方法及裝置

      【技術(shù)領(lǐng)域】
      [0001]本發(fā)明涉及數(shù)據(jù)挖掘【技術(shù)領(lǐng)域】,尤其涉及一種大數(shù)據(jù)挖掘方法及裝置。

      【背景技術(shù)】
      [0002]現(xiàn)有技術(shù)在進(jìn)行數(shù)據(jù)挖掘時(shí),需要人工智能、數(shù)據(jù)庫(kù)、機(jī)器語(yǔ)言和統(tǒng)計(jì)分析知識(shí)等多種夸學(xué)科的知識(shí)。在進(jìn)行數(shù)據(jù)挖掘時(shí)需要有海量的數(shù)據(jù),還需要計(jì)算機(jī)具有相應(yīng)的處理能力,另外計(jì)算機(jī)還需要具有相應(yīng)的存儲(chǔ)和運(yùn)算能力。
      [0003]大數(shù)據(jù)時(shí)由于數(shù)據(jù)量非常的大,一般是TB到PB數(shù)量級(jí)別,由于數(shù)據(jù)量非常的大,現(xiàn)有的數(shù)據(jù)挖掘方法基本都無(wú)法支持大數(shù)據(jù)的挖掘,或者將現(xiàn)有的數(shù)據(jù)挖掘方法應(yīng)用在大數(shù)據(jù)挖掘時(shí),將需要大量的計(jì)算機(jī),導(dǎo)致資源的極大浪費(fèi)。


      【發(fā)明內(nèi)容】

      [0004]鑒于上述問(wèn)題,提出了本發(fā)明以便提供一種克服上述問(wèn)題或者至少部分地解決上述問(wèn)題的一種大數(shù)據(jù)挖掘方法及裝置。
      [0005]本發(fā)明實(shí)施例提供了一種大數(shù)據(jù)挖掘方法,該方法包括:
      [0006]對(duì)原始數(shù)據(jù)進(jìn)行預(yù)處理,將原始數(shù)據(jù)拆分為多個(gè)字段;
      [0007]根據(jù)拆分后的每個(gè)字段,確定每個(gè)counter ;
      [0008]根據(jù)確定的每個(gè)counter,計(jì)算每個(gè)績(jī)效指標(biāo)KPI。
      [0009]進(jìn)一步地,將原始數(shù)據(jù)拆分為多個(gè)字段后,所述方法還包括:
      [0010]根據(jù)預(yù)設(shè)的格式,保存預(yù)處理后的每個(gè)字段。
      [0011]進(jìn)一步地,采用數(shù)據(jù)庫(kù)的方式存儲(chǔ),或者采用非數(shù)據(jù)庫(kù)的方式存儲(chǔ)。
      [0012]進(jìn)一步地,根據(jù)每個(gè)字段的特征,確定每個(gè)字段包含的索引信息。
      [0013]進(jìn)一步地,所述索引信息包括時(shí)間索引信息。
      [0014]進(jìn)一步地,確定每個(gè)counter包括:
      [0015]根據(jù)用戶預(yù)先設(shè)定的表達(dá)式,確定每個(gè)表達(dá)式對(duì)應(yīng)的每個(gè)字段;
      [0016]根據(jù)確定的每個(gè)字段,計(jì)算每個(gè)counter。
      [0017]本發(fā)明實(shí)施例提供了一種大數(shù)據(jù)挖掘裝置,所述裝置包括:
      [0018]預(yù)處理模塊,用于對(duì)原始數(shù)據(jù)進(jìn)行預(yù)處理,將原始數(shù)據(jù)拆分為多個(gè)字段;
      [0019]確定模塊,用于根據(jù)拆分后的每個(gè)字段,確定每個(gè)counter ;
      [0020]計(jì)算模塊,用于根據(jù)確定的每個(gè)counter,計(jì)算每個(gè)績(jī)效指標(biāo)KPI。
      [0021]進(jìn)一步地,所述裝置還包括:
      [0022]存儲(chǔ)模塊,用于根據(jù)預(yù)設(shè)的格式,保存預(yù)處理后的每個(gè)字段。
      [0023]進(jìn)一步地,所述存儲(chǔ)模塊采用數(shù)據(jù)庫(kù)的方式存儲(chǔ),或者采用非數(shù)據(jù)庫(kù)的方式存儲(chǔ)。
      [0024]進(jìn)一步地,所述確定模塊,具體用于根據(jù)用戶預(yù)先設(shè)定的表達(dá)式,確定每個(gè)表達(dá)式對(duì)應(yīng)的每個(gè)字段;根據(jù)確定的每個(gè)字段,計(jì)算每個(gè)counter。
      [0025]本發(fā)明實(shí)施例提供了一種大數(shù)據(jù)挖掘方法及裝置,該方法在進(jìn)行大數(shù)據(jù)挖掘時(shí),對(duì)原始數(shù)據(jù)進(jìn)行預(yù)處理,將原始數(shù)據(jù)拆分為多個(gè)字段;根據(jù)拆分后的每個(gè)字段,確定每個(gè)counter ;根據(jù)確定的每個(gè)counter,計(jì)算每個(gè)績(jī)效指標(biāo)KPI。數(shù)據(jù)由于在本發(fā)明實(shí)施例中將原始數(shù)據(jù)預(yù)處理,確定每個(gè)counter,從而確定每個(gè)KPI,實(shí)現(xiàn)對(duì)大數(shù)據(jù)的挖掘,而且該方法較簡(jiǎn)單,無(wú)需大量的計(jì)算機(jī),節(jié)省了資源。
      [0026]上述說(shuō)明僅是本發(fā)明技術(shù)方案的概述,為了能夠更清楚了解本發(fā)明的技術(shù)手段,而可依照說(shuō)明書的內(nèi)容予以實(shí)施,并且為了讓本發(fā)明的上述和其它目的、特征和優(yōu)點(diǎn)能夠更明顯易懂,以下特舉本發(fā)明的【具體實(shí)施方式】。

      【專利附圖】

      【附圖說(shuō)明】
      [0027]通過(guò)閱讀下文優(yōu)選實(shí)施方式的詳細(xì)描述,各種其他的優(yōu)點(diǎn)和益處對(duì)于本領(lǐng)域普通技術(shù)人員將變得清楚明了。附圖僅用于示出優(yōu)選實(shí)施方式的目的,而并不認(rèn)為是對(duì)本發(fā)明的限制。而且在整個(gè)附圖中,用相同的參考符號(hào)表示相同的部件。在附圖中:
      [0028]圖1為本發(fā)明實(shí)施例提供的一種大數(shù)據(jù)挖掘過(guò)程;
      [0029]圖2為本發(fā)明實(shí)施例提供了一種大數(shù)據(jù)挖掘裝置的結(jié)構(gòu)示意圖。

      【具體實(shí)施方式】
      [0030]為了實(shí)現(xiàn)大數(shù)據(jù)挖掘,節(jié)省資源,本發(fā)明實(shí)施例提供了一種大數(shù)據(jù)挖掘方法及裝置。
      [0031]下面將參照附圖更詳細(xì)地描述本公開(kāi)的示例性實(shí)施例。雖然附圖中顯示了本公開(kāi)的示例性實(shí)施例,然而應(yīng)當(dāng)理解,可以以各種形式實(shí)現(xiàn)本公開(kāi)而不應(yīng)被這里闡述的實(shí)施例所限制。相反,提供這些實(shí)施例是為了能夠更透徹地理解本公開(kāi),并且能夠?qū)⒈竟_(kāi)的范圍完整的傳達(dá)給本領(lǐng)域的技術(shù)人員。
      [0032]下面結(jié)合說(shuō)明附圖,對(duì)本發(fā)明實(shí)施例進(jìn)行說(shuō)明。
      [0033]圖1為本發(fā)明實(shí)施例提供的一種大數(shù)據(jù)挖掘過(guò)程,該過(guò)程包括以下步驟:
      [0034]SlOl:對(duì)原始數(shù)據(jù)進(jìn)行預(yù)處理,將原始數(shù)據(jù)拆分為多個(gè)字段。
      [0035]S102:根據(jù)拆分后的每個(gè)字段,確定每個(gè)counter。
      [0036]S103:根據(jù)確定的每個(gè)counter,計(jì)算每個(gè)績(jī)效指標(biāo)(Key PerformanceIndicator, KPI)。
      [0037]本發(fā)明實(shí)施例中為了實(shí)時(shí)處理大數(shù)據(jù),實(shí)時(shí)確定該大數(shù)據(jù)的ΚΡΙ。當(dāng)獲取到原始數(shù)據(jù)進(jìn)行預(yù)處理,將原始數(shù)據(jù)拆分為不同的字段,并將每個(gè)字段保存起來(lái)。
      [0038]這是因?yàn)樵紨?shù)據(jù)包含有相應(yīng)的信息,例如原始數(shù)據(jù)為手機(jī)號(hào)碼,該手機(jī)號(hào)碼中包括手機(jī)型號(hào),手機(jī)廠商信息等,對(duì)該原始數(shù)據(jù)進(jìn)行預(yù)處理,根據(jù)手機(jī)號(hào)碼中包含的信息,可以將每個(gè)標(biāo)識(shí)不同內(nèi)容的字段拆分出來(lái)。另外,在本發(fā)明實(shí)施例中為了實(shí)現(xiàn)對(duì)原始數(shù)據(jù)的分析,還可以根據(jù)用戶的需求,將原始數(shù)據(jù)進(jìn)行進(jìn)一步的分類,例如根據(jù)手機(jī)號(hào)碼可以將用戶劃分為不同的類型,例如將用戶劃分為漫游用戶,VIP用戶等。
      [0039]對(duì)原始數(shù)據(jù)預(yù)處理,得到每個(gè)拆分后的字段后,保存每個(gè)字段。在保存每個(gè)字段時(shí),為了便于查詢,根據(jù)每個(gè)字段的特征,確定每個(gè)字段的索引信息,該索引信息可以時(shí)間信息,也可以是按照一定順序的序號(hào)信息等。
      [0040]另外,針對(duì)一些原始數(shù)據(jù),可能這些數(shù)據(jù)是非結(jié)構(gòu)化的數(shù)據(jù),例如聊天數(shù)據(jù),在本發(fā)明實(shí)施例中為了實(shí)現(xiàn)對(duì)該原始數(shù)據(jù)的處理,需要將該非結(jié)構(gòu)化的數(shù)據(jù)轉(zhuǎn)換為結(jié)構(gòu)化的數(shù)據(jù),將非結(jié)構(gòu)化的數(shù)據(jù)轉(zhuǎn)換為結(jié)構(gòu)化數(shù)據(jù)的過(guò)程屬于現(xiàn)有技術(shù),在本發(fā)明實(shí)施例中就不對(duì)該過(guò)程進(jìn)行詳細(xì)限定。
      [0041]在對(duì)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)時(shí),用戶可以定義原始數(shù)據(jù)的分類類型,用戶可以按照設(shè)定的時(shí)間間隔進(jìn)行分類,將歸屬于某一時(shí)間段內(nèi)的數(shù)據(jù)分為一類,也可以根據(jù)應(yīng)用的類型進(jìn)行分類,或者也可以服務(wù)器的IP地址進(jìn)行分類。另外,在進(jìn)行分類時(shí),還可以將各種分類信息進(jìn)行結(jié)合,例如可以統(tǒng)計(jì)設(shè)定時(shí)間間隔中某一應(yīng)用的流量等,則該統(tǒng)計(jì)過(guò)程就涉及到了時(shí)間分類和應(yīng)用分類的概念。根據(jù)分類的結(jié)果,將拆分后的每個(gè)字段保存到對(duì)應(yīng)的存儲(chǔ)空間中。
      [0042]得到每個(gè)字段后,由于后期會(huì)使用到相應(yīng)的字段,所以在本發(fā)明實(shí)施例中在拆分得到每個(gè)字段后,直接將該字段存儲(chǔ)起來(lái)。在存儲(chǔ)每個(gè)字段時(shí),可以直接采用數(shù)據(jù)庫(kù)circle的方式進(jìn)行存儲(chǔ),或者采用非數(shù)據(jù)庫(kù)的方式存儲(chǔ)。
      [0043]在確定不同的counter時(shí),可能不同的counter會(huì)用到相同的字段,例如,確定的 Counter 分別是 CounterA, CounterB 和 CounterC, CounterX = CounterA+CounterB,CounterY = CounterA+CounterB+CounterC, CounterA+CounterB 在不同的 Counter 計(jì)算中都是需要的。另外,有些Counter在計(jì)算時(shí),可能需要不同字段之間的乘除運(yùn)算。
      [0044]具體的,在根據(jù)拆分后的每個(gè)字段,確定每個(gè)counter時(shí)包括:
      [0045]根據(jù)用戶預(yù)先設(shè)定的類型,確定每個(gè)類型對(duì)應(yīng)的每個(gè)字段;
      [0046]根據(jù)確定的每個(gè)字段,計(jì)算每個(gè)counter。
      [0047]另外,在本發(fā)明實(shí)施例中為了提高對(duì)大數(shù)據(jù)處理的速度,針對(duì)進(jìn)行加減運(yùn)算的字段,在將原始數(shù)據(jù)拆分為多個(gè)字段后,對(duì)每個(gè)字段直接進(jìn)行加減運(yùn)算,可以對(duì)每個(gè)字段先分別計(jì)算其和值(統(tǒng)計(jì)過(guò)程),然后再計(jì)算兩個(gè)字段和值的和(計(jì)算過(guò)程),減法相同,可以先進(jìn)行計(jì)算過(guò)程再進(jìn)行統(tǒng)計(jì)過(guò)程,或者也可以先進(jìn)行統(tǒng)計(jì)過(guò)程再進(jìn)行計(jì)算過(guò)程;針對(duì)進(jìn)行乘除運(yùn)算的字段,在將原始數(shù)據(jù)拆分為多個(gè)字段后,就需要先進(jìn)行計(jì)算過(guò)程,再進(jìn)行統(tǒng)計(jì)過(guò)程。
      [0048]在計(jì)算每個(gè)counter時(shí),根據(jù)用戶預(yù)先設(shè)定的表達(dá)式,確定每個(gè)表達(dá)式對(duì)應(yīng)的字段,采用二叉樹(shù)的方式進(jìn)行計(jì)算,并且針對(duì)在進(jìn)行counter時(shí),針對(duì)其中重復(fù)的內(nèi)容,可以重新引用,避免重新計(jì)算,節(jié)省了計(jì)算量,提高了整個(gè)數(shù)據(jù)挖掘的效率。例如,不同的counter中會(huì)用到A+B的值,因此當(dāng)計(jì)算出A+B的值后,將該值確定一個(gè)索引信息,便于其他需要使用A+B的值的counter計(jì)算。
      [0049]具體的,為了方便引用重復(fù)的內(nèi)容,計(jì)算了相應(yīng)的counter,根據(jù)該counter中的內(nèi)容,將重復(fù)的內(nèi)容進(jìn)行分類,并確定該分類的索引,便于后續(xù)查詢的需要。
      [0050]圖2為本發(fā)明實(shí)施例提供了一種大數(shù)據(jù)挖掘裝置的結(jié)構(gòu)示意圖,所述裝置包括:
      [0051]預(yù)處理模塊21,用于對(duì)原始數(shù)據(jù)進(jìn)行預(yù)處理,將原始數(shù)據(jù)拆分為多個(gè)字段;
      [0052]確定模塊22,用于根據(jù)拆分后的每個(gè)字段,確定每個(gè)counter ;
      [0053]計(jì)算模塊23,用于根據(jù)確定的每個(gè)counter,計(jì)算每個(gè)績(jī)效指標(biāo)KPI。
      [0054]進(jìn)一步地,所述裝置還包括:
      [0055]存儲(chǔ)模塊24,用于根據(jù)預(yù)設(shè)的格式,保存預(yù)處理后的每個(gè)字段。
      [0056]進(jìn)一步地,所述存儲(chǔ)模塊24采用數(shù)據(jù)庫(kù)的方式存儲(chǔ),或者采用非數(shù)據(jù)庫(kù)的方式存儲(chǔ)。
      [0057]進(jìn)一步地,所述確定模塊22,具體用于根據(jù)用戶預(yù)先設(shè)定的類型,確定每個(gè)類型對(duì)應(yīng)的每個(gè)字段;根據(jù)確定的每個(gè)字段,計(jì)算每個(gè)counter。
      [0058]為了提高裝置的穩(wěn)定性,對(duì)裝置中的各線程進(jìn)行監(jiān)控和調(diào)度。
      [0059]本發(fā)明實(shí)施例提供了一種大數(shù)據(jù)挖掘方法及裝置,該方法在進(jìn)行大數(shù)據(jù)挖掘時(shí),對(duì)原始數(shù)據(jù)進(jìn)行預(yù)處理,將原始數(shù)據(jù)拆分為多個(gè)字段;根據(jù)拆分后的每個(gè)字段,確定每個(gè)counter ;根據(jù)確定的每個(gè)counter,計(jì)算每個(gè)績(jī)效指標(biāo)KPI。由于在本發(fā)明實(shí)施例中將原始數(shù)據(jù)預(yù)處理,確定每個(gè)counter,從而確定每個(gè)KPI,實(shí)現(xiàn)對(duì)大數(shù)據(jù)的挖掘,而且該方法較簡(jiǎn)單,無(wú)需大量的計(jì)算機(jī),節(jié)省了資源。
      [0060]在此提供的算法和顯示不與任何特定計(jì)算機(jī)、虛擬系統(tǒng)或者其它設(shè)備固有相關(guān)。各種通用系統(tǒng)也可以與基于在此的示教一起使用。根據(jù)上面的描述,構(gòu)造這類系統(tǒng)所要求的結(jié)構(gòu)是顯而易見(jiàn)的。此外,本發(fā)明也不針對(duì)任何特定編程語(yǔ)言。應(yīng)當(dāng)明白,可以利用各種編程語(yǔ)言實(shí)現(xiàn)在此描述的本發(fā)明的內(nèi)容,并且上面對(duì)特定語(yǔ)言所做的描述是為了披露本發(fā)明的最佳實(shí)施方式。
      [0061]在此處所提供的說(shuō)明書中,說(shuō)明了大量具體細(xì)節(jié)。然而,能夠理解,本發(fā)明的實(shí)施例可以在沒(méi)有這些具體細(xì)節(jié)的情況下實(shí)踐。在一些實(shí)例中,并未詳細(xì)示出公知的方法、結(jié)構(gòu)和技術(shù),以便不模糊對(duì)本說(shuō)明書的理解。
      [0062]類似地,應(yīng)當(dāng)理解,為了精簡(jiǎn)本公開(kāi)并幫助理解各個(gè)發(fā)明方面中的一個(gè)或多個(gè),在上面對(duì)本發(fā)明的示例性實(shí)施例的描述中,本發(fā)明的各個(gè)特征有時(shí)被一起分組到單個(gè)實(shí)施例、圖、或者對(duì)其的描述中。然而,并不應(yīng)將該公開(kāi)的方法解釋成反映如下意圖:即所要求保護(hù)的本發(fā)明要求比在每個(gè)權(quán)利要求中所明確記載的特征更多的特征。更確切地說(shuō),如下面的權(quán)利要求書所反映的那樣,發(fā)明方面在于少于前面公開(kāi)的單個(gè)實(shí)施例的所有特征。因此,遵循【具體實(shí)施方式】的權(quán)利要求書由此明確地并入該【具體實(shí)施方式】,其中每個(gè)權(quán)利要求本身都作為本發(fā)明的單獨(dú)實(shí)施例。
      [0063]本領(lǐng)域那些技術(shù)人員可以理解,可以對(duì)實(shí)施例中的設(shè)備中的模塊進(jìn)行自適應(yīng)性地改變并且把它們?cè)O(shè)置在與該實(shí)施例不同的一個(gè)或多個(gè)設(shè)備中??梢园褜?shí)施例中的模塊或單元或組件組合成一個(gè)模塊或單元或組件,以及此外可以把它們分成多個(gè)子模塊或子單元或子組件。除了這樣的特征和/或過(guò)程或者單元中的至少一些是相互排斥之外,可以采用任何組合對(duì)本說(shuō)明書(包括伴隨的權(quán)利要求、摘要和附圖)中公開(kāi)的所有特征以及如此公開(kāi)的任何方法或者設(shè)備的所有過(guò)程或單元進(jìn)行組合。除非另外明確陳述,本說(shuō)明書(包括伴隨的權(quán)利要求、摘要和附圖)中公開(kāi)的每個(gè)特征可以由提供相同、等同或相似目的的替代特征來(lái)代替。
      [0064]此外,本領(lǐng)域的技術(shù)人員能夠理解,盡管在此所述的一些實(shí)施例包括其它實(shí)施例中所包括的某些特征而不是其它特征,但是不同實(shí)施例的特征的組合意味著處于本發(fā)明的范圍之內(nèi)并且形成不同的實(shí)施例。例如,在下面的權(quán)利要求書中,所要求保護(hù)的實(shí)施例的任意之一都可以以任意的組合方式來(lái)使用。
      [0065]本發(fā)明的各個(gè)部件實(shí)施例可以以硬件實(shí)現(xiàn),或者以在一個(gè)或者多個(gè)處理器上運(yùn)行的軟件模塊實(shí)現(xiàn),或者以它們的組合實(shí)現(xiàn)。本領(lǐng)域的技術(shù)人員應(yīng)當(dāng)理解,可以在實(shí)踐中使用微處理器或者數(shù)字信號(hào)處理器(DSP)來(lái)實(shí)現(xiàn)根據(jù)本發(fā)明實(shí)施例的大數(shù)據(jù)挖掘裝置中的一些或者全部部件的一些或者全部功能。本發(fā)明還可以實(shí)現(xiàn)為用于執(zhí)行這里所描述的方法的一部分或者全部的設(shè)備或者裝置程序(例如,計(jì)算機(jī)程序和計(jì)算機(jī)程序產(chǎn)品)。這樣的實(shí)現(xiàn)本發(fā)明的程序可以存儲(chǔ)在計(jì)算機(jī)可讀介質(zhì)上,或者可以具有一個(gè)或者多個(gè)信號(hào)的形式。這樣的信號(hào)可以從因特網(wǎng)網(wǎng)站上下載得到,或者在載體信號(hào)上提供,或者以任何其他形式提供。
      [0066]應(yīng)該注意的是上述實(shí)施例對(duì)本發(fā)明進(jìn)行說(shuō)明而不是對(duì)本發(fā)明進(jìn)行限制,并且本領(lǐng)域技術(shù)人員在不脫離所附權(quán)利要求的范圍的情況下可設(shè)計(jì)出替換實(shí)施例。在權(quán)利要求中,不應(yīng)將位于括號(hào)之間的任何參考符號(hào)構(gòu)造成對(duì)權(quán)利要求的限制。單詞“包含”不排除存在未列在權(quán)利要求中的元件或步驟。位于元件之前的單詞“一”或“一個(gè)”不排除存在多個(gè)這樣的元件。本發(fā)明可以借助于包括有若干不同元件的硬件以及借助于適當(dāng)編程的計(jì)算機(jī)來(lái)實(shí)現(xiàn)。在列舉了若干裝置的單元權(quán)利要求中,這些裝置中的若干個(gè)可以是通過(guò)同一個(gè)硬件項(xiàng)來(lái)具體體現(xiàn)。單詞第一、第二、以及第三等的使用不表示任何順序??蓪⑦@些單詞解釋為名稱。
      [0067]顯然,本領(lǐng)域的技術(shù)人員可以對(duì)本發(fā)明進(jìn)行各種改動(dòng)和變型而不脫離本發(fā)明的精神和范圍。這樣,倘若本發(fā)明的這些修改和變型屬于本發(fā)明權(quán)利要求及其等同技術(shù)的范圍之內(nèi),則本發(fā)明也意圖包含這些改動(dòng)和變型在內(nèi)。
      【權(quán)利要求】
      1.一種大數(shù)據(jù)挖掘方法,其特征在于,該方法包括: 對(duì)原始數(shù)據(jù)進(jìn)行預(yù)處理,將原始數(shù)據(jù)拆分為多個(gè)字段; 根據(jù)拆分后的每個(gè)字段,確定每個(gè)counter ; 根據(jù)確定的每個(gè)counter,計(jì)算每個(gè)績(jī)效指標(biāo)KPI。
      2.如權(quán)利要求1所述的方法,其特征在于,將原始數(shù)據(jù)拆分為多個(gè)字段后,所述方法還包括: 根據(jù)預(yù)設(shè)的格式,保存預(yù)處理后的每個(gè)字段。
      3.如權(quán)利要求2所述的方法,其特征在于,采用數(shù)據(jù)庫(kù)的方式存儲(chǔ),或者采用非數(shù)據(jù)庫(kù)的方式存儲(chǔ)。
      4.如權(quán)利要求2所述的方法,其特征在于,根據(jù)每個(gè)字段的特征,確定每個(gè)字段包含的索引信息。
      5.如權(quán)利要求4所述的方法,其特征在于,所述索引信息包括時(shí)間索引信息。
      6.如權(quán)利要求1所述的方法,其特征在于,確定每個(gè)counter包括: 根據(jù)用戶預(yù)先設(shè)定的表達(dá)式,確定每個(gè)表達(dá)式對(duì)應(yīng)的每個(gè)字段; 根據(jù)確定的每個(gè)字段,計(jì)算每個(gè)counter。
      7.一種大數(shù)據(jù)挖掘裝置,其特征在于,所述裝置包括: 預(yù)處理模塊,用于對(duì)原始數(shù)據(jù)進(jìn)行預(yù)處理,將原始數(shù)據(jù)拆分為多個(gè)字段; 確定模塊,用于根據(jù)拆分后的每個(gè)字段,確定每個(gè)counter ; 計(jì)算模塊,用于根據(jù)確定的每個(gè)counter,計(jì)算每個(gè)績(jī)效指標(biāo)KPI。
      8.如權(quán)利要求7所述的裝置,其特征在于,所述裝置還包括: 存儲(chǔ)模塊,用于根據(jù)預(yù)設(shè)的格式,保存預(yù)處理后的每個(gè)字段。
      9.如權(quán)利要求8所述的裝置,其特征在于,所述存儲(chǔ)模塊采用數(shù)據(jù)庫(kù)的方式存儲(chǔ),或者采用非數(shù)據(jù)庫(kù)的方式存儲(chǔ)。
      10.如權(quán)利要求7所述的裝置,其特征在于,所述確定模塊,具體用于根據(jù)用戶預(yù)先設(shè)定的表達(dá)式,確定每個(gè)表達(dá)式對(duì)應(yīng)的每個(gè)字段;根據(jù)確定的每個(gè)字段,計(jì)算每個(gè)counter。
      【文檔編號(hào)】G06F17/30GK104252544SQ201410521951
      【公開(kāi)日】2014年12月31日 申請(qǐng)日期:2014年9月30日 優(yōu)先權(quán)日:2014年9月30日
      【發(fā)明者】鄧法忠 申請(qǐng)人:北京華智凱科技有限公司
      網(wǎng)友詢問(wèn)留言 已有0條留言
      • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1