本公開總體上涉及云中復(fù)雜數(shù)據(jù)的分析,更具體地說,涉及大量數(shù)據(jù)的高效并且智能分區(qū)和實時可視化見解的生成。
背景技術(shù):
1、數(shù)據(jù)分析是日益發(fā)展的領(lǐng)域,它從原始信息源中獲取見解。數(shù)據(jù)分析技術(shù)可有所不同,但它們典型地用于收集、處理和分析數(shù)據(jù)以供人們消費(fèi)和決策。數(shù)據(jù)分析可用于揭示因大量未分析數(shù)據(jù)而丟失或“不可見”的趨勢和指標(biāo)。然而,以這種方式使用該信息可優(yōu)化過程并提高系統(tǒng)的整體效率,否則將無法獲得該信息。
2、傳統(tǒng)上,許多可視化儀表板主要側(cè)重于提供高級摘要,如細(xì)分概況、群組分析和其他類似指標(biāo)。為了獲得競爭優(yōu)勢,利益相關(guān)者(包括直線經(jīng)理)尋求通過深入研究報告中的較低等級數(shù)據(jù)來揭示更深層次分析見解的工具。然而,在‘大數(shù)據(jù)’的上下文中(具有數(shù)萬億表格行和海量存儲器),可視化報告生成變得滯后,尤其是在響應(yīng)前端刷新請求時。這造成了不必要的高延遲儀表板并阻礙了對重要見解的訪問。
3、本領(lǐng)域需要一種解決上述缺點(diǎn)的系統(tǒng)和方法。
技術(shù)實現(xiàn)思路
1、公開了一種優(yōu)化用于數(shù)據(jù)存儲和刷新事件的資源的數(shù)據(jù)處理和分析系統(tǒng)。所提出的系統(tǒng)和方法描述了用于生成分區(qū)策略的動態(tài)和自動化過程,該分區(qū)策略用于在云中管理和維護(hù)大數(shù)據(jù)的實施方式。該系統(tǒng)和方法通過自動評分和標(biāo)識最適合給定項目的用戶需求的最佳分區(qū)大小來解決上述問題。在一個示例中,來自多個源的數(shù)據(jù)可以被集成在云不可知和數(shù)據(jù)格式不可知的過程中,允許系統(tǒng)創(chuàng)建新的度量并且建立關(guān)系的集合,這些關(guān)系支持為可視化工具提供動力的表格語義數(shù)據(jù)模型的構(gòu)建。在一些實施例中,所提出的數(shù)據(jù)分析框架采用高度優(yōu)化和自動化的分區(qū)加載技術(shù),該技術(shù)涉及將數(shù)據(jù)分割為更小的單元。此外,自定義數(shù)據(jù)刷新技術(shù)可有選擇性地只刷新必要的分區(qū),加上智能數(shù)據(jù)集市(“mart”)能力,隨著冗余的消除,所需的計算時間大大減少。
2、一方面,本公開為基于云計算的基礎(chǔ)設(shè)施提供了一種處理和對數(shù)據(jù)進(jìn)行分區(qū)的計算機(jī)實施方法。該方法包括在數(shù)據(jù)分析系統(tǒng)的分區(qū)器模塊處接收第一客戶標(biāo)準(zhǔn)和包括表格數(shù)據(jù)的第一客戶數(shù)據(jù)集的第一步驟,以及在分區(qū)器模塊處計算表格數(shù)據(jù)的第一大小得分的第二步驟,第一大小得分標(biāo)識最有可能滿足第一客戶標(biāo)準(zhǔn)的第一數(shù)據(jù)增量。此外,第三步驟包括在分區(qū)器模塊處基于第一大小得分而生成第一分區(qū)策略,并且第四步驟包括在數(shù)據(jù)分析系統(tǒng)處實施第一分區(qū)策略以產(chǎn)生表格數(shù)據(jù)中的聚合數(shù)據(jù)的集合,這些集合包括第一分區(qū)。該方法的第五步驟包括將集合數(shù)據(jù)作為智能數(shù)據(jù)集市的部分存儲在數(shù)據(jù)分析系統(tǒng)中。第六步驟包括經(jīng)由與數(shù)據(jù)可視化平臺相關(guān)聯(lián)的第一用戶界面接收第一用戶查詢,并且第七步驟包括確定第一用戶查詢與第一分區(qū)有關(guān)。此外,該方法包括經(jīng)由數(shù)據(jù)可視化平臺從智能數(shù)據(jù)集市取回第一分區(qū)的第八步驟,以及為數(shù)據(jù)可視化平臺并且經(jīng)由生成人工智能(ai)模塊基于第一分區(qū)生成第一可視化的第九步驟。
3、另一方面,本公開提供了一種存儲軟件的非暫時性計算機(jī)可讀介質(zhì),該軟件包括可由一個或多個計算機(jī)執(zhí)行的指令,這些指令在執(zhí)行時,促使一個或多個計算機(jī)通過執(zhí)行以下各項為基于云計算的基礎(chǔ)設(shè)施處理和對數(shù)據(jù)進(jìn)行分區(qū):(1)在數(shù)據(jù)分析系統(tǒng)的分區(qū)器模塊處接收第一客戶標(biāo)準(zhǔn)和包括表格數(shù)據(jù)的第一客戶數(shù)據(jù)集;(2)在分區(qū)器模塊處計算表格數(shù)據(jù)的第一大小得分,該第一大小得分標(biāo)識最有可能滿足第一客戶標(biāo)準(zhǔn)的第一數(shù)據(jù)增量;(3)在分區(qū)器模塊處基于第一大小得分而生成第一分區(qū)策略;(4)在數(shù)據(jù)分析系統(tǒng)處實施第一分區(qū)策略以產(chǎn)生表格數(shù)據(jù)中的聚合數(shù)據(jù)的集合,該集合包括第一分區(qū);(5)將聚合數(shù)據(jù)的集合作為智能數(shù)據(jù)集市的部分存儲在數(shù)據(jù)分析系統(tǒng)中;(6)經(jīng)由與數(shù)據(jù)可視化平臺相關(guān)聯(lián)的第一用戶界面接收第一用戶查詢;(7)確定第一用戶查詢與第一分區(qū)有關(guān);(8)經(jīng)由數(shù)據(jù)可視化平臺從智能數(shù)據(jù)集市取回第一分區(qū);以及(9)針對數(shù)據(jù)可視化平臺并且經(jīng)由生成式人工智能(ai)模塊基于第一分區(qū)生成第一可視化。
4、在又一方面,本公開提供了一種用于為基于云計算的基礎(chǔ)設(shè)施生成應(yīng)用程序架構(gòu)的系統(tǒng),該系統(tǒng)包括一個或多個計算機(jī)和存儲指令的一個或多個存儲設(shè)備,這些指令在被一個或多個計算機(jī)執(zhí)行時可操作以使一個或多個計算機(jī):(1)在數(shù)據(jù)分析系統(tǒng)的分區(qū)器模塊處接收第一客戶標(biāo)準(zhǔn)和包括表格數(shù)據(jù)的第一客戶數(shù)據(jù)集;(2)在分區(qū)器模塊處計算表格數(shù)據(jù)的第一大小得分,該第一大小得分標(biāo)識最有可能滿足第一客戶標(biāo)準(zhǔn)的第一數(shù)據(jù)增量;(3)在分區(qū)器模塊處基于第一大小得分而生成第一分區(qū)策略;(4)在數(shù)據(jù)分析系統(tǒng)處實施第一分區(qū)策略以產(chǎn)生表格數(shù)據(jù)中的聚合數(shù)據(jù)的集合,該集合包括第一分區(qū);(5)將聚合數(shù)據(jù)的集合作為智能數(shù)據(jù)集市的部分存儲在數(shù)據(jù)分析系統(tǒng)中;(6)經(jīng)由與數(shù)據(jù)可視化平臺相關(guān)聯(lián)的第一用戶界面接收第一用戶查詢;(7)確定第一用戶查詢與第一分區(qū)有關(guān);(8)經(jīng)由數(shù)據(jù)可視化平臺從智能數(shù)據(jù)集市取回第一分區(qū);以及(9)為數(shù)據(jù)可視化平臺并且經(jīng)由生成式人工智能(ai)模塊基于第一分區(qū)生成第一可視化。
5、本領(lǐng)域普通技術(shù)人員在研究以下附圖和詳細(xì)說明后,將會明白本公開的其他系統(tǒng)、方法、特征和優(yōu)點(diǎn)。所有這類附加的系統(tǒng)、方法、特征和優(yōu)點(diǎn)均旨在包括在本說明書和本公開內(nèi)容中,包括在本公開的范圍內(nèi),并且受到所附權(quán)利要求的保護(hù)。
6、雖然對各種實施例進(jìn)行了描述,但該描述旨在進(jìn)行示例性說明,而非限制性說明,對本領(lǐng)域普通技術(shù)人員而言,清楚的是,實施例范圍內(nèi)可能有更多實施例和實施方式。盡管在附圖中示出了許多可能的特征組合,并在詳細(xì)描述中進(jìn)行了論述,但是所公開特征的許多其他組合也是可能的。除非特別定義,否則任何實施例的任何特征或元素可與任何其他實施例中的任何其他特征或元素結(jié)合使用或替代任何其他特征或元素。
7、本公開包括并考慮了與本領(lǐng)域普通技術(shù)人員已知的特征和元素的組合。已公開的實施例、特征和元素也可與任何常規(guī)特征或元素組合,以形成權(quán)利要求所定義的獨(dú)特發(fā)明。任何實施例的任何特征或元素也可與來自其他發(fā)明的特征或元素相結(jié)合,以形成如權(quán)利要求所定義的另一個不同的發(fā)明。因此,將會理解,本公開中示出和/或論述的任何特征可單獨(dú)地被實施或以任何合適的組合被實施。因此,除了根據(jù)所附權(quán)利要求及其等同物之外,實施例不受限制。此外,在所附權(quán)利要求的范圍內(nèi)可進(jìn)行各種修改和改變。
1.一種用于為基于云計算的基礎(chǔ)設(shè)施處理和對數(shù)據(jù)進(jìn)行分區(qū)的計算機(jī)實施的方法,所述方法包括:
2.根據(jù)權(quán)利要求1所述的方法,其中實施所述第一分區(qū)策略還包括:在基本上同步的過程中在所述表格數(shù)據(jù)中創(chuàng)建多個分區(qū)。
3.根據(jù)權(quán)利要求1所述的方法,還包括:
4.根據(jù)權(quán)利要求3所述的方法,還包括:
5.根據(jù)權(quán)利要求1所述的方法,還包括:
6.根據(jù)權(quán)利要求5所述的方法,還包括:經(jīng)由所述第二用戶界面接收對所述第一選項的選擇,并且其中實施所述第一分區(qū)策略是響應(yīng)于接收到對所述第一選項的所述選擇。
7.根據(jù)權(quán)利要求1所述的方法,還包括:
8.一種非暫時性計算機(jī)可讀介質(zhì),其存儲軟件,所述軟件包括由一個或多個計算機(jī)可執(zhí)行的指令,所述指令在執(zhí)行時,使所述一個或多個計算機(jī)通過以下方式為基于云計算的基礎(chǔ)設(shè)施處理和對數(shù)據(jù)進(jìn)行分區(qū):
9.根據(jù)權(quán)利要求8所述的非暫時性計算機(jī)可讀介質(zhì),其中所述指令還使所述一個或多個計算機(jī)以基本上同步的過程在所述表格數(shù)據(jù)中創(chuàng)建多個分區(qū)。
10.根據(jù)權(quán)利要求8所述的非暫時性計算機(jī)可讀介質(zhì),其中所述指令還使所述一個或多個計算機(jī):
11.根據(jù)權(quán)利要求10所述的非暫時性計算機(jī)可讀介質(zhì),其中所述指令還使所述一個或多個計算機(jī):
12.根據(jù)權(quán)利要求8所述的非暫時性計算機(jī)可讀介質(zhì),其中所述指令還使所述一個或多個計算機(jī):
13.根據(jù)權(quán)利要求12所述的非暫時性計算機(jī)可讀介質(zhì),其中所述指令還使所述一個或多個計算機(jī)經(jīng)由所述第二用戶界面接收對所述第一選項的選擇,并且其中實施所述第一分區(qū)策略是響應(yīng)于接收到對所述第一選項的所述選擇。
14.根據(jù)權(quán)利要求8所述的非暫時性計算機(jī)可讀介質(zhì),其中所述指令還使所述一個或多個計算機(jī):
15.一種用于為基于云計算的基礎(chǔ)設(shè)施處理和對數(shù)據(jù)進(jìn)行分區(qū)的系統(tǒng),所述基礎(chǔ)設(shè)施包括一個或多個計算機(jī)和存儲指令的一個或多個存儲設(shè)備,所述指令在被所述一個或多個計算機(jī)執(zhí)行時可操作以使所述一個或多個計算機(jī):
16.根據(jù)權(quán)利要求15所述的系統(tǒng),其中所述指令還使所述一個或多個計算機(jī)以基本上同步的過程在所述表格數(shù)據(jù)中創(chuàng)建多個分區(qū)。
17.根據(jù)權(quán)利要求15所述的系統(tǒng),其中所述指令還使所述一個或多個計算機(jī):
18.根據(jù)權(quán)利要求17所述的系統(tǒng),其中所述指令還使所述一個或多個計算機(jī):
19.根據(jù)權(quán)利要求15所述的系統(tǒng),其中所述指令還使所述一個或多個計算機(jī):
20.根據(jù)權(quán)利要求19所述的系統(tǒng),其中所述指令還使所述一個或多個計算機(jī)經(jīng)由所述第二用戶界面接收對所述第一選項的選擇,并且其中實施所述第一分區(qū)策略是響應(yīng)于接收到對所述第一選項的所述選擇。