本技術(shù)涉及計(jì)算機(jī),特別涉及一種表格合并方法、裝置、設(shè)備、存儲(chǔ)介質(zhì)及產(chǎn)品。
背景技術(shù):
1、目前,對(duì)于同一業(yè)務(wù),由于該業(yè)務(wù)在不同方面的數(shù)據(jù)可能由不同的人員記錄,而數(shù)據(jù)一般通過表格記錄,進(jìn)而使得同一業(yè)務(wù)的數(shù)據(jù)分散在多個(gè)表格中。而要將多個(gè)表格中的數(shù)據(jù)合并到一個(gè)表格中,則需要人工操作來對(duì)表格進(jìn)行整理,如通過復(fù)制、粘貼等操作來將一個(gè)表格中的數(shù)據(jù)合并到另一個(gè)表格中,顯然費(fèi)時(shí)費(fèi)力,降低了表格合并的效率。
技術(shù)實(shí)現(xiàn)思路
1、本技術(shù)實(shí)施例提供了一種表格合并方法、裝置、設(shè)備、存儲(chǔ)介質(zhì)及產(chǎn)品,該方法提高了表格合并的效率。所述技術(shù)方案如下:
2、一方面,提供了一種表格合并方法,所述方法包括:
3、獲取第一表格和第二表格,每個(gè)表格均包括多個(gè)表頭和每個(gè)表頭分別對(duì)應(yīng)的多個(gè)數(shù)據(jù);
4、對(duì)于每個(gè)表格,從所述表格的多個(gè)表頭中確定目標(biāo)表頭,所述目標(biāo)表頭對(duì)應(yīng)的多個(gè)數(shù)據(jù)分別用于唯一標(biāo)識(shí)表格中的一條數(shù)據(jù);
5、確定所述第一表格和所述第二表格之間的至少一組表頭對(duì),每組表頭對(duì)包括第一表頭和第二表頭,所述第一表頭屬于第一表格,所述第二表頭屬于第二表格,所述第一表頭與所述第二表頭之間的語義相似度滿足預(yù)設(shè)條件;
6、從所述至少一組表頭對(duì)中確定目標(biāo)表頭對(duì),所述目標(biāo)表頭對(duì)中的第一目標(biāo)表頭為所述第一表格的目標(biāo)表頭,所述目標(biāo)表頭對(duì)中的第二目標(biāo)表頭為所述第二表格的目標(biāo)表頭;
7、基于所述目標(biāo)表頭對(duì),對(duì)所述第一表格和所述第二表格進(jìn)行合并,得到合并表格。
8、在一些實(shí)施例中,所述基于所述目標(biāo)表頭對(duì),對(duì)所述第一表格和所述第二表格進(jìn)行合并,得到合并表格,包括:
9、基于所述目標(biāo)表頭對(duì),對(duì)所述第一表格和所述第二表格進(jìn)行合并,得到第三表格;
10、基于所述至少一組表頭對(duì),從所述第三表格中剔除每組表頭對(duì)中的一個(gè)表頭和所述表頭對(duì)應(yīng)的多個(gè)數(shù)據(jù),基于所述第三表格得到所述合并表格。
11、在一些實(shí)施例中,所述基于所述第三表格得到所述合并表格,包括:
12、對(duì)于所述第三表格中的統(tǒng)計(jì)計(jì)算單元格,基于所述第三表格中所述統(tǒng)計(jì)計(jì)算單元格所關(guān)聯(lián)的單元格中的數(shù)據(jù),更新所述統(tǒng)計(jì)計(jì)算單元格中的數(shù)據(jù),將更新后的第三表格輸出為所述合并表格。
13、在一些實(shí)施例中,所述基于所述目標(biāo)表頭對(duì),對(duì)所述第一表格和所述第二表格進(jìn)行合并,得到合并表格,包括:
14、基于所述至少一組表頭對(duì),從所述第一表格中剔除每組表頭對(duì)中的第一表頭和所述第一表頭對(duì)應(yīng)的多個(gè)數(shù)據(jù),得到第四表格;基于所述目標(biāo)表頭對(duì),對(duì)所述第二表格和所述第四表格進(jìn)行合并,得到所述合并表格;或者,
15、基于所述至少一組表頭對(duì),從所述第二表格中剔除每組表頭對(duì)中的第二表頭和所述第二表頭對(duì)應(yīng)的多個(gè)數(shù)據(jù),得到第五表格;基于所述目標(biāo)表頭對(duì),對(duì)所述第一表格和所述第五表格進(jìn)行合并,得到所述合并表格。
16、在一些實(shí)施例中,所述基于所述目標(biāo)表頭對(duì),對(duì)所述第一表格和所述第二表格進(jìn)行合并,得到合并表格,包括:
17、在所述第一目標(biāo)表頭對(duì)應(yīng)的多個(gè)數(shù)據(jù)與所述第二目標(biāo)表頭對(duì)應(yīng)的多個(gè)數(shù)據(jù)相同的情況下,基于所述第二表格中的數(shù)據(jù),增加所述第一表格中每條數(shù)據(jù)所包括的單元格,所增加單元格中的數(shù)據(jù)為所述第二表格中的數(shù)據(jù),將增加數(shù)據(jù)后的第一表格輸出為所述合并表格;或者,
18、在所述第一目標(biāo)表頭對(duì)應(yīng)的多個(gè)數(shù)據(jù)與所述第二目標(biāo)表頭對(duì)應(yīng)的多個(gè)數(shù)據(jù)相同的情況下,基于所述第一表格中的數(shù)據(jù),增加所述第二表格中每條數(shù)據(jù)所包括的單元格,所增加單元格中的數(shù)據(jù)為所述第二表格中的數(shù)據(jù),將增加數(shù)據(jù)后的第二表格輸出為所述合并表格。
19、在一些實(shí)施例中,所述基于所述目標(biāo)表頭對(duì),對(duì)所述第一表格和所述第二表格進(jìn)行合并,得到合并表格,包括:
20、在所述第一目標(biāo)表頭對(duì)應(yīng)的多個(gè)數(shù)據(jù)與所述第二目標(biāo)表頭對(duì)應(yīng)的多個(gè)數(shù)據(jù)不同的情況下,基于所述第二表格中的多條數(shù)據(jù),在所述第一表格中增加多條數(shù)據(jù),所增加的多條數(shù)據(jù)為所述第二表格中的多條數(shù)據(jù),將增加數(shù)據(jù)后的第一表格輸出為所述合并表格;或者,
21、在所述第一目標(biāo)表頭對(duì)應(yīng)的多個(gè)數(shù)據(jù)與所述第二目標(biāo)表頭對(duì)應(yīng)的多個(gè)數(shù)據(jù)不同的情況下,基于所述第一表格中的多條數(shù)據(jù),在所述第二表格中增加多條數(shù)據(jù),所增加的多條數(shù)據(jù)為所述第一表格中的多條數(shù)據(jù),將增加數(shù)據(jù)后的第二表格輸出為所述合并表格。
22、在一些實(shí)施例中,所述基于所述目標(biāo)表頭對(duì),對(duì)所述第一表格和所述第二表格進(jìn)行合并,得到合并表格,包括:
23、基于所述第一表格中第一目標(biāo)表頭對(duì)應(yīng)的多個(gè)數(shù)據(jù)的排列順序,調(diào)整所述第二表格中第二目標(biāo)表頭對(duì)應(yīng)的多個(gè)數(shù)據(jù)分別所標(biāo)識(shí)的多條數(shù)據(jù)的排列順序,對(duì)所述第一表格和調(diào)整后的第二表格進(jìn)行合并,得到所述合并表格;或者,
24、基于所述第二表格中第二目標(biāo)表頭對(duì)應(yīng)的多個(gè)數(shù)據(jù)的排列順序,調(diào)整所述第一表格中第一目標(biāo)表頭對(duì)應(yīng)的多個(gè)數(shù)據(jù)分別所標(biāo)識(shí)的多條數(shù)據(jù)的排列順序,對(duì)所述第二表格和調(diào)整后的第一表格進(jìn)行合并,得到所述合并表格。
25、在一些實(shí)施例中,所述對(duì)于每個(gè)表格,從所述表格的多個(gè)表頭中確定目標(biāo)表頭,包括:
26、對(duì)于每個(gè)表格中的每個(gè)表頭,在所述表頭對(duì)應(yīng)的多個(gè)數(shù)據(jù)中不存在重復(fù)數(shù)據(jù)的情況下,將所述表頭輸出為所述表格的目標(biāo)表頭;或者,
27、對(duì)于每個(gè)表格中的每個(gè)表頭,將所述表頭輸入表頭檢測(cè)模型,輸出所述表頭的檢測(cè)結(jié)果,在所述檢測(cè)結(jié)果指示所述表頭為目標(biāo)表頭的情況下,將所述表頭輸出為所述表格的目標(biāo)表頭,所述表頭檢測(cè)模型用于檢測(cè)表格中的目標(biāo)表頭。
28、另一方面,提供了一種表格合并裝置,所述裝置包括:
29、獲取模塊,用于獲取第一表格和第二表格,每個(gè)表格均包括多個(gè)表頭和每個(gè)表頭分別對(duì)應(yīng)的多個(gè)數(shù)據(jù);
30、確定模塊,用于對(duì)于每個(gè)表格,從所述表格的多個(gè)表頭中確定目標(biāo)表頭,所述目標(biāo)表頭對(duì)應(yīng)的多個(gè)數(shù)據(jù)分別用于唯一標(biāo)識(shí)表格中的一條數(shù)據(jù);
31、所述確定模塊,還用于確定所述第一表格和所述第二表格之間的至少一組表頭對(duì),每組表頭對(duì)包括第一表頭和第二表頭,所述第一表頭屬于第一表格,所述第二表頭屬于第二表格,所述第一表頭與所述第二表頭之間的語義相似度滿足預(yù)設(shè)條件;
32、所述確定模塊,還用于從所述至少一組表頭對(duì)中確定目標(biāo)表頭對(duì),所述目標(biāo)表頭對(duì)中的第一目標(biāo)表頭為所述第一表格的目標(biāo)表頭,所述目標(biāo)表頭對(duì)中的第二目標(biāo)表頭為所述第二表格的目標(biāo)表頭;
33、合并模塊,用于基于所述目標(biāo)表頭對(duì),對(duì)所述第一表格和所述第二表格進(jìn)行合并,得到合并表格。
34、在一些實(shí)施例中,所述合并模塊,用于:
35、基于所述目標(biāo)表頭對(duì),對(duì)所述第一表格和所述第二表格進(jìn)行合并,得到第三表格;
36、基于所述至少一組表頭對(duì),從所述第三表格中剔除每組表頭對(duì)中的一個(gè)表頭和所述表頭對(duì)應(yīng)的多個(gè)數(shù)據(jù),基于所述第三表格得到所述合并表格。
37、在一些實(shí)施例中,所述合并模塊,用于:
38、對(duì)于所述第三表格中的統(tǒng)計(jì)計(jì)算單元格,基于所述第三表格中所述統(tǒng)計(jì)計(jì)算單元格所關(guān)聯(lián)的單元格中的數(shù)據(jù),更新所述統(tǒng)計(jì)計(jì)算單元格中的數(shù)據(jù),將更新后的第三表格輸出為所述合并表格。
39、在一些實(shí)施例中,所述合并模塊,用于:
40、基于所述至少一組表頭對(duì),從所述第一表格中剔除每組表頭對(duì)中的第一表頭和所述第一表頭對(duì)應(yīng)的多個(gè)數(shù)據(jù),得到第四表格;基于所述目標(biāo)表頭對(duì),對(duì)所述第二表格和所述第四表格進(jìn)行合并,得到所述合并表格;或者,
41、基于所述至少一組表頭對(duì),從所述第二表格中剔除每組表頭對(duì)中的第二表頭和所述第二表頭對(duì)應(yīng)的多個(gè)數(shù)據(jù),得到第五表格;基于所述目標(biāo)表頭對(duì),對(duì)所述第一表格和所述第五表格進(jìn)行合并,得到所述合并表格。
42、在一些實(shí)施例中,所述合并模塊,用于:
43、在所述第一目標(biāo)表頭對(duì)應(yīng)的多個(gè)數(shù)據(jù)與所述第二目標(biāo)表頭對(duì)應(yīng)的多個(gè)數(shù)據(jù)相同的情況下,基于所述第二表格中的數(shù)據(jù),增加所述第一表格中每條數(shù)據(jù)所包括的單元格,所增加單元格中的數(shù)據(jù)為所述第二表格中的數(shù)據(jù),將增加數(shù)據(jù)后的第一表格輸出為所述合并表格;或者,
44、在所述第一目標(biāo)表頭對(duì)應(yīng)的多個(gè)數(shù)據(jù)與所述第二目標(biāo)表頭對(duì)應(yīng)的多個(gè)數(shù)據(jù)相同的情況下,基于所述第一表格中的數(shù)據(jù),增加所述第二表格中每條數(shù)據(jù)所包括的單元格,所增加單元格中的數(shù)據(jù)為所述第二表格中的數(shù)據(jù),將增加數(shù)據(jù)后的第二表格輸出為所述合并表格。
45、在一些實(shí)施例中,所述合并模塊,用于:
46、在所述第一目標(biāo)表頭對(duì)應(yīng)的多個(gè)數(shù)據(jù)與所述第二目標(biāo)表頭對(duì)應(yīng)的多個(gè)數(shù)據(jù)不同的情況下,基于所述第二表格中的多條數(shù)據(jù),在所述第一表格中增加多條數(shù)據(jù),所增加的多條數(shù)據(jù)為所述第二表格中的多條數(shù)據(jù),將增加數(shù)據(jù)后的第一表格輸出為所述合并表格;或者,
47、在所述第一目標(biāo)表頭對(duì)應(yīng)的多個(gè)數(shù)據(jù)與所述第二目標(biāo)表頭對(duì)應(yīng)的多個(gè)數(shù)據(jù)不同的情況下,基于所述第一表格中的多條數(shù)據(jù),在所述第二表格中增加多條數(shù)據(jù),所增加的多條數(shù)據(jù)為所述第一表格中的多條數(shù)據(jù),將增加數(shù)據(jù)后的第二表格輸出為所述合并表格。
48、在一些實(shí)施例中,所述合并模塊,用于:
49、基于所述第一表格中第一目標(biāo)表頭對(duì)應(yīng)的多個(gè)數(shù)據(jù)的排列順序,調(diào)整所述第二表格中第二目標(biāo)表頭對(duì)應(yīng)的多個(gè)數(shù)據(jù)分別所標(biāo)識(shí)的多條數(shù)據(jù)的排列順序,對(duì)所述第一表格和調(diào)整后的第二表格進(jìn)行合并,得到所述合并表格;或者,
50、基于所述第二表格中第二目標(biāo)表頭對(duì)應(yīng)的多個(gè)數(shù)據(jù)的排列順序,調(diào)整所述第一表格中第一目標(biāo)表頭對(duì)應(yīng)的多個(gè)數(shù)據(jù)分別所標(biāo)識(shí)的多條數(shù)據(jù)的排列順序,對(duì)所述第二表格和調(diào)整后的第一表格進(jìn)行合并,得到所述合并表格。
51、在一些實(shí)施例中,所述確定模塊,用于:
52、對(duì)于每個(gè)表格中的每個(gè)表頭,在所述表頭對(duì)應(yīng)的多個(gè)數(shù)據(jù)中不存在重復(fù)數(shù)據(jù)的情況下,將所述表頭輸出為所述表格的目標(biāo)表頭;或者,
53、對(duì)于每個(gè)表格中的每個(gè)表頭,將所述表頭輸入表頭檢測(cè)模型,輸出所述表頭的檢測(cè)結(jié)果,在所述檢測(cè)結(jié)果指示所述表頭為目標(biāo)表頭的情況下,將所述表頭輸出為所述表格的目標(biāo)表頭,所述表頭檢測(cè)模型用于檢測(cè)表格中的目標(biāo)表頭。
54、另一方面,提供了一種計(jì)算機(jī)設(shè)備,所述計(jì)算機(jī)設(shè)備包括一個(gè)或多個(gè)處理器和一個(gè)或多個(gè)存儲(chǔ)器,所述一個(gè)或多個(gè)存儲(chǔ)器中存儲(chǔ)有至少一條程序代碼,所述至少一條程序代碼由所述一個(gè)或多個(gè)處理器加載并執(zhí)行,以實(shí)現(xiàn)上述任一實(shí)現(xiàn)方式所述的表格合并方法。
55、另一方面,提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中存儲(chǔ)有至少一條程序代碼,所述至少一條程序代碼由處理器加載并執(zhí)行,以實(shí)現(xiàn)上述任一實(shí)現(xiàn)方式所述的表格合并方法。
56、另一方面,提供了一種計(jì)算機(jī)程序產(chǎn)品,所述計(jì)算機(jī)程序產(chǎn)品包括計(jì)算機(jī)程序代碼,所述計(jì)算機(jī)程序代碼存儲(chǔ)在計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中,計(jì)算機(jī)設(shè)備的處理器從所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)讀取所述計(jì)算機(jī)程序代碼,所述處理器執(zhí)行所述計(jì)算機(jī)程序代碼,使得所述計(jì)算機(jī)設(shè)備執(zhí)行上述任一實(shí)現(xiàn)方式所述的表格合并方法。
57、本技術(shù)實(shí)施例提供了一種表格合并方法,該方法確定了每個(gè)表格的目標(biāo)表頭,目標(biāo)表頭下的多個(gè)數(shù)據(jù)分別用于唯一標(biāo)識(shí)表格中的一條數(shù)據(jù),并且還確定了兩個(gè)表格之間的至少一組表頭對(duì),由于表頭對(duì)中的兩個(gè)表頭之間語義相似度滿足預(yù)設(shè)條件,也即說明兩個(gè)表頭下的數(shù)據(jù)是同種數(shù)據(jù);然后再?gòu)闹辽僖唤M表頭對(duì)中確定兩個(gè)目標(biāo)表頭所在的目標(biāo)表頭對(duì),由于目標(biāo)表頭下的數(shù)據(jù)用于唯一標(biāo)識(shí)表格中的一條條數(shù)據(jù),也即目標(biāo)表頭下的數(shù)據(jù)用于指示一條條數(shù)據(jù)所屬的對(duì)象,而又由于兩個(gè)目標(biāo)表頭語義相似,進(jìn)而說明兩個(gè)目標(biāo)表頭標(biāo)識(shí)的是同種對(duì)象的數(shù)據(jù),也即兩個(gè)表格中的數(shù)據(jù)是同種對(duì)象的數(shù)據(jù),在此基礎(chǔ)上,基于目標(biāo)表頭對(duì)中的兩個(gè)表頭,就能夠?qū)⑼N對(duì)象在多個(gè)表格中的數(shù)據(jù)合并到一個(gè)表格中,保證了表格合并的針對(duì)性和準(zhǔn)確性,避免了表格之間任意合并造成的錯(cuò)誤,且該方法能夠自動(dòng)進(jìn)行表格合并,無需人工參與,省時(shí)省力,進(jìn)而提高了表格合并的效率。