本發(fā)明涉及計(jì)算機(jī),特別涉及一種模板匹配方法、裝置、設(shè)備及計(jì)算機(jī)可讀存儲介質(zhì)。
背景技術(shù):
1、重疊模板匹配計(jì)算是一種隨機(jī)數(shù)查重檢測方法,即通過逐比特移動的方式,在數(shù)據(jù)量為n比特的二元序列上,查找k比特重復(fù)序列出現(xiàn)的次數(shù)。這些以重疊方式重復(fù)出現(xiàn)的固定長度二元序列被稱之為重碼,序列中所存在的重碼對數(shù)是序列隨機(jī)性的判定標(biāo)準(zhǔn)之一。
2、目前快速模板匹配計(jì)算主要基于cuda(并行計(jì)算平臺和編程模型,用于圖形處理單元上的通用計(jì)算)實(shí)現(xiàn),利用cpu(central?processing?unit?/?processor,中央處理器)和gpu(graphics?processing?unit,圖形處理器)并行處理計(jì)算,對所有模板進(jìn)行前綴處理產(chǎn)生大量的中間文件,基于中間文件再進(jìn)行后續(xù)的后綴處理。因此需要對中間文件進(jìn)行存儲,因中間文件量巨大,如對于10gb待檢數(shù)據(jù)的64比特重疊碰撞,需要占用640gb的硬盤資源,而?gpu存儲有限無法滿足存儲要求,因此需要大量的硬盤資源進(jìn)行存儲,對硬盤也具有一定依賴性;并且cpu和gpu并行處理計(jì)算還對cpu和gpu均具有較高的依賴性,存在成本較高問題。
技術(shù)實(shí)現(xiàn)思路
1、有鑒于此,本發(fā)明的目的在于提供一種模板匹配方法,解決了現(xiàn)有技術(shù)中對cpu和硬盤存在依賴性導(dǎo)致成本高的問題。
2、為解決上述技術(shù)問題,本發(fā)明提供了一種模板匹配方法,包括:
3、獲取檢測模板長度和前綴檢測模板長度,并根據(jù)所述前綴檢測模板長度計(jì)算得到前綴匹配次數(shù);
4、將待檢測隨機(jī)序列載入gpu中;在所述gpu中對各個前綴檢測模板執(zhí)行前綴檢測模板匹配、后綴匹配和保存的步驟,直至執(zhí)行次數(shù)達(dá)到所述前綴匹配次數(shù),匹配結(jié)束;
5、其中,所述前綴檢測模板匹配包括:將所述待檢測隨機(jī)序列與所述前綴檢測模板進(jìn)行匹配,將匹配成功的序列作為目標(biāo)對象;所述目標(biāo)對象的長度與所述檢測模板長度一致;
6、所述后綴匹配和保存包括:將所述目標(biāo)對象中后綴序列相同的目標(biāo)對象保留,作為匹配結(jié)果,并將所述匹配結(jié)果的序列信息和位置信息保存至所述gpu中。
7、可選的,所述將所述待檢測隨機(jī)序列與所述前綴檢測模板進(jìn)行匹配,將匹配成功的序列作為目標(biāo)對象,包括:
8、將所述待檢測隨機(jī)序列分為若干個序列塊;
9、利用cuda并行計(jì)算,對各個所述序列塊與所述前綴檢測模板進(jìn)行匹配,得到所述目標(biāo)對象。
10、可選的,所述利用cuda并行計(jì)算,將各個所述序列塊與所述前綴檢測模板進(jìn)行匹配,得到所述目標(biāo)對象,包括:
11、利用cuda并行計(jì)算,將各個所述序列塊與所述前綴檢測模板進(jìn)行匹配,得到各個所述序列塊中匹配成功的次數(shù);
12、從所述匹配成功的次數(shù)不為0的序列塊中獲取匹配成功的位置信息和序列信息,根據(jù)所述位置信息和序列信息得到所述目標(biāo)對象。
13、可選的,所述將各個所述序列塊與所述前綴檢測模板進(jìn)行匹配,得到各個所述序列塊中匹配成功的次數(shù),包括:
14、利用所述gpu的共享內(nèi)存對各個所述序列塊中兩兩字節(jié)塊中的匹配成功次數(shù)進(jìn)行遞歸約減求和,計(jì)算得到所述各個序列塊中匹配成功的次數(shù)。
15、可選的,所述目標(biāo)對象中后綴序列相同的目標(biāo)對象保留,作為匹配結(jié)果,包括:
16、根據(jù)所述目標(biāo)對象的序列信息計(jì)算得到各目標(biāo)對象的比特值;
17、根據(jù)所述比特值對所有所述目標(biāo)對象從小到大或從大到小進(jìn)行排序;
18、將與任一相鄰對象的比特值相同的目標(biāo)對象保留,作為匹配結(jié)果。
19、可選的,所述將所述匹配結(jié)果的序列信息和位置信息保存至所述gpu中,包括:
20、利用reduce優(yōu)化算法計(jì)算所述匹配結(jié)果的總個數(shù),以使所述gpu分配相應(yīng)的內(nèi)存存儲所述匹配結(jié)果的序列信息和位置信息。
21、本發(fā)明還提供了一種模板匹配裝置,包括:
22、獲取模塊,用于獲取檢測模板長度和前綴檢測模板長度,并根據(jù)所述前綴檢測模板長度計(jì)算得到前綴匹配次數(shù);
23、數(shù)據(jù)載入模塊,用于將待檢測隨機(jī)序列載入gpu中;在所述gpu中對各個前綴檢測模板執(zhí)行前綴檢測模板匹配、后綴匹配和保存的步驟,直至執(zhí)行次數(shù)達(dá)到所述前綴匹配次數(shù),匹配結(jié)束;
24、前綴匹配模塊,用于執(zhí)行所述前綴檢測模板匹配,包括:將所述待檢測隨機(jī)序列與所述前綴檢測模板進(jìn)行匹配,將匹配成功的序列作為目標(biāo)對象;所述目標(biāo)對象的長度與所述檢測模板長度一致;
25、后綴匹配與保存模塊,用于執(zhí)行所述后綴匹配和保存,包括:將所述目標(biāo)對象中后綴序列相同的目標(biāo)對象保留,作為匹配結(jié)果,并將所述匹配結(jié)果的序列信息和位置信息保存至所述gpu中。
26、可選的,所述前綴匹配模塊,包括:
27、切分單元,用于將所述待檢測隨機(jī)序列分為若干個序列塊;
28、并行匹配單元,用于利用cuda并行計(jì)算,對各個所述序列塊與所述前綴檢測模板進(jìn)行匹配,得到所述目標(biāo)對象。
29、本發(fā)明還提供了一種模板匹配設(shè)備,包括:
30、存儲器,用于存儲計(jì)算機(jī)程序;
31、處理器,用于執(zhí)行所述計(jì)算機(jī)程序時實(shí)現(xiàn)上述的模板匹配方法。
32、本發(fā)明還提供了一種計(jì)算機(jī)可讀存儲介質(zhì),所述計(jì)算機(jī)可讀存儲介質(zhì)中存儲有計(jì)算機(jī)可執(zhí)行指令,所述計(jì)算機(jī)可執(zhí)行指令被處理器加載并執(zhí)行時,實(shí)現(xiàn)上述的模板匹配方法。
33、可見,本發(fā)明遍歷各個前綴檢測模板對待檢測隨機(jī)序列進(jìn)行前綴檢測模板匹配、后綴匹配,直接得到各個前綴檢測模板匹配的最終結(jié)果,不會產(chǎn)生大量的中間文件,gpu的內(nèi)存即可滿足存儲要求,無需使用硬盤資源進(jìn)行存儲,降低了計(jì)算資源消耗;不需要在其他空間進(jìn)行大文件存儲,還減少了?i/o(input?output?system,輸入輸出系統(tǒng))操作,提高了計(jì)算效率;全程利用gpu進(jìn)行計(jì)算和存儲,對硬盤、內(nèi)存和cpu設(shè)備的依賴極低,降低了配置要求,節(jié)約了成本。
34、此外,本發(fā)明還提供了一種模板匹配裝置、設(shè)備及計(jì)算機(jī)可讀存儲介質(zhì),同樣具有上述有益效果。
1.一種模板匹配方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的模板匹配方法,其特征在于,所述將所述待檢測隨機(jī)序列與所述前綴檢測模板進(jìn)行匹配,將匹配成功的序列作為目標(biāo)對象,包括:
3.根據(jù)權(quán)利要求2所述的模板匹配方法,其特征在于,所述利用cuda并行計(jì)算,對各個所述序列塊與所述前綴檢測模板進(jìn)行匹配,得到所述目標(biāo)對象,包括:
4.根據(jù)權(quán)利要求3所述的模板匹配方法,其特征在于,所述將各個所述序列塊與所述前綴檢測模板進(jìn)行匹配,得到各個所述序列塊中匹配成功的次數(shù),包括:
5.根據(jù)權(quán)利要求1所述的模板匹配方法,其特征在于,所述目標(biāo)對象中后綴序列相同的目標(biāo)對象保留,作為匹配結(jié)果,包括:
6.根據(jù)權(quán)利要求1所述的模板匹配方法,其特征在于,所述將所述匹配結(jié)果的序列信息和位置信息保存至所述gpu中,包括:
7.一種模板匹配裝置,其特征在于,包括:
8.根據(jù)權(quán)利要求7所述的模板匹配裝置,其特征在于,所述前綴匹配模塊,包括:
9.一種模板匹配設(shè)備,其特征在于,包括:
10.一種計(jì)算機(jī)可讀存儲介質(zhì),其特征在于,所述計(jì)算機(jī)可讀存儲介質(zhì)中存儲有計(jì)算機(jī)可執(zhí)行指令,所述計(jì)算機(jī)可執(zhí)行指令被處理器加載并執(zhí)行時,實(shí)現(xiàn)如權(quán)利要求1至6任一項(xiàng)所述的模板匹配方法。