本發(fā)明實施例涉及計算機應(yīng)用,尤其涉及一種文件質(zhì)量校驗方法、裝置、電子設(shè)備及存儲介質(zhì)。
背景技術(shù):
1、檢索模塊和索引模塊是廣告系統(tǒng)的核心模塊,其中,索引模塊可實時接收廣告投放信息,并根據(jù)廣告投放信息構(gòu)建出索引文件,在此基礎(chǔ)上,檢索模塊可基于索引文件,檢索到符合條件的廣告候選集進(jìn)行應(yīng)用。
2、為了保證檢索結(jié)果的準(zhǔn)確性,在索引文件更新的情況下,檢索模塊需加載最新版本的索引文件以上線應(yīng)用。需要說明的是,文件質(zhì)量不佳的索引文件在上線應(yīng)用之后,容易對下游系統(tǒng)造成較大損失。因此,在加載前需對索引文件的文件質(zhì)量進(jìn)行校驗,以使檢索模塊可加載到文件質(zhì)量較好的索引文件。
3、在實現(xiàn)本發(fā)明的過程中,發(fā)明人發(fā)現(xiàn)現(xiàn)有技術(shù)中存在以下技術(shù)問題:目前無法實現(xiàn)文件質(zhì)量校驗。
技術(shù)實現(xiàn)思路
1、本發(fā)明實施例提供了一種文件質(zhì)量校驗方法、裝置、電子設(shè)備及存儲介質(zhì),以實現(xiàn)文件質(zhì)量校驗。
2、根據(jù)本發(fā)明的一方面,提供了一種文件質(zhì)量校驗方法,可以包括:
3、針對部署有檢索服務(wù)的旁路機器,獲取文件信息,其中,文件信息用于描述旁路機器上已加載的對應(yīng)檢索服務(wù)的旁路索引文件;
4、在根據(jù)文件信息,確定旁路索引文件待校驗的情況下,基于數(shù)據(jù)標(biāo)識,從旁路機器上獲取旁路信息,以及,從基準(zhǔn)機器上獲取基準(zhǔn)信息;
5、根據(jù)旁路信息以及基準(zhǔn)信息,校驗旁路索引文件的文件質(zhì)量;
6、其中,旁路信息用于描述旁路索引文件中存儲的與數(shù)據(jù)標(biāo)識對應(yīng)的旁路索引數(shù)據(jù),基準(zhǔn)機器上部署有檢索服務(wù)且已加載對應(yīng)檢索服務(wù)的基準(zhǔn)索引文件,基準(zhǔn)信息用于描述基準(zhǔn)索引文件中存儲的與數(shù)據(jù)標(biāo)識對應(yīng)的基準(zhǔn)索引數(shù)據(jù);
7、數(shù)據(jù)標(biāo)識,用于表征通過檢索服務(wù),基于旁路索引文件或是基準(zhǔn)索引文件檢索得到的數(shù)據(jù)。
8、根據(jù)本發(fā)明的另一方面,提供了一種文件質(zhì)量校驗裝置,可以包括:
9、文件信息獲取模塊,用于針對部署有檢索服務(wù)的旁路機器,獲取文件信息,其中,文件信息用于描述旁路機器上已加載的與檢索服務(wù)對應(yīng)的旁路索引文件;
10、基準(zhǔn)信息獲取模塊,用于在根據(jù)文件信息,確定出旁路索引文件待校驗的情況下,基于數(shù)據(jù)標(biāo)識,從旁路機器上獲取旁路信息,及,從基準(zhǔn)機器上獲取基準(zhǔn)信息;
11、文件質(zhì)量校驗?zāi)K,用于根據(jù)旁路信息以及基準(zhǔn)信息,校驗旁路索引文件的文件質(zhì)量;
12、其中,旁路信息用于描述旁路索引文件中存儲的與數(shù)據(jù)標(biāo)識對應(yīng)的旁路索引數(shù)據(jù),基準(zhǔn)機器上部署有檢索服務(wù)且已加載對應(yīng)檢索服務(wù)的基準(zhǔn)索引文件,基準(zhǔn)信息用于描述基準(zhǔn)索引文件中存儲的與數(shù)據(jù)標(biāo)識對應(yīng)的基準(zhǔn)索引數(shù)據(jù);
13、數(shù)據(jù)標(biāo)識,用于表征通過檢索服務(wù),基于旁路索引文件或是基準(zhǔn)索引文件檢索得到的數(shù)據(jù)。
14、根據(jù)本發(fā)明的另一方面,提供了一種電子設(shè)備,可以包括:
15、至少一個處理器;以及
16、與至少一個處理器通信連接的存儲器;其中,
17、存儲器存儲有可被至少一個處理器執(zhí)行的計算機程序,計算機程序被至少一個處理器執(zhí)行,以使至少一個處理器執(zhí)行時實現(xiàn)本發(fā)明任意實施例所提供的文件質(zhì)量校驗方法。
18、根據(jù)本發(fā)明的另一方面,提供了一種計算機可讀存儲介質(zhì),其上存儲有計算機指令,該計算機指令用于使處理器執(zhí)行時實現(xiàn)本發(fā)明任意實施例所提供的文件質(zhì)量校驗方法。
19、本發(fā)明實施例中的技術(shù)方案,針對部署有檢索服務(wù)的旁路機器,通過獲取用于描述旁路機器上已加載的與檢索服務(wù)對應(yīng)的旁路索引文件的文件信息;在根據(jù)文件信息,確定出旁路索引文件待校驗的情況下,基于數(shù)據(jù)標(biāo)識,從旁路機器上獲取旁路信息,以及,從部署有檢索服務(wù)并且加載有與檢索服務(wù)對應(yīng)的基準(zhǔn)索引文件的基準(zhǔn)機器上獲取基準(zhǔn)信息,該旁路信息用于描述旁路索引文件中存儲的對應(yīng)數(shù)據(jù)標(biāo)識的旁路索引數(shù)據(jù),該基準(zhǔn)信息用于描述基準(zhǔn)索引文件中存儲的對應(yīng)數(shù)據(jù)標(biāo)識的基準(zhǔn)索引數(shù)據(jù),并且數(shù)據(jù)標(biāo)識,用于表征通過檢索服務(wù),基于旁路索引文件或是基準(zhǔn)索引文件檢索得到的數(shù)據(jù);根據(jù)旁路信息以及基準(zhǔn)信息,校驗旁路索引文件的文件質(zhì)量。上述技術(shù)方案,實現(xiàn)了文件質(zhì)量校驗,而且由此得到的校驗結(jié)果,不僅可反映出旁路索引文件本身的質(zhì)量,更可反映出旁路索引文件針對檢索服務(wù)帶來的影響程度,具有較好的線上應(yīng)用價值。
20、應(yīng)當(dāng)理解,本部分所描述的內(nèi)容并非旨在標(biāo)識本發(fā)明的實施例的關(guān)鍵或是重要特征,也不用于限制本發(fā)明的范圍。本發(fā)明的其它特征將通過以下的說明書而變得容易理解。
1.一種文件質(zhì)量校驗方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述在根據(jù)所述文件信息,確定所述旁路索引文件待校驗的情況下,基于數(shù)據(jù)標(biāo)識,從所述旁路機器上獲取旁路信息,以及,從基準(zhǔn)機器上獲取基準(zhǔn)信息,包括:
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述文件信息包括所述旁路索引文件的第一文件標(biāo)識,所述在根據(jù)所述文件信息,確定所述旁路索引文件為最新索引文件且待校驗的情況下,基于數(shù)據(jù)標(biāo)識,從所述旁路機器上獲取旁路信息,以及,從基準(zhǔn)機器上獲取基準(zhǔn)信息,包括:
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,還包括:
5.根據(jù)權(quán)利要求3或4所述的方法,其特征在于,所述旁路機器上預(yù)先配置的索引文件加載開關(guān)被設(shè)置為開啟狀態(tài),以使部署在所述旁路機器上的檢索服務(wù),在檢測到所述第一文件標(biāo)識與所述第二文件標(biāo)識不同的情況下,將所述第二文件標(biāo)識對應(yīng)的索引文件作為所述旁路索引文件,加載到所述旁路機器上;
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述旁路信息以及所述基準(zhǔn)信息,校驗所述旁路索引文件的文件質(zhì)量,包括:
7.根據(jù)權(quán)利要求6所述的方法,其特征在于,在所述旁路索引文件和所述基準(zhǔn)索引文件的文件類型包括正排索引文件的情況下,所述旁路信息包括所述旁路索引數(shù)據(jù)中正排關(guān)鍵字的旁路正排數(shù)量,和/或,旁路正排明細(xì)數(shù)據(jù);
8.根據(jù)權(quán)利要求6所述的方法,其特征在于,在所述旁路索引文件和所述基準(zhǔn)索引文件的文件類型包括倒排索引文件的情況下,所述旁路信息包括所述旁路索引數(shù)據(jù)中的倒排關(guān)鍵字的旁路倒排數(shù)量,和/或,每個倒排鏈的旁路倒排信息,所述旁路倒排信息包括旁路倒排長度、旁路倒排權(quán)重以及旁路倒排明細(xì)數(shù)據(jù)中的至少一個;
9.根據(jù)權(quán)利要求1所述的方法,其特征在于,在部署在所述旁路機器上的檢索服務(wù)暴露有旁路調(diào)試接口,并且部署在所述基準(zhǔn)機器上的檢索服務(wù)暴露有基準(zhǔn)調(diào)試接口的情況下,所述基于數(shù)據(jù)標(biāo)識,從所述旁路機器上獲取旁路信息,以及,從基準(zhǔn)機器上獲取基準(zhǔn)信息,包括:
10.根據(jù)權(quán)利要求9所述的方法,其特征在于,所述將所述調(diào)試請求分別發(fā)送給所述旁路調(diào)試接口以及所述基準(zhǔn)調(diào)試接口,包括:
11.根據(jù)權(quán)利要求1所述的方法,其特征在于,在所述根據(jù)所述旁路信息以及所述基準(zhǔn)信息,校驗所述旁路索引文件的文件質(zhì)量之后,還包括:
12.一種文件質(zhì)量校驗裝置,其特征在于,包括:
13.一種電子設(shè)備,其特征在于,包括:
14.一種計算機可讀存儲介質(zhì),其特征在于,所述計算機可讀存儲介質(zhì)存儲有計算機指令,所述計算機指令用于使處理器執(zhí)行時實現(xiàn)如權(quán)利要求1-11中任一所述的文件質(zhì)量校驗方法。