分組式數(shù)據(jù)查找抓取算法
【專利摘要】本發(fā)明涉及一種分組式數(shù)據(jù)查找抓取算法,屬于數(shù)據(jù)查找領(lǐng)域。所述方法包括制作數(shù)據(jù)查找模板,準(zhǔn)備需要進(jìn)行查找的數(shù)據(jù)源,從數(shù)據(jù)源的第一行開始提取與模板相同行數(shù)的數(shù)據(jù),依次提取,循環(huán)從數(shù)據(jù)源中查找模板中需要查找的內(nèi)容直至最后一行。利用本發(fā)明所述算法,可以將很多需要人為參與分析查找的數(shù)據(jù)實(shí)現(xiàn)自動化處理查找,只需要定義好相關(guān)的模板。最終可以減少相應(yīng)的人力成本,同時提高數(shù)據(jù)查找工作效率。
【專利說明】分組式數(shù)據(jù)查找抓取算法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種分組式數(shù)據(jù)查找抓取算法,屬于數(shù)據(jù)查找領(lǐng)域。
【背景技術(shù)】
[0002]目前我們在進(jìn)行各種數(shù)據(jù)查找時,通常是通過一個或多個關(guān)鍵字來逐個進(jìn)行查找,不能同時根據(jù)多個條件進(jìn)行查找,且同時一次也只能查找到一個關(guān)鍵字。如果同時需要一次按兩個或多個條件查找多個數(shù)據(jù)時,則只能由專門人員參與經(jīng)人工分析后才可以查找到對應(yīng)的數(shù)據(jù)信息。
【發(fā)明內(nèi)容】
[0003]本發(fā)明的目的在于提供一種分組式數(shù)據(jù)查找抓取算法,所述算法的運(yùn)用,可以解決數(shù)據(jù)信息查找中,同時根據(jù)多個條件,查找出多個指定的值。
[0004]本發(fā)明是通過以下技術(shù)方案實(shí)現(xiàn)的:
[0005]一種分組式數(shù)據(jù)查找抓取算法,包括以下步驟:
[0006]步驟一:根據(jù)查找條件,制作數(shù)據(jù)查找模板;
[0007]所述模板保留所述查找條件中定量數(shù)據(jù)的位置,所述查找條件的變量數(shù)據(jù)位置空出;
[0008]步驟二:準(zhǔn)備需要進(jìn)行查找的數(shù)據(jù)源;
[0009]步驟三:判斷所述數(shù)據(jù)源中數(shù)據(jù)的行數(shù)是否大于等于所述模板中數(shù)據(jù)的行數(shù),若否,則執(zhí)行步驟十一;若是,執(zhí)行步驟四;
[0010]步驟四:從所述數(shù)據(jù)源的第一行開始提取與所述模板相同行數(shù)的數(shù)據(jù);
[0011]步驟五:在與所述模板中對應(yīng)的各行數(shù)據(jù)中查找符合所述查找條件的數(shù)據(jù);
[0012]步驟六:判斷從提取到的數(shù)據(jù)中是否可以查找到所有與所述模板對應(yīng)的數(shù)據(jù);若否,執(zhí)行步驟七;若是,執(zhí)行步驟九;
[0013]步驟七:從所述數(shù)據(jù)源的上次提取數(shù)據(jù)的開始位置的下一行開始,重新提取與模板相同行數(shù)的數(shù)據(jù);
[0014]步驟八:循環(huán)從所述數(shù)據(jù)源中查找所述模板中需要查找的數(shù)據(jù)直至最后一行;
[0015]步驟九:從上次提取數(shù)據(jù)的后行再取出一組和所述模板相同行數(shù)的數(shù)據(jù);
[0016]步驟十:循環(huán)從所述數(shù)據(jù)源中查找所述模板中需要查找的數(shù)據(jù)直至最后一行;
[0017]步驟^^一:查找結(jié)束。
[0018]本發(fā)明的有益效果為:
[0019]所述算法是將數(shù)據(jù)按行分組,以每組的總行數(shù)據(jù),及數(shù)據(jù)所處的行數(shù)為依據(jù),精確定位到所有查找的數(shù)據(jù)。以此方法在數(shù)據(jù)信息中循環(huán)查找,直至到數(shù)據(jù)結(jié)尾,重點(diǎn)解決一些復(fù)雜的數(shù)據(jù)查找抓取情況。
[0020]利用本發(fā)明所述算法,可以將很多需要人為參與分析查找的數(shù)據(jù)實(shí)現(xiàn)自動化處理查找,只需要定義好相關(guān)的模板。最終可以減少相應(yīng)的人力成本,同時提高數(shù)據(jù)查找工作效率。
【專利附圖】
【附圖說明】
[0021]圖1為本發(fā)明所述算法的流程示意圖。
【具體實(shí)施方式】
[0022]下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
[0023]一種分組式數(shù)據(jù)查找抓取算法,包括以下步驟:
[0024]步驟一:根據(jù)查找條件,制作數(shù)據(jù)查找模板;
[0025]所述模板保留所述查找條件中定量數(shù)據(jù)的位置,所述查找條件的變量數(shù)據(jù)位置空出;
[0026]所述數(shù)據(jù)查找模板示例如下:
[0027]第一行:臺式機(jī)資產(chǎn)情況一:
[0028]第二行:資產(chǎn)編號:(獲取此處多個非空字符)使用人:(獲取此處多個非空字符)
[0029]第三行:借出人:(獲取此處多個非空字符)價值:(獲取此處多個數(shù)值字符)元
[0030]步驟二:準(zhǔn)備需要進(jìn)行查找的數(shù)據(jù)源;
[0031]數(shù)據(jù)源樣例如下:
[0032]臺式機(jī)資產(chǎn)情況一:
[0033]資產(chǎn)編號:臺式機(jī)一使用人:張文
[0034]借出人:王風(fēng)價值:1000元
[0035]臺式機(jī)資產(chǎn)情況二:
[0036]資產(chǎn)編號:臺式機(jī)二 使用人:張風(fēng)
[0037]借出人:王古 價值:10000元
[0038]臺式機(jī)資產(chǎn)情況三:
[0039]資產(chǎn)編號:臺式機(jī)三使用人:張心
[0040]借出人:王葉價值:880元
[0041]步驟三:判斷所述數(shù)據(jù)源中數(shù)據(jù)的行數(shù)是否大于等于所述模板中數(shù)據(jù)的行數(shù),若否,則查找結(jié)束;若是,執(zhí)行步驟四;
[0042]步驟四:從所述數(shù)據(jù)源的第一行開始提取與所述模板相同行數(shù)的數(shù)據(jù);
[0043]說明:模板中有三行數(shù)據(jù),從數(shù)據(jù)源中取前三行如下:
[0044]臺式機(jī)資產(chǎn)情況一:
[0045]資產(chǎn)編號:臺式機(jī)一使用人:張文
[0046]借出人:王風(fēng) 價值:1000元
[0047]步驟五:在與所述模板中對應(yīng)的各行數(shù)據(jù)中查找符合所述查找條件的數(shù)據(jù);
[0048]說明:依據(jù)模板,在提取的前三行數(shù)據(jù)在進(jìn)行查找,結(jié)果如下:
[0049]第一個結(jié)果為:臺式機(jī)一第二個結(jié)果為:張文[0050]第三個結(jié)果為:王風(fēng)第四個結(jié)果為:1000
[0051]步驟六:判斷從提取到的數(shù)據(jù)中是否可以查找到所有與所述模板對應(yīng)的數(shù)據(jù);若否,執(zhí)行步驟七;若是,執(zhí)行步驟九;
[0052]說明:模板中標(biāo)記有四處數(shù)據(jù)需要查找,均查到結(jié)果,則跳過步驟七、步驟八,執(zhí)行步驟九;其中,
[0053]步驟七為從所述數(shù)據(jù)源的上次提取數(shù)據(jù)的開始位置的下一行開始,重新提取與模板相同行數(shù)的數(shù)據(jù);
[0054]步驟八為循環(huán)從所述數(shù)據(jù)源中查找所述模板中需要查找的數(shù)據(jù)直至最后一行;
[0055]步驟九:從上次提取數(shù)據(jù)的后行再取出一組和所述模板相同行數(shù)的數(shù)據(jù);
[0056]說明:從數(shù)據(jù)源中提取接著上次結(jié)束位置,繼續(xù)向下取三行如下:
[0057]臺式機(jī)資產(chǎn)情況二:
[0058]資產(chǎn)編號:臺式機(jī)二使用人:張風(fēng)
[0059]借出人:王古價值:10000元
[0060]步驟十:循環(huán)從所述數(shù)據(jù)源中查找所述模板中需要查找的數(shù)據(jù)直至最后一行;
[0061]步驟^^一:查到所有結(jié)果如下:
[0062]
【權(quán)利要求】
1.一種分組式數(shù)據(jù)查找抓取算法,其特征在于,包括以下步驟: 步驟一:根據(jù)查找條件,制作數(shù)據(jù)查找模板; 所述模板保留所述查找條件中定量數(shù)據(jù)的位置,所述查找條件的變量數(shù)據(jù)位置空出; 步驟二:準(zhǔn)備需要進(jìn)行查找的數(shù)據(jù)源; 步驟三:判斷所述數(shù)據(jù)源中數(shù)據(jù)的行數(shù)是否大于等于所述模板中數(shù)據(jù)的行數(shù),若否,則執(zhí)行步驟十一;若是,執(zhí)行步驟四; 步驟四:從所述數(shù)據(jù)源的第一行開始提取與所述模板相同行數(shù)的數(shù)據(jù); 步驟五:在與所述模板中對應(yīng)的各行數(shù)據(jù)中查找符合所述查找條件的數(shù)據(jù); 步驟六:判斷從提取到的數(shù)據(jù)中是否可以查找到所有與所述模板對應(yīng)的數(shù)據(jù);若否,執(zhí)行步驟七;若是,執(zhí)行步驟九; 步驟七:從所述數(shù)據(jù)源的上次提取數(shù)據(jù)的開始位置的下一行開始,重新提取與模板相同行數(shù)的數(shù)據(jù); 步驟八:循環(huán)從所述數(shù)據(jù)源中查找所述模板中需要查找的數(shù)據(jù)直至最后一行; 步驟九:從上次提取數(shù)據(jù)的后行再取出一組和所述模板相同行數(shù)的數(shù)據(jù); 步驟十:循環(huán)從所述數(shù)據(jù)源中查找所述模板中需要查找的數(shù)據(jù)直至最后一行; 步驟十一:查找結(jié)束。
【文檔編號】G06F17/30GK104021225SQ201410290983
【公開日】2014年9月3日 申請日期:2014年6月25日 優(yōu)先權(quán)日:2014年6月25日
【發(fā)明者】李偉, 張雨 申請人:鄭州向心力通信技術(shù)股份有限公司