本發(fā)明涉及數(shù)據(jù)采集技術(shù)領(lǐng)域,具體涉及一種基于眾包的數(shù)據(jù)采集方法、裝置及服務(wù)器。
背景技術(shù):
隨著互聯(lián)網(wǎng)信息和大數(shù)據(jù)分析技術(shù)的發(fā)展,當(dāng)今社會在商業(yè)、經(jīng)濟(jì)、政府及相關(guān)領(lǐng)域中,決策行為越來越取決于數(shù)據(jù)和分析,而不再是經(jīng)驗和直覺。例如企業(yè)在產(chǎn)品開發(fā)階段,需要進(jìn)行市場調(diào)研以研究用戶需求;商店在選址時,需要對附近小區(qū)的入住率進(jìn)行調(diào)研。
根據(jù)數(shù)據(jù)來源,數(shù)據(jù)可以分為線上數(shù)據(jù)和線下數(shù)據(jù),線上數(shù)據(jù)即網(wǎng)絡(luò)中存在的數(shù)據(jù),可以通過爬蟲爬取等技術(shù)手段進(jìn)行數(shù)據(jù)采集;線下數(shù)據(jù)是指需要實地采集的數(shù)據(jù),如城市中鮮花店的數(shù)量、發(fā)布、店面大小,小區(qū)的入住情況等。
由于線下數(shù)據(jù)往往具有采集時間長、區(qū)域跨度大等特點,安排專人采集效率低、時效性差,因此,一般采用眾包采集的方式采集線下數(shù)據(jù),眾包采集是將數(shù)據(jù)采集任務(wù)分成多個子任務(wù)安排給多個用戶并給與一定的傭金,由眾多用戶共同完成整個數(shù)據(jù)采集任務(wù)的方式,可以有效提高采集效率。但現(xiàn)有技術(shù)中缺乏一種系統(tǒng)的數(shù)據(jù)采集方案,數(shù)據(jù)采集的各個環(huán)節(jié)之間缺乏銜接,用戶體驗較差,此外,現(xiàn)有的眾包采集方式中,對眾包任務(wù)的管理不完善,任務(wù)領(lǐng)取者偽造數(shù)據(jù)的情況時常發(fā)生,致使數(shù)據(jù)真實性無法保證。此外,現(xiàn)有技術(shù)中缺乏一種系統(tǒng)的數(shù)據(jù)采集方案,數(shù)據(jù)采集的各個環(huán)節(jié)之間缺乏銜接,用戶體驗都較差。
技術(shù)實現(xiàn)要素:
針對現(xiàn)有技術(shù)中的缺陷,本發(fā)明提供一種基于眾包的數(shù)據(jù)采集方法、裝置及服務(wù)器,以提供一種系統(tǒng)的數(shù)據(jù)采集方案,提升用戶體驗,同時解決現(xiàn)有的眾包采集方式中,對眾包任務(wù)的管理不完善,任務(wù)領(lǐng)取者偽造數(shù)據(jù)的情況時常發(fā)生,致使數(shù)據(jù)真實性無法保證的問題。
第一方面,本發(fā)明提供的一種基于眾包的數(shù)據(jù)采集方法,包括:
獲取任務(wù)發(fā)布者發(fā)起的數(shù)據(jù)采集需求;
根據(jù)所述數(shù)據(jù)采集需求計算相應(yīng)的數(shù)據(jù)采集任務(wù)的定價;
根據(jù)所述數(shù)據(jù)采集需求生成數(shù)據(jù)采集任務(wù)以及發(fā)布該數(shù)據(jù)采集任務(wù);
接收用戶端上傳的任務(wù)領(lǐng)取者針對所述數(shù)據(jù)采集任務(wù)采集的數(shù)據(jù);
按照預(yù)設(shè)的審核方法對所述數(shù)據(jù)的真實性進(jìn)行審核。
本發(fā)明提供的所述基于眾包的數(shù)據(jù)采集方法,將數(shù)據(jù)采集需求的獲取、數(shù)據(jù)采集任務(wù)的生成、發(fā)布以及采集的數(shù)據(jù)的獲取、審核等各個數(shù)據(jù)采集環(huán)節(jié)有機(jī)地結(jié)合起來,提供了一種系統(tǒng)的基于眾包的數(shù)據(jù)采集方法,具有良好的用戶體驗,其中,通過對采集的數(shù)據(jù)進(jìn)行真實性審核,可有效識別偽造數(shù)據(jù),減少任務(wù)領(lǐng)取者偽造數(shù)據(jù)的問題;通過在數(shù)據(jù)采集任務(wù)生成前預(yù)先計算定價可以獲得該任務(wù)的預(yù)算,使任務(wù)發(fā)布者能夠?qū)υ撊蝿?wù)進(jìn)行更加有效的評估,進(jìn)一步提升用戶體驗。
可選的,所述按照預(yù)設(shè)的審核方法對所述數(shù)據(jù)的真實性進(jìn)行審核,包括:
獲取用戶端上傳的任務(wù)領(lǐng)取者采集所述數(shù)據(jù)使用的移動終端的內(nèi)置傳感器產(chǎn)生的感應(yīng)信息;
根據(jù)所述感應(yīng)信息判斷所述數(shù)據(jù)的真實性。
其中,由于移動終端的內(nèi)置傳感器產(chǎn)生的感應(yīng)信息是客觀產(chǎn)生的,因此作為驗證數(shù)據(jù)真實性的判斷依據(jù)可靠性較高,本方法可以有效判斷所述數(shù)據(jù)的真實性。
可選的,所述數(shù)據(jù)采集需求為到指定區(qū)域采集數(shù)據(jù)的需求;
所述獲取用戶端上傳的任務(wù)領(lǐng)取者采集所述數(shù)據(jù)使用的移動終端的內(nèi)置傳感器產(chǎn)生的感應(yīng)信息,包括:
獲取用戶端上傳的任務(wù)領(lǐng)取者采集所述數(shù)據(jù)使用的移動終端的內(nèi)置GPS模塊產(chǎn)生的位置信息;
所述根據(jù)所述感應(yīng)信息判斷所述數(shù)據(jù)的真實性,包括:
將所述位置信息與所述指定區(qū)域?qū)?yīng)的位置信息進(jìn)行匹配;
在匹配失敗時,判斷所述數(shù)據(jù)不真實。
上述方法中,可以將GPS模塊產(chǎn)生的位置信息與所述指定區(qū)域?qū)?yīng)的位置信息進(jìn)行包容性匹配,以判斷任務(wù)領(lǐng)取者是否是在所述指定區(qū)域內(nèi)采集的數(shù)據(jù),從而判斷所述任務(wù)領(lǐng)取者上傳的數(shù)據(jù)的真實性,容易理解的是,若匹配失敗,可以認(rèn)為任務(wù)領(lǐng)取者并沒有涉足指定區(qū)域,那么其上傳的數(shù)據(jù)有較大的可能是偽造的,即判斷所述數(shù)據(jù)時不真實的,本方法適用于所述數(shù)據(jù)采集需求為到指定區(qū)域采集數(shù)據(jù)的需求的情形,對數(shù)據(jù)真實性判斷較為準(zhǔn)確。
考慮到,對任務(wù)完成情況的審核應(yīng)該是多方面的,不只是真實性一方面,因此,可選的,在所述接收用戶端上傳的任務(wù)領(lǐng)取者針對所述數(shù)據(jù)采集任務(wù)采集的數(shù)據(jù)的步驟后,還包括:
將所述數(shù)據(jù)與所述數(shù)據(jù)采集需求進(jìn)行匹配,根據(jù)匹配結(jié)果確定所述數(shù)據(jù)采集任務(wù)的完成質(zhì)量。
一般情況下,數(shù)據(jù)采集需求中會有多項采集指標(biāo),本方法中,所述將所述數(shù)據(jù)與所述數(shù)據(jù)采集需求進(jìn)行匹配,具體可以是判斷所述數(shù)據(jù)是否符合上述指標(biāo),若符合,則匹配,否則匹配失敗。這樣,可以更加全面的對數(shù)據(jù)采集任務(wù)的執(zhí)行情況進(jìn)行監(jiān)督,提高任務(wù)的執(zhí)行度,以保證數(shù)據(jù)的有效性。
可選的,所述獲取任務(wù)發(fā)布者發(fā)起的數(shù)據(jù)采集需求,包括:
向任務(wù)發(fā)布者提供數(shù)據(jù)采集任務(wù)動態(tài)表單;
根據(jù)所述任務(wù)發(fā)布者在所述數(shù)據(jù)采集任務(wù)動態(tài)表單中輸入的內(nèi)容獲得所述任務(wù)發(fā)布者數(shù)據(jù)采集需求。
本方法中,數(shù)據(jù)采集任務(wù)動態(tài)表單可以起到模板的作用,通過為任務(wù)發(fā)布者提供數(shù)據(jù)采集任務(wù)動態(tài)表單,可以使任務(wù)發(fā)布者更加直觀、快捷的輸入數(shù)據(jù)采集需求,同時,表單的形式更加有序、易于更改,便于后續(xù)在任務(wù)執(zhí)行過程中變更、調(diào)整。
可選的,所述發(fā)布該數(shù)據(jù)采集任務(wù),包括:
將所述數(shù)據(jù)采集任務(wù)發(fā)布至指定的網(wǎng)絡(luò)眾包公共平臺,以供任務(wù)領(lǐng)取者領(lǐng)??;
或者
將所述數(shù)據(jù)采集任務(wù)推送至符合指定條件的任務(wù)領(lǐng)取者的用戶端,以供所述任務(wù)領(lǐng)取者領(lǐng)取。
以上提供了兩種數(shù)據(jù)采集任務(wù)的發(fā)布方式,第一種是通過平臺發(fā)布,由任務(wù)領(lǐng)取者搶單領(lǐng)取,第二種是預(yù)先根據(jù)數(shù)據(jù)采集任務(wù)的需求篩選出符合指定條件(如與采集位置的距離遠(yuǎn)近、歷史任務(wù)完成量的多少、歷史任務(wù)完成質(zhì)量的高低等)的任務(wù)領(lǐng)取者,然后向其派單,更有針對性,可以在發(fā)布任務(wù)階段對任務(wù)領(lǐng)取者進(jìn)行篩選,以提高數(shù)據(jù)采集任務(wù)的成功率和完成質(zhì)量。
可選的,所述根據(jù)所述數(shù)據(jù)采集需求生成數(shù)據(jù)采集任務(wù),包括:
確定所述數(shù)據(jù)采集任務(wù)的任務(wù)發(fā)布模式,所述任務(wù)發(fā)布模式包括任務(wù)分包方式、任務(wù)分配方式和基本任務(wù)定價;
根據(jù)所述數(shù)據(jù)采集需求和所述任務(wù)發(fā)布模式,生成數(shù)據(jù)采集任務(wù)。
本部分,可以根據(jù)任務(wù)密度、可執(zhí)行任務(wù)的用戶數(shù)、每個用戶的歷史評分、用戶的空間分布等等要素確定所述數(shù)據(jù)采集任務(wù)的任務(wù)發(fā)布模式,從而選擇更合理的任務(wù)發(fā)布模式,進(jìn)而使生成的任務(wù)更加合理,以保證數(shù)據(jù)采集任務(wù)更加有效、合理的完成。
可選的,所述根據(jù)所述數(shù)據(jù)采集需求計算相應(yīng)的數(shù)據(jù)采集任務(wù)的定價,包括:
將所述數(shù)據(jù)采集需求相應(yīng)的定價參數(shù)輸入預(yù)先訓(xùn)練好的定價模型,通過所述定價模型計算相應(yīng)的數(shù)據(jù)采集任務(wù)的定價;其中,所述定價模型已根據(jù)歷史定價數(shù)據(jù)通過機(jī)器學(xué)習(xí)算法進(jìn)行訓(xùn)練。
利用預(yù)先訓(xùn)練好的定價模型,可以利用少量的參數(shù)(如所在城市、需要采集的條數(shù)等),即可快速、較為準(zhǔn)確的計算出相應(yīng)數(shù)據(jù)采集任務(wù)的定價,避免用戶在提交數(shù)據(jù)采集需求后因等待較長時間得不到答復(fù)而放棄,提高與用戶的互動效率,提升用戶體驗;此外,所述定價模型已根據(jù)歷史定價數(shù)據(jù)通過機(jī)器學(xué)習(xí)算法進(jìn)行訓(xùn)練,可以保證該定價與實際定價偏差在允許范圍內(nèi)。
第二方面,本發(fā)明提供的一種基于眾包的數(shù)據(jù)采集裝置,包括:
數(shù)據(jù)采集需求獲取模塊,用于獲取任務(wù)發(fā)布者發(fā)起的數(shù)據(jù)采集需求;
任務(wù)定價模塊,用于根據(jù)所述數(shù)據(jù)采集需求計算相應(yīng)的數(shù)據(jù)采集任務(wù)的定價;
數(shù)據(jù)采集任務(wù)發(fā)布模塊,用于根據(jù)所述數(shù)據(jù)采集需求生成數(shù)據(jù)采集任務(wù)以及發(fā)布該數(shù)據(jù)采集任務(wù);
采集數(shù)據(jù)接收模塊,用于接收用戶端上傳的任務(wù)領(lǐng)取者針對所述數(shù)據(jù)采集任務(wù)采集的數(shù)據(jù);
采集數(shù)據(jù)審核模塊,用于按照預(yù)設(shè)的審核方法對所述數(shù)據(jù)的真實性進(jìn)行審核。
可選的,所述采集數(shù)據(jù)審核模塊,包括:
感應(yīng)信息獲取單元,用于獲取用戶端上傳的任務(wù)領(lǐng)取者采集所述數(shù)據(jù)使用的移動終端的內(nèi)置傳感器產(chǎn)生的感應(yīng)信息;
真實性判斷單元,用于根據(jù)所述感應(yīng)信息判斷所述數(shù)據(jù)的真實性。
可選的,所述數(shù)據(jù)采集需求為到指定區(qū)域采集數(shù)據(jù)的需求;
所述感應(yīng)信息獲取單元,包括:
定位信息獲取子單元,用于獲取用戶端上傳的任務(wù)領(lǐng)取者采集所述數(shù)據(jù)使用的移動終端的內(nèi)置GPS模塊產(chǎn)生的位置信息;
所述真實性判斷單元,包括:
位置匹配子單元,用于將所述位置信息與所述指定區(qū)域?qū)?yīng)的位置信息進(jìn)行匹配;
真實性判斷子單元,用于在匹配失敗時,判斷所述數(shù)據(jù)不真實。
可選的,所述基于眾包的數(shù)據(jù)采集裝置,還包括:
完成質(zhì)量審核模塊,用于將所述數(shù)據(jù)與所述數(shù)據(jù)采集需求進(jìn)行匹配,根據(jù)匹配結(jié)果確定所述數(shù)據(jù)采集任務(wù)的完成質(zhì)量。
可選的,所述數(shù)據(jù)采集需求獲取模塊,包括:
動態(tài)表單提供單元,用于向任務(wù)發(fā)布者提供數(shù)據(jù)采集任務(wù)動態(tài)表單;
采集需求獲取單元,用于根據(jù)所述任務(wù)發(fā)布者在所述數(shù)據(jù)采集任務(wù)動態(tài)表單中輸入的內(nèi)容獲得所述任務(wù)發(fā)布者數(shù)據(jù)采集需求。
可選的,所述數(shù)據(jù)采集任務(wù)發(fā)布模塊,包括:
平臺發(fā)布單元,用于將所述數(shù)據(jù)采集任務(wù)發(fā)布至指定的網(wǎng)絡(luò)眾包公共平臺,以供任務(wù)領(lǐng)取者領(lǐng)??;
或者
推送發(fā)布單元,用于將所述數(shù)據(jù)采集任務(wù)推送至符合指定條件的任務(wù)領(lǐng)取者的用戶端,以供所述任務(wù)領(lǐng)取者領(lǐng)取。
可選的,所述數(shù)據(jù)采集任務(wù)發(fā)布模塊,包括:
發(fā)布模式確定單元,用于確定所述數(shù)據(jù)采集任務(wù)的任務(wù)發(fā)布模式,所述任務(wù)發(fā)布模式包括任務(wù)分包方式、任務(wù)分配方式和基本任務(wù)定價;
采集任務(wù)生成單元,用于根據(jù)所述數(shù)據(jù)采集需求和所述任務(wù)發(fā)布模式,生成數(shù)據(jù)采集任務(wù)。
可選的,所述任務(wù)定價模塊,包括:
任務(wù)定價單元,用于將所述數(shù)據(jù)采集需求相應(yīng)的定價參數(shù)輸入預(yù)先訓(xùn)練好的定價模型,通過所述定價模型計算相應(yīng)的數(shù)據(jù)采集任務(wù)的定價;其中,所述定價模型已根據(jù)歷史定價數(shù)據(jù)通過機(jī)器學(xué)習(xí)算法進(jìn)行訓(xùn)練。
本發(fā)明提供的所述基于眾包的數(shù)據(jù)采集裝置與所述基于眾包的數(shù)據(jù)采集方法基于相同的發(fā)明構(gòu)思,具有相同的有益效果。
第三方面,本發(fā)明提供的一種基于眾包的數(shù)據(jù)采集服務(wù)器,包括:處理器、存儲器、總線接口、總線和收發(fā)機(jī);
所述處理器、所述存儲器和所述總線接口通過所述總線連接,所述收發(fā)機(jī)與所述總線接口連接,所述天線與所述收發(fā)機(jī)連接;
其中,所述存儲器用于存儲程序;
所述處理器,用于讀取所述存儲器中的程序,執(zhí)行本發(fā)明提供的任一項所述的基于眾包的數(shù)據(jù)采集方法;
所述收發(fā)機(jī),用于在所述處理器的控制下接收和發(fā)送數(shù)據(jù)。
本發(fā)明提供的所述基于眾包的數(shù)據(jù)采集服務(wù)器與所述基于眾包的數(shù)據(jù)采集方法基于相同的發(fā)明構(gòu)思,具有相同的有益效果。
附圖說明
為了更清楚地說明本發(fā)明具體實施方式或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對具體實施方式或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹。在所有附圖中,類似的元件或部分一般由類似的附圖標(biāo)記標(biāo)識。附圖中,各元件或部分并不一定按照實際的比例繪制。
圖1示出了本發(fā)明第一實施例所提供的一種基于眾包的數(shù)據(jù)采集方法的流程圖;
圖2示出了本發(fā)明第二實施例所提供的一種基于眾包的數(shù)據(jù)采集裝置的示意圖;
圖3示出了本發(fā)明第三實施例所提供的一種基于眾包的數(shù)據(jù)采集服務(wù)器的示意圖。
具體實施方式
下面將結(jié)合附圖對本發(fā)明技術(shù)方案的實施例進(jìn)行詳細(xì)的描述。以下實施例僅用于更加清楚地說明本發(fā)明的技術(shù)方案,因此只是作為示例,而不能以此來限制本發(fā)明的保護(hù)范圍。
需要注意的是,除非另有說明,本申請使用的技術(shù)術(shù)語或者科學(xué)術(shù)語應(yīng)當(dāng)為本發(fā)明所屬領(lǐng)域技術(shù)人員所理解的通常意義。
本申請?zhí)峁┮环N基于眾包的數(shù)據(jù)采集方法、裝置及服務(wù)器。下面結(jié)合附圖對本發(fā)明的實施例進(jìn)行說明。
需要說明的是,本發(fā)明實施例中所述的數(shù)據(jù),可以是文字、圖像、聲音、影音等任意形式的數(shù)據(jù)或其變更。例如,本發(fā)明實施例的一種應(yīng)用場景為,某房地產(chǎn)中介想要切入某城市的市場,需要對該城市的小區(qū)情況(如小區(qū)的入住率、戶型圖、基礎(chǔ)設(shè)施等)進(jìn)行摸底,因此,可以通過本發(fā)明提供的方法發(fā)布數(shù)據(jù)采集任務(wù),由小區(qū)居民或自由職業(yè)者領(lǐng)取任務(wù),到小區(qū)拍照、填寫描述信息等通過手機(jī)回傳到服務(wù)器,這些照片、描述信息即為需要采集的數(shù)據(jù)。
圖1示出了本發(fā)明第一實施例所提供的一種基于眾包的數(shù)據(jù)采集方法的流程圖,如圖1所示,本發(fā)明第一實施例提供的一種基于眾包的數(shù)據(jù)采集方法包括以下步驟:
步驟S101:獲取任務(wù)發(fā)布者發(fā)起的數(shù)據(jù)采集需求。
本發(fā)明實施例的執(zhí)行主體為服務(wù)器,一般架設(shè)于網(wǎng)絡(luò)后臺,而用戶提交數(shù)據(jù)采集需求是通過網(wǎng)絡(luò)前端的用戶端實現(xiàn)的,因此,本步驟在實施時,可以是由用戶在用戶端上編輯好數(shù)據(jù)采集需求后,由用戶端發(fā)送至服務(wù)器,服務(wù)器即可獲取該數(shù)據(jù)采集需求。
由于不同的用戶采集的數(shù)據(jù)是不同的,其數(shù)據(jù)要求也各不相同,為了便于用戶輸入數(shù)據(jù)采集需求,在本發(fā)明提供的一個實施例中,所述獲取任務(wù)發(fā)布者發(fā)起的數(shù)據(jù)采集需求,包括:
向任務(wù)發(fā)布者提供數(shù)據(jù)采集任務(wù)動態(tài)表單;
根據(jù)所述任務(wù)發(fā)布者在所述數(shù)據(jù)采集任務(wù)動態(tài)表單中輸入的內(nèi)容獲得所述任務(wù)發(fā)布者數(shù)據(jù)采集需求。
該數(shù)據(jù)采集任務(wù)動態(tài)表單為可編輯表單,用戶可以自由修改、編輯該表單,以充分表達(dá)自己的數(shù)據(jù)采集需求,為了實現(xiàn)任務(wù)變更、修改的靈活性,該數(shù)據(jù)采集任務(wù)動態(tài)表單還可以在采集任務(wù)執(zhí)行過程中靈活修改,從而即時修改數(shù)據(jù)采集需求,進(jìn)而對數(shù)據(jù)采集任務(wù)進(jìn)行調(diào)整、修改。
本發(fā)明實施例中,數(shù)據(jù)采集任務(wù)動態(tài)表單可以起到模板的作用,通過為任務(wù)發(fā)布者提供數(shù)據(jù)采集任務(wù)動態(tài)表單,可以使任務(wù)發(fā)布者更加直觀、快捷的輸入數(shù)據(jù)采集需求,同時,表單的形式更加有序、易于更改,便于后續(xù)在任務(wù)執(zhí)行過程中變更、調(diào)整。
步驟S102:根據(jù)所述數(shù)據(jù)采集需求計算相應(yīng)的數(shù)據(jù)采集任務(wù)的定價。
在實際應(yīng)用中,任務(wù)發(fā)布者在提交了數(shù)據(jù)采集需求后,往往需要首先預(yù)估一下相應(yīng)的采集數(shù)據(jù)任務(wù)的定價,根據(jù)預(yù)算判斷是否要發(fā)布該任務(wù)或者修改任務(wù)至合理的價錢后再行發(fā)布,因此,在本發(fā)明提供的一個實施例中,所述根據(jù)所述數(shù)據(jù)采集需求計算相應(yīng)的數(shù)據(jù)采集任務(wù)的定價,包括:
將所述數(shù)據(jù)采集需求相應(yīng)的定價參數(shù)輸入預(yù)先訓(xùn)練好的定價模型,通過所述定價模型計算相應(yīng)的數(shù)據(jù)采集任務(wù)的定價;其中,所述定價模型已根據(jù)歷史定價數(shù)據(jù)通過機(jī)器學(xué)習(xí)算法進(jìn)行訓(xùn)練。
利用預(yù)先訓(xùn)練好的定價模型,可以通過少量的定價參數(shù)(如所在城市、需要采集的條數(shù)、單條數(shù)據(jù)采集的耗時等),即可快速、較為準(zhǔn)確的計算出相應(yīng)數(shù)據(jù)采集任務(wù)的定價,避免用戶在提交數(shù)據(jù)采集需求后因等待較長時間得不到答復(fù)而放棄,提高與用戶的互動效率,提升用戶體驗;此外,所述定價模型已根據(jù)歷史定價數(shù)據(jù)通過機(jī)器學(xué)習(xí)算法(如回歸算法)進(jìn)行訓(xùn)練,可以保證該定價與實際定價偏差在允許范圍內(nèi)。
步驟S103:根據(jù)所述數(shù)據(jù)采集需求生成數(shù)據(jù)采集任務(wù)以及發(fā)布該數(shù)據(jù)采集任務(wù)。
在獲得數(shù)據(jù)采集需求后,即可根據(jù)所述數(shù)據(jù)采集需求生成相應(yīng)的數(shù)據(jù)采集任務(wù),一種簡單的實施方式,是直接將步驟S101中輸入完成的數(shù)據(jù)采集任務(wù)動態(tài)表單作為數(shù)據(jù)采集任務(wù)內(nèi)容;考慮到數(shù)據(jù)可能分包采集,如上述采集某城市小區(qū)信息的應(yīng)用場景中,數(shù)據(jù)采集任務(wù)動態(tài)表單為采集一個小區(qū)的任務(wù)內(nèi)容,另外再導(dǎo)入一個該城市的小區(qū)列表作為種子數(shù)據(jù),根據(jù)上述數(shù)據(jù)采集任務(wù)動態(tài)表單和該小區(qū)列表即可生成多個以小區(qū)進(jìn)行區(qū)分的多個數(shù)據(jù)采集任務(wù)(可以視為該城市整體數(shù)據(jù)采集任務(wù)的子任務(wù))。
在本發(fā)明提供的一個實施例中,所述根據(jù)所述數(shù)據(jù)采集需求生成數(shù)據(jù)采集任務(wù),包括:
確定所述數(shù)據(jù)采集任務(wù)的任務(wù)發(fā)布模式,所述任務(wù)發(fā)布模式包括任務(wù)分包方式、任務(wù)分配方式和基本任務(wù)定價;
根據(jù)所述數(shù)據(jù)采集需求和所述任務(wù)發(fā)布模式,生成數(shù)據(jù)采集任務(wù)。
其中,任務(wù)分包方式包括分包或不分包,任務(wù)分配方式包括任務(wù)領(lǐng)取或任務(wù)分配。任務(wù)分布模式可以但不僅限于根據(jù)任務(wù)密度、可執(zhí)行任務(wù)的用戶數(shù)、每個用戶的評分、空間分布等等確定。
本發(fā)明實施例,可以根據(jù)任務(wù)密度、可執(zhí)行任務(wù)的用戶數(shù)、每個用戶的歷史評分、用戶的空間分布等等要素確定所述數(shù)據(jù)采集任務(wù)的任務(wù)發(fā)布模式,從而選擇更合理的任務(wù)發(fā)布模式,進(jìn)而使生成的任務(wù)更加合理,以保證數(shù)據(jù)采集任務(wù)更加有效、合理的完成。
另外,在本發(fā)明提供的一個實施例中,所述發(fā)布該數(shù)據(jù)采集任務(wù),包括:
將所述數(shù)據(jù)采集任務(wù)發(fā)布至指定的網(wǎng)絡(luò)眾包公共平臺,以供任務(wù)領(lǐng)取者領(lǐng)取;
或者
將所述數(shù)據(jù)采集任務(wù)推送至符合指定條件的任務(wù)領(lǐng)取者的用戶端,以供所述任務(wù)領(lǐng)取者領(lǐng)取。
以上提供了兩種數(shù)據(jù)采集任務(wù)的發(fā)布方式,第一種是通過平臺發(fā)布,由任務(wù)領(lǐng)取者搶單領(lǐng)取,第二種是預(yù)先根據(jù)數(shù)據(jù)采集任務(wù)的需求篩選出符合指定條件(如與采集位置的距離遠(yuǎn)近、歷史任務(wù)完成量的多少、歷史任務(wù)完成質(zhì)量的高低等)的任務(wù)領(lǐng)取者,然后向其派單,更有針對性,可以在發(fā)布任務(wù)階段對任務(wù)領(lǐng)取者進(jìn)行篩選,以提高數(shù)據(jù)采集任務(wù)的成功率和完成質(zhì)量。
步驟S104:接收用戶端上傳的任務(wù)領(lǐng)取者針對所述數(shù)據(jù)采集任務(wù)采集的數(shù)據(jù)。
本發(fā)明實施例中所述的用戶端可以是任何具有上網(wǎng)功能的服務(wù)器設(shè)備,如手機(jī)、平板電腦、個人數(shù)字助理(Personal Digital Assistant,PDA)、筆記本電腦、臺式機(jī)電腦等;也可以是安裝于上述服務(wù)器設(shè)備上的客戶端軟件,該客戶端軟件可以控制所述服務(wù)器設(shè)備執(zhí)行數(shù)據(jù)采集、接收和發(fā)送等功能,其均在本發(fā)明的保護(hù)范圍之內(nèi)。
步驟S105:按照預(yù)設(shè)的審核方法對所述數(shù)據(jù)的真實性進(jìn)行審核。
在本發(fā)明提供的一個實施例中,所述按照預(yù)設(shè)的審核方法對所述數(shù)據(jù)的真實性進(jìn)行審核,包括:
獲取用戶端上傳的任務(wù)領(lǐng)取者采集所述數(shù)據(jù)使用的移動終端的內(nèi)置傳感器產(chǎn)生的感應(yīng)信息;
根據(jù)所述感應(yīng)信息判斷所述數(shù)據(jù)的真實性。
其中,由于移動終端的內(nèi)置傳感器產(chǎn)生的感應(yīng)信息是客觀產(chǎn)生的,因此作為驗證數(shù)據(jù)真實性的判斷依據(jù)可靠性較高,本方法可以有效判斷所述數(shù)據(jù)的真實性。
在本發(fā)明提供的一個實施例中,所述數(shù)據(jù)采集需求為到指定區(qū)域采集數(shù)據(jù)的需求;
所述獲取用戶端上傳的任務(wù)領(lǐng)取者采集所述數(shù)據(jù)使用的移動終端的內(nèi)置傳感器產(chǎn)生的感應(yīng)信息,包括:
獲取用戶端上傳的任務(wù)領(lǐng)取者采集所述數(shù)據(jù)使用的移動終端的內(nèi)置GPS模塊產(chǎn)生的位置信息;
所述根據(jù)所述感應(yīng)信息判斷所述數(shù)據(jù)的真實性,包括:
將所述位置信息與所述指定區(qū)域?qū)?yīng)的位置信息進(jìn)行匹配;
在匹配失敗時,判斷所述數(shù)據(jù)不真實。
上述方法中,可以將GPS模塊產(chǎn)生的位置信息與所述指定區(qū)域?qū)?yīng)的位置信息進(jìn)行包容性匹配,以判斷任務(wù)領(lǐng)取者是否是在所述指定區(qū)域內(nèi)采集的數(shù)據(jù),從而判斷所述任務(wù)領(lǐng)取者上傳的數(shù)據(jù)的真實性,容易理解的是,若匹配失敗,可以認(rèn)為任務(wù)領(lǐng)取者并沒有涉足指定區(qū)域,那么其上傳的數(shù)據(jù)有較大的可能是偽造的,即判斷所述數(shù)據(jù)時不真實的,本方法適用于所述數(shù)據(jù)采集需求為到指定區(qū)域采集數(shù)據(jù)的需求的情形,對數(shù)據(jù)真實性判斷較為準(zhǔn)確。
考慮到,對任務(wù)完成情況的審核應(yīng)該是多方面的,不只是真實性一方面,因此,在本發(fā)明提供的一個實施例中,在所述接收用戶端上傳的任務(wù)領(lǐng)取者針對所述數(shù)據(jù)采集任務(wù)采集的數(shù)據(jù)的步驟后,還包括:
將所述數(shù)據(jù)與所述數(shù)據(jù)采集需求進(jìn)行匹配,根據(jù)匹配結(jié)果確定所述數(shù)據(jù)采集任務(wù)的完成質(zhì)量。
一般情況下,數(shù)據(jù)采集需求中會有多項采集指標(biāo),本方法中,所述將所述數(shù)據(jù)與所述數(shù)據(jù)采集需求進(jìn)行匹配,具體可以是判斷所述數(shù)據(jù)是否符合上述指標(biāo),若符合,則匹配,否則匹配失敗。這樣,可以更加全面的對數(shù)據(jù)采集任務(wù)的執(zhí)行情況進(jìn)行監(jiān)督,提高任務(wù)的執(zhí)行度,以保證數(shù)據(jù)的有效性。
至此,通過步驟S101至步驟S105,完成了本發(fā)明第一實施例所提供的一種基于眾包的數(shù)據(jù)采集方法的流程。相較于現(xiàn)有技術(shù)中,本發(fā)明提供的所述基于眾包的數(shù)據(jù)采集方法,將數(shù)據(jù)采集需求的獲取、數(shù)據(jù)采集任務(wù)的生成、發(fā)布以及采集的數(shù)據(jù)的獲取、審核等各個數(shù)據(jù)采集環(huán)節(jié)有機(jī)地結(jié)合起來,提供了一種系統(tǒng)的基于眾包的數(shù)據(jù)采集方法,具有良好的用戶體驗,其中,通過對采集的數(shù)據(jù)進(jìn)行真實性審核,可有效識別偽造數(shù)據(jù),減少任務(wù)領(lǐng)取者偽造數(shù)據(jù)的問題;通過在數(shù)據(jù)采集任務(wù)生成前預(yù)先計算定價可以獲得該任務(wù)的預(yù)算,使任務(wù)發(fā)布者能夠?qū)υ撊蝿?wù)進(jìn)行更加有效的評估,進(jìn)一步提升用戶體驗。
在上述的第一實施例中,提供了一種基于眾包的數(shù)據(jù)采集方法,與之相對應(yīng)的,本申請還提供一種基于眾包的數(shù)據(jù)采集裝置。請參考圖2,其為本發(fā)明第二實施例提供的一種基于眾包的數(shù)據(jù)采集裝置的示意圖。由于裝置實施例基本相似于方法實施例,所以描述得比較簡單,相關(guān)之處參見方法實施例的部分說明即可。下述描述的裝置實施例僅僅是示意性的。
本發(fā)明第二實施例提供的一種基于眾包的數(shù)據(jù)采集裝置,包括:
數(shù)據(jù)采集需求獲取模塊101,用于獲取任務(wù)發(fā)布者發(fā)起的數(shù)據(jù)采集需求;
任務(wù)定價模塊102,用于根據(jù)所述數(shù)據(jù)采集需求計算相應(yīng)的數(shù)據(jù)采集任務(wù)的定價;
數(shù)據(jù)采集任務(wù)發(fā)布模塊103,用于根據(jù)所述數(shù)據(jù)采集需求生成數(shù)據(jù)采集任務(wù)以及發(fā)布該數(shù)據(jù)采集任務(wù);
采集數(shù)據(jù)接收模塊104,用于接收用戶端上傳的任務(wù)領(lǐng)取者針對所述數(shù)據(jù)采集任務(wù)采集的數(shù)據(jù);
采集數(shù)據(jù)審核模塊105,用于按照預(yù)設(shè)的審核方法對所述數(shù)據(jù)的真實性進(jìn)行審核。
在本發(fā)明提供的一個實施例中,所述采集數(shù)據(jù)審核模塊105,包括:
感應(yīng)信息獲取單元,用于獲取用戶端上傳的任務(wù)領(lǐng)取者采集所述數(shù)據(jù)使用的移動終端的內(nèi)置傳感器產(chǎn)生的感應(yīng)信息;
真實性判斷單元,用于根據(jù)所述感應(yīng)信息判斷所述數(shù)據(jù)的真實性。
在本發(fā)明提供的一個實施例中,所述數(shù)據(jù)采集需求為到指定區(qū)域采集數(shù)據(jù)的需求;
所述感應(yīng)信息獲取單元,包括:
定位信息獲取子單元,用于獲取用戶端上傳的任務(wù)領(lǐng)取者采集所述數(shù)據(jù)使用的移動終端的內(nèi)置GPS模塊產(chǎn)生的位置信息;
所述真實性判斷單元,包括:
位置匹配子單元,用于將所述位置信息與所述指定區(qū)域?qū)?yīng)的位置信息進(jìn)行匹配;
真實性判斷子單元,用于在匹配失敗時,判斷所述數(shù)據(jù)不真實。
在本發(fā)明提供的一個實施例中,所述基于眾包的數(shù)據(jù)采集裝置,還包括:
完成質(zhì)量審核模塊,用于將所述數(shù)據(jù)與所述數(shù)據(jù)采集需求進(jìn)行匹配,根據(jù)匹配結(jié)果確定所述數(shù)據(jù)采集任務(wù)的完成質(zhì)量。
在本發(fā)明提供的一個實施例中,所述數(shù)據(jù)采集需求獲取模塊101,包括:
動態(tài)表單提供單元,用于向任務(wù)發(fā)布者提供數(shù)據(jù)采集任務(wù)動態(tài)表單;
采集需求獲取單元,用于根據(jù)所述任務(wù)發(fā)布者在所述數(shù)據(jù)采集任務(wù)動態(tài)表單中輸入的內(nèi)容獲得所述任務(wù)發(fā)布者數(shù)據(jù)采集需求。
在本發(fā)明提供的一個實施例中,所述數(shù)據(jù)采集任務(wù)發(fā)布模塊103,包括:
平臺發(fā)布單元,用于將所述數(shù)據(jù)采集任務(wù)發(fā)布至指定的網(wǎng)絡(luò)眾包公共平臺,以供任務(wù)領(lǐng)取者領(lǐng)??;
或者
推送發(fā)布單元,用于將所述數(shù)據(jù)采集任務(wù)推送至符合指定條件的任務(wù)領(lǐng)取者的用戶端,以供所述任務(wù)領(lǐng)取者領(lǐng)取。
在本發(fā)明提供的一個實施例中,所述數(shù)據(jù)采集任務(wù)發(fā)布模塊103,包括:
發(fā)布模式確定單元,用于確定所述數(shù)據(jù)采集任務(wù)的任務(wù)發(fā)布模式,所述任務(wù)發(fā)布模式包括任務(wù)分包方式、任務(wù)分配方式和基本任務(wù)定價;
采集任務(wù)生成單元,用于根據(jù)所述數(shù)據(jù)采集需求和所述任務(wù)發(fā)布模式,生成數(shù)據(jù)采集任務(wù)。
在本發(fā)明提供的一個實施例中,所述任務(wù)定價模塊102,包括:
任務(wù)定價單元,用于將所述數(shù)據(jù)采集需求相應(yīng)的定價參數(shù)輸入預(yù)先訓(xùn)練好的定價模型,通過所述定價模型計算相應(yīng)的數(shù)據(jù)采集任務(wù)的定價;其中,所述定價模型已根據(jù)歷史定價數(shù)據(jù)通過機(jī)器學(xué)習(xí)算法進(jìn)行訓(xùn)練。
以上,為本發(fā)明第二實施例提供的一種基于眾包的數(shù)據(jù)采集裝置說明。
本發(fā)明提供的一種基于眾包的數(shù)據(jù)采集裝置與上述基于眾包的數(shù)據(jù)采集方法出于相同的發(fā)明構(gòu)思,具有相同的有益效果,此處不再贅述。
請參考圖3,其為本發(fā)明第三實施例所提供的一種基于眾包的數(shù)據(jù)采集服務(wù)器的示意圖。本發(fā)明提供的一種基于眾包的數(shù)據(jù)采集服務(wù)器,包括:處理器1、存儲器2、總線接口3、總線4和收發(fā)機(jī)5和天線6;
所述處理器1、所述存儲器2和所述總線接口3通過所述總線4連接,所述收發(fā)機(jī)5與所述總線接口3連接,所述天線6與所述收發(fā)機(jī)5連接;
其中,所述存儲器2用于存儲程序;
所述處理器1,用于讀取所述存儲器2中的程序,執(zhí)行本發(fā)明提供的任一項所述的基于眾包的數(shù)據(jù)采集方法;
所述收發(fā)機(jī)5,用于在所述處理器1的控制下接收和發(fā)送數(shù)據(jù)。
在圖3中,總線架構(gòu)(用總線4來代表),總線4可以包括任意數(shù)量的互聯(lián)的總線和橋,總線4將包括由處理器1代表的一個或多個處理器和存儲器2代表的存儲器的各種電路鏈接在一起??偩€4還可以將諸如外圍設(shè)備、穩(wěn)壓器和功率管理電路等之類的各種其他電路鏈接在一起,這些都是本領(lǐng)域所公知的,因此,本文不再對其進(jìn)行進(jìn)一步描述??偩€接口3在總線4和收發(fā)機(jī)5之間提供接口。收發(fā)機(jī)5可以是一個元件,也可以是多個元件,比如多個接收器和發(fā)送器,提供用于在傳輸介質(zhì)上與各種其他裝置通信的單元。經(jīng)處理器1處理的數(shù)據(jù)通過天線6在無線介質(zhì)上進(jìn)行傳輸,進(jìn)一步,天線6還接收數(shù)據(jù)并將數(shù)據(jù)傳送給處理器1。處理器1負(fù)責(zé)管理總線4和通常的處理,還可以提供各種功能,包括定時,外圍接口,電壓調(diào)節(jié)、電源管理以及其他控制功能。而存儲器2可以被用于存儲處理器1在執(zhí)行操作時所使用的數(shù)據(jù)。可選的,處理器1可以是CPU(中央處埋器)、ASIC(Application Specific Integrated Circuit,專用集成電路)、FPGA(Field-Programmable Gate Array,現(xiàn)場可編程門陣列)或CPLD(Complex Programmable Logic Device,復(fù)雜可編程邏輯器件)。
本發(fā)明提供的一種基于眾包的數(shù)據(jù)采集服務(wù)器與上述基于眾包的數(shù)據(jù)采集方法出于相同的發(fā)明構(gòu)思,具有相同的有益效果,此處不再贅述。
在本說明書的描述中,參考術(shù)語“一個實施例”、“一些實施例”、“示例”、“具體示例”、或“一些示例”等的描述意指結(jié)合該實施例或示例描述的具體特征、結(jié)構(gòu)、材料或者特點包含于本發(fā)明的至少一個實施例或示例中。在本說明書中,對上述術(shù)語的示意性表述不必須針對的是相同的實施例或示例。而且,描述的具體特征、結(jié)構(gòu)、材料或者特點可以在任一個或多個實施例或示例中以合適的方式結(jié)合。此外,在不相互矛盾的情況下,本領(lǐng)域的技術(shù)人員可以將本說明書中描述的不同實施例或示例以及不同實施例或示例的特征進(jìn)行結(jié)合和組合。
需要說明的是,附圖中的流程圖和框圖顯示了根據(jù)本發(fā)明的多個實施例的服務(wù)器、方法和計算機(jī)程序產(chǎn)品的可能實現(xiàn)的體系架構(gòu)、功能和操作。在這點上,流程圖或框圖中的每個方框可以代表一個模塊、程序段或代碼的一部分,所述模塊、程序段或代碼的一部分包含一個或多個用于實現(xiàn)規(guī)定的邏輯功能的可執(zhí)行指令。也應(yīng)當(dāng)注意,在有些作為替換的實現(xiàn)中,方框中所標(biāo)注的功能也可以以不同于附圖中所標(biāo)注的順序發(fā)生。例如,兩個連續(xù)的方框?qū)嶋H上可以基本并行地執(zhí)行,它們有時也可以按相反的順序執(zhí)行,這依所涉及的功能而定。也要注意的是,框圖和/或流程圖中的每個方框、以及框圖和/或流程圖中的方框的組合,可以用執(zhí)行規(guī)定的功能或動作的專用的基于硬件的服務(wù)器來實現(xiàn),或者可以用專用硬件與計算機(jī)指令的組合來實現(xiàn)。
本發(fā)明實施例所提供的基于眾包的數(shù)據(jù)采集裝置可以是計算機(jī)程序產(chǎn)品,包括存儲了程序代碼的計算機(jī)可讀存儲介質(zhì),所述程序代碼包括的指令可用于執(zhí)行前面方法實施例中所述的方法,具體實現(xiàn)可參見方法實施例,在此不再贅述。
所屬領(lǐng)域的技術(shù)人員可以清楚地了解到,為描述的方便和簡潔,上述描述的服務(wù)器、裝置和單元的具體工作過程,可以參考前述方法實施例中的對應(yīng)過程,在此不再贅述。
在本申請所提供的幾個實施例中,應(yīng)該理解到,所揭露的服務(wù)器、裝置和方法,可以通過其它的方式實現(xiàn)。以上所描述的裝置實施例僅僅是示意性的,例如,所述單元的劃分,僅僅為一種邏輯功能劃分,實際實現(xiàn)時可以有另外的劃分方式,又例如,多個單元或組件可以結(jié)合或者可以集成到另一個服務(wù)器,或一些特征可以忽略,或不執(zhí)行。另一點,所顯示或討論的相互之間的耦合或直接耦合或通信連接可以是通過一些通信接口,裝置或單元的間接耦合或通信連接,可以是電性,機(jī)械或其它的形式。
所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個地方,或者也可以發(fā)布到多個網(wǎng)絡(luò)單元上??梢愿鶕?jù)實際的需要選擇其中的部分或者全部單元來實現(xiàn)本實施例方案的目的。
另外,在本發(fā)明各個實施例中的各功能單元可以集成在一個處理單元中,也可以是各個單元單獨物理存在,也可以兩個或兩個以上單元集成在一個單元中。
所述功能如果以軟件功能單元的形式實現(xiàn)并作為獨立的產(chǎn)品銷售或使用時,可以存儲在一個計算機(jī)可讀取存儲介質(zhì)中?;谶@樣的理解,本發(fā)明的技術(shù)方案本質(zhì)上或者說對現(xiàn)有技術(shù)做出貢獻(xiàn)的部分或者該技術(shù)方案的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計算機(jī)軟件產(chǎn)品存儲在一個存儲介質(zhì)中,包括若干指令用以使得一臺計算機(jī)設(shè)備(可以是個人計算機(jī),服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個實施例所述方法的全部或部分步驟。而前述的存儲介質(zhì)包括:U盤、移動硬盤、只讀存儲器(ROM,Read-Only Memory)、隨機(jī)存取存儲器(RAM,Random Access Memory)、磁碟或者光盤等各種可以存儲程序代碼的介質(zhì)。
最后應(yīng)說明的是:以上各實施例僅用以說明本發(fā)明的技術(shù)方案,而非對其限制;盡管參照前述各實施例對本發(fā)明進(jìn)行了詳細(xì)的說明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解:其依然可以對前述各實施例所記載的技術(shù)方案進(jìn)行修改,或者對其中部分或者全部技術(shù)特征進(jìn)行等同替換;而這些修改或者替換,并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明各實施例技術(shù)方案的范圍,其均應(yīng)涵蓋在本發(fā)明的權(quán)利要求和說明書的范圍當(dāng)中。