應(yīng)用程序的排名欺詐檢測(cè)方法和排名欺詐檢測(cè)系統(tǒng)的制作方法
【專(zhuān)利摘要】本發(fā)明提供了一種應(yīng)用程序的排名欺詐檢測(cè)方法和排名欺詐檢測(cè)系統(tǒng)。所述方法包括:活躍期檢測(cè)步驟,基于歷史排名信息檢測(cè)所述應(yīng)用程序的活躍期;排名欺詐檢測(cè)步驟,基于至少一個(gè)證據(jù)對(duì)所述活躍期進(jìn)行檢測(cè),得到排名欺詐檢測(cè)結(jié)果。本發(fā)明的方法及系統(tǒng)能夠自動(dòng)地識(shí)別出與應(yīng)用程序有關(guān)的排名欺詐行為,從而使應(yīng)用程序用戶(hù)獲得真實(shí)的應(yīng)用程序排名信息。
【專(zhuān)利說(shuō)明】應(yīng)用程序的排名欺詐檢測(cè)方法和排名欺詐檢測(cè)系統(tǒng)
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及網(wǎng)絡(luò)領(lǐng)域,尤其涉及一種應(yīng)用程序的排名欺詐檢測(cè)方法和排名欺詐檢測(cè)系統(tǒng)。
【背景技術(shù)】
[0002]用戶(hù)應(yīng)用程序,尤其是安裝并運(yùn)行于移動(dòng)終端的移動(dòng)應(yīng)用程序近年來(lái)發(fā)展迅速。為了方便用戶(hù)選擇并安裝應(yīng)用程序,很多應(yīng)用程序網(wǎng)站或應(yīng)用程序商店會(huì)集中地提供應(yīng)用程序的查詢(xún)、下載、用戶(hù)評(píng)價(jià)或評(píng)論等服務(wù),同時(shí)還會(huì)定期地,例如每日,發(fā)布應(yīng)用程序排行榜(Application Leaderboard)以體現(xiàn)一些當(dāng)前受用戶(hù)歡迎的應(yīng)用程序。事實(shí)上,該排行榜是促銷(xiāo)應(yīng)用程序的最重要手段之一,應(yīng)用程序在排行榜上很高的排名通常會(huì)刺激用戶(hù)大量下載該應(yīng)用程序,并為應(yīng)用程序開(kāi)發(fā)者帶來(lái)巨大的經(jīng)濟(jì)收益。因此,應(yīng)用程序開(kāi)發(fā)者非常希望其應(yīng)用程序在排行榜上占據(jù)更高的排名。
[0003]應(yīng)用程序的排名欺詐(Ranking Fraud)是指目的在于提高應(yīng)用程序在應(yīng)用程序排行榜上的排名而進(jìn)行的欺騙行為。事實(shí)上,不同于依賴(lài)傳統(tǒng)的市場(chǎng)手段來(lái)提高應(yīng)用程序排名,應(yīng)用程序開(kāi)發(fā)者通過(guò)夸大其產(chǎn)品銷(xiāo)量或發(fā)布虛假的產(chǎn)品評(píng)價(jià)來(lái)實(shí)施排名欺詐的行為已經(jīng)越來(lái)越普遍,例如雇傭“水軍(human water armies)”來(lái)在短時(shí)間內(nèi)提升應(yīng)用程序的下載量和評(píng)價(jià)次數(shù)等。
[0004]業(yè)界已經(jīng)意識(shí)到防止排名欺詐以使應(yīng)用程序用戶(hù)獲得真實(shí)的應(yīng)用程序排名信息的重要性。為了防止應(yīng)用程序的排名欺詐,現(xiàn)有的辦法是根據(jù)一天內(nèi)應(yīng)用程序排名上升的程度來(lái)推斷排名欺詐行為的存在,并在判斷出現(xiàn)排名欺詐的時(shí)候直接鎖定整個(gè)應(yīng)用程序的排名,這種方式過(guò)于簡(jiǎn)單粗暴,難以準(zhǔn)確判斷排名欺詐行為而且傷害了正常應(yīng)用程序的排名上升。可見(jiàn),本領(lǐng)域?qū)τ趹?yīng)用程序的排名欺詐檢測(cè)問(wèn)題的理解和研究還非常有限,至今還不存在有效檢測(cè)應(yīng)用程序的排名欺詐的相關(guān)技術(shù)。
【發(fā)明內(nèi)容】
[0005]本發(fā)明的目的在于提供一種應(yīng)用程序的排名欺詐的檢測(cè)技術(shù),從而自動(dòng)地有效識(shí)別出與應(yīng)用程序有關(guān)的排名欺詐行為,以使應(yīng)用程序用戶(hù)獲得真實(shí)的應(yīng)用程序排名信息。
[0006]為解決上述技術(shù)問(wèn)題,根據(jù)本發(fā)明的一個(gè)方面,提供一種應(yīng)用程序的排名欺詐檢測(cè)方法,所述方法包括:
[0007]活躍期檢測(cè)步驟,基于歷史排名信息檢測(cè)所述應(yīng)用程序的活躍期;
[0008]排名欺詐檢測(cè)步驟,基于至少一個(gè)證據(jù)對(duì)所述活躍期進(jìn)行檢測(cè),得到排名欺詐檢測(cè)結(jié)果。
[0009]根據(jù)本發(fā)明的另一個(gè)方面,還提供一種應(yīng)用程序的排名欺詐檢測(cè)系統(tǒng),所述系統(tǒng)包括:
[0010]活躍期檢測(cè)單元,用于基于歷史排名信息檢測(cè)所述應(yīng)用程序的活躍期;
[0011]排名欺詐檢測(cè)單元,用于基于至少一個(gè)證據(jù)對(duì)所述活躍期進(jìn)行檢測(cè),得到排名欺詐檢測(cè)結(jié)果。
[0012]根據(jù)本發(fā)明的另一個(gè)方面,還提供一種應(yīng)用程序的排名欺詐檢測(cè)方法,所述方法包括:
[0013]基于至少一個(gè)證據(jù)對(duì)應(yīng)用程序的活躍期進(jìn)行檢測(cè),得到排名欺詐檢測(cè)結(jié)果。
[0014]根據(jù)本發(fā)明的另一個(gè)方面,還提供一種應(yīng)用程序的排名欺詐檢測(cè)系統(tǒng),所述系統(tǒng)包括:
[0015]排名欺詐檢測(cè)單元,用于基于至少一個(gè)證據(jù)對(duì)應(yīng)用程序的活躍期進(jìn)行檢測(cè),得到排名欺詐檢測(cè)結(jié)果。
[0016]本發(fā)明的方法及系統(tǒng)能夠自動(dòng)地有效識(shí)別出與應(yīng)用程序有關(guān)的排名欺詐行為,從而使應(yīng)用程序用戶(hù)獲得真實(shí)的應(yīng)用程序排名信息。
【專(zhuān)利附圖】
【附圖說(shuō)明】
[0017]圖1是本發(fā)明【具體實(shí)施方式】中應(yīng)用程序的活躍期檢測(cè)方法的流程圖;
[0018]圖2a是在應(yīng)用程序排行榜中活躍事件的一個(gè)示例;
[0019]圖2b是在應(yīng)用程序排行榜中活躍期的一個(gè)示例;
[0020]圖3是應(yīng)用程序的一個(gè)活躍事件中不同排名階段的示意圖;
[0021]圖4a是一個(gè)疑似存在排名欺詐的應(yīng)用程序的排名記錄示意圖;
[0022]圖4b是一個(gè)正常應(yīng)用程序的排名記錄示意圖;
[0023]圖5是本發(fā)明【具體實(shí)施方式】中應(yīng)用程序的排名欺詐檢測(cè)系統(tǒng)的系統(tǒng)結(jié)構(gòu)圖;
[0024]圖6是本發(fā)明另一實(shí)施例中應(yīng)用程序的排名欺詐檢測(cè)系統(tǒng)的結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0025]下面結(jié)合附圖和實(shí)施例,對(duì)本發(fā)明的【具體實(shí)施方式】作進(jìn)一步詳細(xì)說(shuō)明。以下實(shí)施例用于說(shuō)明本發(fā)明,但不用來(lái)限制本發(fā)明的范圍。
[0026]本發(fā)明針對(duì)與應(yīng)用程序排名相關(guān)的技術(shù)問(wèn)題進(jìn)行研究,因此本領(lǐng)域技術(shù)人員對(duì)本發(fā)明中的“應(yīng)用程序”應(yīng)做廣義理解,其包括可發(fā)布于互聯(lián)網(wǎng)并可供用戶(hù)下載、評(píng)價(jià)、執(zhí)行的各種程序或文件,即包括運(yùn)行于個(gè)人電腦中的傳統(tǒng)應(yīng)用程序、運(yùn)行于移動(dòng)終端的移動(dòng)應(yīng)用程序,也包括可下載并播放的圖片、音頻、視頻等多媒體文件等。
[0027]在檢測(cè)應(yīng)用程序的排名欺詐時(shí),有幾個(gè)需要解決的重要問(wèn)題。首先,在應(yīng)用程序的整個(gè)生命周期中并不會(huì)總出現(xiàn)排名欺詐,因此首先需要檢測(cè)可能出現(xiàn)排名欺詐的時(shí)間;第二,由于應(yīng)用程序數(shù)量巨大,很難手工地為每個(gè)出現(xiàn)排名欺詐的應(yīng)用程序進(jìn)行標(biāo)定,因此需要提供一種自動(dòng)檢測(cè)排名欺詐的技術(shù);第三,現(xiàn)有技術(shù)中并不確定可基于何種依據(jù)來(lái)檢測(cè)排名欺詐的存在。
[0028]本發(fā)明的一個(gè)【具體實(shí)施方式】對(duì)應(yīng)用程序的排名欺詐行為進(jìn)行了整體性的分析和研究,提供了一種可檢測(cè)應(yīng)用程序的排名欺詐的技術(shù),其可通過(guò)對(duì)應(yīng)用程序的歷史排名信息的分析來(lái)檢測(cè)應(yīng)用程序的“活躍期”,針對(duì)活躍期中應(yīng)用程序的特定特征(包括排名特征、用戶(hù)評(píng)價(jià)特征、用戶(hù)評(píng)論特征、活躍用戶(hù)信譽(yù)度特征等),基于至少一個(gè)證據(jù)來(lái)進(jìn)行排名欺詐的檢測(cè)。
[0029]根據(jù)發(fā)明人的分析發(fā)現(xiàn),存在排名欺詐的應(yīng)用程序并不會(huì)長(zhǎng)期在排名榜上占據(jù)很高的排名,排名較高的情況僅是作為一些獨(dú)立事件集中發(fā)生在一段相對(duì)較短的時(shí)期內(nèi),這表明排名欺詐行為正是發(fā)生在這段時(shí)期內(nèi)。在本發(fā)明中,可將應(yīng)用程序持續(xù)排名較高的時(shí)期稱(chēng)為應(yīng)用程序的“活躍事件(Leading Event)”,可將頻繁發(fā)生活躍事件的時(shí)期稱(chēng)為應(yīng)用程序的“活躍期(Leading Session)”。因此,對(duì)于排名欺詐的檢測(cè)首先需要檢測(cè)每個(gè)應(yīng)用程序有可能存在排名欺詐的該活躍事件和該活躍期。
[0030]應(yīng)用程序商店運(yùn)營(yíng)商處擁有應(yīng)用程序的歷史排名信息,從應(yīng)用程序商店運(yùn)營(yíng)商處直接獲取,或通過(guò)對(duì)應(yīng)用程序商店運(yùn)營(yíng)商在一段較長(zhǎng)歷史時(shí)期內(nèi)持續(xù)發(fā)布的應(yīng)用程序排行榜信息進(jìn)行分析和處理,也可以獲得應(yīng)用程序的歷史排名信息。由于應(yīng)用程序的該歷史排名信息記載了有關(guān)應(yīng)用程序排名的歷史信息、有關(guān)應(yīng)用程序的用戶(hù)評(píng)價(jià)的歷史信息、有關(guān)應(yīng)用程序的用戶(hù)評(píng)論的歷史信息和有關(guān)應(yīng)用程序的用戶(hù)信譽(yù)度的歷史信息等多種信息,因此在本發(fā)明【具體實(shí)施方式】中,可以基于該歷史排名信息來(lái)進(jìn)行每個(gè)應(yīng)用程序的活躍事件和活躍期的檢測(cè),并進(jìn)而實(shí)現(xiàn)對(duì)排名欺詐的檢測(cè)。通過(guò)分析應(yīng)用程序的排名行為發(fā)現(xiàn),相比于正常的應(yīng)用程序而言,存在排名欺詐的應(yīng)用程序在活躍事件和活躍期內(nèi)會(huì)呈現(xiàn)成不同的特定特征。因此,有可能從應(yīng)用程序的歷史排名信息中抽取出一些用于判定排名欺詐的證據(jù),并獲取這些證據(jù),從而實(shí)現(xiàn)對(duì)排名欺詐的檢測(cè)。
[0031]如圖1所示,本發(fā)明的一個(gè)【具體實(shí)施方式】中提供了一種應(yīng)用程序的排名欺詐檢測(cè)方法,所述方法包括:
[0032]活躍期檢測(cè)步驟S10,基于歷史排名信息檢測(cè)所述應(yīng)用程序的活躍期;排名欺詐檢測(cè)步驟S20,基于至少一個(gè)證據(jù)來(lái)對(duì)所述活躍期進(jìn)行檢測(cè),得到排名欺詐檢測(cè)結(jié)果。
[0033]下面,結(jié)合附圖來(lái)說(shuō)明本發(fā)明【具體實(shí)施方式】中上述排名欺詐檢測(cè)方法的各步驟流程和功能。
[0034]由于歷史排名信息是本發(fā)明中檢測(cè)應(yīng)用程序的排名欺詐的數(shù)據(jù)基礎(chǔ),因此作為本發(fā)明的一個(gè)優(yōu)選實(shí)施方式,該排名欺詐檢測(cè)方法還可包括一歷史排名信息獲取步驟,獲取所述應(yīng)用程序在應(yīng)用程序排行榜上的歷史排名信息。
[0035]應(yīng)用程序排行榜通??娠@示受歡迎的排名前K位的應(yīng)用程序,例如前1000位等。而且,應(yīng)用程序排行榜通常會(huì)定期更新,例如每日進(jìn)行更新。因此,對(duì)于每個(gè)應(yīng)用程序a而言都有其歷史排名信息,該歷史排名信息可以包括表示為一個(gè)與離散時(shí)間序列對(duì)應(yīng)的排名序列Ra = Ir13,r,3,rna},該離散時(shí)間序列中的時(shí)間點(diǎn)之間的間隔固定,即應(yīng)用程序排行榜的更新周期。其中,是該應(yīng)用程序a在時(shí)間\時(shí)的排名,riae {I,...,K..+ 00表示應(yīng)用程序a不在排行榜排名前K位之列;n表示所有歷史排名信息所對(duì)應(yīng)的時(shí)間點(diǎn)總數(shù)。例如,在排行榜每天更新的情況下,\就表示該段歷史中的第i天,n就是歷史排名信息所對(duì)應(yīng)的總天數(shù)??梢钥闯觯?lt; 的值越小,說(shuō)明應(yīng)用程序a第i天在排行榜上的排名越聞。
[0036]在一個(gè)應(yīng)用程序被發(fā)布后,任何用戶(hù)都可以對(duì)其進(jìn)行評(píng)價(jià)。實(shí)際上,用戶(hù)評(píng)價(jià)對(duì)于應(yīng)用程序推廣而言是最重要的特征之一。具有越高評(píng)價(jià)的應(yīng)用程序就會(huì)吸引越多的用戶(hù)來(lái)購(gòu)買(mǎi)或下載它,并導(dǎo)致該應(yīng)用程序在排行榜上的更高排名。因而在歷史排名信息中,可以包括歷史評(píng)價(jià)信息,即歷史各時(shí)間段中應(yīng)用程序的用戶(hù)對(duì)該應(yīng)用程序做出的評(píng)價(jià)信息。
[0037]同樣,在一個(gè)應(yīng)用程序被發(fā)布后,任何用戶(hù)都可以對(duì)其進(jìn)行文字性的評(píng)論。實(shí)際上,用戶(hù)評(píng)論對(duì)于應(yīng)用程序推廣而言是最重要的特征之一。具有越積極評(píng)論的應(yīng)用程序就會(huì)吸引越多的用戶(hù)來(lái)購(gòu)買(mǎi)或下載它,并導(dǎo)致該應(yīng)用程序在排行榜上的更高排名。因而在歷史排名信息中,可以包括歷史評(píng)論信息,即歷史各時(shí)間段中應(yīng)用程序的用戶(hù)對(duì)該應(yīng)用程序做出的評(píng)論信息。
[0038]同樣,在一個(gè)應(yīng)用程序被發(fā)布后,任何用戶(hù)都可以購(gòu)買(mǎi)、下載并使用該應(yīng)用程序或?qū)υ搼?yīng)用程序進(jìn)行等級(jí)評(píng)價(jià)或進(jìn)行文字性的評(píng)論。通過(guò)對(duì)上述這些用戶(hù)行為的采集和分析(例如通過(guò)移動(dòng)終端統(tǒng)計(jì)用戶(hù)使用所下載或購(gòu)買(mǎi)的應(yīng)用程序的次數(shù)、頻度等),并結(jié)合用戶(hù)的其他網(wǎng)絡(luò)行為(例如用戶(hù)在社交網(wǎng)絡(luò)中的行為、用戶(hù)在其它應(yīng)用程序商店的行為、用戶(hù)曾經(jīng)的排名欺詐行為歷史等),可對(duì)每個(gè)應(yīng)用程序用戶(hù)的信譽(yù)進(jìn)行評(píng)級(jí)(例如包括從I?5這五個(gè)等級(jí),5代表用戶(hù)信譽(yù)最高,I代表用戶(hù)信譽(yù)最差),以作為該用戶(hù)的信譽(yù)度。因而,在該歷史排名信息中,可以包括歷史用戶(hù)信譽(yù)度信息,即歷史各時(shí)間段中某應(yīng)用程序或應(yīng)用程序排行榜中所有應(yīng)用程序的用戶(hù)信譽(yù)度信息。相應(yīng)地在本發(fā)明中,將在一應(yīng)用程序的活躍期內(nèi)出現(xiàn)用戶(hù)行為(包括購(gòu)買(mǎi)、下載并使用該應(yīng)用程序或?qū)υ搼?yīng)用程序進(jìn)行等級(jí)評(píng)價(jià)或進(jìn)行文字性的評(píng)論)的相應(yīng)用戶(hù)稱(chēng)為該應(yīng)用程序的“活躍用戶(hù)”,將在活躍期內(nèi)的活躍用戶(hù)的相應(yīng)信譽(yù)度信息稱(chēng)為“活躍用戶(hù)信譽(yù)度”。
[0039]在該歷史排名信息獲取步驟中,可以多種方式來(lái)獲取該歷史排名信息。例如,可從應(yīng)用程序商店運(yùn)營(yíng)商處直接獲取該歷史排名信息,也可以從應(yīng)用程序商店在一段較長(zhǎng)歷史時(shí)期內(nèi)持續(xù)發(fā)布的數(shù)據(jù)中抽取該歷史排名信息等。
[0040]S10:活躍期檢測(cè)步驟,基于歷史排名信息檢測(cè)所述應(yīng)用程序的活躍期。
[0041]活躍期表示一應(yīng)用程序在應(yīng)用程序排行榜上排名較高,也就是用戶(hù)關(guān)注度比較高的一段時(shí)期,因此對(duì)應(yīng)用程序市場(chǎng)會(huì)造成較大影響的排名欺詐行為只會(huì)出現(xiàn)在這些活躍期內(nèi)。所以在本發(fā)明【具體實(shí)施方式】中,對(duì)于排名欺詐的檢測(cè)首先要從應(yīng)用程序的歷史排名信息中檢測(cè)出應(yīng)用程序的活躍期。
[0042]在本發(fā)明一個(gè)優(yōu)選實(shí)施方式中,在該活躍期檢測(cè)步驟中可進(jìn)一步包括一活躍事件檢測(cè)步驟,基于該歷史排名信息檢測(cè)所述應(yīng)用程序的活躍事件。
[0043]由于應(yīng)用程序開(kāi)發(fā)者均希望其應(yīng)用程序在排行榜上占據(jù)較高的排名,因此應(yīng)用程序開(kāi)發(fā)者有可能利用排名欺詐的手段使其應(yīng)用程序躋身排行榜前列。通過(guò)分析發(fā)現(xiàn),應(yīng)用程序并不會(huì)總是在排名榜上占據(jù)很高的排名,發(fā)生持續(xù)排名較高的時(shí)期即為“活躍事件”,圖2a中示出了應(yīng)用程序的活躍事件的例子,圖中橫軸表示歷史排名信息對(duì)應(yīng)的時(shí)間序列(Date Index),縱軸表示應(yīng)用程序的排名(Ranking),圖中的事件I (Eventl)和事件2(Event2)表示該應(yīng)用程序排名歷史中所出現(xiàn)的兩個(gè)活躍事件,其輪廓分別由活躍事件期間的排名點(diǎn)連接而成。
[0044]在本發(fā)明【具體實(shí)施方式】中,應(yīng)用程序在應(yīng)用程序排行榜上排名較高的標(biāo)準(zhǔn)是該應(yīng)用程序的排名不大于一排名閾值K*。由于應(yīng)用程序的排名在排行榜前K*位之列被認(rèn)為是排名較高,因而應(yīng)用程序的排名持續(xù)在前K*位之列的時(shí)間段即可被認(rèn)為是一個(gè)活躍事件,該活躍事件應(yīng)從該應(yīng)用程序開(kāi)始進(jìn)入排行榜前K*位之列開(kāi)始,持續(xù)到該應(yīng)用程序跌出排行榜前K*位之列結(jié)束。
[0045]優(yōu)選地,本發(fā)明實(shí)施方式中的方法還可包括一設(shè)置該排名閾值K*的步驟,從而確定應(yīng)用程序在應(yīng)用程序排行榜上排名較高的標(biāo)準(zhǔn)。由于排行榜上的應(yīng)用程序總數(shù)量K通常很大,例如為1000等,因此上述排名閾值K*通常小于K值。根據(jù)應(yīng)用程序排行榜中應(yīng)用程序的總數(shù)量K和本領(lǐng)域技術(shù)人員的分析需求等因素,該排名閾值K*可在例如I~500之間的整數(shù)間取值。本領(lǐng)域技術(shù)人員可以理解,K*的取值越小,應(yīng)用程序被認(rèn)為排名較高的標(biāo)準(zhǔn)就越高。在圖2a中,該K*的取值為300。
[0046]根據(jù)上述對(duì)于活躍事件的文字表述,應(yīng)用程序a的活躍事件e可以如下公式化表述:
[0047]給定一排名閾值K*作為排名較高的標(biāo)準(zhǔn),其中K* G [I, K];應(yīng)用程序a的活躍事件e包括從一開(kāi)始時(shí)間到一結(jié)束時(shí)間的一時(shí)間范圍Te =[C,,C],對(duì)應(yīng)的應(yīng)用程序a的排
名滿(mǎn)足二 ^K^Crt4且C W<匕丨?,而且叫e(cr”cj均滿(mǎn)足rka ( K*。
[0048]根據(jù)上述表述可以看出,對(duì)于活躍事件的檢測(cè)重要的在于檢測(cè)應(yīng)用程序的排名持續(xù)在前K*位之列的一段時(shí)間的開(kāi)始時(shí)間和結(jié)束時(shí)間,并將一對(duì)開(kāi)始時(shí)間和結(jié)束時(shí)間之間的時(shí)期確定為活躍事件。因此,在本發(fā)明【具體實(shí)施方式】中,該活躍事件檢測(cè)步驟可進(jìn)一步包括如下步驟:
[0049]開(kāi)始時(shí)間識(shí)別步驟SlOl:在該步驟中,從歷史排名信息中識(shí)別出活躍事件的開(kāi)始時(shí)間。具體地,在該開(kāi)始時(shí)間識(shí)別步驟中,可順序搜索歷史排名信息中每個(gè)時(shí)間點(diǎn)上的應(yīng)用程序排名,當(dāng)當(dāng)前時(shí)間點(diǎn)的排名不大于排名閾值K*且上一時(shí)間點(diǎn)的排名大于排名閾值K*時(shí),識(shí)別當(dāng)前時(shí)間點(diǎn)為活躍事件的開(kāi)始時(shí)間。本領(lǐng)域技術(shù)人員可以理解,由于在應(yīng)用程序排名歷史中可能包括多個(gè)活躍事件,因此在該開(kāi)始時(shí)間識(shí)別步驟中可能識(shí)別出多個(gè)開(kāi)始時(shí)間點(diǎn)。
[0050]結(jié)束時(shí)間識(shí)別步驟S102:在該步驟中,從歷史排名信息中識(shí)別出活躍時(shí)間的結(jié)束時(shí)間。具體地,在該結(jié)束時(shí)間識(shí)別步驟中,可順序搜索歷史排名信息中每個(gè)時(shí)間點(diǎn)上的應(yīng)用程序排名,當(dāng)當(dāng)前時(shí)間點(diǎn)的排名大于排名閾值K*且上一時(shí)間點(diǎn)的排名不大于排名閾值K*時(shí),識(shí)別上一時(shí)間點(diǎn)為活躍事件的結(jié)束時(shí)間。本領(lǐng)域技術(shù)人員可以理解,由于在應(yīng)用程序排名歷史中可能包括多個(gè)活躍事件`,因此在該結(jié)束時(shí)間識(shí)別步驟中可能識(shí)別出多個(gè)結(jié)束時(shí)間點(diǎn)。
[0051]活躍事件識(shí)別步驟S103:在該步驟中將每個(gè)開(kāi)始時(shí)間與其之后相鄰的結(jié)束時(shí)間之間的時(shí)間段識(shí)別為活躍事件,這樣就檢測(cè)出了應(yīng)用程序在排名歷史中的所有活躍事件。
[0052]值得說(shuō)明的是,作為一種特殊情況,如果在所分析和處理的歷史時(shí)期的第一個(gè)時(shí)間點(diǎn)上,例如在歷史記錄中的第一天,應(yīng)用程序的排名就在排行榜前K*位之列,此時(shí)在所述開(kāi)始時(shí)間識(shí)別步驟SlOl中,將該第一個(gè)時(shí)間點(diǎn)定義為一個(gè)開(kāi)始時(shí)間。類(lèi)似地,如果在所分析和處理的歷史時(shí)期的最后一個(gè)時(shí)間點(diǎn)上,例如今天,應(yīng)用程序的排名仍在排行榜前K*位之列,此時(shí)在所述結(jié)束時(shí)間識(shí)別步驟S102中將該最后一個(gè)時(shí)間點(diǎn)定義為一個(gè)結(jié)束時(shí)間。
[0053]上面介紹了檢測(cè)應(yīng)用程序中活躍事件的方式,在此基礎(chǔ)上,在本發(fā)明一個(gè)優(yōu)選實(shí)施方式中,可在該活躍期檢測(cè)步驟中合并相鄰近的活躍事件以構(gòu)成所述活躍期。
[0054]通過(guò)進(jìn)一步研究發(fā)現(xiàn),一些應(yīng)用程序會(huì)在一段時(shí)期內(nèi)連續(xù)出現(xiàn)多次彼此相鄰近的活躍事件,這段時(shí)期就是本發(fā)明中應(yīng)用程序的“活躍期”??梢?jiàn),將相鄰近的活躍事件合并起來(lái)就構(gòu)成了活躍期。具體地,可將相鄰兩個(gè)活躍事件的時(shí)間間隔小于一間隔閾值0作為將兩個(gè)活躍事件合并在同一活躍期內(nèi)的標(biāo)準(zhǔn),而相鄰兩個(gè)活躍事件的時(shí)間間隔則是指相鄰兩個(gè)活躍事件中前一活躍事件的結(jié)束時(shí)間和后一活躍事件的開(kāi)始時(shí)間之間的間隔。[0055]優(yōu)選地,本發(fā)明實(shí)施方式中的方法還可包括一設(shè)置該間隔閾值0的步驟,從而確定將兩個(gè)活躍事件合并在同一活躍期內(nèi)的標(biāo)準(zhǔn)。根據(jù)本領(lǐng)域技術(shù)人員的分析需求等因素,該間隔閾值0的取值可以是應(yīng)用程序排行榜的更新周期的2?10倍中的整數(shù)值。本領(lǐng)域技術(shù)人員可以理解,間隔閾值0的取值越小,將兩個(gè)活躍事件合并在同一活躍期內(nèi)的標(biāo)準(zhǔn)就越聞。
[0056]圖2b中示出了應(yīng)用程序的活躍期的例子,圖中橫軸表示歷史排名信息對(duì)應(yīng)的時(shí)間序列(Date Index),縱軸表示應(yīng)用程序的排名(Ranking),圖中的期間I (Sessionl)和期間2 (Session)代表該應(yīng)用程序排名歷史中所出現(xiàn)的兩個(gè)活躍期,每個(gè)活躍期由多個(gè)活躍事件構(gòu)成。
[0057]根據(jù)上述對(duì)于活躍期的文字表述,應(yīng)用程序a的活躍期s可以如下公式化表述:
[0058]應(yīng)用程序a的活躍期s包括一時(shí)間范圍I; = Ifstsrt,Cd]和n個(gè)相鄰的活躍事
件{ep...,en},其滿(mǎn)足Crt =CamtL = Cj且不存在其它活躍期s*使得J; c 7>此外,
都有,其中*是預(yù)設(shè)的活躍事件間隔閾值,是用于判斷活躍事件之間相鄰程度以將它們納入同一活躍期的判斷標(biāo)準(zhǔn)。
[0059]根據(jù)上述表述可以看出,對(duì)于活躍期的檢測(cè)重要的在于基于間隔閾值0將應(yīng)用程序排名歷史中相鄰近的活躍事件合并以形成活躍期。具體地,在本發(fā)明【具體實(shí)施方式】的活躍期檢測(cè)步驟中,從歷史排名信息中的初始時(shí)間點(diǎn)開(kāi)始順序搜索每個(gè)檢測(cè)出的活躍事件,當(dāng)當(dāng)前活躍事件與上一活躍事件的時(shí)間間隔小于該間隔閾值0時(shí),將這兩個(gè)活躍事件合并在同一活躍期內(nèi),直至搜索完所有檢測(cè)出的活躍事件以檢測(cè)出該應(yīng)用程序在排名歷史中的所有活躍期。
[0060]值得說(shuō)明的是,作為一種特殊情況,如果一個(gè)活躍事件并不與任何其他活躍事件相鄰近,該活躍事件自身也可被認(rèn)為構(gòu)成一活躍期。在這種情況下,在該活躍期檢測(cè)步驟中,當(dāng)一活躍事件與上一活躍事件的時(shí)間間隔不小于所述間隔閾值0,且該活躍事件與下一活躍事件的時(shí)間間隔不小于所述間隔閾值0時(shí),檢測(cè)該活躍事件自身為一活躍期。
[0061]正如前文所述,所檢測(cè)出的上述活躍期表示一應(yīng)用程序在應(yīng)用程序排行榜上排名較高,也就是受到用戶(hù)歡迎的一段時(shí)期,所檢測(cè)出的該活躍期可作為包括檢測(cè)排名欺詐在內(nèi)的各種應(yīng)用程序服務(wù)的數(shù)據(jù)基礎(chǔ)。因此,在檢測(cè)出應(yīng)用程序的活躍期之后,作為本發(fā)明一個(gè)優(yōu)選實(shí)施方式,還可以將所檢測(cè)出的應(yīng)用程序的活躍期信息發(fā)送給應(yīng)用程序開(kāi)發(fā)者、應(yīng)用程序商店運(yùn)營(yíng)商或應(yīng)用程序的終端用戶(hù)。
[0062]對(duì)于應(yīng)用程序開(kāi)發(fā)者而言,其可以根據(jù)該活躍期信息分析相關(guān)【技術(shù)領(lǐng)域】的發(fā)展趨勢(shì)或應(yīng)用程序用戶(hù)的需求,從而指導(dǎo)應(yīng)用程序的開(kāi)發(fā)和運(yùn)營(yíng);對(duì)于應(yīng)用程序商店運(yùn)營(yíng)商而言,其可以根據(jù)該活躍期信息進(jìn)一步分析出利用欺詐手段獲取排行榜上虛假高排名的排名欺詐行為等,從而改進(jìn)應(yīng)用程序商店的運(yùn)營(yíng);而對(duì)于應(yīng)用程序終端用戶(hù)而言,他們可以根據(jù)該活躍期信息來(lái)自行判斷應(yīng)用程序存在排名欺詐的可能性或者選擇符合自身需求的應(yīng)用程序等。
[0063]此外,作為檢測(cè)應(yīng)用程序的活躍事件和活躍期的一種具體實(shí)現(xiàn)方式,如下的算法I示出了在給定應(yīng)用程序a的歷史排名信息中檢測(cè)活躍期的一個(gè)程序代碼的實(shí)例。
【權(quán)利要求】
1.一種應(yīng)用程序的排名欺詐檢測(cè)方法,其特征在于,所述方法包括: 活躍期檢測(cè)步驟,基于歷史排名信息檢測(cè)所述應(yīng)用程序的活躍期; 排名欺詐檢測(cè)步驟,基于至少一個(gè)證據(jù)對(duì)所述活躍期進(jìn)行檢測(cè),得到排名欺詐檢測(cè)結(jié)果。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述排名欺詐檢測(cè)步驟進(jìn)一步包括: 證據(jù)驗(yàn)證步驟,基于至少一個(gè)證據(jù)對(duì)所述活躍期進(jìn)行驗(yàn)證并得到一欺詐參數(shù)。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述排名欺詐檢測(cè)步驟進(jìn)一步包括: 活躍事件分析步驟,識(shí)別所述活躍期中至少一個(gè)活躍事件的上升階段、保持階段和下降階段。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,在所述活躍事件分析步驟中,確定所述活躍事件中所述應(yīng)用程序的排名在一峰值范圍AR內(nèi)的第一個(gè)時(shí)間和最后一個(gè)時(shí)間,將所述第一個(gè)時(shí)間和所述最后一個(gè)時(shí)間之間的時(shí)間段識(shí)別為所述保持階段,將所述活躍事件中在保持階段之前的時(shí)間段識(shí)別為所述上升階段,將所述活躍事件中在保持階段之后的時(shí)間段識(shí)別為所述下降階段。
5.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述證據(jù)基于所述活躍期內(nèi)的活躍事件中的上升階段和/或下降階段構(gòu)成。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于, 所述欺詐參數(shù)是所述活躍期內(nèi)所有活躍事件的所述上升階段的時(shí)間范圍的平均值,或所述活躍期內(nèi)所有活躍事件的所述下降階段的時(shí)間范圍的平均值,或所述活躍期內(nèi)所有活躍事件的所述上升階段的時(shí)間范圍和下降階段的時(shí)間范圍的和的平均值。
7.根據(jù)權(quán)利要求5所述的方法,其特征在于, 所述欺詐參數(shù)是所述活躍期內(nèi)所有活躍事件的所述上升階段的曲線與時(shí)間軸相交所形成的銳角的角度的平均值,或所有活躍事件的所述下降階段的曲線與時(shí)間軸相交所形成的銳角的角度的平均值,或所有活躍事件的所述上升階段的曲線和所述下降階段的曲線與時(shí)間軸相交所形成的銳角的角度和的平均值。
8.根據(jù)權(quán)利要求3所述的方法,其特征在于, 所述證據(jù)基于所述活躍期內(nèi)的活躍事件中的保持階段構(gòu)成。
9.根據(jù)權(quán)利要求8所述的方法,其特征在于, 所述欺詐參數(shù)是所述活躍期內(nèi)所有活躍事件的所述保持階段的時(shí)間范圍的平均值。
10.根據(jù)權(quán)利要求8所述的方法,其特征在于,基于所有活躍事件的所述保持階段中所述應(yīng)用程序的平均排名和所述保持階段的時(shí)間范圍來(lái)計(jì)算所述欺詐參數(shù)。
11.根據(jù)權(quán)利要求2所述的方法,其特征在于, 所述證據(jù)基于所述活躍期內(nèi)活躍事件的數(shù)量構(gòu)成。
12.根據(jù)權(quán)利要求11所述的方法,其特征在于, 所述欺詐參數(shù)是所述活躍期內(nèi)活躍事件的數(shù)量。
13.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述證據(jù)基于所述活躍期內(nèi)的平均評(píng)價(jià)和歷史平均評(píng)價(jià)構(gòu)成。
14.根據(jù)權(quán)利 要求13所述的方法,其特征在于, 所述欺詐參數(shù)是所述活躍期內(nèi)的平均評(píng)價(jià)和歷史平均評(píng)價(jià)的差值或比值。
15.根據(jù)權(quán)利要求13所述的方法,其特征在于, 所述欺詐參數(shù)是所述活躍期內(nèi)的平均評(píng)價(jià)和歷史平均評(píng)價(jià)的差值與歷史平均評(píng)價(jià)的比值。
16.根據(jù)權(quán)利要求2所述的方法,其特征在于, 所述證據(jù)基于應(yīng)用程序在所述活躍期內(nèi)的評(píng)價(jià)等級(jí)的分布和歷史評(píng)價(jià)信息中評(píng)價(jià)等級(jí)的分布構(gòu)成。
17.根據(jù)權(quán)利要求16所述的方法,其特征在于, 所述欺詐參數(shù)是應(yīng)用程序在所述活躍期內(nèi)的評(píng)價(jià)等級(jí)的分布和歷史評(píng)價(jià)信息中評(píng)價(jià)等級(jí)的分布之間的差值。
18.根據(jù)權(quán)利要求17所述的方法,其特征在于,通過(guò)計(jì)算應(yīng)用程序在所述活躍期內(nèi)的評(píng)價(jià)等級(jí)的分布和歷史評(píng)價(jià)信息中評(píng)價(jià)等級(jí)的分布之間的余弦距離來(lái)計(jì)算它們之間的差值。
19.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述證據(jù)基于所述活躍期內(nèi)用戶(hù)評(píng)論間的相似程度構(gòu)成。
20.根據(jù)權(quán)利要求19所述的方法,其特征在于, 所述欺詐參數(shù)是所述活躍期內(nèi)用戶(hù)評(píng)論間的平均相似度。
21.根據(jù)權(quán)利要求20所述的方法,其特征在于, 所述證據(jù)驗(yàn)證步驟進(jìn)一步包括: 對(duì)所述活躍期內(nèi)的所有用戶(hù)評(píng)論進(jìn)行標(biāo)準(zhǔn)化處理; 為所述活躍期內(nèi)的每一條用戶(hù)評(píng)論構(gòu)建標(biāo)準(zhǔn)化詞匯向量; 基于所述標(biāo)準(zhǔn)化詞匯向量計(jì)算所述活躍期內(nèi)用戶(hù)評(píng)論間的平均相似度。
22.根據(jù)權(quán)利要求2所述的方法,其特征在于, 所述證據(jù)基于應(yīng)用程序在所述活躍期內(nèi)用戶(hù)評(píng)論的主題分布和歷史評(píng)論信息中用戶(hù)評(píng)論的主題分布構(gòu)成。
23.根據(jù)權(quán)利要求22所述的方法,其特征在于, 所述欺詐參數(shù)是應(yīng)用程序在所述活躍期內(nèi)用戶(hù)評(píng)論的主題分布和歷史評(píng)論信息中用戶(hù)評(píng)論的主題分布之間的差值。
24.根據(jù)權(quán)利要求23所述的方法,其特征在于,通過(guò)計(jì)算應(yīng)用程序在所述活躍期內(nèi)用戶(hù)評(píng)論的主題分布和歷史評(píng)論信息中用戶(hù)評(píng)論的主題分布之間的余弦距離來(lái)計(jì)算它們之間的差值。
25.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述證據(jù)基于所述應(yīng)用程序的活躍用戶(hù)平均信譽(yù)度和所述應(yīng)用程序的歷史用戶(hù)平均信譽(yù)度構(gòu)成。
26.根據(jù)權(quán)利要求25所述的方法,其特征在于, 所述欺詐參數(shù)是所述應(yīng)用程序的歷史用戶(hù)平均信譽(yù)度和所述應(yīng)用程序的活躍用戶(hù)平均信譽(yù)度的差值或比值。
27.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述證據(jù)基于所述應(yīng)用程序的活躍用戶(hù)平均信譽(yù)度和應(yīng)用程序排行榜中所有應(yīng)用程序的歷史用戶(hù)平均信譽(yù)度構(gòu)成。
28.根據(jù)權(quán)利要求27所述的方法,其特征在于, 所述欺詐參數(shù)是應(yīng)用程序排行榜中所有應(yīng)用程序的歷史用戶(hù)平均信譽(yù)度和所述應(yīng)用程序的活躍用戶(hù)平均信譽(yù)度的差值或比值。
29.根據(jù)權(quán)利要求2所述的方法,其特征在于, 所述證據(jù)基于所述應(yīng)用程序的活躍用戶(hù)信譽(yù)度分布和所述應(yīng)用程序的歷史用戶(hù)信譽(yù)度分布構(gòu)成。
30.根據(jù)權(quán)利要求29所述的方法,其特征在于, 所述欺詐參數(shù)是所述應(yīng)用程序的歷史用戶(hù)信譽(yù)度分布和所述應(yīng)用程序的活躍用戶(hù)信譽(yù)度分布之間的差值。
31.根據(jù)權(quán)利要求30所述的方法,其特征在于,通過(guò)計(jì)算所述應(yīng)用程序的歷史用戶(hù)信譽(yù)度分布和所述應(yīng)用程序的活躍用戶(hù)信譽(yù)度分布之間的余弦距離來(lái)計(jì)算它們之間的差值。
32.根據(jù)權(quán)利要求2所述的方法,其特征在于, 所述證據(jù)基于所述應(yīng)用程序的活躍用戶(hù)信譽(yù)度分布和應(yīng)用程序排行榜中所有應(yīng)用程序的歷史用戶(hù)信譽(yù)度分布構(gòu)成。
33.根據(jù)權(quán)利要求32所述的方法,其特征在于, 所述欺詐參數(shù)是應(yīng)用程序排行榜中所有應(yīng)用程序的歷史用戶(hù)信譽(yù)度分布和所述應(yīng)用程序的活躍用戶(hù)信譽(yù)度分布之間的差值。
34.根據(jù)權(quán)利要求33所述的方法,其特征在于,通過(guò)計(jì)算應(yīng)用程序排行榜中所有應(yīng)用程序的歷史用戶(hù)信譽(yù)度分布和所述應(yīng)用程序的活躍用戶(hù)信譽(yù)度分布之間的余弦距離來(lái)計(jì)算它們之間的差值。
35.根據(jù)權(quán)利要求2所述的方法,其特征在于,在所述證據(jù)驗(yàn)證步驟中,綜合考慮所述至少一個(gè)證據(jù),將基于所述至少一個(gè)證據(jù)驗(yàn)證得到的對(duì)應(yīng)欺詐參數(shù)進(jìn)行加權(quán)計(jì)算,從而得到所述欺詐參數(shù)。
36.根據(jù)權(quán)利要求2-35中任一項(xiàng)所述的方法,其特征在于,所述排名欺詐檢測(cè)步驟進(jìn)一步包括: 欺詐參數(shù)判斷步驟,將所述欺詐參數(shù)與一閾值進(jìn)行比較,從而判斷所述應(yīng)用程序是否存在排名欺詐。
37.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括: 歷史排名信息獲取步驟,獲取所述應(yīng)用程序在應(yīng)用程序排行榜上的所述歷史排名信肩、O
38.根據(jù)權(quán)利要求37所述的方法,其特征在于,在所述歷史排名信息獲取步驟中,從應(yīng)用程序商店運(yùn)營(yíng)商獲取所述歷史排名信息,或從應(yīng)用程序商店發(fā)布的數(shù)據(jù)中抽取所述歷史排名信息。
39.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述歷史排名信息包括表示為一個(gè)與離散時(shí)間序列對(duì)應(yīng)的排名序列,所述排名序列中的每個(gè)元素對(duì)應(yīng)于所述時(shí)間序列中的一個(gè)離散時(shí)間點(diǎn),表示所述應(yīng)用程序在所述離散時(shí)間點(diǎn)時(shí)的排名。
40.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述歷史排名信息包括歷史各時(shí)間段中所述應(yīng)用程序的用戶(hù)對(duì)該應(yīng)用程序做出的評(píng)價(jià)信息。
41.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述歷史排名信息包括歷史各時(shí)間段中所述應(yīng)用程序的用戶(hù)對(duì)所述應(yīng)用程序做出的用戶(hù)評(píng)論。
42.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述歷史排名信息包括歷史各時(shí)間段中所述應(yīng)用程序的用戶(hù)信譽(yù)度或歷史各時(shí)間段中應(yīng)用程序排行榜中所有應(yīng)用程序的用戶(hù)信譽(yù)度。
43.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括:將所檢測(cè)出的所述應(yīng)用程序的所述活躍期發(fā)送給應(yīng)用程序開(kāi)發(fā)者、應(yīng)用程序商店運(yùn)營(yíng)商、應(yīng)用程序用戶(hù)中的至少一個(gè)。
44.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括:將所檢測(cè)出的所述排名欺詐檢測(cè)結(jié)果發(fā)送給應(yīng)用程序商店運(yùn)營(yíng)商、應(yīng)用程序用戶(hù)中的至少一個(gè)。
45.一種應(yīng)用程序的排名欺詐檢測(cè)系統(tǒng),其特征在于,所述系統(tǒng)包括: 活躍期檢測(cè)單元,用于基于歷史排名信息檢測(cè)所述應(yīng)用程序的活躍期; 排名欺詐檢測(cè)單元,用于基于至少一個(gè)證據(jù)對(duì)所述活躍期進(jìn)行檢測(cè),得到排名欺詐檢測(cè)結(jié)果。
46.根據(jù)權(quán)利要求45所述的系統(tǒng),其特征在于,所述排名欺詐檢測(cè)單元進(jìn)一步包括: 證據(jù)驗(yàn)證模塊,用于基于至少一個(gè)證據(jù)對(duì)所述活躍期進(jìn)行驗(yàn)證并得到一欺詐參數(shù)。
47.根據(jù)權(quán)利要求46所述的系統(tǒng),其特征在于,所述排名欺詐檢測(cè)單元進(jìn)一步包括: 活躍事件分析模塊,用于識(shí)別所述活躍期中至少一個(gè)活躍事件的上升階段、保持階段和下降階段。
48.根據(jù)權(quán)利要求47所述的系統(tǒng),其特征在于,所述活躍事件分析模塊,用于確定所述活躍事件中所述應(yīng)用程序的排名在一峰值范圍AR內(nèi)的第一個(gè)時(shí)間和最后一個(gè)時(shí)間,將所述第一個(gè)時(shí)間和所述最后一個(gè)時(shí)間之間的時(shí)間段識(shí)別為所述保持階段,將所述活躍事件中在保持階段之前的時(shí)間段識(shí)別為所述上升階段,將所述活躍事件中在保持階段之后的時(shí)間段識(shí)別為所述下降階段。
49.根據(jù)權(quán)利要求47所述的系統(tǒng),其特征在于,所述證據(jù)基于所述活躍期內(nèi)的活躍事件中的上升階段和/或下降階段構(gòu)成。
50.根據(jù)權(quán)利要求47所述的系統(tǒng),其特征在于,所述證據(jù)基于所述活躍期內(nèi)的活躍事件中的保持階段構(gòu)成。
51.根據(jù)權(quán)利要求46所述的系統(tǒng),其特征在于, 所述證據(jù)基于所述活躍期內(nèi)活躍事件的數(shù)量構(gòu)成。
52.根據(jù)權(quán)利要求46所述的系統(tǒng),其特征在于,所述證據(jù)基于所述活躍期內(nèi)的平均評(píng)價(jià)和歷史平均評(píng)價(jià)構(gòu)成。
53.根據(jù)權(quán)利要求46所述的系統(tǒng),其特征在于,所述證據(jù)基于應(yīng)用程序在所述活躍期內(nèi)的評(píng)價(jià)等級(jí)的分布和歷史評(píng)價(jià)信息中評(píng)價(jià)等級(jí)的分布構(gòu)成。
54.根據(jù)權(quán)利要求4`6所述的系統(tǒng),其特征在于,所述證據(jù)基于所述活躍期內(nèi)用戶(hù)評(píng)論間的相似程度構(gòu)成。
55.根據(jù)權(quán)利要求46所述的系統(tǒng),其特征在于,所述證據(jù)基于應(yīng)用程序在所述活躍期內(nèi)用戶(hù)評(píng)論的主題分布和歷史評(píng)論信息中用戶(hù)評(píng)論的主題分布構(gòu)成。
56.根據(jù)權(quán)利要求46所述的系統(tǒng),其特征在于,所述證據(jù)基于所述應(yīng)用程序的活躍用戶(hù)平均信譽(yù)度和所述應(yīng)用程序的歷史用戶(hù)平均信譽(yù)度構(gòu)成。
57.根據(jù)權(quán)利要求46所述的系統(tǒng),其特征在于,所述證據(jù)基于所述應(yīng)用程序的活躍用戶(hù)平均信譽(yù)度和應(yīng)用程序排行榜中所有應(yīng)用程序的歷史用戶(hù)平均信譽(yù)度構(gòu)成。
58.根據(jù)權(quán)利要求46所述的系統(tǒng),其特征在于,所述證據(jù)基于所述應(yīng)用程序的活躍用戶(hù)信譽(yù)度分布和所述應(yīng)用程序的歷史用戶(hù)信譽(yù)度分布構(gòu)成。
59.根據(jù)權(quán)利要求46所述的系統(tǒng),其特征在于,所述證據(jù)基于所述應(yīng)用程序的活躍用戶(hù)信譽(yù)度分布和應(yīng)用程序排行榜中所有應(yīng)用程序的歷史用戶(hù)信譽(yù)度分布構(gòu)成。
60.根據(jù)權(quán)利要求46所述的系統(tǒng),其特征在于,所述證據(jù)驗(yàn)證模塊,用于綜合考慮所述至少一個(gè)證據(jù),將基于所述至少一個(gè)證據(jù)驗(yàn)證得到的對(duì)應(yīng)欺詐參數(shù)進(jìn)行加權(quán)計(jì)算,從而得到所述欺詐參數(shù)。
61.根據(jù)權(quán)利要求46-60中任一項(xiàng)所述的系統(tǒng),其特征在于,所述排名欺詐檢測(cè)單元進(jìn)一步包括: 欺詐參數(shù)判斷模塊,用于將所述欺詐參數(shù)與一閾值進(jìn)行比較,從而判斷所述應(yīng)用程序是否存在排名欺詐。
62.根據(jù)權(quán)利要求45所述的系統(tǒng),其特征在于,所述系統(tǒng)還包括: 歷史排名信息獲取單元,用于獲取所述應(yīng)用程序在應(yīng)用程序排行榜上的所述歷史排名信息。
63.根據(jù)權(quán)利要求62所述的系統(tǒng),其特征在于,所述歷史排名信息獲取單元,用于從應(yīng)用程序商店運(yùn)營(yíng)商獲取所述歷史排名信息,或從應(yīng)用程序商店發(fā)布的數(shù)據(jù)中抽取所述歷史排名信息。
64.根據(jù)權(quán)利要求45所述的系統(tǒng),其特征在于,所述系統(tǒng)還包括一活躍期發(fā)送單元,用于將所檢測(cè)出的所述應(yīng)用程序的所述活躍期發(fā)送給應(yīng)用程序開(kāi)發(fā)者、應(yīng)用程序商店運(yùn)營(yíng)商、應(yīng)用程序用戶(hù)中的至少一個(gè)。`
65.根據(jù)權(quán)利要求45所述的系統(tǒng),其特征在于,所述系統(tǒng)還包括一排名欺詐檢測(cè)結(jié)果發(fā)送單元,用于將所檢測(cè)出的所述排名欺詐檢測(cè)結(jié)果發(fā)送給應(yīng)用程序商店運(yùn)營(yíng)商、應(yīng)用程序用戶(hù)中的至少一個(gè)。
66.一種應(yīng)用程序的排名欺詐檢測(cè)方法,其特征在于,所述方法包括: 基于至少一個(gè)證據(jù)對(duì)應(yīng)用程序的活躍期進(jìn)行檢測(cè),得到排名欺詐檢測(cè)結(jié)果。
67.根據(jù)權(quán)利要求66所述的方法,其特征在于,所述方法進(jìn)一步包括: 證據(jù)驗(yàn)證步驟,基于至少一個(gè)證據(jù)對(duì)所述活躍期進(jìn)行驗(yàn)證并得到一欺詐參數(shù)。
68.根據(jù)權(quán)利要求67所述的方法,其特征在于,所述方法進(jìn)一步包括: 活躍事件分析步驟,識(shí)別所述活躍期中至少一個(gè)活躍事件的上升階段、保持階段和下降階段。
69.根據(jù)權(quán)利要求68所述的方法,其特征在于,在所述活躍事件分析步驟中,確定所述活躍事件中所述應(yīng)用程序的排名在一峰值范圍AR內(nèi)的第一個(gè)時(shí)間和最后一個(gè)時(shí)間,將所述第一個(gè)時(shí)間和所述最后一個(gè)時(shí)間之間的時(shí)間段識(shí)別為所述保持階段,將所述活躍事件中在保持階段之前的時(shí)間段識(shí)別為所述上升階段,將所述活躍事件中在保持階段之后的時(shí)間段識(shí)別為所述下降階段。
70.根據(jù)權(quán)利要求68所述的方法,其特征在于,所述證據(jù)基于所述活躍期內(nèi)的活躍事件中的上升階段和/或下降階段構(gòu)成。
71.根據(jù)權(quán)利要求70所述的方法,其特征在于, 所述欺詐參數(shù)是所述活躍期內(nèi)所有活躍事件的所述上升階段的時(shí)間范圍的平均值,或所述活躍期內(nèi)所有活躍事件的所述下降階段的時(shí)間范圍的平均值,或所述活躍期內(nèi)所有活躍事件的所述上升階段的時(shí)間范圍和下降階段的時(shí)間范圍的和的平均值。
72.根據(jù)權(quán)利要求70所述的方法,其特征在于, 所述欺詐參數(shù)是所述活躍期內(nèi)所有活躍事件的所述上升階段的曲線與時(shí)間軸相交所形成的銳角的角度的平均值,或所有活躍事件的所述下降階段的曲線與時(shí)間軸相交所形成的銳角的角度的平均值,或所有活躍事件的所述上升階段的曲線和所述下降階段的曲線與時(shí)間軸相交所形成的銳角的角度和的平均值。
73.根據(jù)權(quán)利要求68所述的方法,其特征在于, 所述證據(jù)基于所述活躍期內(nèi)的活躍事件中的保持階段構(gòu)成。
74.根據(jù)權(quán)利要求73所述的方法,其特征在于, 所述欺詐參數(shù)是所述活躍期內(nèi)所有活躍事件的所述保持階段的時(shí)間范圍的平均值。
75.根據(jù)權(quán)利要求73所述的方法,其特征在于,基于所有活躍事件的所述保持階段中所述應(yīng)用程序的平均排名和所述保持階段的時(shí)間范圍來(lái)計(jì)算所述欺詐參數(shù)。
76.根據(jù)權(quán)利要求67所述的方法,其特征在于, 所述證據(jù)基于所述活躍期內(nèi)活躍事件的數(shù)量構(gòu)成。
77.根據(jù)權(quán)利要求76所述的方法,其特征在于, 所述欺詐參數(shù)是所述活躍期內(nèi)活躍事件的數(shù)量。
78.根據(jù)權(quán)利要求67`所述的方法,其特征在于,所述證據(jù)基于所述活躍期內(nèi)的平均評(píng)價(jià)和歷史平均評(píng)價(jià)構(gòu)成。
79.根據(jù)權(quán)利要求78所述的方法,其特征在于, 所述欺詐參數(shù)是所述活躍期內(nèi)的平均評(píng)價(jià)和歷史平均評(píng)價(jià)的差值或比值。
80.根據(jù)權(quán)利要求78所述的方法,其特征在于, 所述欺詐參數(shù)是所述活躍期內(nèi)的平均評(píng)價(jià)和歷史平均評(píng)價(jià)的差值與歷史平均評(píng)價(jià)的比值。
81.根據(jù)權(quán)利要求67所述的方法,其特征在于, 所述證據(jù)基于應(yīng)用程序在所述活躍期內(nèi)的評(píng)價(jià)等級(jí)的分布和歷史評(píng)價(jià)信息中評(píng)價(jià)等級(jí)的分布構(gòu)成。
82.根據(jù)權(quán)利要求81所述的方法,其特征在于, 所述欺詐參數(shù)是應(yīng)用程序在所述活躍期內(nèi)的評(píng)價(jià)等級(jí)的分布和歷史評(píng)價(jià)信息中評(píng)價(jià)等級(jí)的分布之間的差值。
83.根據(jù)權(quán)利要求82所述的方法,其特征在于,通過(guò)計(jì)算應(yīng)用程序在所述活躍期內(nèi)的評(píng)價(jià)等級(jí)的分布和歷史評(píng)價(jià)信息中評(píng)價(jià)等級(jí)的分布之間的余弦距離來(lái)計(jì)算它們之間的差值。
84.根據(jù)權(quán)利要求67所述的方法,其特征在于,所述證據(jù)基于所述活躍期內(nèi)用戶(hù)評(píng)論間的相似程度構(gòu)成。
85.根據(jù)權(quán)利要求84所述的方法,其特征在于, 所述欺詐參數(shù)是所述活躍期內(nèi)用戶(hù)評(píng)論間的平均相似度。
86.根據(jù)權(quán)利要求85所述的方法,其特征在于, 所述證據(jù)驗(yàn)證步驟進(jìn)一步包括:對(duì)所述活躍期內(nèi)的所有用戶(hù)評(píng)論進(jìn)行標(biāo)準(zhǔn)化處理; 為所述活躍期內(nèi)的每一條用戶(hù)評(píng)論構(gòu)建標(biāo)準(zhǔn)化詞匯向量; 基于所述標(biāo)準(zhǔn)化詞匯向量計(jì)算所述活躍期內(nèi)用戶(hù)評(píng)論間的平均相似度。
87.根據(jù)權(quán)利要求67所述的方法,其特征在于, 所述證據(jù)基于應(yīng)用程序在所述活躍期內(nèi)用戶(hù)評(píng)論的主題分布和歷史評(píng)論信息中用戶(hù)評(píng)論的主題分布構(gòu)成。
88.根據(jù)權(quán)利要求87所述的方法,其特征在于, 所述欺詐參數(shù)是應(yīng)用程序在所述活躍期內(nèi)用戶(hù)評(píng)論的主題分布和歷史評(píng)論信息中用戶(hù)評(píng)論的主題分布之間的差值。
89.根據(jù)權(quán)利要求88所述的方法,其特征在于,通過(guò)計(jì)算應(yīng)用程序在所述活躍期內(nèi)用戶(hù)評(píng)論的主題分布和歷史評(píng)論信息中用戶(hù)評(píng)論的主題分布之間的余弦距離來(lái)計(jì)算它們之間的差值。
90.根據(jù)權(quán)利要求67所述的方法,其特征在于,所述證據(jù)基于所述應(yīng)用程序的活躍用戶(hù)平均信譽(yù)度和所述應(yīng)用程序的歷史用戶(hù)平均信譽(yù)度構(gòu)成。
91.根據(jù)權(quán)利要求90所述的方法,其特征在于, 所述欺詐參數(shù)是所述應(yīng)用程序的歷史用戶(hù)平均信譽(yù)度和所述應(yīng)用程序的活躍用戶(hù)平均信譽(yù)度的差值或比值。
92.根據(jù)權(quán)利要求67所述的方法,其特征在于,所述證據(jù)基于所述應(yīng)用程序的活躍用戶(hù)平均信譽(yù)度和應(yīng)用程序排行榜中所有應(yīng)用程序的歷史用戶(hù)平均信譽(yù)度構(gòu)成。
93.根據(jù)權(quán)利要求92所述的方法,其特征在于, 所述欺詐參數(shù)是應(yīng)用程序排行榜中所有應(yīng)用程序的歷史用戶(hù)平均信譽(yù)度和所述應(yīng)用程序的活躍用戶(hù)平均信譽(yù)度的差值或比值。
94.根據(jù)權(quán)利要求67所述的方法,其特征在于, 所述證據(jù)基于所述應(yīng)用程序的活躍用戶(hù)信譽(yù)度分布和所述應(yīng)用程序的歷史用戶(hù)信譽(yù)度分布構(gòu)成。
95.根據(jù)權(quán)利要求94所述的方法,其特征在于, 所述欺詐參數(shù)是所述應(yīng)用程序的歷史用戶(hù)信譽(yù)度分布和所述應(yīng)用程序的活躍用戶(hù)信譽(yù)度分布之間的差值。
96.根據(jù)權(quán)利要求95所述的方法,其特征在于,通過(guò)計(jì)算所述應(yīng)用程序的歷史用戶(hù)信譽(yù)度分布和所述應(yīng)用程序的活躍用戶(hù)信譽(yù)度分布之間的余弦距離來(lái)計(jì)算它們之間的差值。
97.根據(jù)權(quán)利要求67所述的方法,其特征在于, 所述證據(jù)基于所述應(yīng)用程序的活躍用戶(hù)信譽(yù)度分布和應(yīng)用程序排行榜中所有應(yīng)用程序的歷史用戶(hù)信譽(yù)度分布構(gòu)成。
98.根據(jù)權(quán)利要求97所述的方法,其特征在于, 所述欺詐參數(shù)是應(yīng)用程序排行榜中所有應(yīng)用程序的歷史用戶(hù)信譽(yù)度分布和所述應(yīng)用程序的活躍用戶(hù)信譽(yù)度分布之間的差值。
99.根據(jù)權(quán)利要求98所述的方法,其特征在于,通過(guò)計(jì)算應(yīng)用程序排行榜中所有應(yīng)用程序的歷史用戶(hù)信譽(yù)度分布和所述應(yīng)用程序的活躍用戶(hù)信譽(yù)度分布之間的余弦距離來(lái)計(jì)算它們之間的差值。
100.根據(jù)權(quán)利要求67所述的方法,其特征在于,在所述證據(jù)驗(yàn)證步驟中,綜合考慮所述至少一個(gè)證據(jù),將基于所述至少一個(gè)證據(jù)驗(yàn)證得到的對(duì)應(yīng)欺詐參數(shù)進(jìn)行加權(quán)計(jì)算,從而得到所述欺詐參數(shù)。
101.根據(jù)權(quán)利要求67-100中任一項(xiàng)所述的方法,其特征在于,所述方法進(jìn)一步包括: 欺詐參數(shù)判斷步驟,將所述欺詐參數(shù)與一閾值進(jìn)行比較,從而判斷所述應(yīng)用程序是否存在排名欺詐。
102.根據(jù)權(quán)利要求66所述的方法,其特征在于,所述方法還包括:將所檢測(cè)出的所述排名欺詐檢測(cè)結(jié)果發(fā)送給應(yīng)用程序商店運(yùn)營(yíng)商、應(yīng)用程序用戶(hù)中的至少一個(gè)。
103.一種應(yīng)用程序的排名欺詐檢測(cè)系統(tǒng),其特征在于,所述系統(tǒng)包括: 排名欺詐檢測(cè)單元,用于基于至少一個(gè)證據(jù)對(duì)應(yīng)用程序的活躍期進(jìn)行檢測(cè),得到排名欺詐檢測(cè)結(jié)果。
104.根據(jù)權(quán)利要求104所述的系統(tǒng),其特征在于,所述排名欺詐檢測(cè)單元進(jìn)一步包括: 證據(jù)驗(yàn)證模塊,用于基于至少一個(gè)證據(jù)對(duì)所述活躍期進(jìn)行驗(yàn)證并得到一欺詐參數(shù)。
105.根據(jù)權(quán)利要求104所述的系統(tǒng),其特征在于,所述排名欺詐檢測(cè)單元進(jìn)一步包括: 活躍事件分析模塊,用于識(shí)別所述活躍期中至少一個(gè)活躍事件的上升階段、保持階段和下降階段。
106.根據(jù)權(quán)利要求105所述的系統(tǒng),其特征在于,所述活躍事件分析模塊,用于確定所述活躍事件中所述應(yīng)用程序的排名在一峰值范圍AR內(nèi)的第一個(gè)時(shí)間和最后一個(gè)時(shí)間,將所述第一個(gè)時(shí)間和所述最后一個(gè)時(shí)間之間的時(shí)間段識(shí)別為所述保持階段,將所述活躍事件中在保持階段之前的時(shí)間段`識(shí)別為所述上升階段,將所述活躍事件中在保持階段之后的時(shí)間段識(shí)別為所述下降階段。
107.根據(jù)權(quán)利要求105所述的系統(tǒng),其特征在于,所述證據(jù)基于所述活躍期內(nèi)的活躍事件中的上升階段和/或下降階段構(gòu)成。
108.根據(jù)權(quán)利要求105所述的系統(tǒng),其特征在于,所述證據(jù)基于所述活躍期內(nèi)的活躍事件中的保持階段構(gòu)成。
109.根據(jù)權(quán)利要求104所述的系統(tǒng),其特征在于, 所述證據(jù)基于所述活躍期內(nèi)活躍事件的數(shù)量構(gòu)成。
110.根據(jù)權(quán)利要求104所述的系統(tǒng),其特征在于,所述證據(jù)基于所述活躍期內(nèi)的平均評(píng)價(jià)和歷史平均評(píng)價(jià)構(gòu)成。
111.根據(jù)權(quán)利要求104所述的系統(tǒng),其特征在于,所述證據(jù)基于應(yīng)用程序在所述活躍期內(nèi)的評(píng)價(jià)等級(jí)的分布和歷史評(píng)價(jià)信息中評(píng)價(jià)等級(jí)的分布構(gòu)成。
112.根據(jù)權(quán)利要求104所述的系統(tǒng),其特征在于,所述證據(jù)基于所述活躍期內(nèi)用戶(hù)評(píng)論間的相似程度構(gòu)成。
113.根據(jù)權(quán)利要求104所述的系統(tǒng),其特征在于,所述證據(jù)基于應(yīng)用程序在所述活躍期內(nèi)用戶(hù)評(píng)論的主題分布和歷史評(píng)論信息中用戶(hù)評(píng)論的主題分布構(gòu)成。
114.根據(jù)權(quán)利要求104所述的系統(tǒng),其特征在于,所述證據(jù)基于所述應(yīng)用程序的活躍用戶(hù)平均信譽(yù)度和所述應(yīng)用程序的歷史用戶(hù)平均信譽(yù)度構(gòu)成。
115.根據(jù)權(quán)利要求104所述的系統(tǒng),其特征在于,所述證據(jù)基于所述應(yīng)用程序的活躍用戶(hù)平均信譽(yù)度和應(yīng)用程序排行榜中所有應(yīng)用程序的歷史用戶(hù)平均信譽(yù)度構(gòu)成。
116.根據(jù)權(quán)利要求104所述的系統(tǒng),其特征在于,所述證據(jù)基于所述應(yīng)用程序的活躍用戶(hù)信譽(yù)度分布和所述應(yīng)用程序的歷史用戶(hù)信譽(yù)度分布構(gòu)成。
117.根據(jù)權(quán)利要求104所述的系統(tǒng),其特征在于,所述證據(jù)基于所述應(yīng)用程序的活躍用戶(hù)信譽(yù)度分布和應(yīng)用程序排行榜中所有應(yīng)用程序的歷史用戶(hù)信譽(yù)度分布構(gòu)成。
118.根據(jù)權(quán)利要求104所述的系統(tǒng),其特征在于,所述證據(jù)驗(yàn)證模塊,用于綜合考慮所述至少一個(gè)證據(jù),將基于所述至少一個(gè)證據(jù)驗(yàn)證得到的對(duì)應(yīng)欺詐參數(shù)進(jìn)行加權(quán)計(jì)算,從而得到所述欺詐參數(shù)。
119.根據(jù)權(quán)利要求104-118中任一項(xiàng)所述的系統(tǒng),其特征在于,所述排名欺詐檢測(cè)單元進(jìn)一步包括: 欺詐參數(shù)判斷模塊,用于將所述欺詐參數(shù)與一閾值進(jìn)行比較,從而判斷所述應(yīng)用程序是否存在排名欺詐。
120.根據(jù)權(quán)利要求103所述的系統(tǒng),其特征在于,所述系統(tǒng)還包括一排名欺詐檢測(cè)結(jié)果發(fā)送單元,用于將所檢測(cè)出的所述排名欺詐檢測(cè)結(jié)果發(fā)送給應(yīng)用程序商店運(yùn)營(yíng)商、應(yīng)用程序用戶(hù)中的至少一個(gè)。`
【文檔編號(hào)】G06F17/30GK103559208SQ201310469985
【公開(kāi)日】2014年2月5日 申請(qǐng)日期:2013年10月10日 優(yōu)先權(quán)日:2013年10月10日
【發(fā)明者】祝恒書(shū), 于魁飛 申請(qǐng)人:北京智谷睿拓技術(shù)服務(wù)有限公司