一種app軟件用戶(hù)評(píng)論有關(guān)性判斷方法
【專(zhuān)利摘要】本發(fā)明涉及一種APP軟件用戶(hù)評(píng)論有關(guān)性判斷方法,屬于APP軟件用戶(hù)評(píng)價(jià)領(lǐng)域。本發(fā)明首先提取APP軟件每條評(píng)論的關(guān)鍵詞集;然后計(jì)算提取的APP軟件每條評(píng)論的關(guān)鍵詞集對(duì)特征庫(kù)中的有關(guān)性概率得分;最后通過(guò)判斷有關(guān)性概率得分是否大于預(yù)設(shè)閾值的情況來(lái)確定APP軟件用戶(hù)評(píng)論是否與該APP軟件有關(guān)。本發(fā)明定義并提取APP軟件用戶(hù)評(píng)論關(guān)鍵詞集,有利于提高判斷用戶(hù)評(píng)論有關(guān)性的效率;將樸素貝葉斯文本分類(lèi)方法進(jìn)行了修改,結(jié)合詞頻統(tǒng)計(jì)的方法判斷APP軟件用戶(hù)評(píng)論有關(guān)性概率得分,有助于給用戶(hù)篩選出有關(guān)評(píng)論,減少對(duì)評(píng)論篩選的時(shí)間;通過(guò)判斷APP軟件用戶(hù)評(píng)論的有關(guān)性,有助于用戶(hù)評(píng)價(jià)APP軟件的質(zhì)量。
【專(zhuān)利說(shuō)明】
一種APP軟件用戶(hù)評(píng)論有關(guān)性判斷方法
技術(shù)領(lǐng)域
[0001] 本發(fā)明涉及一種APP軟件用戶(hù)評(píng)論有關(guān)性判斷方法,屬于APP軟件用戶(hù)評(píng)價(jià)領(lǐng)域。
【背景技術(shù)】
[0002] 用戶(hù)評(píng)論在電子商務(wù)與微博領(lǐng)域的信息分析日漸成熟。多數(shù)對(duì)中文評(píng)論的研究使 用ICTCLAS進(jìn)行信息處理,最后通過(guò)自然語(yǔ)言處理的方法來(lái)對(duì)處理后的用戶(hù)評(píng)論信息進(jìn)行 分析。例如,楊震等提出一種基于上下文重構(gòu)的短文本情感極性判別研究;宋友等提出一種 基于正則表達(dá)式對(duì)網(wǎng)絡(luò)通用文本處理方法。
[0003] 用戶(hù)對(duì)于應(yīng)用的選擇一定基礎(chǔ)上是來(lái)自于企業(yè)宣傳和應(yīng)用本身的知名度。但是對(duì) 于某些同種類(lèi)型或有相似功能的應(yīng)用,用戶(hù)更愿意對(duì)比各APP間用戶(hù)們對(duì)于應(yīng)用的評(píng)價(jià)、描 述等來(lái)判斷哪個(gè)應(yīng)用更好或者更加適合自己。APP軟件評(píng)價(jià)能夠節(jié)約用戶(hù)查看應(yīng)用的其他 用戶(hù)評(píng)論、評(píng)價(jià)等的時(shí)間,而且能夠更快的告訴用戶(hù)所關(guān)注應(yīng)用的綜合性評(píng)價(jià),減少用戶(hù)對(duì) 有關(guān)信息的篩選。目前對(duì)于APP評(píng)價(jià),基本只有企業(yè)自己進(jìn)行評(píng)測(cè),可能會(huì)出現(xiàn)對(duì)APP不實(shí)的 介紹等。APP軟件評(píng)價(jià)是第三方的,有助于對(duì)APP提出一個(gè)較為客觀的介紹和評(píng)價(jià)。
[0004] 本發(fā)明提出通過(guò)提取APP軟件用戶(hù)評(píng)論關(guān)鍵詞集,計(jì)算關(guān)鍵詞集對(duì)特征庫(kù)中的有 關(guān)性概率得分,并根據(jù)有關(guān)性概率得分判斷APP軟件用戶(hù)評(píng)論的有關(guān)性,有助于用戶(hù)選擇滿(mǎn) 足需要的APP軟件。
【發(fā)明內(nèi)容】
[0005] 針對(duì)上述問(wèn)題,本發(fā)明提供了一種APP軟件用戶(hù)評(píng)論有關(guān)性判斷方法,以用于幫助 用戶(hù)從大量的APP評(píng)論中提取出與該APP軟件有關(guān)的評(píng)論。
[0006] 本發(fā)明的技術(shù)方案是:一種APP軟件用戶(hù)評(píng)論有關(guān)性判斷方法,首先提取APP軟件 每條評(píng)論的關(guān)鍵詞集;然后計(jì)算提取的APP軟件每條評(píng)論的關(guān)鍵詞集對(duì)特征庫(kù)中的有關(guān)性 概率得分;最后通過(guò)判斷有關(guān)性概率得分是否大于預(yù)設(shè)閾值的情況來(lái)確定APP軟件用戶(hù)評(píng) 論是否與該APP軟件有關(guān)。
[0007] 所述方法的具體步驟如下:
[0008] Stepl、提取APP軟件num條用戶(hù)評(píng)論,以及每條用戶(hù)評(píng)論的評(píng)論分詞結(jié)果集 WordResulti= {w〇/f〇,wi/fi,…,評(píng)論分詞詞性集Featurei= ;其中Wj為 詞,fj為詞性(i = 〇,l,…,num-1,j = 0,l ,··· ,η-1),n為分詞以后詞的個(gè)數(shù);
[0009] Step2、根據(jù)num條用戶(hù)評(píng)論的WordResulti和Featurei提取每條評(píng)論的關(guān)鍵詞集 Keywordsi:
[0010] 提取Keywordsi方法:找到Featurei中為動(dòng)詞、名詞和形容詞詞性所有的元素下標(biāo), 并將WordResulti中對(duì)應(yīng)下標(biāo)所有元素 Wj/fj存入Keywordsi;
[0011] Step3、判斷current是否小于L,如果是,則執(zhí)行步驟Step4 ;否則,執(zhí)行步驟 Stepl3;其中,總迭代次數(shù)L=Lnum/imiexj,index表示每次迭代條數(shù)且滿(mǎn)足不大于num,初始 時(shí)的當(dāng)前迭代次數(shù)current = 0;
[0012] Step4、根據(jù)current與L,確定在第current次迭代時(shí),第一條評(píng)論所在條數(shù)first、 最后一條評(píng)論所在條數(shù)last、i = f irst;
[0013] 其中,first = current氺index ;當(dāng) current = L_1 時(shí),last = num;否貝lj,last = (current+1)*index_l;
[0014] Step5、判斷i是否小于或等于last,如果是,則執(zhí)行步驟Step6;否則,執(zhí)行步驟 Stepl2;
[0015] Step6、判斷第i條評(píng)論的Keywordsi是否為空,如果是,則執(zhí)行步驟Stepll;否則執(zhí) 行步驟Step7;
[0016] Step7、根據(jù)第first 條評(píng)論的Keywordsi 提取被測(cè)詞集 Testi= {ti,t2,…,tk} (k = 0,1,2,…,u_l):
[0017] 當(dāng)Keywordsi中所有元素 wk/fk中fk都為形容詞,則將其所有wk存入Testi,否則,對(duì) 元素 wk/fk中fk為動(dòng)詞、名詞的元素,將其wk存入Testi,fk存入判斷詞性集TestFeaturei; [0018] steps、計(jì)算第i條評(píng)論有關(guān)性概率得分score,并將其特征詞存入對(duì)應(yīng)的特征庫(kù):
實(shí)中,第i條評(píng)論中包含被測(cè)詞wk的特征庫(kù)中文本個(gè)數(shù)Nk(k = 0,1,2,…,u-1),文檔個(gè)數(shù)N=4,wk在對(duì)應(yīng)特征庫(kù)中出現(xiàn)頻數(shù)為timesk,wk在對(duì)應(yīng)特征庫(kù)中平 均特征頻數(shù)為m,u為T(mén)esti的元素個(gè)數(shù);
[0019] Step9、判斷有關(guān)性概率得分score是否大于閾值α,如果是,則執(zhí)行步驟SteplO;否 則執(zhí)行步驟Stepll;
[0020] SteplO、第i條評(píng)論有關(guān)性標(biāo)記輸出為"有關(guān)",i++,執(zhí)行步驟Step5:
[0021] Stepll、第i條評(píng)論有關(guān)性標(biāo)記輸出為"無(wú)關(guān)",i++,執(zhí)行步驟Step5;
[0022 ] Step 12、current++,執(zhí)行步驟 Step3;
[0023] Stepl3、輸出"完成所有迭代"。
[0024] 所述α = ?。
[0025] 本發(fā)明的工作原理是:
[0026]提取ΑΡΡ軟件用戶(hù)評(píng)論關(guān)鍵詞集,用于對(duì)用戶(hù)評(píng)論信息的內(nèi)容進(jìn)行處理并篩選出 ΑΡΡ軟件用戶(hù)評(píng)論關(guān)鍵詞集;
[0027]計(jì)算貝葉斯與詞頻的綜合概率得分,用于判斷用戶(hù)評(píng)論信息中ΑΡΡ軟件用戶(hù)評(píng)論 關(guān)鍵詞集與特征庫(kù)有關(guān)。
[0028]本發(fā)明使用ICTCLAS 2015作為數(shù)據(jù)處理工具,進(jìn)行用戶(hù)評(píng)論的分詞及詞性標(biāo)記。
[0029] 本發(fā)明的有益效果是:
[0030] (1)本發(fā)明定義并提取ΑΡΡ軟件用戶(hù)評(píng)論關(guān)鍵詞集,有利于提高判斷用戶(hù)評(píng)論有關(guān) 性的效率;
[0031] (2)本發(fā)明將樸素貝葉斯文本分類(lèi)方法進(jìn)行了修改,結(jié)合詞頻統(tǒng)計(jì)的方法判斷ΑΡΡ 軟件用戶(hù)評(píng)論有關(guān)性概率得分,有助于給用戶(hù)篩選出有關(guān)評(píng)論,減少對(duì)評(píng)論篩選的時(shí)間; [0032] (3)本發(fā)明通過(guò)判斷ΑΡΡ軟件用戶(hù)評(píng)論的有關(guān)性,有助于用戶(hù)評(píng)價(jià)ΑΡΡ軟件的質(zhì)量。
【附圖說(shuō)明】
[0033]圖1是本發(fā)明的流程圖;
[0034]圖2為圖1中步驟S1的具體流程;
[0035]圖3為圖1中步驟S2的具體流程;
[0036]圖4為圖1中步驟S8的具體流程;
[0037]圖5為圖1中步驟S9的具體流程。
【具體實(shí)施方式】
[0038] 實(shí)施例1:如圖1-5所示,APP軟件用戶(hù)評(píng)論如表1所示,
[0039] 表 1
[0040]
[0041 ]所述APP軟件用戶(hù)評(píng)論有關(guān)性判斷方法的具體步驟如下:
[0042] Stepl、提取APP軟件num條用戶(hù)評(píng)論,以及每條用戶(hù)評(píng)論的評(píng)論分詞結(jié)果集 WordResulti= {wo/fo,wi/fi,…,評(píng)論分詞詞性集Featurei= …灼},其中Wj為 詞,fj為詞性(i = 〇,l,…,num-1,j = 0,l,…,n-l):
[0043] 本發(fā)明利用ICTCLAS 2015作為數(shù)據(jù)處理的工具,進(jìn)行用戶(hù)評(píng)論的分詞及詞性標(biāo) 注。本實(shí)施例中對(duì)用戶(hù)評(píng)論信息分詞結(jié)果為:"無(wú)意/v中/h/wj",提取分詞結(jié)果集: WordResulto= {無(wú)意/v,中/f,α/wj},提取評(píng)論分詞詞性集:Featureo= {v,f,wj},此時(shí)num =1〇
[0044] 3七6口2、根據(jù)11111]1條用戶(hù)評(píng)論的¥(^(11^81111:和?631:11代提取每條評(píng)論的關(guān)鍵詞集 Keywordsi:
[0045] 提取Keywordsi方法:找到Featurei中為動(dòng)詞、名詞和形容詞詞性所有的元素下標(biāo), 并將Keywordsi中對(duì)應(yīng)下標(biāo)所有元素 Wj/f j存入Keywordsi:
[0046] 本實(shí)施例中,Keywordso= {無(wú)意/v};
[0047] St ep3、定義每次迭代條數(shù)index ( index必須滿(mǎn)足不大于num),總迭代次數(shù) L=limm/indexj :,初始化當(dāng)前迭代次數(shù)current = 0:
[0048] 本實(shí)施例中,定義index = l,則L=1;
[0049] Step4、判斷current是否小于L:本實(shí)施例中,0〈1,執(zhí)行步驟Step5;
[0050] Step5、根據(jù)current與L,確定在第current次迭代時(shí),第一條評(píng)論所在條數(shù)f irst 和最后一條評(píng)論所在條數(shù)1&8〖,1=:[>;^8〖:本實(shí)施例中,第0次時(shí):[ >;^8〖=0,1&8〖=0,1=0; [0051 ] Step6、判斷i是否小于或等于last:本實(shí)施例中,0〈 = 0,執(zhí)行步驟Step7;
[0052] Step7、判斷第i條評(píng)論的Keywordsi是否為空:本實(shí)施例中,第0條評(píng)論的Keywordso 不為空,執(zhí)行步驟Step8;
[0053] Step8、根據(jù)第first 條評(píng)論的Keywordsi 提取被測(cè)詞集 Testi= {ti,t2,…,tk} (k = 0,1,2,…,u_l):
[0054] 當(dāng)Keywordsi中所有元素 wk/fk中fk都為形容詞,則將其所有wk存入Testi,否貝lj,對(duì) 元素 wk/fk中fk為動(dòng)詞、名詞的元素,將其wk存入Testi,fk存入判斷詞性集TestFeaturei:本 實(shí)施例中,1^7¥(^(18〇={無(wú)意八}中€1^有動(dòng)詞,貝丨】其下68切={無(wú)意},下68七?6&加代〇={>}, isAllAdjust = false ;
[0055] Step9、計(jì)算第i條評(píng)論得分score,并將其特征詞存入對(duì)應(yīng)的特征庫(kù):
[0056] 計(jì)算第i條評(píng)論的貝葉斯與詞頻的綜合概率得分score時(shí),需獲取第i條評(píng)論中包 含被測(cè)詞wk的特征庫(kù)中文本個(gè)數(shù)Nk(k = 0,1,2,…,u-1),文檔中含形容詞特征庫(kù),名詞特征 庫(kù),動(dòng)詞特征庫(kù),軟件簡(jiǎn)介,其文檔個(gè)數(shù)N = 4,wk在對(duì)應(yīng)特征庫(kù)中出現(xiàn)頻數(shù)timesk,wk在對(duì)應(yīng) 特征庫(kù)中平均特征頻數(shù)m,u為T(mén) e s t i的元素個(gè)數(shù);根據(jù)公式計(jì)算s c 〇 r e :
[0057] 將特征詞存入對(duì)應(yīng)特征庫(kù):若特征詞全為形容詞,則將其特征詞全存入形容詞特 征詞庫(kù)并增加頻數(shù);否則存入對(duì)應(yīng)特征庫(kù)并增加頻數(shù);若特征詞在對(duì)應(yīng)特征庫(kù)中不存在,則 先在對(duì)應(yīng)特征庫(kù)中新增該特征詞,并將其頻數(shù)設(shè)置為1:
[0058] 本實(shí)施例中,此時(shí)動(dòng)詞特征庫(kù)中所有動(dòng)詞出現(xiàn)的頻數(shù)總和為56,動(dòng)詞個(gè)數(shù)為14,則 動(dòng)詞特征庫(kù)中平均特征頻數(shù)avgv為56/14 = 4,貝fjTesto的wo其對(duì)應(yīng)的m=4,N〇= 1,times〇 = l, 計(jì)算第〇條評(píng)論score = 0.9;
[0059] SteplO、判斷score是否大于閾值α,本實(shí)施例中,〇.9〈1,執(zhí)行步驟Stepl2;
[0060] Stepl2、第i條評(píng)論有關(guān)性標(biāo)記輸出為"無(wú)關(guān)",i++:本實(shí)施例中,第0條評(píng)論有關(guān)性 標(biāo)記輸出為"無(wú)關(guān)",i++ = l,執(zhí)行步驟Step6;
[0061 ] Step6、判斷i是否小于或等于last:本實(shí)施例中,1>0,執(zhí)行步驟Stepl3;
[0062] Stepl3、current++ = 1,執(zhí)行步驟 Step4;
[0063] Step4、判斷current是否小于L:本實(shí)施例中,1 = 1,執(zhí)行步驟Stepl4;
[0064] Stepl4、輸出"完成所有迭代"。
[0065] 實(shí)施例2:如圖1-5所示,
[0066] APP軟件用戶(hù)評(píng)論如表2所示,
[0067] 表 2
[0068]
[0069] 所述APP軟件用戶(hù)評(píng)論有關(guān)性判斷方法的具體步驟如下:
[0070] Stepl、提取APP軟件num條用戶(hù)評(píng)論,以及每條用戶(hù)評(píng)論的評(píng)論分詞結(jié)果集 WordResulti= {wo/fo,wi/fi,…,評(píng)論分詞詞性集Featurei= …灼},其中Wj為 詞,fj為詞性(i = 〇,l,…,num-1,j = 0,l,…,n-l):
[0071 ] 本實(shí)施例中,WordResulto= {哈哈哈/〇},提取評(píng)論分詞詞性集:Featureo= {〇},此 時(shí) num= 1 〇
[0072] 3丨6口2、根據(jù)]1111]1條用戶(hù)評(píng)論的¥(^(11^81111:和?631:11代提取每條評(píng)論的關(guān)鍵詞集 Keywordsi:本實(shí)施例中,Keywordso = {};
[0073] Step3、定義每次迭代條數(shù)index ( index必須滿(mǎn)足不大于num),總迭代次數(shù) L=[n_/index丨,初始化當(dāng)前迭代次數(shù)current = 0:
[0074] 本實(shí)施例中,定義index = l,則L=1;
[0075] Step4、判斷current是否小于L:本實(shí)施例中,0〈1,執(zhí)行步驟Step5;
[0076] Step5、根據(jù)current與L,確定在第current次迭代時(shí),第一條評(píng)論所在條數(shù)f irst 和最后一條評(píng)論所在條數(shù)last,i = f irst:本實(shí)施例中,第0次時(shí)f irst = 0,last = 0,i = 0; [0077] Step6、判斷i是否小于或等于last:本實(shí)施例中,0〈 = 0,執(zhí)行步驟Step7;
[0078] Step7、判斷第i條評(píng)論的Keywordsi是否為空:本實(shí)施例中,第0條評(píng)論的Keywordso 為空,執(zhí)行步驟Stepl2;
[0079] Stepl2、第i條評(píng)論有關(guān)性標(biāo)記輸出為"無(wú)關(guān)",i++:本實(shí)施例中,第0條評(píng)論有關(guān)性 標(biāo)記輸出為"無(wú)關(guān)",i++ = l,執(zhí)行步驟Step6;
[0080] Step6、判斷i是否小于或等于last:本實(shí)施例中,1>0,執(zhí)行步驟Stepl3;
[0081 ] Stepl3、current++ = 1,執(zhí)行步驟 Step4;
[0082] Step4、判斷current是否小于L:本實(shí)施例中,1 = 1,執(zhí)行步驟Stepl4;
[0083] Stepl4、輸出"完成所有迭代"。
[0084] 實(shí)施例3:如圖1-5所示,
[0085] APP軟件用戶(hù)評(píng)論如表3所示,
[0086] 表 3
[0087]
[0088] 所述APP軟件用戶(hù)評(píng)論有關(guān)性判斷方法的具體步驟如下:
[0089] Stepl、提取APP軟件num條用戶(hù)評(píng)論,以及每條用戶(hù)評(píng)論的評(píng)論分詞結(jié)果集 WordResulti= {wo/fo,wi/fi,…,評(píng)論分詞詞性集Featurei= …灼},其中Wj為 詞,fj為詞性(i = 〇,l,…,num-1,j = 0,l,…,n-l):
[0090] 本實(shí)施例中,WordResulto= {真/d,好/a,用/v},提取評(píng)論分詞詞性集:Featureo = {d,a,v},此時(shí)num=l〇
[0091 ] 3七6口2、根據(jù)11111]1條用戶(hù)評(píng)論的¥(^(11^81111:和?631:11代提取每條評(píng)論的關(guān)鍵詞集 Keywordsi:
[0092] 提取Keywordsi方法:找到Featurei中為動(dòng)詞、名詞和形容詞詞性所有的元素下標(biāo), 并將Keywordsi中對(duì)應(yīng)下標(biāo)所有元素 Wj/fj存入Keywordsi:
[0093] 本實(shí)施例中,Keywordso= {好/a,用/v};
[0094] Step3、定義每次迭代條數(shù)index ( index必須滿(mǎn)足不大于num),總迭代次數(shù) L=[numZindcx |,初始化當(dāng)前迭代次數(shù)current = 0:
[0095] 本實(shí)施例中,定義index = l,則L=1;
[0096] Step4、判斷current是否小于L:本實(shí)施例中,0〈1,執(zhí)行步驟Step5;
[0097] Step5、根據(jù)current與L,確定在第current次迭代時(shí),第一條評(píng)論所在條數(shù)f irst 和最后一條評(píng)論所在條數(shù)last,i = f irst:本實(shí)施例中,第0次時(shí)f irst = 0,last = 0,i = 0; [0098] Step6、判斷i是否小于或等于last:本實(shí)施例中,0〈 = 0,執(zhí)行步驟Step7;
[00"] Step7、判斷第i條評(píng)論的Keywordsi是否為空:本實(shí)施例中,第0條評(píng)論的Keywordso 不為空,執(zhí)行步驟Step8;
[0100] Step8、根據(jù)第first 條評(píng)論的Keywordsi 提取被測(cè)詞集 Testi= {ti,t2,…,tk} (k = 0,1,2,…,u_l):
[0101 ] 當(dāng)Keywordsi中所有元素 Wk/fk中fk都為形容詞,則將其所有Wk存入Testi,否則,對(duì) 于元素 wk/fk中fk為動(dòng)詞、名詞的元素,將其wk存入Testi,fk存入判斷詞性集TestFeaturei: 本實(shí)施例中,Keywordso = {好/a,用/v}中fk有動(dòng)詞,貝lj其Testo = {用},TestFeatureo = {v}, isAllAdjust = false ;
[0102] Step9、計(jì)算第i條評(píng)論得分score,并將其特征詞存入對(duì)應(yīng)的特征庫(kù):
[0103] 本實(shí)施例中,此時(shí)動(dòng)詞特征庫(kù)中平均特征頻數(shù)avgv為11.125,則Testo的wo其對(duì)應(yīng) 的m=ll · 125,~=2,1:;[11168()=16,計(jì)算第0條評(píng)論8(30代=2.128;
[0104] SteplO、判斷score是否大于閾值α,本實(shí)施例中,2.128>1,執(zhí)行步驟Stepll;
[0105] Stepll、第i條評(píng)論有關(guān)性標(biāo)記輸出為"有關(guān)",i++:本實(shí)施例中,第0條評(píng)論有關(guān)性 標(biāo)記輸出為"有關(guān)",i++ = l,執(zhí)行步驟Step6;
[0106] Step6、判斷i是否小于或等于last:本實(shí)施例中,1>0,執(zhí)行步驟Stepl3;
[0107] Stepl3、current++ = 1,執(zhí)行步驟 Step4;
[0108] Step4、判斷current是否小于L:本實(shí)施例中,1 = 1,執(zhí)行步驟Stepl4;
[0109] Stepl4、輸出"完成所有迭代"。
[0110] 實(shí)施例4:如圖1-5所示,
[0111] APP軟件用戶(hù)評(píng)論如表4所示,
[0112] 表4
[0113]
[0114] 所述APP軟件用戶(hù)評(píng)論有關(guān)性判斷方法的具體步驟如下:
[0115] Stepl、提取APP軟件num條用戶(hù)評(píng)論,以及每條用戶(hù)評(píng)論的評(píng)論分詞結(jié)果集 WordResulti= {wo/fo,wi/fi,…,評(píng)論分詞詞性集Featurei= …灼},其中Wj為 詞,fj為詞性(i = 〇,l,…,num-1,j = 0,l,…,n-l):
[0116] 本實(shí)施例中,WordResulto= {差/a},提取評(píng)論分詞詞性集:Featureo= {a},此時(shí) num= 1 〇
[0117] 3七6口2、根據(jù)11111]1條用戶(hù)評(píng)論的¥(^(11^81111:和?631:11代提取每條評(píng)論的關(guān)鍵詞集 Keywordsi:
[0118] 提取Keywordsi方法:找到Featurei中為動(dòng)詞、名詞和形容詞詞性所有的元素下標(biāo), 并將Keywordsi中對(duì)應(yīng)下標(biāo)所有元素 Wj/fj存入Keywordsi:
[0119] 本實(shí)施例中,Keywordso= {差/a};
[0120] Step3、定義每次迭代條數(shù)index ( index必須滿(mǎn)足不大于num),總迭代次數(shù) L=[num/index |,初始化當(dāng)前迭代次數(shù)current = 0:
[0121] 本實(shí)施例中,定義index = l,則L=1;
[0122] Step4、判斷current是否小于L:本實(shí)施例中,0〈1,執(zhí)行步驟Step5;
[0123] Step5、根據(jù)current與L,確定在第current次迭代時(shí),第一條評(píng)論所在條數(shù)f irst 和最后一條評(píng)論所在條數(shù)last,i = f irst:本實(shí)施例中,第0次時(shí)f irst = 0,last = 0,i = 0; [0124] Step6、判斷i是否小于或等于last:本實(shí)施例中,0〈 = 0,執(zhí)行步驟Step7;
[0125] Step7、判斷第i條評(píng)論的Keywordsi是否為空:本實(shí)施例中,第0條評(píng)論的Keywordso 不為空,執(zhí)行步驟Step8;
[0126] Step8、根據(jù)第 first 條評(píng)論的 Keywordsi 提取被測(cè)詞集 Testi= {ti, t2,…,tk} (k = 0,1,2,···,u_l):
[01 Z7]當(dāng)Keywordsi中所有元素 wk/fk中fk都為形容詞,則將其所有wk存入Testi,否則,對(duì) 元素 wk/fk中fk為動(dòng)詞、名詞的元素,將其wk存入Testi,fk存入判斷詞性集TestFeaturei:本 實(shí)施例中,Keywordso= {差/a}中fk只有形容詞,貝IJ其Testo = {差},isAllAdjust = true; [0128] Step9、計(jì)算第i條評(píng)論得分score,并將其特征詞存入對(duì)應(yīng)的特征庫(kù):
[0129] 本實(shí)施例中,此時(shí)動(dòng)詞特征庫(kù)中平均特征頻數(shù)avgv為11.5,則Testo的wo其對(duì)應(yīng)的m = 11.15,N〇=l,times。= 15,計(jì)算第0條評(píng)論 score = 1 · 791;
[0130] SteplO、判斷score是否大于閾值α,本實(shí)施例中,1 ·791>1,執(zhí)行步驟Stepll;
[0131] Stepll、第i條評(píng)論有關(guān)性標(biāo)記輸出為"有關(guān)",i++:本實(shí)施例中,第0條評(píng)論有關(guān)性 標(biāo)記輸出為"有關(guān)",i++ = l,執(zhí)行步驟Step6;
[0132] Step6、判斷i是否小于或等于last:本實(shí)施例中,1>0,執(zhí)行步驟Stepl3;
[0133] Stepl3、current++ = 1,執(zhí)行步驟 Step4;
[0134] Step4、判斷current是否小于L:本實(shí)施例中,1 = 1,執(zhí)行步驟Stepl4;
[0135] Stepl4、輸出"完成所有迭代"。
[0136] 實(shí)施例5:如圖1-5所示,
[0137] APP軟件用戶(hù)評(píng)論如表5所示,
[0138] 表5
[0139]
[0140]所述APP軟件用戶(hù)評(píng)論有關(guān)性判斷方法的具體步驟如下:
[0141] Stepl、提取APP軟件num條用戶(hù)評(píng)論,以及每條用戶(hù)評(píng)論的評(píng)論分詞結(jié)果集 WordResulti= {w〇/f〇,wi/fi,…,評(píng)論分詞詞性集Featurei= ,其中Wj為 詞,fj為詞性(i = 〇,l,…,num-1,j = 0,l,…,n-l):
[0142] 本實(shí)施例中,WordResult〇={為什么/ryv,以前/f,安裝/v,的/udel,了/y,,/wd, 現(xiàn)在/t,安裝/v,不/d,了/y},F(xiàn)eature〇= {ryv,f,v,udel,y,wd,t,v,d,y},WordResulti = {不錯(cuò)/a},F(xiàn)eaturei= {a},此時(shí)num=2〇
[0143] 3七6口2、根據(jù)11111]1條用戶(hù)評(píng)論的¥(^(11^81111:和?631:11代提取每條評(píng)論的關(guān)鍵詞集 Keywordsi:
[0144] 提取Keywordsi方法:找到Feature!中為動(dòng)詞、名詞和形容詞詞性所有的元素下標(biāo), 并將Keywordsi中對(duì)應(yīng)下標(biāo)所有元素 Wj/fj存入Keywordsi:
[0145] 本實(shí)施例中,Keywords〇= {安裝/v},Keywordsi= {不錯(cuò)/a};
[0146] Step3、定義每次迭代條數(shù)index ( index必須滿(mǎn)足不大于num),總迭代次數(shù) I^lilum/indexj,初始化當(dāng)前迭代次數(shù)current = Ο:
[0147] 本實(shí)施例中,定義index = l,則L = 2;
[0148] Step4、判斷current是否小于L:本實(shí)施例中,0〈2,執(zhí)行步驟Step5;
[0149] Step5、根據(jù)current與L,確定在第current次迭代時(shí),第一條評(píng)論所在條數(shù)f irst 和最后一條評(píng)論所在條數(shù)last,i = f irst:本實(shí)施例中,第0次時(shí)f irst = 0,last = 0,i = 0; [0150] Step6、判斷i是否小于或等于last:本實(shí)施例中,0〈 = 0,執(zhí)行步驟Step7;
[0151 ] Step7、判斷第i條評(píng)論的Keywordsi是否為空:本實(shí)施例中,第0條評(píng)論的Keywordso 不為空,執(zhí)行步驟Step8;
[0152] Step8、根據(jù)第first 條評(píng)論的Keywordsi 提取被測(cè)詞集 Testi= {ti,t2,…,tk} (k = 0,1,2,…,u_l):本實(shí)施例中,Testo= {安裝},TestFeatureo = {v},isAllAdjust = false; [0153] Step9、計(jì)算第i條評(píng)論得分score,并將其特征詞存入對(duì)應(yīng)的特征庫(kù):
[0154] 本實(shí)施例中,此時(shí)動(dòng)詞特征庫(kù)中平均特征頻數(shù)avgv為5.571,則Testo的wo其對(duì)應(yīng)的 111 = 5.571,~=1,1:;[11168() = 34,計(jì)算第0條評(píng)論8(30代=6.682;
[0155] SteplO、判斷score是否大于閾值α,本實(shí)施例中,6.682>1,執(zhí)行步驟Stepll;
[0156] Step 11、第i條評(píng)論有關(guān)性標(biāo)記輸出為"有關(guān)",i++:本實(shí)施例中,第0條評(píng)論有關(guān)性 標(biāo)記輸出為"有關(guān)",i++ = l,執(zhí)行步驟Step6;
[0157] Step6、判斷i是否小于或等于last:本實(shí)施例中,1>0,執(zhí)行步驟Stepl3;
[0158] Stepl3、current++ = 1,執(zhí)行步驟 Step4;
[0159] Step4、判斷current是否小于L:本實(shí)施例中,1〈2,執(zhí)行步驟Step5;
[0160] Step5、根據(jù)current與L,確定在第current次迭代時(shí),第一條評(píng)論所在條數(shù)f irst 和最后一條評(píng)論所在條數(shù)1381:,1=;1^;^81::本實(shí)施例中,第1次時(shí);1^;^8丨=1,138丨=1,1 = 1; [0161 ] Step6、判斷i是否小于或等于last:本實(shí)施例中,1〈 = 1,執(zhí)行步驟Step7;
[0162] Step7、判斷第i條評(píng)論的Keywordsi是否為空:本實(shí)施例中,第1條評(píng)論的Keywordsi 不為空,執(zhí)行步驟Step8;
[0163] Step8、根據(jù)第first 條評(píng)論的Keywordsi 提取被測(cè)詞集 Testi= {ti,t2,…,tk} (k = 0,1,2,…,u_l):本實(shí)施例中,Testi = {不錯(cuò)},isAllAdjust = true;
[0164] Step9、計(jì)算第i條評(píng)論得分score,并將其特征詞存入對(duì)應(yīng)的特征庫(kù):
[0165] 本實(shí)施例中,此時(shí)形容詞特征庫(kù)中平均特征頻數(shù)avga*ll .25,則Testj^wo其對(duì)應(yīng) 的m = 11 · 25,N〇 = 1,times〇= 19,計(jì)算第1條評(píng)論 score = 2 · 178;
[0166] SteplO、判斷score是否大于閾值α,本實(shí)施例中,2.178>1,執(zhí)行步驟Stepll;
[0167] Step 11、第i條評(píng)論有關(guān)性標(biāo)記輸出為"有關(guān)",i++:本實(shí)施例中,第0條評(píng)論有關(guān)性 標(biāo)記輸出為"有關(guān)",i++ = l,執(zhí)行步驟Step6;
[0168] Step6、判斷i是否小于或等于last:本實(shí)施例中,2>1,執(zhí)行步驟Stepl3;
[0169] Step 13、current++ = 2,執(zhí)行步驟 Step4;
[0170] Step4、判斷current是否小于L:本實(shí)施例中,2 = 2,執(zhí)行步驟Stepl4;
[0171] Stepl4、輸出"完成所有迭代"。
[0172] 實(shí)施例6:如圖1-5所示,
[0173] APP軟件用戶(hù)評(píng)論如表6所示,
[0174] 表6
[0175]
[0176] 所述APP軟件用戶(hù)評(píng)論有關(guān)性判斷方法的具體步驟如下:
[0177] Stepl、提取APP軟件num條用戶(hù)評(píng)論,以及每條用戶(hù)評(píng)論的評(píng)論分詞結(jié)果集 WordResulti= {w〇/f〇,wi/fi,…,評(píng)論分詞詞性集Featurei= ,其中Wj為 詞,fj為詞性(i = 〇,l,…,num-1,j = 0,l,…,n-l):
[0178] 本實(shí)施例中,WordResult〇= {非常/d,不錯(cuò)/a},F(xiàn)eature〇= {d,a},WordResulti = {很/d,好/a} ;Featurei = {d,a},此時(shí)num=2〇
[0179] 3七6口2、根據(jù)11111]1條用戶(hù)評(píng)論的¥(^(11^81111:和?631:11代提取每條評(píng)論的關(guān)鍵詞集 Keywordsi:
[0180] 提取Keywordsi方法:找到Feature!中為動(dòng)詞、名詞和形容詞詞性所有的元素下標(biāo), 并將Keywordsi中對(duì)應(yīng)下標(biāo)所有元素 Wj/fj存入Keywordsi:
[0181 ]本實(shí)施例中,Keywords〇= {不錯(cuò)/a},Keywordsi= {好/a};
[0182] Step3、定義每次迭代條數(shù)index ( index必須滿(mǎn)足不大于num),總迭代次數(shù) L=[n:um/iiidex|,初始化當(dāng)前迭代次數(shù)CUrrent = 0:
[0183] 本實(shí)施例中,定義index = l,貝ljL = 2;
[0184] Step4、判斷current是否小于L:本實(shí)施例中,0〈2,執(zhí)行步驟Step5;
[0185] Step5、根據(jù)current與L,確定在第current次迭代時(shí),第一條評(píng)論所在條數(shù)f irst 和最后一條評(píng)論所在條數(shù)last,i = f irst:本實(shí)施例中,第0次時(shí)f irst = 0,last = 0,i = 0;
[0186] Step6、判斷i是否小于或等于last:本實(shí)施例中,0〈 = 0,執(zhí)行步驟Step7;
[0187] Step7、判斷第i條評(píng)論的Keywordsi是否為空:本實(shí)施例中,第0條評(píng)論的Keywords。 不為空,執(zhí)行步驟Step8;
[0188] Step8、根據(jù)第first 條評(píng)論的Keywordsi 提取被測(cè)詞集 Testi= {ti,t2,…,tk} (k = 0,1,2,…,u-1):本實(shí)施例中,Test〇= {不錯(cuò)},isAllAdjust = true;
[0189] Step9、計(jì)算第i條評(píng)論得分score,并將其特征詞存入對(duì)應(yīng)的特征庫(kù):
[0190] 本實(shí)施例中,此時(shí)動(dòng)詞特征庫(kù)中平均特征頻數(shù)avga*12.125,則Testo的wo其對(duì)應(yīng) 的m = 12 · 125,N〇 = 1,times〇 = 21,計(jì)算第0 條評(píng)論 score = 2 · 214;
[0191 ] SteplO、判斷score是否大于閾值α,本實(shí)施例中,2·214>1,執(zhí)行步驟Stepll;
[0192] Stepll、第i條評(píng)論有關(guān)性標(biāo)記輸出為"有關(guān)",i++:本實(shí)施例中,第0條評(píng)論有關(guān)性 標(biāo)記輸出為"有關(guān)",i++ = l,執(zhí)行步驟Step6;
[0193] Step6、判斷i是否小于或等于last:本實(shí)施例中,1>0,執(zhí)行步驟Stepl 3;
[0194] Stepl3、current++ = 1,執(zhí)行步驟 Step4;
[0195] Step4、判斷current是否小于L:本實(shí)施例中,1〈2,執(zhí)行步驟Step5;
[0196] Step5、根據(jù)current與L,確定在第current次迭代時(shí),第一條評(píng)論所在條數(shù)f irst 和最后一條評(píng)論所在條數(shù)1381:,1=;1^;^81::本實(shí)施例中,第1次時(shí);1^;^8丨=1,138丨=1,1 = 1;
[0197] Step6、判斷i是否小于或等于last:本實(shí)施例中,1〈 = 1,執(zhí)行步驟Step7;
[0198] Step7、判斷第i條評(píng)論的Keywordsi是否為空:本實(shí)施例中,第1條評(píng)論的Keywordsi 不為空,執(zhí)行步驟Step8;
[0199] Step8、根據(jù)第first 條評(píng)論的Keywordsi 提取被測(cè)詞集 Testi= {ti,t2,…,tk} (k = 0,1,2,…,u_l):本實(shí)施例中,Testi = {好},isAllAdjust = true;
[0200] Step9、計(jì)算第i條評(píng)論得分score,并將其特征詞存入對(duì)應(yīng)的特征庫(kù):
[0201] 本實(shí)施例中,此時(shí)形容詞特征庫(kù)中平均特征頻數(shù)avga*ll .25,則Testj^wo其對(duì)應(yīng) 的m = 11 · 25,N〇 = 3,times〇 = 35,計(jì)算第1條評(píng)論 score = 3 · 739;
[0202] SteplO、判斷score是否大于閾值α,本實(shí)施例中,3·739>1,執(zhí)行步驟Stepll;
[0203] Stepll、第i條評(píng)論有關(guān)性標(biāo)記輸出為"有關(guān)",i++:本實(shí)施例中,第0條評(píng)論有關(guān)性 標(biāo)記輸出為"有關(guān)",i++ = l,執(zhí)行步驟Step6;
[0204] Step6、判斷i是否小于或等于last:本實(shí)施例中,2>1,執(zhí)行步驟Stepl3;
[0205] Stepl 3、current++ = 2,執(zhí)行步驟 Step4;
[0206] Step4、判斷current是否小于L:本實(shí)施例中,2 = 2,執(zhí)行步驟Stepl4;
[0207] Stepl4、輸出"完成所有迭代"。
[0208] 實(shí)施例7:如圖1-5所示,
[0209] APP軟件用戶(hù)評(píng)論如表7所示,
[0210] 表7
[0211]
[0212] 所述APP軟件用戶(hù)評(píng)論有關(guān)性判斷方法的具體步驟如下:
[0213] Stepl、提取APP軟件num條用戶(hù)評(píng)論,以及每條用戶(hù)評(píng)論的評(píng)論分詞結(jié)果集 WordResulti= {w〇/f〇,wi/fi,…,評(píng)論分詞詞性集Featurei= ,其中Wj為 詞,fj為詞性(i = 〇,l,…,num-1,j = 0,l,…,n-l):
[0214] 本實(shí)施例中,W〇rdResult〇= {為什么/ryv,下載/V,了/ule,沒(méi)有/d,在/p,桌面/n, 上/f,出現(xiàn)/v,?/ww},F(xiàn)eature〇 = {ryv,v,ule,d,p,n,f,v,ww},WordResulti = {好/a,,/wd, 感謝/V,微信/nz,各位/rr,朋友/n},F(xiàn)eaturei = {a,wd,v,nz,rr,n},此時(shí)num=2〇
[0215] 3七6口2、根據(jù)11111]1條用戶(hù)評(píng)論的¥(^(11^81111:和?631:11代提取每條評(píng)論的關(guān)鍵詞集 Keywordsi:
[0216] 提取Keywordsi方法:找到Feature!中為動(dòng)詞、名詞和形容詞詞性所有的元素下標(biāo), 并將Keywordsi中對(duì)應(yīng)下標(biāo)所有元素 Wj/fj存入Keywordsi:
[0217] 本實(shí)施例中,Keywords〇= {下載/v,桌面/n,出現(xiàn)/v},Keywordsi= {好/a,感謝/V, 微信/nz,朋友/η};
[0218] Step3、定義每次迭代條數(shù)index ( index必須滿(mǎn)足不大于num),總迭代次數(shù) I^lilum/indexj,初始化當(dāng)前迭代次數(shù)current = Ο:
[0219] 本實(shí)施例中,定義index = l,則L = 2;
[0220] Step4、判斷current是否小于L:本實(shí)施例中,0〈2,執(zhí)行步驟Step5;
[0221 ] Step5、根據(jù)current與L,確定在第current次迭代時(shí),第一條評(píng)論所在條數(shù)f irst 和最后一條評(píng)論所在條數(shù)last,i = f irst:本實(shí)施例中,第0次時(shí)f irst = 0,last = 0,i = 0; [0222] Step6、判斷i是否小于或等于last:本實(shí)施例中,0〈 = 0,執(zhí)行步驟Step7;
[0223] Step7、判斷第i條評(píng)論的Keywordsi是否為空:本實(shí)施例中,第0條評(píng)論的Keywordso 不為空,執(zhí)行步驟Step8;
[0224] Step8、根據(jù)第first 條評(píng)論的Keywordsi 提取被測(cè)詞集 Testi= {ti,t2,…,tk} (k = 0,1,2,…,u-1):本實(shí)施例中,Testo={下載,桌面,出現(xiàn)},TestFeatureo = {v,n,v}, isAllAdjust = false ;
[0225] Step9、計(jì)算第i條評(píng)論得分score,并將其特征詞存入對(duì)應(yīng)的特征庫(kù):
[0226]本實(shí)施例中,此時(shí)動(dòng)詞特征庫(kù)中平均特征頻數(shù)avgv為6.343,名詞特征庫(kù)中平均特 征頻數(shù)avgn為3 · 852,則Test。的wo其對(duì)應(yīng)的m = 6 · 343,N〇 = 1,times〇 = 25 ;wi對(duì)應(yīng)的m = 3.852,Ni=l,time si = l;W2對(duì)應(yīng)的m = 6.343,N2 = 1,time S2 = 1,計(jì)算第0條評(píng)論 score = 2.958;
[0227] SteplO、判斷score是否大于閾值a,本實(shí)施例中,2.958>1,執(zhí)行步驟Stepll;
[0228] Stepll、第i條評(píng)論有關(guān)性標(biāo)記輸出為"有關(guān)",i++:本實(shí)施例中,第0條評(píng)論有關(guān)性 標(biāo)記輸出為"有關(guān)",i++ = l,執(zhí)行步驟Step6;
[0229] Step6、判斷i是否小于或等于last:本實(shí)施例中,1>0,執(zhí)行步驟Stepl3;
[0230] Stepl3、current++ = 1,執(zhí)行步驟 Step4;
[0231 ] Step4、判斷current是否小于L:本實(shí)施例中,1〈2,執(zhí)行步驟Step5;
[0232] Step5、根據(jù)current與L,確定在第current次迭代時(shí),第一條評(píng)論所在條數(shù)f irst 和最后一條評(píng)論所在條數(shù)1381:,1=;1^;^81::本實(shí)施例中,第1次時(shí);1^;^8丨=1,138丨=1,1 = 1; [0233] Step6、判斷i是否小于或等于last:本實(shí)施例中,1〈 = 1,執(zhí)行步驟Step7;
[0234] Step7、判斷第i條評(píng)論的Keywordsi是否為空:本實(shí)施例中,第1條評(píng)論的Keywordsi 不為空,執(zhí)行步驟Step8;
[0235] Step8、根據(jù)第first 條評(píng)論的Keywordsi 提取被測(cè)詞集 Testi= {ti,t2,…,tk} (k = 0,1,2,…,u-1):本實(shí)施例中,Testi = {感謝,微信,朋友},TestFeaturei = {v,nz,n}, isAllAdjust = false ;
[0236] Step9、計(jì)算第i條評(píng)論得分score,并將其特征詞存入對(duì)應(yīng)的特征庫(kù):
[0237] 本實(shí)施例中,此時(shí)動(dòng)詞特征庫(kù)中平均特征頻數(shù)avgv為13.25,名詞特征庫(kù)中平均特 征頻 avgn為 6 · 829,貝 ijTesti的 wo 其對(duì)應(yīng)的 m= 13 · 25,N〇= 1,times〇 = 4,wi 其對(duì)應(yīng)的 m=6 · 829, ~=2,1:;[11168。= 32,¥2其對(duì)應(yīng)的111 = 6.829,1^。= 2,1:;[11168。= 4,計(jì)算第1條評(píng)論8(30代=7.535;
[0238] SteplO、判斷score是否大于閾值α,本實(shí)施例中,7.535>1,執(zhí)行步驟Stepll;
[0239] Stepll、第i條評(píng)論有關(guān)性標(biāo)記輸出為"有關(guān)",i++:本實(shí)施例中,第0條評(píng)論有關(guān)性 標(biāo)記輸出為"有關(guān)",i++ = l,執(zhí)行步驟Step6;
[0240] Step6、判斷i是否小于或等于last:本實(shí)施例中,2>1,執(zhí)行步驟Stepl3;
[0241 ] Stepl3、current++ = 2,執(zhí)行步驟 Step4;
[0242] Step4、判斷current是否小于L:本實(shí)施例中,2 = 2,執(zhí)行步驟Stepl4;
[0243] Stepl4、輸出"完成所有迭代"。
[0244] 實(shí)施例8:如圖1-5所示,
[0245] APP軟件用戶(hù)評(píng)論如表8所示,
[0246] 表 8
[0247]
[0248] 所述APP軟件用戶(hù)評(píng)論有關(guān)性判斷方法的具體步驟如下:
[0249] Stepl、提取APP軟件num條用戶(hù)評(píng)論,以及每條用戶(hù)評(píng)論的評(píng)論分詞結(jié)果集 WordResulti= {w〇/f〇,wi/fi,…,評(píng)論分詞詞性集Featurei= ,其中Wj為 詞,fj為詞性(i = 〇,l,…,num-1,j = 0,l,…,n-l):
[0250] 本實(shí)施例中,W〇rdResult〇= {小武/nr2},F(xiàn)eature〇= {nr2},WordResulti= {郞衛(wèi) 忠/nr},F(xiàn)eaturei= {nr},此時(shí)num=2〇
[0251 ] 3七6口2、根據(jù)11111]1條用戶(hù)評(píng)論的¥(^(11^81111:和?631:11代提取每條評(píng)論的關(guān)鍵詞集 Keywordsi:
[0252] 提取Keywordsi方法:找到Feature!中為動(dòng)詞、名詞和形容詞詞性所有的元素下標(biāo), 并將Keywordsi中對(duì)應(yīng)下標(biāo)所有元素 Wj/fj存入Keywordsi:
[0253] 本實(shí)施例中,Keywords〇= {小武/nr2},Keywordsi= {郞衛(wèi)忠/nr};
[0254] Step3、定義每次迭代條數(shù)index ( index必須滿(mǎn)足不大于num),總迭代次數(shù) L=lnum/iridex丨,初始化當(dāng)前迭代次數(shù)current = 0:
[0255] 本實(shí)施例中,定義index = l,則L = 2;
[0256] Step4、判斷current是否小于L:本實(shí)施例中,0〈2,執(zhí)行步驟Step5;
[0257] Step5、根據(jù)current與L,確定在第current次迭代時(shí),第一條評(píng)論所在條數(shù)f irst 和最后一條評(píng)論所在條數(shù)last,i = f irst:本實(shí)施例中,第0次時(shí)f irst = 0,last = 0,i = 0;
[0258] Step6、判斷i是否小于或等于last:本實(shí)施例中,0〈 = 0,執(zhí)行步驟Step7;
[0259] Step7、判斷第i條評(píng)論的Keywordsi是否為空:本實(shí)施例中,第0條評(píng)論的Keywords。 不為空,執(zhí)行步驟Step8;
[0260] Step8、根據(jù)第first 條評(píng)論的Keywordsi 提取被測(cè)詞集 Testi= {ti,t2,…,tk} (k = 0,1,2,…,u_l):本實(shí)施例中,Test〇= {小武},TestFeature〇= {nr2},isAllAdjust = false; [0261 ] Step9、計(jì)算第i條評(píng)論得分score,并將其特征詞存入對(duì)應(yīng)的特征庫(kù):
[0262] 本實(shí)施例中,名詞特征庫(kù)中平均特征頻數(shù)avgn為4.148,則Test。的w〇其對(duì)應(yīng)的m = 4.148,心=1,1:;[11168。=1,計(jì)算第0條評(píng)論8(30代=0.882;
[0263] SteplO、判斷score是否大于閾值α,本實(shí)施例中,0.882〈1,執(zhí)行步驟3七6?12;
[0264] Stepl2、第i條評(píng)論有關(guān)性標(biāo)記輸出為"無(wú)關(guān)",i++:本實(shí)施例中,第0條評(píng)論有關(guān)性 標(biāo)記輸出為"無(wú)關(guān)",i++ = l,執(zhí)行步驟Step6;
[0265] Step6、判斷i是否小于或等于last:本實(shí)施例中,1>0,執(zhí)行步驟Stepl3;
[0266] Stepl3、current++ = 1,執(zhí)行步驟 Step4;
[0267] Step4、判斷current是否小于L:本實(shí)施例中,1〈2,執(zhí)行步驟Step5;
[0268] Step5、根據(jù)current與L,確定在第current次迭代時(shí),第一條評(píng)論所在條數(shù)f irst 和最后一條評(píng)論所在條數(shù)1381:,1=;1^;^81::本實(shí)施例中,第1次時(shí);1^;^8丨=1,138丨=1,1 = 1; [0269] Step6、判斷i是否小于或等于last:本實(shí)施例中,1〈 = 1,執(zhí)行步驟Step7;
[0270] Step7、判斷第i條評(píng)論的Keywordsi是否為空:本實(shí)施例中,第1條評(píng)論的Keywordsi 不為空,執(zhí)行步驟Step8;
[0271 ] Step8、根據(jù)第first 條評(píng)論的Keywordsi 提取被測(cè)詞集 Testi= {ti,t2,…,tk} (k = 0,1,2,…,u_l):本實(shí)施例中,Testi = {郞衛(wèi)忠 },TestFeaturei = {nr},isAl lAd just = false;
[0272] Step9、計(jì)算第i條評(píng)論得分score,并將其特征詞存入對(duì)應(yīng)的特征庫(kù):
[0273] 本實(shí)施例中,此時(shí)名詞特征庫(kù)中平均特征頻avgn為4.296,則Test的《〇其對(duì)應(yīng)的m =4.296,~=1,1:;[11168。=1,計(jì)算第1條評(píng)論8(30代=0.866;
[0274] SteplO、判斷score是否大于閾值α,本實(shí)施例中,〇.866〈1,執(zhí)行步驟Stepl2;
[0275] Stepl2、第i條評(píng)論有關(guān)性標(biāo)記輸出為"無(wú)關(guān)",i++:本實(shí)施例中,第0條評(píng)論有關(guān)性 標(biāo)記輸出為"無(wú)關(guān)",i++ = l,執(zhí)行步驟Step6;
[0276] Step6、判斷i是否小于或等于last:本實(shí)施例中,2>1,執(zhí)行步驟Stepl3;
[0277] Step 13、current++ = 2,執(zhí)行步驟 Step4;
[0278] Step4、判斷current是否小于L:本實(shí)施例中,2 = 2,執(zhí)行步驟Stepl4;
[0279] Stepl4、輸出"完成所有迭代"。
[0280] 實(shí)施例9:如圖1-5所示,
[0281] APP軟件用戶(hù)評(píng)論如表9所示,
[0282] 表 9
[0283]
[0284] 所述APP軟件用戶(hù)評(píng)論有關(guān)性判斷方法的具體步驟如下:
[0285] Stepl、提取APP軟件num條用戶(hù)評(píng)論,以及每條用戶(hù)評(píng)論的評(píng)論分詞結(jié)果集 WordResulti= {wo/fo,wi/fi,…,評(píng)論分詞詞性集Featurei= …灼},其中Wj為 詞,fj為詞性(i = 〇,l,…,num-1,j = 0,l,…,n-l):
[0286] 本實(shí)施例中,WordResulto= {呵呵/〇},F(xiàn)eatureo= {〇},WordResulti = {哈哈/〇, !/ wt},F(xiàn)eaturei= {o,wt},此時(shí)num=2〇
[0287] 3丨6口2、根據(jù)11111]1條用戶(hù)評(píng)論的¥(^(11^81111:和?631:11代提取每條評(píng)論的關(guān)鍵詞集 Keywordsi:本實(shí)施例中,Keywordso = {},Keywordsi = {};
[0288] Step3、定義每次迭代條數(shù)index ( index必須滿(mǎn)足不大于num),總迭代次數(shù) L=|num/index |,初始化當(dāng)前迭代次數(shù)current = 0:
[0289] 本實(shí)施例中,定義index = l,則L = 2;
[0290] Step4、判斷current是否小于L:本實(shí)施例中,0〈2,執(zhí)行步驟Step5;
[0291 ] Step5、根據(jù)current與L,確定在第current次迭代時(shí),第一條評(píng)論所在條數(shù)f irst 和最后一條評(píng)論所在條數(shù)last,i = f irst:本實(shí)施例中,第0次時(shí)f irst = 0,last = 0,i = 0; [0292] Step6、判斷i是否小于或等于last:本實(shí)施例中,0〈 = 0,執(zhí)行步驟Step7;
[0293] Step7、判斷第i條評(píng)論的Keywordsi是否為空:本實(shí)施例中,第0條評(píng)論的Keywordso 為空,執(zhí)行步驟Stepl2;
[0294] Stepl2、第i條評(píng)論有關(guān)性標(biāo)記輸出為"無(wú)關(guān)",i++:本實(shí)施例中,第0條評(píng)論有關(guān)性 標(biāo)記輸出為"無(wú)關(guān)",i++ = l,執(zhí)行步驟Step6;
[0295] Step6、判斷i是否小于或等于last:本實(shí)施例中,1>0,執(zhí)行步驟Stepl3;
[0296] Stepl3、current++ = 1,執(zhí)行步驟 Step4;
[0297] Step4、判斷current是否小于L:本實(shí)施例中,1〈2,執(zhí)行步驟Step5;
[0298] Step5、根據(jù)current與L,確定在第current次迭代時(shí),第一條評(píng)論所在條數(shù)f irst 和最后一條評(píng)論所在條數(shù)1381:,1=;1^;^81::本實(shí)施例中,第1次時(shí);1^;^8丨=1,138丨=1,1 = 1; [0299] Step6、判斷i是否小于或等于last:本實(shí)施例中,1〈 = 1,執(zhí)行步驟Step7;
[0300] Step7、判斷第i條評(píng)論的Keywordsi是否為空:本實(shí)施例中,第1條評(píng)論的Keywordsi 為空,執(zhí)行步驟Stepl2;
[0301] Stepl2、第i條評(píng)論有關(guān)性標(biāo)記輸出為"無(wú)關(guān)",i++:本實(shí)施例中,第0條評(píng)論有關(guān)性 標(biāo)記輸出為"無(wú)關(guān)",i++ = l,執(zhí)行步驟Step6;
[0302] Step6、判斷i是否小于或等于last:本實(shí)施例中,2>1,執(zhí)行步驟Stepl3;
[0303] Step 13、current++ = 2,執(zhí)行步驟 Step4;
[0304] Step4、判斷current是否小于L:本實(shí)施例中,2 = 2,執(zhí)行步驟Stepl4;
[0305] Stepl4、輸出"完成所有迭代"。
[0306] 實(shí)施例10:如圖1-5所示,
[0307] APP軟件用戶(hù)評(píng)論如表10所示,
[0308] 表1〇
[0309]
[0310] 所述APP軟件用戶(hù)評(píng)論有關(guān)性判斷方法的具體步驟如下:
[0311] Stepl、提取APP軟件num條用戶(hù)評(píng)論,以及每條用戶(hù)評(píng)論的評(píng)論分詞結(jié)果集 WordResulti= {w〇/f〇,wi/fi,…,評(píng)論分詞詞性集Featurei= ,其中Wj為 詞,fj為詞性(i = 〇,l,…,num-1,j = 0,l,…,n-l):
[0312] 本實(shí)施例中,WordResult〇= {嘻嘻/〇},F(xiàn)eature〇= {〇},WordResulti = {彭江/nr}, Featurei= {nr},此時(shí)num=2〇
[0313] 3七6口2、根據(jù)11111]1條用戶(hù)評(píng)論的¥(^(11^81111:和?631:11代提取每條評(píng)論的關(guān)鍵詞集 Keywordsi:
[0314] 提取Keywordsi方法:找到Feature!中為動(dòng)詞、名詞和形容詞詞性所有的元素下標(biāo), 并將Keywordsi中對(duì)應(yīng)下標(biāo)所有元素 Wj/f j存入Keywordsi:
[0315] 本實(shí)施例中,Keywordso= {},Keywordsi= {彭江/nr};
[0316] Step3、定義每次迭代條數(shù)index ( index必須滿(mǎn)足不大于num),總迭代次數(shù) L=[num/inde>c |,初始化當(dāng)前迭代次數(shù)current = 0:
[0317] 本實(shí)施例中,定義index = l,貝ljL = 2;
[0318] Step4、判斷current是否小于L:本實(shí)施例中,0〈2,執(zhí)行步驟Step5;
[0319] Step5、根據(jù)current與L,確定在第current次迭代時(shí),第一條評(píng)論所在條數(shù)f irst 和最后一條評(píng)論所在條數(shù)last,i = f irst:本實(shí)施例中,第0次時(shí)f irst = 0,last = 0,i = 0; [0320] Step6、判斷i是否小于或等于last:本實(shí)施例中,0〈 = 0,執(zhí)行步驟Step7;
[0321 ] Step7、判斷第i條評(píng)論的Keywordsi是否為空:本實(shí)施例中,第0條評(píng)論的Keywordso 為空,執(zhí)行步驟Stepl2;
[0322] Stepl2、第i條評(píng)論有關(guān)性標(biāo)記輸出為"無(wú)關(guān)",i++:本實(shí)施例中,第0條評(píng)論有關(guān)性 標(biāo)記輸出為"無(wú)關(guān)",i++ = l,執(zhí)行步驟Step6;
[0323] Step6、判斷i是否小于或等于last:本實(shí)施例中,1>0,執(zhí)行步驟Stepl3;
[0324] Stepl3、current++ = 1,執(zhí)行步驟 Step4;
[0325] Step4、判斷current是否小于L:本實(shí)施例中,1〈2,執(zhí)行步驟Step5;
[0326] Step5、根據(jù)current與L,確定在第current次迭代時(shí),第一條評(píng)論所在條數(shù)f irst 和最后一條評(píng)論所在條數(shù)1381:,1=;1^;^81::本實(shí)施例中,第1次時(shí);1^;^8丨=1,138丨=1,1 = 1; [0327] Step6、判斷i是否小于或等于last:本實(shí)施例中,1〈 = 1,執(zhí)行步驟Step7;
[0328] Step7、判斷第i條評(píng)論的Keywordsi是否為空:本實(shí)施例中,第1條評(píng)論的Keywordsi 不為空,執(zhí)行步驟Step8;
[0329] Step8、根據(jù)第first 條評(píng)論的Keywordsi 提取被測(cè)詞集 Testi= {ti,t2,…,tk} (k = 0,1,2,…,u_l):本實(shí)施例中,Testi = {彭江},TestFeaturei = {nr},isAllAdjust = false; [0330] Step9、計(jì)算第i條評(píng)論得分score,并將其特征詞存入對(duì)應(yīng)的特征庫(kù):
[0331] 本實(shí)施例中,此時(shí)名詞特征庫(kù)中平均特征頻avgn為4.819,則了68以的¥〇其對(duì)應(yīng)的!11 = 4.819,N〇=l,times〇 = 1,計(jì)算第 1 條評(píng)論 score = 0 · 815;
[0332] SteplO、判斷score是否大于閾值α,本實(shí)施例中,〇.815〈1,執(zhí)行步驟Stepl2;
[0333] Stepl2、第i條評(píng)論有關(guān)性標(biāo)記輸出為"無(wú)關(guān)",i++:本實(shí)施例中,第0條評(píng)論有關(guān)性 標(biāo)記輸出為"無(wú)關(guān)",i++ = l,執(zhí)行步驟Step6;
[0334] Step6、判斷i是否小于或等于last:本實(shí)施例中,2>1,執(zhí)行步驟Stepl3;
[0335] Stepl 3、current++ = 2,執(zhí)行步驟 Step4;
[0336] Step4、判斷current是否小于L:本實(shí)施例中,2 = 2,執(zhí)行步驟Stepl4;
[0337] Stepl4、輸出"完成所有迭代"。
[0338] 實(shí)施例11:如圖1-5所示,
[0339] APP軟件用戶(hù)評(píng)論如表11所示,
[0340] 表11
[0341]
[0342] 所述APP軟件用戶(hù)評(píng)論有關(guān)性判斷方法的具體步驟如下:
[0343] Stepl、提取APP軟件num條用戶(hù)評(píng)論,以及每條用戶(hù)評(píng)論的評(píng)論分詞結(jié)果集 WordResulti= {w〇/f〇,wi/fi,…,評(píng)論分詞詞性集Featurei= ,其中Wj為 詞,fj為詞性(i = 〇,l,…,num-1,j = 0,l,…,n-l):
[0344] 本實(shí)施例中,WordResul t〇= {后臺(tái)/η,運(yùn)行/vn,就/d,收/v,不/d,至lj/v,信息/η,提 不/ν,什么/ry,情況/n,?/ww},F(xiàn)eature〇= {n,vn,d,v,d,v,n,v,ry,n,ww},WordResulti = {愛(ài)/v,馬仕/nr},F(xiàn)eaturei= {v,nr},此時(shí)num=2〇
[0345] 3丨6口2、根據(jù)11111]1條用戶(hù)評(píng)論的¥(^(11^81111:和?631:11代提取每條評(píng)論的關(guān)鍵詞集 Keywordsi:
[0346] 提取Keywordsi方法:找到Feature!中為動(dòng)詞、名詞和形容詞詞性所有的元素下標(biāo), 并將Keywordsi中對(duì)應(yīng)下標(biāo)所有元素 Wj/fj存入Keywordsi:
[0347] 本實(shí)施例中,Keywords。= {后臺(tái)/η,運(yùn)行/vn,收/v,至lj/ν,信息/η,提示/v,情況/ n},Keywordsi= {愛(ài)/v,馬仕/nr};
[0348] Step3、定義每次迭代條數(shù)index ( index必須滿(mǎn)足不大于num),總迭代次數(shù) L_=〖.num/indexj,.初始化當(dāng)前迭代次數(shù)current = 0:
[0349] 本實(shí)施例中,定義index = l,則L = 2;
[0350] Step4、判斷current是否小于L:本實(shí)施例中,0〈2,執(zhí)行步驟Step5;
[0351 ] Step5、根據(jù)current與L,確定在第current次迭代時(shí),第一條評(píng)論所在條數(shù)f irst 和最后一條評(píng)論所在條數(shù)last,i = f irst:本實(shí)施例中,第0次時(shí)f irst = 0,last = 0,i = 0;
[0352] Step6、判斷i是否小于或等于last:本實(shí)施例中,0〈 = 0,執(zhí)行步驟Step7;
[0353] Step7、判斷第i條評(píng)論的Keywordsi是否為空:本實(shí)施例中,第0條評(píng)論的Keywords。 不為空,執(zhí)行步驟Step8;
[0354] Step8、根據(jù)第first 條評(píng)論的Keywordsi 提取被測(cè)詞集 Testi= {ti,t2,…,tk} (k = 0,1,2,…,u-1):本實(shí)施例中,Test〇= {后臺(tái),運(yùn)行,收,至丨」,信息,提示,情況},TestFeature〇 = {n,vn,v,v,n,v,n},isAllAdjust = false;
[0355] Step9、計(jì)算第i條評(píng)論得分score,并將其特征詞存入對(duì)應(yīng)的特征庫(kù):
[0356] 本實(shí)施例中,此時(shí)動(dòng)詞特征庫(kù)中平均特征頻數(shù)avgv為7.314,名詞特征庫(kù)中平均特 征頻數(shù)avg n為4 · 667,貝ijTesto的w〇其對(duì)應(yīng)的m = 4 · 667,N〇 = 1,times〇 = 11; wi對(duì)應(yīng)的m = 7 · 314,Νι = 1,timesi = 11;W2對(duì)應(yīng)的m = 7 · 314,N2 = 2,times2 = 11;W3對(duì)應(yīng)的m = 7 · 314,N3 = l,times3 = 19;W4)^i^9m = 4.667,N4=l,times4=ll,;W5)^i^9m = 7.314,N5 = l,times5 = 11; W6 對(duì)應(yīng)的m=4 · 667,N6 = 1,t imes6 = 11,計(jì)算第0條評(píng)論score = 767 · 26;
[0357] SteplO、判斷score是否大于閾值α,本實(shí)施例中,767.26>1,執(zhí)行步驟Stepll;
[0358] Stepll、第i條評(píng)論有關(guān)性標(biāo)記輸出為"有關(guān)",i++:本實(shí)施例中,第0條評(píng)論有關(guān)性 標(biāo)記輸出為"有關(guān)",i++ = l,執(zhí)行步驟Step6;
[0359] Step6、判斷i是否小于或等于last:本實(shí)施例中,1>0,執(zhí)行步驟Stepl3;
[0360] Stepl3、current++ = 1,執(zhí)行步驟 Step4;
[0361 ] Step4、判斷current是否小于L:本實(shí)施例中,1〈2,執(zhí)行步驟Step5;
[0362] Step5、根據(jù)current與L,確定在第current次迭代時(shí),第一條評(píng)論所在條數(shù)f irst 和最后一條評(píng)論所在條數(shù)1381:,1=;1^;^81::本實(shí)施例中,第1次時(shí);1^;^8丨=1,138丨=1,1 = 1; [0363] Step6、判斷i是否小于或等于last:本實(shí)施例中,1〈 = 1,執(zhí)行步驟Step7;
[0364] Step7、判斷第i條評(píng)論的Keywordsi是否為空:本實(shí)施例中,第1條評(píng)論的Keywordsi 不為空,執(zhí)行步驟Step8;
[0365] Step8、根據(jù)第first 條評(píng)論的Keywordsi 提取被測(cè)詞集 Testi= {ti,t2,…,tk} (k = 0,1,2,…,u_l):本實(shí)施例中,丁〇81:1={愛(ài),馬仕},TestFeaturei = {v,nr},isAllAd just = false;
[0366] Step9、計(jì)算第i條評(píng)論得分score,并將其特征詞存入對(duì)應(yīng)的特征庫(kù):
[0367] 本實(shí)施例中,此時(shí)動(dòng)詞特征庫(kù)中平均特征頻數(shù)avgv為7.429,名詞特征庫(kù)中平均特 征頻3¥811為4.778,貝丨打681:1的¥()其對(duì)應(yīng)的111=7.429,他=1,1:;[11168() = 4,¥1其對(duì)應(yīng)的111=4.778, N0= 1,times0= 1,計(jì)算第1 條評(píng)論 score = 0 · 878;
[0368] SteplO、判斷score是否大于閾值α,本實(shí)施例中,0.878〈1,執(zhí)行步驟3七6?12;
[0369] Stepl2、第i條評(píng)論有關(guān)性標(biāo)記輸出為"無(wú)關(guān)",i++:本實(shí)施例中,第0條評(píng)論有關(guān)性 標(biāo)記輸出為"無(wú)關(guān)",i++ = l,執(zhí)行步驟Step6;
[0370] Step6、判斷i是否小于或等于last:本實(shí)施例中,2>1,執(zhí)行步驟Stepl3;
[0371 ] Stepl3、current++ = 2,執(zhí)行步驟 Step4;
[0372] Step4、判斷current是否小于L:本實(shí)施例中,2 = 2,執(zhí)行步驟Stepl4;
[0373] Stepl4、輸出"完成所有迭代"。
[0374] 實(shí)施例12:如圖1-5所示,
[0375] APP軟件用戶(hù)評(píng)論如表12所示,
[0376] 表12
[0377]
L〇378」所述APP軟仵用尸評(píng)論有夫性判斷萬(wàn)法的具體步驟如卜:
[0379] Stepl、提取APP軟件num條用戶(hù)評(píng)論,以及每條用戶(hù)評(píng)論的評(píng)論分詞結(jié)果集 WordResulti= {wo/fo,wi/fi,…,評(píng)論分詞詞性集Featurei= …灼},其中Wj為 詞,fj為詞性(i = 〇,l,…,num-1,j = 0,l,…,n-l):
[0380] 本實(shí)施例中,WordResulto= {很/d,愛(ài)/v},F(xiàn)eatureo= {d,v},WordResulti= {嘎 嘎/〇},F(xiàn)eaturei= {〇},此時(shí)num=2〇
[0381 ] 3七6口2、根據(jù)11111]1條用戶(hù)評(píng)論的¥(^(11^81111:和?631:11代提取每條評(píng)論的關(guān)鍵詞集 Keywordsi :
[0382] 提取Keywordsi方法:找到Featurei中為動(dòng)詞、名詞和形容詞詞性所有的元素下標(biāo), 并將Keywordsi中對(duì)應(yīng)下標(biāo)所有元素 Wj/f j存入Keywordsi:
[0383] 本實(shí)施例中,Keywordso= {愛(ài)/v},Keywordsi= {};
[0384] Step3、定義每次迭代條數(shù)index ( index必須滿(mǎn)足不大于num),總迭代次數(shù) L=[!ium/index |,初始化當(dāng)前迭代次數(shù)current = 0:
[0385] 本實(shí)施例中,定義index = l,則L = 2;
[0386] Step4、判斷current是否小于L:本實(shí)施例中,0〈2,執(zhí)行步驟Step5;
[0387] Step5、根據(jù)current與L,確定在第current次迭代時(shí),第一條評(píng)論所在條數(shù)f irst 和最后一條評(píng)論所在條數(shù)last,i = f irst:本實(shí)施例中,第0次時(shí)f irst = 0,last = 0,i = 0; [0388] Step6、判斷i是否小于或等于last:本實(shí)施例中,0〈 = 0,執(zhí)行步驟Step7;
[0389] Step7、判斷第i條評(píng)論的Keywordsi是否為空:本實(shí)施例中,第0條評(píng)論的Keywordso 不為空,執(zhí)行步驟Step8;
[0390] Step8、根據(jù)第first 條評(píng)論的Keywordsi 提取被測(cè)詞集 Testi= {ti,t2,…,tk} (k = 0,1,2,…,u_l):本實(shí)施例中,Testo= {愛(ài)},TestFeatureo = {v},isAllAdjust = false;
[0391 ] Step9、計(jì)算第i條評(píng)論得分score,并將其特征詞存入對(duì)應(yīng)的特征庫(kù):
[0392] 本實(shí)施例中,此時(shí)動(dòng)詞特征庫(kù)中平均特征頻數(shù)avgv為7.457,則Testo的wo其對(duì)應(yīng)的 m = 7 · 457,N〇= 1,times〇 = 5,計(jì)算第 0條評(píng)論 score = 1 · 205;
[0393] SteplO、判斷score是否大于閾值α,本實(shí)施例中,1 ·205>1,執(zhí)行步驟Stepll;
[0394] Stepll、第i條評(píng)論有關(guān)性標(biāo)記輸出為"有關(guān)",i++:本實(shí)施例中,第0條評(píng)論有關(guān)性 標(biāo)記輸出為"有關(guān)",i++ = l,執(zhí)行步驟Step6;
[0395] Step6、判斷i是否小于或等于last:本實(shí)施例中,1>0,執(zhí)行步驟Stepl3;
[0396] Stepl3、current++ = 1,執(zhí)行步驟 Step4;
[0397] Step4、判斷current是否小于L:本實(shí)施例中,1〈2,執(zhí)行步驟Step5;
[0398] Step5、根據(jù)current與L,確定在第current次迭代時(shí),第一條評(píng)論所在條數(shù)f irst 和最后一條評(píng)論所在條數(shù)1381:,1=;1^;^81::本實(shí)施例中,第1次時(shí);1^;^8丨=1,138丨=1,1 = 1; [0399] Step6、判斷i是否小于或等于last:本實(shí)施例中,1〈 = 1,執(zhí)行步驟Step7;
[0400] Step7、判斷第i條評(píng)論的Keywordsi是否為空:本實(shí)施例中,第1條評(píng)論的Keywordsi 為空,執(zhí)行步驟Stepl2;
[0401] Stepl2、第i條評(píng)論有關(guān)性標(biāo)記輸出為"無(wú)關(guān)",i++:本實(shí)施例中,第0條評(píng)論有關(guān)性 標(biāo)記輸出為"無(wú)關(guān)",i++ = l,執(zhí)行步驟Step6;
[0402] Step6、判斷i是否小于或等于last:本實(shí)施例中,2>1,執(zhí)行步驟Stepl3;
[0403] Step 13、current++ = 2,執(zhí)行步驟 Step4;
[0404] Step4、判斷current是否小于L:本實(shí)施例中,2 = 2,執(zhí)行步驟Stepl4;
[0405] Stepl4、輸出"完成所有迭代"。
[0406] 實(shí)施例13:如圖1-5所示,
[0407] APP軟件用戶(hù)評(píng)論如表13所示,
[0408]表13
[0409]
[0410] 所述APP軟件用戶(hù)評(píng)論有關(guān)性判斷方法的具體步驟如下:
[0411] Stepl、提取APP軟件num條用戶(hù)評(píng)論,以及每條用戶(hù)評(píng)論的評(píng)論分詞結(jié)果集 WordResulti= {w〇/f〇,wi/fi,…,評(píng)論分詞詞性集Featurei= ,其中Wj為 詞,fj為詞性(i = 〇,l,…,num-1,j = 0,l,…,n-l):
[0412] 本實(shí)施例中,W〇rdResult〇= {太/d,好/a,了/y,!/wt,我/rr,非常/d,喜歡/vi}, Feature〇 = {d,a,y,wt,rr,d,vi},WordResulti= {只要/c,東西/n,好/a,,/wd,評(píng)價(jià)/V,也/ d,會(huì)/v,高/a,,/wd,良心/n,品牌/n},F(xiàn)eaturei={c,n,a,wd,v,d,v,a,wd,n,n}, WordResult2= {不錯(cuò)/a,,/wd,值得/v,下載/v,!/wt},F(xiàn)eature2= {a,wd,v,v,wt}, WordResult3= {內(nèi)容/n,豐富/a,,/wd,出乎/V,我/rr,所/usuo,料/V,啊/y,!/wt},F(xiàn)eature3 ={n,a,wd,v,rr,usuo,v,y,wt},此時(shí)num = 4〇
[0413] 3七6口2、根據(jù)11111]1條用戶(hù)評(píng)論的¥(^(11^81111:和?631:11代提取每條評(píng)論的關(guān)鍵詞集 Keywordsi:
[0414] 提取Keywordsi方法:找到Feature!中為動(dòng)詞、名詞和形容詞詞性所有的元素下標(biāo), 并將WordResulti中對(duì)應(yīng)下標(biāo)所有元素 Wj/fj存入Keywordsi:
[0415] 本實(shí)施例中,Keywords〇= {好/a,喜歡/v},Keywordsi= {東西/n,好/a,評(píng)價(jià)/v,會(huì)/ v,高/a,良心/n,品牌/n},Keywords2 = {不錯(cuò)/a,值得/V,下載/v},Keywords3 = {內(nèi)容/n,豐 富/a,出乎/v,料/v};
[0416] Step3、定義每次迭代條數(shù)index ( index必須滿(mǎn)足不大于num),總迭代次數(shù) L==|num/index|,初始化當(dāng)前迭代次數(shù)current = 0:
[0417] 本實(shí)施例中,定義index = 2,則L = 2;
[0418] Step4、判斷current是否小于L:本實(shí)施例中,0〈2,執(zhí)行步驟Step5;
[0419] Step5、根據(jù)current與L,確定在第current次迭代時(shí),第一條評(píng)論所在條數(shù)f irst 和最后一條評(píng)論所在條數(shù)last,i = f irst:本實(shí)施例中,第0次時(shí)f irst = 0,last = 1,i = 0;
[0420] Step6、判斷i是否小于或等于last:本實(shí)施例中,0〈 = 1,執(zhí)行步驟Step7;
[0421 ] Step7、判斷第i條評(píng)論的Keywordsi是否為空:本實(shí)施例中,第0條評(píng)論的Keywords。 不為空,執(zhí)行步驟Step8;
[0422] Step8、根據(jù)第first 條評(píng)論的Keywordsi 提取被測(cè)詞集 Testi= {ti,t2,…,tk} (k = 0,1,2,…,u_l):本實(shí)施例中,Test。= {喜歡},TestFeatureo= {v},isAllAd just = false,u =1;
[0423] Step9、計(jì)算第i條評(píng)論得分score,并將其特征詞存入對(duì)應(yīng)的特征庫(kù):
[0424] 本實(shí)施例中,此時(shí)動(dòng)詞特征庫(kù)中平均特征頻數(shù)avgv為7.457,則Testo的wo其對(duì)應(yīng)的 m = 7 · 457,N〇= 1,times〇 = 5,u= 1,計(jì)算第 0 條評(píng)論 score = 1 · 205;
[0425] SteplO、判斷score是否大于閾值α,本實(shí)施例中,1 ·205>1,執(zhí)行步驟Stepll;
[0426] Stepll、第i條評(píng)論有關(guān)性標(biāo)記輸出為"有關(guān)",i++:本實(shí)施例中,第0條評(píng)論有關(guān)性 標(biāo)記輸出為"有關(guān)",i++ = l,執(zhí)行步驟Step6;
[0427] Step6、判斷i是否小于或等于last:本實(shí)施例中,1〈 = 1,執(zhí)行步驟Step7;
[0428] Step7、判斷第i條評(píng)論的Keywordsi是否為空:本實(shí)施例中,第1條評(píng)論的Keywordsi 不為空,執(zhí)行步驟Step8;
[0429] Step8、根據(jù)第first 條評(píng)論的Keywordsi 提取被測(cè)詞集 Testi= {ti,t2,…,tk} (k = 0,1,2,…,u-1):本實(shí)施例中,Testi = {東西,評(píng)價(jià),會(huì),良心,品牌},TestFeaturei = {n,v,v, n,n},isAllAdjust = false,u = 5;
[0430] Step9、計(jì)算第i條評(píng)論得分score,并將其特征詞存入對(duì)應(yīng)的特征庫(kù):
[0431 ]本實(shí)施例中,此時(shí)動(dòng)詞特征庫(kù)中平均特征頻數(shù)avgv為7.457,名詞特征庫(kù)中平均特 征頻數(shù)avgn為4 · 975,Testi的wo其對(duì)應(yīng)的m = 4 · 975,N〇 = 1,times〇 = 20 ; wi其對(duì)應(yīng)的m = 7.457,他=2,1:;[111681 = 32;¥2其對(duì)應(yīng)的111 = 7.457,犯=2,1:;[111682 = 30;¥3其對(duì)應(yīng)的111 = 4.975, N3 = 0,times3 = 0; W4 其對(duì)應(yīng)的 m = 4 · 975,N4 = 1,times4= 12,u = 5,計(jì)算第1 條評(píng)論score = 132.9181;
[0432] SteplO、判斷score是否大于閾值α,本實(shí)施例中,132.918D1,執(zhí)行步驟Stepll;
[0433] Stepll、第i條評(píng)論有關(guān)性標(biāo)記輸出為"有關(guān)",i++:本實(shí)施例中,第0條評(píng)論有關(guān)性 標(biāo)記輸出為"有關(guān)",i++ = 2,執(zhí)行步驟Step6;
[0434] Step6、判斷i是否小于或等于last:本實(shí)施例中,2>1,執(zhí)行步驟Stepl3;
[0435] Stepl3、current++ = 1,執(zhí)行步驟 Step4;
[0436] Step4、判斷current是否小于L:本實(shí)施例中,1〈2,執(zhí)行步驟Step5;
[0437] Step5、根據(jù)current與L,確定在第current次迭代時(shí),第一條評(píng)論所在條數(shù)f irst 和最后一條評(píng)論所在條數(shù)last,i = first:本實(shí)施例中,第1次時(shí)first = 2,last = 3,i = 2; [0438] Step6、判斷i是否小于或等于last:本實(shí)施例中,2〈 = 3,執(zhí)行步驟Step7;
[0439] Step7、判斷第i條評(píng)論的Keywordsi是否為空:本實(shí)施例中,第2條評(píng)論的Keywords。 不為空,執(zhí)行步驟Step8;
[0440] Step8、根據(jù)第first 條評(píng)論的Keywordsi 提取被測(cè)詞集 Testi = {ti,t2,…,tk} (k = 0,1,2,…,u_l):本實(shí)施例中,Test2= {值得,下載},TestFeature2= {v,v},isAllAdjust = false,u = 2;
[0441 ] Step9、計(jì)算第i條評(píng)論得分score,并將其特征詞存入對(duì)應(yīng)的特征庫(kù):
[0442] 本實(shí)施例中,此時(shí)動(dòng)詞特征庫(kù)中平均特征頻數(shù)avgv為7.594,則Test 2的wo其對(duì)應(yīng)的 m = 7 · 594,N〇 = 1,times〇 = 11 ;wi其對(duì)應(yīng)的 m = 7 · 594,N〇 = 2,times〇 = 36,u = 2,計(jì)算第2 條評(píng) 論score = 10·836;
[0443] SteplO、判斷score是否大于閾值α,本實(shí)施例中,10.836>1,執(zhí)行步驟Stepll;
[0444] Stepll、第i條評(píng)論有關(guān)性標(biāo)記輸出為"有關(guān)",i++:本實(shí)施例中,第0條評(píng)論有關(guān)性 標(biāo)記輸出為"有關(guān)",i++ = 3,執(zhí)行步驟Step6;
[0445] Step6、判斷i是否小于或等于last:本實(shí)施例中,3〈 = 3,執(zhí)行步驟Step7;
[0446] Step7、判斷第i條評(píng)論的Keywordsi是否為空:本實(shí)施例中,第3條評(píng)論的Keywords3 不為空,執(zhí)行步驟Step8;
[0447] Step8、根據(jù)第first 條評(píng)論的Keywordsi 提取被測(cè)詞集 Testi= {ti,t2,…,tk} (k = 0,1,2,…,u-1):本實(shí)施例中,Test3={內(nèi)容,出乎,料},TestFeature3={n,v,v}, isAllAdjust = false,u = 3;
[0448] Step9、計(jì)算第i條評(píng)論得分score,并將其特征詞存入對(duì)應(yīng)的特征庫(kù):
[0449] 本實(shí)施例中,此時(shí)動(dòng)詞特征庫(kù)中平均特征頻數(shù)avgv為8.004,名詞特征庫(kù)中平均特 征頻數(shù)avgn為5 · 100,Test3的wo其對(duì)應(yīng)的m = 5 · 100,N〇 = 2,times〇 = 34 ;wi其對(duì)應(yīng)的m = 8.004,~=1,1:;[1116 81 = 4;¥2其對(duì)應(yīng)的111 = 8.004,% = 1,1:;[1116 82 = 8,11 = 3,計(jì)算第3條評(píng)論 score = ll .657;
[0450] SteplO、判斷score是否大于閾值α,本實(shí)施例中,11 ·657>1,執(zhí)行步驟Stepll;
[0451] Stepll、第i條評(píng)論有關(guān)性標(biāo)記輸出為"有關(guān)",i++:本實(shí)施例中,第0條評(píng)論有關(guān)性 標(biāo)記輸出為"有關(guān)",i++ = 4,執(zhí)行步驟Step6;
[0452] Step6、判斷i是否小于或等于last:本實(shí)施例中,4>3,執(zhí)行步驟Stepl3;
[0453] Step 13、current++ = 2,執(zhí)行步驟 Step4;
[0454] Step4、判斷current是否小于L:本實(shí)施例中,2 = 2,執(zhí)行步驟Stepl4;
[0455] Stepl4、輸出"完成所有迭代"。
[0456] 詞性解釋?zhuān)?br>[0457] η名詞,t時(shí)間詞,s處所詞,f方位詞,v動(dòng)詞,a形容詞,b區(qū)別詞,z狀態(tài)詞,r代詞,m數(shù) 詞,q量詞,d副詞,p介詞,c連詞,u助詞,e嘆詞,y語(yǔ)氣詞,〇擬聲詞,h前綴,X字符串,w標(biāo)點(diǎn)符 號(hào)。
[0458] 實(shí)施例14:如圖1-5所示,一種APP軟件用戶(hù)評(píng)論有關(guān)性判斷方法,首先提取APP軟 件每條評(píng)論的關(guān)鍵詞集;然后計(jì)算提取的APP軟件每條評(píng)論的關(guān)鍵詞集對(duì)特征庫(kù)中的有關(guān) 性概率得分;最后通過(guò)判斷有關(guān)性概率得分是否大于預(yù)設(shè)閾值的情況來(lái)確定APP軟件用戶(hù) 評(píng)論是否與該APP軟件有關(guān)。
[0459] 上面結(jié)合附圖對(duì)本發(fā)明的【具體實(shí)施方式】作了詳細(xì)說(shuō)明,但是本發(fā)明并不限于上述 實(shí)施方式,在本領(lǐng)域普通技術(shù)人員所具備的知識(shí)范圍內(nèi),還可以在不脫離本發(fā)明宗旨的前 提下做出各種變化。
【主權(quán)項(xiàng)】
1. 一種APP軟件用戶(hù)評(píng)論有關(guān)性判斷方法,其特征在于:首先提取APP軟件每條評(píng)論的 關(guān)鍵詞集;然后計(jì)算提取的APP軟件每條評(píng)論的關(guān)鍵詞集對(duì)特征庫(kù)中的有關(guān)性概率得分;最 后通過(guò)判斷有關(guān)性概率得分是否大于預(yù)設(shè)闊值的情況來(lái)確定APP軟件用戶(hù)評(píng)論是否與該 APP軟件有關(guān)。2. 根據(jù)權(quán)利要求1所述的APP軟件用戶(hù)評(píng)論有關(guān)性判斷方法,其特征在于:所述方法的 具體步驟如下: Stepl、提取APP軟件ruim條用戶(hù)評(píng)論,W及每條用戶(hù)評(píng)論的評(píng)論分詞結(jié)果集WordResulti ={wo/fo,wiAfi,…,Wj化},評(píng)論分詞詞性集Featurei = ...fj};其中Wj為詞,fj為詞性 (i = 0,l,…,num-1,j = 0,l,…,n-l),n為分詞W后詞的個(gè)數(shù); Step2、根據(jù)num條用戶(hù)評(píng)論的WordResulti和Featurei提取每條評(píng)論的關(guān)鍵詞集 Keywords!: 提取Keywords巧法:找到Featurei中為動(dòng)詞、名詞和形容詞詞性所有的元素下標(biāo),并將 WordResulti中對(duì)應(yīng)下標(biāo)所有元素 Wj/f j存入Keywordsi; Step3、判斷current是否小于L,如果是,則執(zhí)行步驟Step4;否則,執(zhí)行步驟Stepl3;其 中,總迭代次數(shù)L= Lnum,''index I,index表示每次迭代條數(shù)且滿(mǎn)足不大于num,初始時(shí)的當(dāng)前迭 代次數(shù) current = 0; Step4、根據(jù)current與L,確定在第current次迭代時(shí),第一條評(píng)論所在條數(shù)first、最后 一條評(píng)論所在條數(shù)last、i = f irst; 其中,f irst = current*index;當(dāng)current = L-l時(shí),1曰st = num;否卯J,1曰st= (current+ l)*index-l; Step5、判斷i是否小于或等于last,如果是,則執(zhí)行步驟Step6;否則,執(zhí)行步驟Stepl2; Step6、判斷第i條評(píng)論的Keywordsi是否為空,如果是,則執(zhí)行步驟Stepll;否則執(zhí)行步 驟Step7; Step7、根據(jù)第first條評(píng)論的Keywordsi提取被測(cè)詞集Testi = ,tkKk = 0,1, 2,...,11-1): 當(dāng)Keywordsi中所有元素 wkパk中fk都為形容詞,則將其所有wk存入Testi,否則,對(duì)元素 wk/fk中fk為動(dòng)詞、名詞的元素,將其wk存入化sti,fk存入判斷詞性集Tes巧'eaturei; steps、計(jì)算第i條評(píng)論有關(guān)性概率得分score,并將其特征詞存入對(duì)應(yīng)的特征庫(kù):;其中,第i條評(píng)論中包含被測(cè)詞wk的特征庫(kù)中文本個(gè)數(shù)Nk化= 0,1,2,…,U-1),文檔個(gè)數(shù)N=4,wk在對(duì)應(yīng)特征庫(kù)中出現(xiàn)頻數(shù)為timesk,wk在對(duì)應(yīng)特征庫(kù)中平 均特征頻數(shù)為m,u為T(mén)esti的元素個(gè)數(shù); Step9、判斷有關(guān)性概率得分score是否大于闊值α,如果是,則執(zhí)行步驟SteplO;否則執(zhí) 行步驟Stepll; St邱10、第i條評(píng)論有關(guān)性標(biāo)記輸出為"有關(guān)",i++,執(zhí)行步驟steps: St邱11、第i條評(píng)論有關(guān)性標(biāo)記輸出為"無(wú)關(guān)",i++,執(zhí)行步驟steps; St 邱 12、cu;rrent++,執(zhí)行步驟 Step3; St邱13、輸出"完成所有迭代"。3.根據(jù)權(quán)利要求2所述的APP軟件用戶(hù)評(píng)論有關(guān)性判斷方法,其特征在于:所述α = 1。
【文檔編號(hào)】G06F17/30GK105975487SQ201610264134
【公開(kāi)日】2016年9月28日
【申請(qǐng)日】2016年4月26日
【發(fā)明人】姜瑛, 向祺鑫, 冉猛, 李凌宇, 丁家滿(mǎn), 汪海濤, 劉英莉
【申請(qǐng)人】昆明理工大學(xué)