微博中網(wǎng)絡(luò)新詞抽取方法和微博情感分析方法及系統(tǒng)的制作方法
【專利摘要】本發(fā)明公開了一種針對網(wǎng)絡(luò)微博進(jìn)行情感分析的方法,針對傳統(tǒng)情感分析中所存在的對突發(fā)事件多元化情感表示不足問題,提出了基于多維向量的表示模型來進(jìn)行情感分析的方法。結(jié)合臨床心理學(xué)情感檢測表抽取情感詞初始化情感分析向量,其次利用基于大規(guī)模語料庫和統(tǒng)計(jì)的方法自動發(fā)現(xiàn)微博中的網(wǎng)絡(luò)新詞,自動吸收能表達(dá)情感的網(wǎng)絡(luò)新詞與情感標(biāo)識符,不斷擴(kuò)充情感向量,并建立情感向量的層次化結(jié)構(gòu);最后基于已有的向量模型,對微博文本進(jìn)行多角度情感分析和時序分析。
【專利說明】微博中網(wǎng)絡(luò)新詞抽取方法和微博情感分析方法及系統(tǒng)
【技術(shù)領(lǐng)域】
[0001]本發(fā)明屬于數(shù)據(jù)挖掘領(lǐng)域,尤其涉及針對微博數(shù)據(jù)的情感分析方法。
【背景技術(shù)】
[0002]隨著互聯(lián)網(wǎng)和通信技術(shù)的發(fā)展,以新聞報(bào)道為代表的長文本已經(jīng)不再是人們獲得信息源的唯一途徑?!?010年中國互聯(lián)網(wǎng)輿情分析報(bào)告》調(diào)查顯示,2010年年度網(wǎng)絡(luò)熱點(diǎn)事件中關(guān)于“騰訊與360大戰(zhàn)”話題,新浪微博的回復(fù)量達(dá)到260萬條,“上海世博會”的相關(guān)評論也達(dá)到106萬條,遠(yuǎn)遠(yuǎn)超過新聞報(bào)道、社區(qū)、論壇的數(shù)目。2011年7月23日溫州動車事件,新浪微博相關(guān)評論達(dá)到282萬,騰訊微博也有684萬回復(fù)量??梢娢⒉┮呀?jīng)成為社會輿論傳播的重要媒介之一,對微博進(jìn)行情感分析,是掌握網(wǎng)民對突發(fā)事件的情感反饋的主要手段。
[0003]情感分析,又稱意見挖掘,是對帶有情感色彩的主觀性文本進(jìn)行分析、處理歸納和推理的過程。目前情感分析的主要研究點(diǎn)在于對文本的傾向性進(jìn)行分析,即挖掘網(wǎng)絡(luò)文本內(nèi)容蘊(yùn)含的各種情感、信念、態(tài)度、意見和情感等屬性信息。目前國內(nèi)外對于文本傾向性的研究從方法上可大致分為兩類:基于統(tǒng)計(jì)的文本傾向性研究方法和基于語義規(guī)則的文本傾向性研究方法。
[0004]基于統(tǒng)計(jì)的文本傾向性研究方法的核心思想是首先人工標(biāo)注一些文檔的傾向性,并將這些已標(biāo)注文檔作為訓(xùn)練集,再通過機(jī)器學(xué)習(xí)的方法構(gòu)造一個褒貶兩類分類器。最后使用構(gòu)造好的褒貶兩類分類器對待分析文檔進(jìn)行分類,從而識別出該文檔的傾向性。有研究者使用標(biāo)準(zhǔn)的機(jī)器學(xué)習(xí)技術(shù)對文本分類工作進(jìn)行了研究,比較了樸素貝葉斯(NativeBayes)、最大熵(Maximum Entropy)及支持向量機(jī)(Support Vector Machines)方法在文本分類上的效果,并提出了將分類結(jié)果按照語義傾向性強(qiáng)度進(jìn)行細(xì)分的方法。
[0005]基于語義規(guī)則的文本傾向性研究方法主要有兩種。第一種是先對待分析文本中的形容詞或能夠體現(xiàn)主觀色彩的短語進(jìn)行抽取,然后對抽取出來的形容詞或短語逐一進(jìn)行傾向性判斷并賦予一個傾向值,最后將上述所有傾向值累加起來得到文章的總體文本傾向性。有研究者對形容詞作傾向性分析,利用詞匯之間的連詞訓(xùn)練生成詞匯間的同義或反義傾向的連接圖,然后用聚類的方法將詞匯聚成褒義和貶義兩類。也有研究者使用兩個詞匯“excellent”與“poor”作為基準(zhǔn)詞來判斷其它詞匯的語義傾向,通過PMI_IR(PointwiseMutual Information and Information Retrieval,逐點(diǎn)互信息和信息檢索)方法,計(jì)算詞語的情感傾向值,根據(jù)給定的閾值把詞語劃分為褒義和貶義兩個類別。也有研究者直接使用已有的本體知識庫判斷詞的傾向性,如使用英文的WordNet及中文的HowNet來計(jì)算待估詞與已選定的基準(zhǔn)詞對的語義距離,進(jìn)而判斷待估詞的傾向性。第二種基于語義的文本傾向性的研究方法是預(yù)先建立一個傾向性語義模式庫,有時還會附帶一個傾向性字典。然后將待估文檔參照語義模式庫做模式匹配,最后累加所有匹配模式對應(yīng)的傾向性值從而得到整個文檔的傾向性。
[0006]上述研究無論采用監(jiān)督學(xué)習(xí)還是無監(jiān)督學(xué)習(xí)的方法,其對文本的情感分析都可以抽象成一個三元分類問題,即將文本的情感分為積極、消極、中立(或者正面、負(fù)面、中立)。實(shí)際上,用戶在同一文本中往往體現(xiàn)出多元化的情感,例如微博“此次汶川地震我深深被大自然的力量震驚了,深切同情遇難同胞,,實(shí)際上體現(xiàn)出了兩種情感“震驚”與“同情”,傳統(tǒng)文本的三元分類對這種多元化的情感表征存在嚴(yán)重不足。目前,許多研究人員已經(jīng)意識到這個不足,例如有研究者針對博客采用向量的表示方法對多元化情感進(jìn)行建模,但其研究是基于表情符號來構(gòu)建向量,并未充分利用內(nèi)容信息進(jìn)行分析研究。
【發(fā)明內(nèi)容】
[0007]針對上述問題,本發(fā)明提出了一種基于能夠充分表征多元化情感的多維向量來對微博情感進(jìn)行分析的方法。
[0008]本發(fā)明的目的是通過以下技術(shù)方案實(shí)現(xiàn)的:
[0009]一方面,本發(fā)明提供了一種微博情感分析方法,該方法包括
[0010]步驟1,確定情感向量E,所述情感向量E由多個能夠表示情感的情感詞構(gòu)成;
[0011]步驟2,對于待分析的每條博文M,建立該博文的情感向量Em = <xM1,XM2,-,XMi,-> ;其中,如果情感向量E中第i個情感詞屬于該博文M的關(guān)鍵詞集合,則Em中對應(yīng)的第i個元素XMi取值為I,否則取值為O ;
[0012]步驟3,基于博文的情感向量來得到對事件的情感分布。
[0013]上述方法中,所述步驟I中所述情感向量E中的情感詞可以是從臨床心理學(xué)中的情感檢測表中抽取出的能夠表示情感的情感詞。
[0014]上述方法中,所述步驟I中所述情感向量E中還可包括能表達(dá)情感的表情符號。
[0015]上述方法中,所述步驟I還可包括對微博數(shù)據(jù)流進(jìn)行監(jiān)測,定期從微博語料庫中抽取網(wǎng)絡(luò)新詞,并從中選擇能表示情感的網(wǎng)絡(luò)新詞添加到情感向量E中。
[0016]上述方法中,所述從微博語料庫中抽取網(wǎng)絡(luò)新詞可包括以下步驟:
[0017]步驟I)基于N-gram將微博語料庫中的每條博文切分成多個候選詞,從而形成候選詞集合;
[0018]步驟2)從候選詞集合中刪除詞典中已有的詞;
[0019]步驟3)從候選詞集合中選擇出現(xiàn)頻率高的前K個候選詞并計(jì)算其互信息;
[0020]步驟4)從所述K個候選詞中選擇其互信息大于互信息閾值的候選詞來構(gòu)成網(wǎng)絡(luò)新詞候選集。
[0021]上述方法中,還可包括步驟5)分別對兩個或更多個微博語料庫執(zhí)行步驟I)至4)以得到多個網(wǎng)絡(luò)新詞候選集,并選擇在多個網(wǎng)絡(luò)新詞候選集中共同出現(xiàn)的詞作為網(wǎng)絡(luò)新
ο
[0022]上述方法中,在所述步驟I)之前還可包括對微博語料庫進(jìn)行預(yù)處理的步驟,其包括:對于僅轉(zhuǎn)發(fā)的博文,進(jìn)行直接合并,只保留一個樣本;對于轉(zhuǎn)發(fā)并評論的博文,將轉(zhuǎn)發(fā)內(nèi)容去除,只保留評論內(nèi)容;對于拷貝信息源,提取主要關(guān)鍵詞,作為一條微博進(jìn)行處理。
[0023]上述方法中,所述步驟2)還可包括從候選詞集合中刪除出現(xiàn)頻率低于預(yù)定閾值的詞。
[0024]上述方法中,所述步驟3可包括對與事件相關(guān)的所有博文的情感向量求和,以分析在該事件中公眾的主流情感及在情感向量的各維度上的情感分布比例。[0025]上述方法中,還可包括基于情感向量E建立情感向量層次結(jié)構(gòu),所述情感向量層次結(jié)構(gòu)包括頂層、中間層、底層和傾向性層,其中底層為由多個情感詞構(gòu)成情感向量E,中間層是底層情感詞的聚類,并隸屬于頂層類別,頂層分為基本情緒、復(fù)合情緒和其他情緒三類型,傾向性層為每個情感詞的情感傾向,分為積極、消極、中立三類。
[0026]上述方法中,還可包括對于待分析的每條博文M,分別建立該博文的頂層情感向量、中間層情感向量、底層情感向量和傾向?qū)忧楦邢蛄康牟襟E,其中上層的情感向量可由下層的情感向量聚合而成。
[0027]上述方法中,所述步驟3還可包括將博文的情感向量按照時間粒度進(jìn)行聚合,以得到情感隨時間的變化趨勢。
[0028]上述方法中,所述步驟3還可包括基于所建立的博文的情感向量,統(tǒng)計(jì)各個事件中屬于各情感的博文占與該事件相關(guān)的所有博文的比例。
[0029]又一方面,本發(fā)明提供了一種微博情感分析系統(tǒng),包括:
[0030]情感向量確定模塊,用于確定情感向量E,所述情感向量E由多個能夠表示情感的情感詞構(gòu)成;
[0031]微博情感向量建立模塊,用于對于待分析的每條博文M,建立該博文的情感向量Em=〈XM1,XM2,…,XMi,…〉;其中,如果情感向量E中第i個情感詞屬于該博文M的關(guān)鍵詞集合,則Em中對應(yīng)的第i個元素XMi取值為1,否則取值為O ;
[0032]情感分析模塊,用于基于博文的情感向量來得到對事件的情感分布。
[0033]其中,所述情感向量確`定模塊還可用于對微博數(shù)據(jù)流進(jìn)行監(jiān)測,定期從微博語料庫抽取網(wǎng)絡(luò)新詞,并從中選擇能表示情感的網(wǎng)絡(luò)新詞添加到情感向量E中。
[0034]一方面,本發(fā)明提供了一種基于微博語料庫抽取網(wǎng)絡(luò)新詞的方法,所述方法包括:
[0035]步驟I)基于N-gram將微博語料庫中的每條博文切分成多個候選詞,從而形成候選詞集合;
[0036]步驟2)從候選詞集合中刪除詞典中已有的詞;
[0037]步驟3)從候選詞集合中選擇出現(xiàn)頻率高的前K個候選詞并計(jì)算其互信息;
[0038]步驟4)從所述K個候選詞中選擇其互信息大于互信息閾值的候選詞來構(gòu)成網(wǎng)絡(luò)新詞候選集。
[0039]上述抽取網(wǎng)絡(luò)新詞的方法還可包括步驟5)分別對兩個或更多個微博語料庫執(zhí)行步驟I)至4)以得到多個網(wǎng)絡(luò)新詞候選集,并選擇在多個網(wǎng)絡(luò)新詞候選集中共同出現(xiàn)的詞作為網(wǎng)絡(luò)新詞。
[0040]上述抽取網(wǎng)絡(luò)新詞的方法中,在所述步驟I)之前還可包括對微博語料庫進(jìn)行預(yù)處理的步驟,其包括:對于僅轉(zhuǎn)發(fā)的博文,進(jìn)行直接合并,只保留一個樣本;對于轉(zhuǎn)發(fā)并評論的博文,將轉(zhuǎn)發(fā)內(nèi)容去除,只保留評論內(nèi)容;對于拷貝信息源,提取主要關(guān)鍵詞,作為一條微博進(jìn)行處理。
[0041]上述抽取網(wǎng)絡(luò)新詞的方法,所述步驟2)還可包括從候選詞集合中刪除出現(xiàn)頻率低于預(yù)定閾值的詞。
[0042]又一方面,本發(fā)明提供了一種基于微博語料庫抽取網(wǎng)絡(luò)新詞的設(shè)備,所述設(shè)備包括:[0043]用于基于N-gram將微博語料庫中的每條博文切分成多個候選詞,從而形成候選詞集合的裝置;
[0044]用于從候選詞集合中刪除詞典中已有的詞的裝置;
[0045]用于從候選詞集合中選擇出現(xiàn)頻率高的前K個候選詞并計(jì)算其互信息的裝置;
[0046]用于從所述K個候選詞中選擇其互信息大于互信息閾值的候選詞來構(gòu)成網(wǎng)絡(luò)新詞候選集的裝置。
[0047]該設(shè)備還可包括用于從兩個或更多個微博語料庫得到多個網(wǎng)絡(luò)新詞候選集中選擇在多個網(wǎng)絡(luò)新詞候選集中共同出現(xiàn)的詞作為網(wǎng)絡(luò)新詞的裝置。
[0048]與現(xiàn)有技術(shù)相比,本發(fā)明的優(yōu)點(diǎn)在于:
[0049]基于能夠充分表征多元化情感的多維向量來對微博情感進(jìn)行分析,能有效對多元化情感進(jìn)行表示。采用與臨床心理學(xué)相結(jié)合的方法構(gòu)建情感向量,并對微博數(shù)據(jù)流進(jìn)行檢測,自動發(fā)現(xiàn)并吸收能表示情感的網(wǎng)絡(luò)新詞來更新情感向量,不僅具有一定的權(quán)威性,同時也可以保證情感向量的全面性。建立情感向量的層次化結(jié)構(gòu),避免了情感向量的稀疏性;同時基于情感向量的層次結(jié)構(gòu),可對微博進(jìn)行的多層次分析,能從不同角度反應(yīng)公眾對突發(fā)事件的情感態(tài)度。
【專利附圖】
【附圖說明】
[0050]以下參照附圖對本發(fā)明實(shí)施例作進(jìn)一步說明,其中:
[0051]圖1為根據(jù)本發(fā)明實(shí)施例的抽取網(wǎng)絡(luò)新詞的方法的流程圖;
[0052]圖2為根據(jù)本發(fā)明實(shí)施例的情感向量的層次化結(jié)構(gòu)示意圖;
[0053]圖3為根據(jù)本發(fā)明實(shí)施例的三種典型情感在不同事件上的分布圖;
[0054]圖4為根據(jù)本發(fā)明實(shí)施例的情感向量時序分析圖。
【具體實(shí)施方式】
[0055]為了使本發(fā)明的目的,技術(shù)方案及優(yōu)點(diǎn)更加清楚明白,以下結(jié)合附圖通過具體實(shí)施例對本發(fā)明進(jìn)一步詳細(xì)說明。應(yīng)當(dāng)理解,此處所描述的具體實(shí)施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。
[0056]在本發(fā)明的一個實(shí)施例中,提供了一種基于多維情感向量對微博進(jìn)行情感分析方法。在介紹該方法的【具體實(shí)施方式】之前,首先介紹下文中使用的微博情感向量的定義:對于每條博文M, M =〈Time, WordSet〉;其中Time (也可以簡記為T)表示博文M的發(fā)表時間;WordSet 表不博文 M 的關(guān)鍵詞集合,WordSet = (Keyfford1, Keyfford2,..., KeyffordJ ,Keyffordi (I≤ i≤ K)表示博文M經(jīng)分詞、去除停用詞后的關(guān)鍵詞;其中,K為大于O的整數(shù),其指示博文M中所含關(guān)鍵詞的個數(shù)。假設(shè)E為包含多個情感詞的情感向量,E = <word1,word2,......,wordN>,其中Wordi (I≤i≤N)表示第i個情感形容詞;N為大于O的整數(shù),
其指示情感向量E中包含的情感形容詞的個數(shù)。則相應(yīng)地對于博文M, M的情感向量Em可以表示為:Em = <XM1;XM2,……,XMn> ;其中,如果E中第i個情感詞屬于該博文M的關(guān)鍵詞集合,則Em中對應(yīng)的第i個元素XMi取值為1,否則取值為0,即:
[0057]
【權(quán)利要求】
1.一種微博情感分析方法,所述方法包括: 步驟1,確定情感向量E,所述情感向量E由多個能夠表示情感的情感詞構(gòu)成; 步驟2,對于待分析的每條博文M,建立該博文的情感向量Em=…,XMi,…〉;其中,如果情感向量E中第i個情感詞屬于該博文M的關(guān)鍵詞集合,則Em中對應(yīng)的第i個元素XMi取值為I,否則取值為O ; 步驟3,基于博文的情感向量來得到對事件的情感分布。
2.根據(jù)權(quán)利要求1所述的方法,所述步驟I中所述情感向量E中的情感詞是從臨床心理學(xué)中的情感檢測表中抽取出的能夠表示情感的情感詞。
3.根據(jù)權(quán)利要求1或2所述的方法,所述步驟I中所述情感向量E中還包括能表達(dá)情感的表情符號。
4.根據(jù)權(quán)利要求1所述的方法,所述步驟I還包括對微博數(shù)據(jù)流進(jìn)行監(jiān)測,定期從微博語料庫中抽取網(wǎng)絡(luò)新詞,并從中選擇能表示情感的網(wǎng)絡(luò)新詞添加到情感向量E中。
5.根據(jù)權(quán)利要求4所述的方法,所述從微博語料庫中抽取網(wǎng)絡(luò)新詞包括以下步驟: 步驟I)基于N-gram將微博語料庫中的每條博文切分成多個候選詞,從而形成候選詞集合; 步驟2)從候選詞集合中刪除詞典中已有的詞; 步驟3)從候選詞集合中選擇出現(xiàn)頻率高的前K個候選詞并計(jì)算其互信息; 步驟4)從所述K個候選詞中選擇其互信息大于互信息閾值的候選詞來構(gòu)成網(wǎng)絡(luò)新詞候選集。
6.根據(jù)權(quán)利要求5所述的方法,還包括步驟5)分別對兩個或更多個微博語料庫執(zhí)行步驟I)至4)以得到多個網(wǎng)絡(luò)新詞候選集,并選擇在多個網(wǎng)絡(luò)新詞候選集中共同出現(xiàn)的詞作為網(wǎng)絡(luò)新詞。
7.根據(jù)權(quán)利要求5或6所述的方法,在所述步驟I)之前還包括對微博語料庫進(jìn)行預(yù)處理的步驟,其包括:對于僅轉(zhuǎn)發(fā)的博文,進(jìn)行直接合并,只保留一個樣本;對于轉(zhuǎn)發(fā)并評論的博文,將轉(zhuǎn)發(fā)內(nèi)容去除,只保留評論內(nèi)容;對于拷貝信息源,提取主要關(guān)鍵詞,作為一條微博進(jìn)行處理。
8.根據(jù)權(quán)利要求5或6所述的方法,所述步驟2)還包括從候選詞集合中刪除出現(xiàn)頻率低于預(yù)定閾值的詞。
9.根據(jù)權(quán)利要求1所述的方法,所述步驟3包括對與事件相關(guān)的所有博文的情感向量求和,以分析在該事件中公眾的主流情感及在情感向量的各維度上的情感分布比例。
10.根據(jù)權(quán)利要求1所述的方法,還包括基于情感向量E建立情感向量層次結(jié)構(gòu),所述情感向量層次結(jié)構(gòu)包括頂層、中間層、底層和傾向性層,其中底層為由多個情感詞構(gòu)成情感向量E,中間層是底層情感詞的聚類,并隸屬于頂層類別,頂層分為基本情緒、復(fù)合情緒和其他情緒三類型,傾向性層為每個情感詞的情感傾向,分為積極、消極、中立三類。
11.根據(jù)權(quán)利要求10所述的方法,還包括對于待分析的每條博文M,分別建立該博文的頂層情感向量、中間層情感向量、底層情感向量和傾向?qū)忧楦邢蛄康牟襟E,其中上層的情感向量可由下層的情感向量聚合而成。
12.根據(jù)權(quán)利要求11所述的方法,所述步驟3還包括將博文的情感向量按照時間粒度進(jìn)行聚合,以得到情感隨時間的變化趨勢。
13.根據(jù)權(quán)利要求11所述的方法,所述步驟3還包括基于所建立的博文的情感向量,統(tǒng)計(jì)各個事件中屬于各情感的博文占與該事件相關(guān)的所有博文的比例。
14.一種微博情感分析系統(tǒng),包括: 情感向量確定模塊,用于確定情感向量E,所述情感向量E由多個能夠表示情感的情感詞構(gòu)成; 微博情感向量建立模塊,用于對于待分析的每條博文M,建立該博文的情感向量Em =<x?1,x?2,…,XMi,…〉;其中,如果情感向量E中第i個情感詞屬于該博文M的關(guān)鍵詞集合,則Em中對應(yīng)的第i個元素XMi取值為1,否則取值為O ; 情感分析模塊,用于基于博文的情感向量來得到對事件的情感分布。
15.根據(jù)權(quán)利要求14所述的系統(tǒng),所述情感向量確定模塊,還用于對微博數(shù)據(jù)流進(jìn)行監(jiān)測,定期從微博語料庫抽取網(wǎng)絡(luò)新詞,并從中選擇能表示情感的網(wǎng)絡(luò)新詞添加到情感向量E中。
16.一種基于微博語料庫抽取網(wǎng)絡(luò)新詞的方法,所述方法包括: 步驟I)基于N-gram將微博語料庫中的每條博文切分成多個候選詞,從而形成候選詞集合; 步驟2)從候選詞集合中刪除詞典中已有的詞; 步驟3)從候選詞集合中選擇出現(xiàn)頻率高的前K個候選詞并計(jì)算其互信息; 步驟4)從所述K個候選詞中選擇其互信息大于互信息閾值的候選詞來構(gòu)成網(wǎng)絡(luò)新詞候選集。
17.根據(jù)權(quán)利要求16所述的方法,還包括步驟5)分別對兩個或更多個微博語料庫執(zhí)行步驟I)至4)以得到多個網(wǎng)絡(luò)新詞候選集,并選擇在多個網(wǎng)絡(luò)新詞候選集中共同出現(xiàn)的詞作為網(wǎng)絡(luò)新詞。
18.根據(jù)權(quán)利要求16或17所述的方法,在所述步驟I)之前還包括對微博語料庫進(jìn)行預(yù)處理的步驟,其包括:對于僅轉(zhuǎn)發(fā)的博文,進(jìn)行直接合并,只保留一個樣本;對于轉(zhuǎn)發(fā)并評論的博文,將轉(zhuǎn)發(fā)內(nèi)容去除,只保留評論內(nèi)容;對于拷貝信息源,提取主要關(guān)鍵詞,作為一條微博進(jìn)行處理。
19.根據(jù)權(quán)利要求16或17所述的方法,所述步驟2)還包括從候選詞集合中刪除出現(xiàn)頻率低于預(yù)定閾值的詞。
20.一種基于微博語料庫抽取網(wǎng)絡(luò)新詞的設(shè)備,所述設(shè)備包括: 用于基于N-gram將微博語料庫中的每條博文切分成多個候選詞,從而形成候選詞集合的裝置; 用于從候選詞集合中刪除詞典中已有的詞的裝置; 用于從候選詞集合中選擇出現(xiàn)頻率高的前K個候選詞并計(jì)算其互信息的裝置; 用于從所述K個候選詞中選擇其互信息大于互信息閾值的候選詞來構(gòu)成網(wǎng)絡(luò)新詞候選集的裝置。
21.根據(jù)權(quán)利要求20所述的設(shè)備,還包括用于從兩個或更多個微博語料庫得到多個網(wǎng)絡(luò)新詞候選集中選擇在多個網(wǎng)絡(luò)新詞候選集中共同出現(xiàn)的詞作為網(wǎng)絡(luò)新詞的裝置。
【文檔編號】G06F17/30GK103559233SQ201310506561
【公開日】2014年2月5日 申請日期:2013年10月24日 優(yōu)先權(quán)日:2012年10月29日
【發(fā)明者】張魯民, 賈焰, 周斌, 韓毅 申請人:中國人民解放軍國防科學(xué)技術(shù)大學(xué)