本發(fā)明涉及一種商品性能評價方法,該方法是一種網絡評價文本引導下的商品性能評價方法。
背景技術:
隨著電子商務的迅速發(fā)展,網上購物成為了一種普遍現象,但是由于網上購物缺乏對商品的直觀接觸,那么查閱他人對商品的評論就成為消費者獲取商品信息的重要途徑。
然而,目前的商品評價體系并不盡如人意,大部分的商品采用的方法都是好中差評,雖然也有部分商品加上了材質等性能等參數,但是往往會出現客戶所關注的性能特征不在評價之列,這時候就需要逐條去查看其它客戶的評論,挖掘自己所需的信息,而這是極費時間的。
從商戶而言,也希望能夠深度挖掘用戶評價背后所蘊藏的信息,比如客戶更關注商品的哪些性能特征,以及現有的產品在哪一方面做的較好,又有哪些方面是客戶重視,而存在不足的。
本發(fā)明提出的一種網絡評價文本引導下的商品性能評價方法,可通過已購買客戶的評價自動獲取客戶所關注的商品性能特征(評價對象),也可以計算每條評論的情感極性和所有評價文本的情感極性,消費者和商戶也可以根據自己的需要挖掘所需信息。
技術實現要素:
鑒于現有的技術問題,本發(fā)明提供一種網絡評價文本引導下的商品性能評價方法來解決此問題。
包括:
a.針對需要進行性能評價的商品,從網絡獲取所售商品的全部評價文本。
b.對所獲取的商品評價文本進行預處理,包括去停用詞、分詞、標注詞性等工作。
c.根據處理好的評價文本獲取商品的評價對象,即客戶可能會關注的商品性能特征,并計算該評價對象的權重。
d.對商品的每一條評論進行預處理,構造評價對象向量,并進行歸一化處理。
e.抽取與評價對象相關的情感詞,并賦情感極性,同時抽取跟情感詞相關的否定詞、程度副詞等并賦權值。
f.根據所得數據,計算每條評論的情感極性,從而得到所有評價文本的情感極性。
進一步地,步驟a中商品的生產廠家可以通過代理商獲取所售產品的全部網絡評價文本。
進一步地,步驟b中對客戶的網絡評價文本預處理,包括去停用詞和分詞、標注詞性等工作,該部分工作可以利用中科院中文分詞系統(tǒng)ICTCLAS或CRF++0.54進行。
進一步地,步驟c中根據處理好的評價文本抽取評價對象,這一步是非常關鍵的,與目前的商品評價方法不同,重視網絡評價文本自身的引導,即關注客戶所關注的商品特性。
進一步地,步驟c中需要給每個評價對象賦權重,這一步可以通過計算每個評價對象的TF-IDF值,其對數值可以作為評價對象的權重,以表示消費者對這一評價對象的重視程度,本方法是一種商品評價文本引導下的商品評價方法,較傳統(tǒng)的無引導方法要更好。
進一步地,步驟e中對商品的每一條評論進行預處理后抽取情感詞,利用符號函數給情感詞賦情感極性值,同時抽取跟情感詞相關的否定詞、程度副詞等并賦權值,賦值可以采用現有的分級標準,也可以結合自定義的方法。
進一步地,步驟f中根據前面所得數據,計算每條評論的情感極性,再根據所有評論的情感極性計算該商品的總體情感極性,消費者和商戶也可以根據自己的需要獲取所需的信息。
附圖說明
圖1是用來說明一種網絡評價文本引導下的商品性能評價方法中如何抽取評價對象,并對其賦權重的流程圖;
圖2是用來說明本發(fā)明方法中如何對每一條評論文本構造評價對象向量,抽取情感詞并賦情感極性、抽取否定、程度副詞并賦權重的流程圖。
具體實施方式
以下將結合附圖所示的具體實施方式對本發(fā)明進行詳細描述。
圖1是網絡評價文本引導下的商品性能評價方法中如何抽取評價對象,并對其賦權重的流程圖。在本實施方式中,主要包括以下步驟:
商戶通過代理商收集已售商品的所有評論文本集。
對所收集的網絡評論文本集進行預處理,預處理的內容包括去停用詞,利用中科院中文分詞系統(tǒng)ICTCLAS或CRF++0.54進行分詞、標注詞性的工作,并將預處理好的評價文本數據導出待用;
根據處理好的評價文本數據,抽取評價對象集O=(o1,o2,…on),并計算其TF-IDF值,取其自然對數后給評價對象賦權重w1=(w11,w12,…w1n)。
圖2是說明本發(fā)明方法中如何對每一條評論文本構造評價對象向量,抽取情感詞并賦情感極性、抽取否定、程度副詞并賦權重的流程圖。在本實施方式中,主要包括以下步驟:
對于每一條評論文本,進行預處理,同樣包括去停用詞,分詞及標注詞性等工作,采取的方法與圖1中的實施方式一致。
對處理好的這條評論文本,構造評價對象向量V=(v1,v2,…,vn),其中vi表示oi在本條評論中出現i次,i=0,1。
為了防止情感極性出現多評價對象偏離,需對評價對象向量進行歸一化處理P=(p1,p2,…,pn),其中
從預處理好的文本中抽取情感詞Q=(q1,q2,…,qn),并給情感詞賦情感極性值EQ=(e1,e2,…,en),其中ei=sgn(qi的極性)。
從預處理好的文本中抽取與情感詞相對應的否定詞,程度副詞;若出現否定詞,則賦權重-1,程度副詞的權重可參考已有的等級標準賦權重也可以結合自定義的方法賦權重,綜合否定詞與程度副詞后的權重記為w2=(w21,w22,…w2n)。
根據前面所得數據,計算本條評論的情感極性值:
通過對所有評論文本的情感極性值取平均值可以判斷所有評論文本的情感極性值。
此外,通過前面的數據可以挖掘更多的信息,比如,通過每個評價對象的在每條評論的情感極值中的比重計算每個評價對象的重要性,還可以在此基礎上抽取出重要評價對象集,從而指導商品評論,也給消費者提供重要參考等。
以上所述僅為本發(fā)明的較佳實施方式,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內,所做的任何修改、等同替換、改進等,均應包含在本發(fā)明的保護范圍之內。