專利名稱:基于互聯(lián)網(wǎng)的廠商口碑自動(dòng)排序系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種廠商口碑自動(dòng)排序系統(tǒng)。
背景技術(shù):
買(mǎi)賣(mài)商品是一種經(jīng)常性且重要的活動(dòng),無(wú)論對(duì)于生產(chǎn)者還是消費(fèi)者都具有重要意 義。如何使消費(fèi)者在最短的時(shí)間內(nèi),了解到其所關(guān)心商品的比較全面的信息是非常重要的。 將充斥于網(wǎng)絡(luò)的、產(chǎn)品使用后大量評(píng)論信息進(jìn)行結(jié)構(gòu)化和量化的展示,對(duì)于促進(jìn)生產(chǎn)者了 解使用者意見(jiàn)和消費(fèi)者對(duì)同類(lèi)產(chǎn)品進(jìn)行比較都具有極為重要的實(shí)用價(jià)值。消費(fèi)者為買(mǎi)到適 合心意的產(chǎn)品,一般會(huì)對(duì)不同生產(chǎn)廠家進(jìn)行對(duì)比和了解;而對(duì)于生產(chǎn)者或商家來(lái)說(shuō),通過(guò)與 競(jìng)爭(zhēng)者的對(duì)比也有利于發(fā)現(xiàn)自己的優(yōu)勢(shì)、劣勢(shì)及用戶的興趣點(diǎn)和偏好,從而為生產(chǎn)決策提 供參考和依據(jù)。隨著網(wǎng)絡(luò)的普及和信息資訊建設(shè)取得的極大進(jìn)步,越來(lái)越多的人們傾向于 通過(guò)搜索引擎獲取關(guān)于產(chǎn)品的各種相關(guān)信息,如用戶使用后意見(jiàn)、廠家信譽(yù)和口碑、價(jià)格信 息等,從而為其消費(fèi)決策提供支持。事實(shí)上,在互聯(lián)網(wǎng)上存在著大量關(guān)于產(chǎn)品的評(píng)論和意 見(jiàn)。這些產(chǎn)品使用者的反饋相對(duì)于廠家提供的產(chǎn)品介紹網(wǎng)頁(yè)對(duì)于潛在購(gòu)買(mǎi)者來(lái)說(shuō)更容易接 受,因此提供了購(gòu)買(mǎi)產(chǎn)品的重要參考。目前了解產(chǎn)品信息途徑存在的問(wèn)題是無(wú)法進(jìn)行不同產(chǎn)品及其諸多特征的橫向、迅 速、直觀的比較。通用的搜索引擎難以進(jìn)行專門(mén)的意見(jiàn)搜索,會(huì)返回大量無(wú)關(guān)信息等。即使 能準(zhǔn)確收集到有關(guān)某項(xiàng)產(chǎn)品的相關(guān)評(píng)論,也會(huì)由于數(shù)量龐雜眾多,使得用戶耗費(fèi)較多的閱 讀時(shí)間。現(xiàn)有的搜索引擎在搜索上比較有效,但在資訊的整理特別是結(jié)構(gòu)化處理上就顯得 相對(duì)不足。盡管很多廠家通過(guò) 設(shè)計(jì)反饋表的方式收集用戶意見(jiàn),但是其表格數(shù)據(jù)項(xiàng)一般相 對(duì)固定且消費(fèi)者參與較少。此外由生產(chǎn)者自行設(shè)計(jì)的產(chǎn)品統(tǒng)計(jì)對(duì)比信息可信度也難以保 證。產(chǎn)品比較一度是非常費(fèi)時(shí)費(fèi)力的工作,人們往往事先對(duì)產(chǎn)品特征了解甚少(如部 件、功能、外觀、售后服務(wù)、價(jià)格等),此外,同類(lèi)產(chǎn)品往往有多種不同廠家、不同型號(hào)的選擇。 或者用戶不知道某產(chǎn)品都有哪些品牌和生產(chǎn)廠家,不知道有哪些相關(guān)服務(wù)和相關(guān)配套產(chǎn) 品。這些導(dǎo)致消費(fèi)者常常會(huì)買(mǎi)到不符合需求的產(chǎn)品,或者有著用不到的功能,造成金錢(qián)上的 浪費(fèi)??偠灾?,人們?nèi)狈κ孪热媪私猱a(chǎn)品特征及使用情況的信息。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種基于互聯(lián)網(wǎng)的廠商口碑自動(dòng)排序系統(tǒng),以解決消費(fèi)者無(wú) 從檢索到對(duì)相關(guān)商品評(píng)價(jià)信息的缺陷。它包括一號(hào)服務(wù)器,接受網(wǎng)上訪問(wèn)者的請(qǐng)求,從互聯(lián)網(wǎng)上識(shí)別和收集對(duì)相關(guān)商品的評(píng)價(jià) fn息;二號(hào)服務(wù)器,對(duì)收集到的相關(guān)商品評(píng)價(jià)信息進(jìn)行結(jié)構(gòu)化和規(guī)范化處理,從而得出 對(duì)同一商品各個(gè)生產(chǎn)廠家的口碑排序;三號(hào)服務(wù)器,向網(wǎng)上訪問(wèn)者發(fā)布相關(guān)商品的不同生產(chǎn)廠家的口碑排序結(jié)果。
本發(fā)明提供一種自動(dòng)挖掘用戶對(duì)產(chǎn)品意見(jiàn)的技術(shù)。依托在互聯(lián)網(wǎng)上的形形色色的 產(chǎn)品意見(jiàn)評(píng)論文檔為處理對(duì)象,進(jìn)行相應(yīng)的結(jié)構(gòu)化、量化處理,從而形成清晰的口碑對(duì)比結(jié) 果。通過(guò)將大量無(wú)結(jié)構(gòu)化的、表達(dá)方式多樣的評(píng)論轉(zhuǎn)化成清晰有意義的規(guī)律性結(jié)構(gòu)化信息, 使人們可以從宏觀的角度來(lái)觀察數(shù)據(jù)。這種技術(shù)能夠提供導(dǎo)航和瀏覽機(jī)制,從而極大地方 便分析和決策。其結(jié)果可用于為有購(gòu)買(mǎi)產(chǎn)品意向的潛在用戶輔助決策,也可以供生成商家 了解市場(chǎng)上用戶反映和意見(jiàn),并對(duì)產(chǎn)品做進(jìn)一步改進(jìn)提供參考。本發(fā)明的特點(diǎn)在于1)設(shè) 計(jì)量化和結(jié)構(gòu)化技術(shù),實(shí)現(xiàn)口碑對(duì)比的快速瀏覽;2)信息源來(lái)自互聯(lián)網(wǎng),使信息量較大,且 信息的評(píng)價(jià)范圍也非常廣泛。
圖1是本發(fā)明工作過(guò)程示意圖,圖2是實(shí)施方式一工作過(guò)程第四步驟中評(píng)價(jià)對(duì)象 與上下文極性關(guān)聯(lián)的獲取方法,圖3是實(shí)施方式二中量化二維表的示意圖。
具體實(shí)施方式
具體實(shí)施方式
一下面結(jié)合圖1具體說(shuō)明本實(shí)施方式。本實(shí)施方式包括一號(hào)服務(wù)器,接受網(wǎng)上訪問(wèn)者的請(qǐng)求,從互聯(lián)網(wǎng)上識(shí)別和收集對(duì)相關(guān)商品的評(píng)價(jià) fn息;二號(hào)服務(wù)器,對(duì)收集到的相關(guān)商品評(píng)價(jià)信息進(jìn)行結(jié)構(gòu)化和規(guī)范化處理,從而得出 對(duì)同一商品各個(gè)生產(chǎn)廠家的口碑排序;在二號(hào)服務(wù)器中構(gòu)造一個(gè)具有一定規(guī)模的通用情感傾向性詞典;針對(duì)需要進(jìn)行挖 掘用戶意見(jiàn)的產(chǎn)品,構(gòu)造相應(yīng)的專業(yè)極性詞詞典;獲取和識(shí)別若干評(píng)價(jià)該產(chǎn)品的句子;對(duì) 評(píng)論句子進(jìn)行句法分析,在此基礎(chǔ)上識(shí)別評(píng)價(jià)的對(duì)象、評(píng)價(jià)對(duì)象與觀點(diǎn)的對(duì)應(yīng)關(guān)系;根據(jù)所 有句子的識(shí)別結(jié)果,利用該產(chǎn)品的部件和屬性特征,獲得結(jié)構(gòu)化和量化的直觀結(jié)果。三號(hào)服務(wù)器,向網(wǎng)上訪問(wèn)者發(fā)布相關(guān)商品的不同生產(chǎn)廠家的口碑(即大眾對(duì)該廠 家生產(chǎn)的產(chǎn)品的某項(xiàng)質(zhì)量指標(biāo)或整體性價(jià)比的)排序結(jié)果。本發(fā)明的工作工程如下一、產(chǎn)品評(píng)論信息的準(zhǔn)確識(shí)別與及時(shí)全面獲取。利用產(chǎn)品評(píng)論領(lǐng)域相對(duì)確定、主題 與特征相對(duì)確定的特點(diǎn),事先分領(lǐng)域收集大量產(chǎn)品評(píng)論相關(guān)的語(yǔ)料,從中統(tǒng)計(jì)出可以用于 描述產(chǎn)品評(píng)論的特征詞集或模式對(duì),并定期檢索網(wǎng)絡(luò)或者重點(diǎn)關(guān)注若干網(wǎng)絡(luò)站點(diǎn),用于主 動(dòng)發(fā)現(xiàn)相關(guān)信息。利用網(wǎng)絡(luò)主題爬蟲(chóng)技術(shù)和人工收集整理相結(jié)合,獲得足夠規(guī)模的多領(lǐng)域、 不同主題的產(chǎn)品評(píng)論語(yǔ)料庫(kù);對(duì)獲得的產(chǎn)品評(píng)論語(yǔ)料庫(kù)按重要性進(jìn)行主題分級(jí),并為每個(gè) 主題人工標(biāo)注產(chǎn)品評(píng)論關(guān)鍵詞及關(guān)鍵詞模式對(duì)。人工標(biāo)注關(guān)鍵詞及關(guān)鍵詞模式對(duì)的效果可 以利用通用搜索引擎或者設(shè)計(jì)單獨(dú)的評(píng)價(jià)系統(tǒng)來(lái)進(jìn)行評(píng)價(jià)。如果某一關(guān)鍵詞及關(guān)鍵詞模式 對(duì)被輸入給通用搜索引擎或者設(shè)計(jì)單獨(dú)的評(píng)價(jià)系統(tǒng)后,能返回所期望的信息,則認(rèn)為標(biāo)注 成功。而人工標(biāo)注的關(guān)鍵詞及關(guān)鍵詞模式對(duì)的評(píng)分也可以通過(guò)其返回所期望的信息的數(shù)量 和質(zhì)量而進(jìn)行量化。利用產(chǎn)品評(píng)論語(yǔ)料庫(kù)及人工標(biāo)注的關(guān)鍵詞及關(guān)鍵詞模式對(duì),對(duì)人工標(biāo) 注的關(guān)鍵詞及關(guān)鍵詞模式對(duì)進(jìn)行重要性評(píng)價(jià),并進(jìn)行冗余消除等處理,從而獲得最終的產(chǎn) 品評(píng)論特征集。利用最終的產(chǎn)品評(píng)論特征集檢索網(wǎng)絡(luò),獲得潛在的產(chǎn)品評(píng)論信息文檔流。二、產(chǎn)品評(píng)論信息的的快速分類(lèi)和聚類(lèi)整理。
產(chǎn)品評(píng)論信息的組織與整理非常關(guān)鍵。文本分類(lèi)和文本聚類(lèi)是兩種非常重要的技術(shù),且二者相互補(bǔ)充。文本分類(lèi)是一種按照經(jīng)驗(yàn)分類(lèi)體系和歷史訓(xùn)練的結(jié)果對(duì)信息組織 的手段,其類(lèi)別體系是先組的、有系統(tǒng)的,類(lèi)目和文獻(xiàn)之間具有相對(duì)獨(dú)立性。因而文本分類(lèi) 適合根據(jù)預(yù)案和領(lǐng)域?qū)<业慕?jīng)驗(yàn)知識(shí)對(duì)產(chǎn)品評(píng)論信息類(lèi)型、性質(zhì)及所屬領(lǐng)域的大致迅速判 定,有助于減少搜索空間。相比于文本分類(lèi),文本聚類(lèi)則是先有文本信息后有類(lèi),類(lèi)的性質(zhì)及整個(gè)類(lèi)目體系 完全由需要處理的產(chǎn)品評(píng)論信息內(nèi)容所決定;從類(lèi)目形成過(guò)程上看,分類(lèi)是從總到分,聚類(lèi) 是從分到總。相比之下,聚類(lèi)處理更加細(xì)化,更能發(fā)現(xiàn)產(chǎn)品評(píng)論信息的方方面面、新線索、新 主題乃至各種謠言,平常容易被忽略的信息主題在聚類(lèi)后將被識(shí)別,因而更容易被發(fā)現(xiàn),因 為聚類(lèi)提供了一種直觀、可視化的產(chǎn)品評(píng)論信息查看和管理方法。聚類(lèi)系統(tǒng)需要在達(dá)到一 定聚類(lèi)質(zhì)量的前提下,達(dá)到較高的效率。此外考慮到產(chǎn)品評(píng)論信息的實(shí)際特點(diǎn),聚類(lèi)需要具 有處理動(dòng)態(tài)文本的能力,因?yàn)樾畔⒌墨@取是漸進(jìn)的,信息量將隨著時(shí)間的遞進(jìn)而逐漸增加。 可見(jiàn),為了能夠適應(yīng)產(chǎn)品評(píng)論對(duì)信息處理的要求,聚類(lèi)系統(tǒng)應(yīng)該具有較強(qiáng)的動(dòng)態(tài)自適應(yīng)能 力、快速處理能力且便于檢索。三、產(chǎn)品評(píng)論信息的消費(fèi)者關(guān)注焦點(diǎn)特征識(shí)別。所謂焦點(diǎn)特征,重點(diǎn)是指被消費(fèi)者廣泛關(guān)注的、能夠反映和描述產(chǎn)品評(píng)論方方面 面的特征。將產(chǎn)品特征分為5種,即屬性、部件、部件的特征,相關(guān)概念,相關(guān)部件等。提取 焦點(diǎn)特征的意義還在于可以通過(guò)語(yǔ)言分析的手段計(jì)算消費(fèi)者對(duì)大多數(shù)特征的態(tài)度和意見(jiàn)。 因而可以實(shí)現(xiàn)特征的參數(shù)化,并進(jìn)一步計(jì)算其量化的取值。因此焦點(diǎn)特征及相應(yīng)公眾意見(jiàn) 的量化是反映產(chǎn)品評(píng)論的重要指標(biāo)和描述。從網(wǎng)絡(luò)上發(fā)表的與產(chǎn)品評(píng)論有關(guān)的評(píng)論意見(jiàn)等信息來(lái)提取焦點(diǎn)特征可以考慮利 用啟發(fā)式規(guī)則。此時(shí)可供利用的信息包括1)焦點(diǎn)特征一般是名詞或者名詞短語(yǔ);2)焦 點(diǎn)特征一般與觀點(diǎn)詞在一定的句法范圍內(nèi),處理的句法單位可以是句子、單句或者組塊;3) 焦點(diǎn)特征一般具有一些特定的語(yǔ)法結(jié)構(gòu)。如“adj(形容詞)、n(名詞)”、“n ad j " ”等模式; 上述啟發(fā)式規(guī)則需要結(jié)合使用,例如特征一般為名詞或者名詞短語(yǔ),但不能簡(jiǎn)單地將出現(xiàn) 在用戶評(píng)論中的名詞作為特征,這就需要利用焦點(diǎn)特征出現(xiàn)的語(yǔ)法規(guī)則信息和統(tǒng)計(jì)信息, 為此可以通過(guò)句法分析獲得句子的句法結(jié)構(gòu)??梢詫⒚~作為候選特征并進(jìn)行概率估計(jì)評(píng) 價(jià)其作為焦點(diǎn)特征的可能性。此外如果一個(gè)名詞在平衡的綜合語(yǔ)料庫(kù)(以1998年人民日?qǐng)?bào) 為例)中的頻率較高,則可以降低其作為特征的概率。除了上述基于規(guī)則的方法外,可以考 慮利用與觀點(diǎn)詞的同現(xiàn)統(tǒng)計(jì)信息來(lái)發(fā)現(xiàn)特征。在用戶評(píng)論意見(jiàn)語(yǔ)料中,觀點(diǎn)和態(tài)度往往是 針對(duì)某一具體特征(變量),為此,可以利用句法分析手段,在一定規(guī)模的人工標(biāo)注語(yǔ)料上, 發(fā)現(xiàn)特征與觀點(diǎn)詞的同現(xiàn)模式和規(guī)模,進(jìn)而利用這些模式和帶有態(tài)度傾向的觀點(diǎn)詞來(lái)發(fā)現(xiàn) 特征。焦點(diǎn)特征是根據(jù)具體的產(chǎn)品而提取的,是基于內(nèi)容的,不同類(lèi)型產(chǎn)品其特征參數(shù) 也不同,并且隨著時(shí)間推移及新技術(shù)、產(chǎn)品改進(jìn)等變化在不同階段其特征參數(shù)集也將變化。 因此特征提取機(jī)制具有自適應(yīng)、動(dòng)態(tài)性、基于內(nèi)容等特點(diǎn)。此外,特征評(píng)價(jià)涉及到句子級(jí)別 的抽取評(píng)價(jià)問(wèn)題和總體特征抽取的評(píng)價(jià)問(wèn)題。盡管單句的特征抽取識(shí)別精度對(duì)于特征集的 獲取是重要的基礎(chǔ)工作,但整體特征集的獲取事實(shí)上可以在一定程度內(nèi)容忍單句特征抽取 識(shí)別的誤差。
四、產(chǎn)品評(píng)論信息的關(guān)注特征及觀點(diǎn)對(duì)的自動(dòng)提取。采用極性詞驅(qū)動(dòng)的辦法來(lái)處理(1)利用極性詞詞典,首先獲取句子中的極性詞; (2)判斷極性詞的詞性,極性詞詞性大致有如下幾種情況形容詞a (例如“*****真/d不 錯(cuò)/a”)、動(dòng)詞ν (例如,“*****比較/d人性化/V,)、名詞η (例如,“*****很/d有/ν特色 /η”)等;(3)如果極性詞直接作為特征的修飾語(yǔ),例如“及時(shí)有效的應(yīng)對(duì)措施”,則可以直接 提取特征_觀點(diǎn)對(duì);(4)如果極性詞詞性為“a (形容詞)”,則需要往前查找,查找其描述的 主語(yǔ)特征,例如“照相功能顯得比較人性化”中的“照相功能”和“人性化”可以據(jù)此確定為 特征_觀點(diǎn)對(duì);(5)如果極性詞為“ν (動(dòng)詞)”,可能有兩種情況一種是帶賓語(yǔ)的模式,可以 將動(dòng)詞直接賦給賓語(yǔ)中的核心名詞;另外一種情況是沒(méi)有賓語(yǔ)的情況,此時(shí)可以直接將謂 語(yǔ)上的動(dòng)詞極性傳遞給主語(yǔ);(6)如果極性詞為“η (名詞)”,則直接提取特征_觀點(diǎn)對(duì)。特征-觀點(diǎn)對(duì)的提取離不開(kāi)傾向詞典的支持。目前可以借鑒和利用的相關(guān)中文資 源包括國(guó)內(nèi)的知網(wǎng)第一版等。但有些詞無(wú)法嚴(yán)格給出其極性,因?yàn)槠鋺B(tài)度方向是動(dòng)態(tài)的,即 依賴于上下文環(huán)境和特征,在不同的情景模式下,其極性方向往往不同。例如,“大”、“小”、 “高”、“低”等詞。這些詞雖然規(guī)模有限,但其出現(xiàn)頻率特別高,幾乎可以用于修飾所有特征。 為了識(shí)別其在不同情境模式下,與具體特征搭配時(shí)的極性方向,采用如下方法(1)人工找 到這些動(dòng)態(tài)極性詞;(2)在語(yǔ)料規(guī)模足夠且確定、與具體特征相對(duì)應(yīng)的特征_觀點(diǎn)對(duì)數(shù)量規(guī) 模較大的前提下,該特征的口碑應(yīng)該是穩(wěn)定的,可以識(shí)別出其總體評(píng)論傾向,設(shè)為Ψ。如果 該特征公眾爭(zhēng)議較大,則重新選取語(yǔ)料。(3)找到與該特征描述最多的動(dòng)態(tài)極性詞;(4)將 Ψ的方向直接賦給修飾該特征的動(dòng)態(tài)極性詞。五、產(chǎn)品評(píng)論信息的量化。采用等時(shí)間間隔對(duì)語(yǔ)料進(jìn)行采樣,根據(jù)產(chǎn)品相關(guān)子事件的發(fā)生時(shí)間定義不等間隔 的時(shí)間節(jié)點(diǎn),從而評(píng)估子事件(如產(chǎn)品改進(jìn)和更新?lián)Q代)的發(fā)生對(duì)后續(xù)序列的影響。令對(duì) 于某個(gè)特征維Fy在采樣時(shí)間節(jié)點(diǎn)Tx與前一個(gè)時(shí)間節(jié)點(diǎn)之間的時(shí)間段內(nèi)的態(tài)度信息量化 值為Attitude (Tx,F(xiàn)y),此時(shí)假設(shè)有η個(gè)特征和觀點(diǎn)對(duì)被識(shí)別,其中有η+個(gè)正向,η_個(gè)反向 (Π++ΙΓ彡η),則可以計(jì)算其量化取值,例如通過(guò)公式Attitude (Tx,F(xiàn)y) = (n+-rO /n來(lái)計(jì)算, 可以進(jìn)一步在實(shí)踐中修正,例如要求評(píng)論的η必須大于某個(gè)閾值。因?yàn)閷?duì)于某個(gè)特征,如果 量化值接近零,則表示無(wú)人評(píng)價(jià),也有可能評(píng)價(jià)的人較多,但爭(zhēng)議較大。此外,在相同量化取 值(例如Attitude (Tx,F(xiàn)y) = ξ ‘)的情況下,則可能是只有ξ ‘個(gè)相同傾向的評(píng)論,也有 可能是很多評(píng)論但二者的差值為ξ ‘。此時(shí)可以設(shè)定一個(gè)置信度因子Ψ (0 < Ψ < 1),其 具體取值通過(guò)對(duì)評(píng)價(jià)的次數(shù)進(jìn)行分段處理而得到,評(píng)價(jià)次數(shù)越多,量化取值的置信度也越 大。則此時(shí)的公式將修正為Attitude (Tx,F(xiàn)y) = Ψ(η+-η_)/η。使得置信度較大的特征其量 化取值得以強(qiáng)化。量化的作用在于1)通過(guò)大量的統(tǒng)計(jì),可以將引起廣泛關(guān)注的特征突出,對(duì)特征 進(jìn)行分類(lèi)管理或者進(jìn)行特征重要性排序;2)規(guī)避了由于語(yǔ)言處理技術(shù)精度不高、個(gè)別語(yǔ)句 不符合語(yǔ)法規(guī)范及可能的誤差帶來(lái)的問(wèn)題。量化建立在前面所述的特征和觀點(diǎn)對(duì)的識(shí)別 基礎(chǔ)上,量化后的數(shù)據(jù)可以在不同的特征維及時(shí)間節(jié)點(diǎn)上形成比較精確化和直觀的對(duì)比數(shù) 據(jù)。
具體實(shí)施方式
二 本實(shí)施方式與實(shí)施方式一的不同點(diǎn)是一號(hào)服務(wù)器先產(chǎn)生用 于從互聯(lián)網(wǎng)檢索產(chǎn)品評(píng)論信息的查詢表達(dá)式后獲取到足夠規(guī)模的面向特定產(chǎn)品的評(píng)論語(yǔ)料;二號(hào)服務(wù)器對(duì)特定產(chǎn)品的評(píng)論語(yǔ)料進(jìn)行評(píng)價(jià)對(duì)象獲取、特征-觀點(diǎn)對(duì)識(shí)別等處 理,特別是對(duì)于動(dòng)態(tài)極性詞與不同特征關(guān)聯(lián)時(shí)的極性取值問(wèn)題,采取了一種有效的處理策 略;在此基礎(chǔ)上,進(jìn)行結(jié)構(gòu)化和量化計(jì)算處理,從而獲得對(duì)該類(lèi)產(chǎn)品的不同廠商及型號(hào)的量 化二維表,并據(jù)此進(jìn)行排序比較操作,從而供消費(fèi)者和生產(chǎn)者參考。量化二維表為二維表,其中一維為產(chǎn)品的不同廠商以及型號(hào),另外一維是該種產(chǎn) 品的所有特征。例如,對(duì)于手機(jī)產(chǎn)品而言,特征包括“電池”、“手感”、“照相功能”等。二維 表中的數(shù)據(jù)為用戶對(duì)同一特征,不同型號(hào)產(chǎn)品的口碑量化數(shù)值。
權(quán)利要求
基于互聯(lián)網(wǎng)的廠商口碑自動(dòng)排序系統(tǒng),其特征在于它包括一號(hào)服務(wù)器,接受網(wǎng)上訪問(wèn)者的請(qǐng)求,從互聯(lián)網(wǎng)上識(shí)別和收集對(duì)相關(guān)商品的評(píng)價(jià)信息;二號(hào)服務(wù)器,對(duì)收集到的相關(guān)商品評(píng)價(jià)信息進(jìn)行結(jié)構(gòu)化和規(guī)范化處理,從而得出對(duì)同一商品各個(gè)生產(chǎn)廠家的口碑排序;三號(hào)服務(wù)器,向網(wǎng)上訪問(wèn)者發(fā)布相關(guān)商品的不同生產(chǎn)廠家的口碑排序結(jié)果。
2.根據(jù)權(quán)利要求1所述的基于互聯(lián)網(wǎng)的廠商口碑自動(dòng)排序系統(tǒng),其特征在于在二號(hào) 服務(wù)器中構(gòu)造一個(gè)具有一定規(guī)模的通用情感傾向性詞典;針對(duì)需要進(jìn)行挖掘用戶意見(jiàn)的產(chǎn) 品,構(gòu)造相應(yīng)的專業(yè)極性詞詞典;獲取和識(shí)別若干評(píng)價(jià)該產(chǎn)品的句子;對(duì)評(píng)論句子進(jìn)行句 法分析,在此基礎(chǔ)上識(shí)別評(píng)價(jià)的對(duì)象、評(píng)價(jià)對(duì)象與觀點(diǎn)的對(duì)應(yīng)關(guān)系;根據(jù)所有句子的識(shí)別結(jié) 果,利用該產(chǎn)品的部件和屬性特征,獲得結(jié)構(gòu)化和量化的直觀結(jié)果。
3.根據(jù)權(quán)利要求1所述的基于互聯(lián)網(wǎng)的廠商口碑自動(dòng)排序系統(tǒng),其特征在于一號(hào)服務(wù) 器先產(chǎn)生用于從互聯(lián)網(wǎng)檢索產(chǎn)品評(píng)論信息的查詢表達(dá)式后獲取到足夠規(guī)模的面向特定產(chǎn) 品的評(píng)論語(yǔ)料;二號(hào)服務(wù)器對(duì)特定產(chǎn)品的評(píng)論語(yǔ)料進(jìn)行評(píng)價(jià)對(duì)象獲取、特征_觀點(diǎn)對(duì)識(shí)別 等處理;在此基礎(chǔ)上進(jìn)行結(jié)構(gòu)化和量化計(jì)算處理,從而獲得對(duì)該類(lèi)產(chǎn)品的不同廠商及型號(hào) 的量化二維表,并據(jù)此進(jìn)行排序比較操作。
全文摘要
基于互聯(lián)網(wǎng)的廠商口碑自動(dòng)排序系統(tǒng),本發(fā)明涉及一種廠商口碑自動(dòng)排序系統(tǒng)。它解決了消費(fèi)者無(wú)從檢索到對(duì)相關(guān)商品評(píng)價(jià)信息的缺陷。本發(fā)明用于廠商口碑的排序工作。它包括一號(hào)服務(wù)器,接受網(wǎng)上訪問(wèn)者的請(qǐng)求,從互聯(lián)網(wǎng)上識(shí)別和收集對(duì)相關(guān)商品的評(píng)價(jià)信息;二號(hào)服務(wù)器,對(duì)收集到的相關(guān)商品評(píng)價(jià)信息進(jìn)行結(jié)構(gòu)化和規(guī)范化處理,從而得出對(duì)同一商品各個(gè)生產(chǎn)廠家的口碑排序;三號(hào)服務(wù)器,向網(wǎng)上訪問(wèn)者發(fā)布相關(guān)商品的不同生產(chǎn)廠家的口碑排序結(jié)果。
文檔編號(hào)G06Q30/00GK101833560SQ20101010380
公開(kāi)日2010年9月15日 申請(qǐng)日期2010年2月2日 優(yōu)先權(quán)日2010年2月2日
發(fā)明者劉秉權(quán), 劉遠(yuǎn)超, 劉銘, 單麗莉, 孫承杰, 林磊, 王曉龍 申請(qǐng)人:哈爾濱工業(yè)大學(xué)