用于組織與產(chǎn)品相關(guān)的數(shù)據(jù)的方法、裝置以及計(jì)算機(jī)可讀介質(zhì)的制作方法
【專(zhuān)利摘要】各種實(shí)施方式涉及用于組織與產(chǎn)品相關(guān)的數(shù)據(jù)的方法、裝置以及計(jì)算機(jī)可讀介質(zhì)。實(shí)施方式涉及用于基于與產(chǎn)品有關(guān)的數(shù)據(jù)來(lái)生成用于產(chǎn)品的修正層級(jí)的方法。所述方法包括生成用于產(chǎn)品的初始層級(jí),所述初始層級(jí)包括多個(gè)節(jié)點(diǎn),每個(gè)節(jié)點(diǎn)代表不同的產(chǎn)品層面,所述多個(gè)節(jié)點(diǎn)取決于不同的產(chǎn)品層面之間的關(guān)系而相互連接。所述方法還包括從所述數(shù)據(jù)識(shí)別產(chǎn)品層面。所述方法額外地包括通過(guò)計(jì)算目標(biāo)函數(shù)為所識(shí)別出的產(chǎn)品層面確定在所述初始層級(jí)中的優(yōu)化位置。所述方法進(jìn)一步包括將所識(shí)別出的產(chǎn)品層面插入所述初始層級(jí)中的所述優(yōu)化位置以生成所述修正層級(jí)。
【專(zhuān)利說(shuō)明】用于組織與產(chǎn)品相關(guān)的數(shù)據(jù)的方法、裝置W及計(jì)算機(jī)可讀 介質(zhì)
【技術(shù)領(lǐng)域】
[0001] 各種實(shí)施方式涉及用于組織與產(chǎn)品相關(guān)的數(shù)據(jù)的方法、裝置W及計(jì)算機(jī)可讀介 質(zhì)。尤其,實(shí)施方式涉及:用于基于與產(chǎn)品有關(guān)的數(shù)據(jù)來(lái)生成用于產(chǎn)品的修正層級(jí)的方法; 用于基于與產(chǎn)品有關(guān)的數(shù)據(jù)來(lái)識(shí)別產(chǎn)品層面的方法;用于從與產(chǎn)品有關(guān)的數(shù)據(jù)確定用于產(chǎn) 品層面的層面情緒(sentiment)的方法;用于基于與產(chǎn)品有關(guān)的數(shù)據(jù)來(lái)分級(jí)產(chǎn)品層面的方 法;用于從與產(chǎn)品有關(guān)的數(shù)據(jù)確定產(chǎn)品情緒的方法;用于基于與產(chǎn)品有關(guān)的數(shù)據(jù)來(lái)生成產(chǎn) 品評(píng)價(jià)概要的方法;W及對(duì)應(yīng)的裝置W及計(jì)算機(jī)可讀介質(zhì)。
【背景技術(shù)】
[0002] 組織與產(chǎn)品相關(guān)的數(shù)據(jù)使得數(shù)據(jù)更能理解。數(shù)據(jù)可W包括文本、圖形、表格等。例 女口,如果數(shù)據(jù)被組織的話(huà),數(shù)據(jù)內(nèi)的訊息或者信息可W變得更清楚。取決于組織的方法,數(shù) 據(jù)內(nèi)的不同訊息或者信息可W變得更清楚。隨著數(shù)據(jù)的體積增加,越需要組織數(shù)據(jù)W識(shí)別 數(shù)據(jù)內(nèi)的訊息、信息、主題、課題、趨勢(shì)。
[0003] 與產(chǎn)品有關(guān)的數(shù)據(jù)可W指的是產(chǎn)品的一個(gè)或多個(gè)不同的層面(即特征)。例如, 如果產(chǎn)品是移動(dòng)電話(huà),示范的產(chǎn)品層面可W包括;可用性、尺寸、電池性能、處理性能W及重 量。所述數(shù)據(jù)可W包括對(duì)產(chǎn)品的評(píng)論或者評(píng)價(jià),更具體來(lái)說(shuō),對(duì)產(chǎn)品各個(gè)層面的評(píng)論或者評(píng) 價(jià)。
【發(fā)明內(nèi)容】
[0004] 第一方案提供了用于基于與產(chǎn)品有關(guān)的數(shù)據(jù)來(lái)生成用于產(chǎn)品的修正層級(jí)的方法, 所述方法包括:生成用于產(chǎn)品的初始層級(jí),所述初始層級(jí)包括多個(gè)節(jié)點(diǎn),每個(gè)節(jié)點(diǎn)代表不同 的產(chǎn)品層面,所述多個(gè)節(jié)點(diǎn)取決于不同的產(chǎn)品層面之間的關(guān)系而相互連接;從所述數(shù)據(jù)識(shí) 別產(chǎn)品層面;通過(guò)計(jì)算目標(biāo)函數(shù)為所識(shí)別出的產(chǎn)品層面確定在所述初始層級(jí)中的優(yōu)化位 置;W及將所識(shí)別出的產(chǎn)品層面插入所述初始層級(jí)中的所述優(yōu)化位置W生成所述修正層 級(jí)。
[0005] 第二方案提供了用于基于與產(chǎn)品有關(guān)的數(shù)據(jù)來(lái)生成用于產(chǎn)品的修正層級(jí)的裝置, 所述裝置包括:至少一個(gè)處理器;W及至少一個(gè)內(nèi)存包括計(jì)算機(jī)程序代碼;所述至少一個(gè) 內(nèi)存和所述計(jì)算機(jī)程序代碼構(gòu)造為利用所述至少一個(gè)處理器引起所述裝置至少:生成用于 產(chǎn)品的初始層級(jí),所述初始層級(jí)包括多個(gè)節(jié)點(diǎn),每個(gè)節(jié)點(diǎn)代表不同的產(chǎn)品層面,所述多個(gè)節(jié) 點(diǎn)取決于不同的產(chǎn)品層面之間的關(guān)系而相互連接;從所述數(shù)據(jù)識(shí)別產(chǎn)品層面;通過(guò)計(jì)算目 標(biāo)函數(shù)為所識(shí)別出的產(chǎn)品層面確定在所述初始層級(jí)中的優(yōu)化位置;W及將所識(shí)別出的產(chǎn)品 層面插入所述初始層級(jí)中的所述優(yōu)化位置W生成所述修正層級(jí)。
[0006] 第H方案提供了計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序代碼,計(jì)算機(jī)程序 代碼當(dāng)由計(jì)算機(jī)執(zhí)行時(shí)引起計(jì)算機(jī)執(zhí)行用于基于與產(chǎn)品有關(guān)的數(shù)據(jù)來(lái)生成用于產(chǎn)品的修 正層級(jí)的方法,所述方法是根據(jù)所述第一方案的方法。
[0007] 第四方案提供了用于基于與產(chǎn)品有關(guān)的數(shù)據(jù)來(lái)識(shí)別產(chǎn)品層面的方法,所述方法包 括:從所述數(shù)據(jù)的第一部分識(shí)別數(shù)據(jù)段;根據(jù)所述第一方案基于所述數(shù)據(jù)的第二部分生成 修正層級(jí);W及將所述數(shù)據(jù)段分類(lèi)為多個(gè)層面類(lèi)別之一,每個(gè)層面類(lèi)別關(guān)聯(lián)于由所述修正 層級(jí)中的不同節(jié)點(diǎn)代表的產(chǎn)品層面W識(shí)別所述數(shù)據(jù)段相關(guān)于哪個(gè)產(chǎn)品層面。
[0008] 第五方案提供了用于基于與產(chǎn)品有關(guān)的數(shù)據(jù)來(lái)識(shí)別產(chǎn)品層面的裝置,所述裝置包 括;至少一個(gè)處理器;W及至少一個(gè)內(nèi)存包括計(jì)算機(jī)程序代碼;所述至少一個(gè)內(nèi)存和所述 計(jì)算機(jī)程序代碼構(gòu)造為利用所述至少一個(gè)處理器引起所述裝置至少;從所述數(shù)據(jù)的第一部 分識(shí)別數(shù)據(jù)段;使用第二方案的裝置基于所述數(shù)據(jù)的第二部分生成修正層級(jí);W及將所述 數(shù)據(jù)段分類(lèi)為多個(gè)層面類(lèi)別之一,每個(gè)層面類(lèi)別關(guān)聯(lián)于由所述修正層級(jí)中的不同節(jié)點(diǎn)代表 的產(chǎn)品層面W識(shí)別所述數(shù)據(jù)段相關(guān)于哪個(gè)產(chǎn)品層面。
[0009] 第六方案提供了計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序代碼,計(jì)算機(jī)程序 代碼當(dāng)由計(jì)算機(jī)執(zhí)行時(shí)引起計(jì)算機(jī)執(zhí)行用于基于與產(chǎn)品有關(guān)的數(shù)據(jù)來(lái)識(shí)別產(chǎn)品層面的方 法,所述方法是根據(jù)第四方案的方法。
[0010] 第走方案提供了用于從與產(chǎn)品有關(guān)的數(shù)據(jù)確定用于產(chǎn)品層面的層面情緒的方法, 所述方法包括:從所述數(shù)據(jù)的第一部分識(shí)別數(shù)據(jù)段;根據(jù)所述第一方案,基于所述數(shù)據(jù)的 第二部分生成修正層級(jí);將所述數(shù)據(jù)段分類(lèi)為多個(gè)層面類(lèi)別之一,每個(gè)層面類(lèi)別關(guān)聯(lián)于由 所述修正層級(jí)中的不同節(jié)點(diǎn)代表的產(chǎn)品層面W識(shí)別所述數(shù)據(jù)段相關(guān)于哪個(gè)產(chǎn)品層面;從所 述數(shù)據(jù)段抽取與所述數(shù)據(jù)段相關(guān)的產(chǎn)品層面所對(duì)應(yīng)的觀(guān)點(diǎn);將所抽取出的觀(guān)點(diǎn)分類(lèi)為多個(gè) 觀(guān)點(diǎn)類(lèi)別之一,每個(gè)觀(guān)點(diǎn)類(lèi)別關(guān)聯(lián)于不同的觀(guān)點(diǎn),所述層面情緒是與所述一個(gè)觀(guān)點(diǎn)類(lèi)別關(guān) 聯(lián)的觀(guān)點(diǎn)。
[0011] 第八方案提供了用于從與產(chǎn)品有關(guān)的數(shù)據(jù)確定用于產(chǎn)品層面的層面情緒的裝置, 所述裝置包括:至少一個(gè)處理器;W及至少一個(gè)內(nèi)存包括計(jì)算機(jī)程序代碼;所述至少一個(gè) 內(nèi)存和所述計(jì)算機(jī)程序代碼構(gòu)造為利用所述至少一個(gè)處理器引起所述裝置至少:從所述數(shù) 據(jù)的第一部分識(shí)別數(shù)據(jù)段;使用第二方案的裝置基于所述數(shù)據(jù)的第二部分生成修正層級(jí); 將所述數(shù)據(jù)段分類(lèi)為多個(gè)層面類(lèi)別之一,每個(gè)層面類(lèi)別關(guān)聯(lián)于由所述修正層級(jí)中的不同節(jié) 點(diǎn)代表的產(chǎn)品層面W識(shí)別所述數(shù)據(jù)段相關(guān)于哪個(gè)產(chǎn)品層面;從所述數(shù)據(jù)段抽取與所述數(shù)據(jù) 段相關(guān)的產(chǎn)品層面所對(duì)應(yīng)的觀(guān)點(diǎn);W及將所抽取出的觀(guān)點(diǎn)分類(lèi)為多個(gè)觀(guān)點(diǎn)類(lèi)別之一,每個(gè) 觀(guān)點(diǎn)類(lèi)別關(guān)聯(lián)于不同的觀(guān)點(diǎn),所述層面情緒是與所述一個(gè)觀(guān)點(diǎn)類(lèi)別關(guān)聯(lián)的觀(guān)點(diǎn)。
[0012] 第九方案提供了計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序代碼,計(jì)算機(jī)程序 代碼當(dāng)由計(jì)算機(jī)執(zhí)行時(shí)引起計(jì)算機(jī)執(zhí)行用于從與產(chǎn)品有關(guān)的數(shù)據(jù)確定用于產(chǎn)品層面的層 面情緒的方法,所述方法是根據(jù)第走方案的方法。
[0013] 第十方案提供了用于基于與產(chǎn)品有關(guān)的數(shù)據(jù)來(lái)分級(jí)產(chǎn)品層面的方法,所述方法包 括:從所述數(shù)據(jù)識(shí)別產(chǎn)品層面;基于產(chǎn)品層面在數(shù)據(jù)中的出現(xiàn)頻率W及所識(shí)別出的產(chǎn)品層 面的影響測(cè)度,生成用于每個(gè)所識(shí)別出的產(chǎn)品層面的權(quán)重因子;W及基于所生成的權(quán)重因 子來(lái)分級(jí)所識(shí)別出的產(chǎn)品層面。
[0014] 第十一方案提供了用于基于與產(chǎn)品有關(guān)的數(shù)據(jù)來(lái)分級(jí)產(chǎn)品層面的裝置,所述裝置 包括;至少一個(gè)處理器;W及至少一個(gè)內(nèi)存包括計(jì)算機(jī)程序代碼;所述至少一個(gè)內(nèi)存和所 述計(jì)算機(jī)程序代碼構(gòu)造為利用所述至少一個(gè)處理器引起所述裝置至少:從所述數(shù)據(jù)識(shí)別產(chǎn) 品層面;基于產(chǎn)品層面在數(shù)據(jù)中的出現(xiàn)頻率W及所識(shí)別出的產(chǎn)品層面的影響測(cè)度,生成用 于每個(gè)所識(shí)別出的產(chǎn)品層面的權(quán)重因子;W及基于所生成的權(quán)重因子來(lái)分級(jí)所識(shí)別出的產(chǎn) 品層面。
[0015] 第十二方案提供了計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序代碼,計(jì)算機(jī)程 序代碼當(dāng)由計(jì)算機(jī)執(zhí)行時(shí)引起計(jì)算機(jī)執(zhí)行用于基于與產(chǎn)品有關(guān)的數(shù)據(jù)來(lái)分級(jí)產(chǎn)品層面的 方法,所述方法是根據(jù)第十方案的方法。
[0016] 第十H方案提供了用于從與產(chǎn)品有關(guān)的數(shù)據(jù)確定產(chǎn)品情緒的方法,所述方法包 括:根據(jù)第十方案基于所述數(shù)據(jù)的第一部分確定與產(chǎn)品相關(guān)的所分級(jí)的產(chǎn)品層面;從所述 數(shù)據(jù)的第二部分識(shí)別一個(gè)或多個(gè)特征,所述或者每個(gè)特征識(shí)別所分級(jí)的產(chǎn)品層面W及對(duì)應(yīng) 觀(guān)點(diǎn);基于其對(duì)應(yīng)觀(guān)點(diǎn)將每個(gè)特征分類(lèi)為多個(gè)觀(guān)點(diǎn)類(lèi)別之一,每個(gè)觀(guān)點(diǎn)類(lèi)別關(guān)聯(lián)于不同的 觀(guān)點(diǎn);W及基于所述多個(gè)觀(guān)點(diǎn)類(lèi)別中哪一個(gè)包含最多特征來(lái)確定產(chǎn)品情緒。
[0017] 第十四方案提供了用于從與產(chǎn)品有關(guān)的數(shù)據(jù)確定產(chǎn)品情緒的裝置,所述裝置包 括;至少一個(gè)處理器;W及至少一個(gè)內(nèi)存包括計(jì)算機(jī)程序代碼;所述至少一個(gè)內(nèi)存和所述 計(jì)算機(jī)程序代碼構(gòu)造為利用所述至少一個(gè)處理器引起所述裝置至少;使用第十一方案所述 的裝置基于所述數(shù)據(jù)的第一部分確定與產(chǎn)品相關(guān)的所分級(jí)的產(chǎn)品層面;從所述數(shù)據(jù)的第二 部分識(shí)別一個(gè)或多個(gè)特征,所述或者每個(gè)特征識(shí)別所分級(jí)的產(chǎn)品層面W及對(duì)應(yīng)觀(guān)點(diǎn);基于 其對(duì)應(yīng)觀(guān)點(diǎn)將每個(gè)特征分類(lèi)為多個(gè)觀(guān)點(diǎn)類(lèi)別之一,每個(gè)觀(guān)點(diǎn)類(lèi)別關(guān)聯(lián)于不同的觀(guān)點(diǎn);W及 基于所述多個(gè)觀(guān)點(diǎn)類(lèi)別中哪一個(gè)包含最多特征來(lái)確定產(chǎn)品情緒。
[0018] 第十五方案提供了計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序代碼,計(jì)算機(jī)程 序代碼當(dāng)由計(jì)算機(jī)執(zhí)行時(shí)引起計(jì)算機(jī)執(zhí)行用于從與產(chǎn)品有關(guān)的數(shù)據(jù)確定產(chǎn)品情緒的方法, 所述方法是根據(jù)第十H方案的方法。
[0019] 第十六方案提供了用于基于與產(chǎn)品有關(guān)的數(shù)據(jù)來(lái)生成產(chǎn)品評(píng)價(jià)概要的方法,所述 方法包括:根據(jù)第十方案基于所述數(shù)據(jù)的第一部分確定與產(chǎn)品相關(guān)的所分級(jí)的產(chǎn)品層面; 從所述數(shù)據(jù)的第二部分抽取一個(gè)或多個(gè)數(shù)據(jù)段,基于所述數(shù)據(jù)段是否識(shí)別出所分級(jí)的產(chǎn)品 層面W及包含對(duì)應(yīng)觀(guān)點(diǎn)來(lái)計(jì)算用于所述或者每個(gè)所抽取出的數(shù)據(jù)段的相關(guān)性分?jǐn)?shù);W及取 決于它們的相應(yīng)相關(guān)性分?jǐn)?shù)來(lái)生成包括一個(gè)或多個(gè)所抽取出的數(shù)據(jù)段的產(chǎn)品評(píng)價(jià)概要。
[0020] 第十走方案提供了用于基于與產(chǎn)品有關(guān)的數(shù)據(jù)來(lái)生成產(chǎn)品評(píng)價(jià)概要的裝置,所述 裝置包括;至少一個(gè)處理器;W及至少一個(gè)內(nèi)存包括計(jì)算機(jī)程序代碼;所述至少一個(gè)內(nèi)存 和所述計(jì)算機(jī)程序代碼構(gòu)造為利用所述至少一個(gè)處理器引起所述裝置至少;使用第十一方 案的裝置基于所述數(shù)據(jù)的第一部分確定與產(chǎn)品相關(guān)的所分級(jí)的產(chǎn)品層面;從所述數(shù)據(jù)的第 二部分抽取一個(gè)或多個(gè)數(shù)據(jù)段,基于所述數(shù)據(jù)段是否識(shí)別出所分級(jí)的產(chǎn)品層面W及包含對(duì) 應(yīng)觀(guān)點(diǎn)來(lái)計(jì)算用于所述或者每個(gè)所抽取出的數(shù)據(jù)段的相關(guān)性分?jǐn)?shù);W及取決于它們的相應(yīng) 相關(guān)性分?jǐn)?shù)來(lái)生成包括一個(gè)或多個(gè)所抽取出的數(shù)據(jù)段的產(chǎn)品評(píng)價(jià)概要。
[0021] 第十八方案提供了計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序代碼,計(jì)算機(jī)程 序代碼當(dāng)由計(jì)算機(jī)執(zhí)行時(shí)引起計(jì)算機(jī)執(zhí)行用于基于與產(chǎn)品有關(guān)的數(shù)據(jù)來(lái)生成產(chǎn)品評(píng)價(jià)概 要的方法,所述方法是根據(jù)第十六方案的方法。
[0022] 應(yīng)該理解的是,在W下說(shuō)明中,一個(gè)方案(例如,方法)的進(jìn)一步特征及優(yōu)勢(shì)將同 樣應(yīng)用于對(duì)應(yīng)的方案(例如,對(duì)應(yīng)裝置或者對(duì)應(yīng)計(jì)算機(jī)可讀介質(zhì))中,在此在對(duì)應(yīng)的方案中 再次陳述。
【專(zhuān)利附圖】
【附圖說(shuō)明】
[0023] 通過(guò)W下說(shuō)明書(shū),僅依靠例子并結(jié)合附圖,本領(lǐng)域的技術(shù)人員將更好地理解和容 易明白本發(fā)明的實(shí)施方式,附圖中,類(lèi)似附圖標(biāo)記涉及類(lèi)似部件,其中:
[0024] 圖1示出了來(lái)自維基百科(W化ipedia)的示范產(chǎn)品說(shuō)明書(shū);
[002引圖2示出了來(lái)自CNet. com的示范產(chǎn)品說(shuō)明書(shū);
[0026] 圖3a是根據(jù)實(shí)施方式的用于層級(jí)組織的框架的流程圖;
[0027] 圖3b示出了根據(jù)實(shí)施方式的用于iPhone 3G產(chǎn)品的示范層級(jí)組織;
[0028] 圖4示出了來(lái)自網(wǎng)站Viewpoints, com的示范消費(fèi)者評(píng)價(jià);
[0029] 圖5示出了來(lái)自網(wǎng)站Reevoo. com的示范消費(fèi)者評(píng)價(jià);
[0030] 圖6是根據(jù)實(shí)施方式的用于產(chǎn)品層面識(shí)別的框架的流程圖;
[0031] 圖7示出了來(lái)自開(kāi)放目錄專(zhuān)案(OD巧的示范外部語(yǔ)言資源;
[003引 圖8示出了來(lái)自WordNet的示范外部語(yǔ)言資源;
[0033] 圖9是根據(jù)實(shí)施方式的用于情緒分類(lèi)的框架的流程圖;
[0034] 圖10示出了與示范產(chǎn)品評(píng)價(jià)數(shù)據(jù)組的統(tǒng)計(jì)相關(guān)的估計(jì)數(shù)據(jù),#指代評(píng)價(jià)/句子的 數(shù)量;
[0035] 圖11示出了與示范外部語(yǔ)言資源的統(tǒng)計(jì)相關(guān)的估計(jì)數(shù)據(jù);
[0036] 圖12示出了與對(duì)自由文本評(píng)價(jià)的產(chǎn)品層面識(shí)別的性能相關(guān)的估計(jì)數(shù)據(jù);
[0037] 圖13示出了與層面層級(jí)生成的性能相關(guān)的估計(jì)數(shù)據(jù)。應(yīng)注意的是,'w/H'指代包 括初始層級(jí)的方法,'w/o H'指的是不包括初始層級(jí)的方法;
[0038] 圖14示出了與不同比例的初始層級(jí)的影響相關(guān)的估計(jì)數(shù)據(jù);
[0039] 圖15示出了當(dāng)清除單個(gè)標(biāo)準(zhǔn)時(shí)與Fl-測(cè)量的改變的多個(gè)優(yōu)化標(biāo)準(zhǔn).%相關(guān)的估計(jì) 數(shù)據(jù);
[0040] 圖16示出了與語(yǔ)言特征對(duì)于語(yǔ)義距離學(xué)習(xí)的影響相關(guān)的估計(jì)數(shù)據(jù);
[0041] 圖17示出了與外部語(yǔ)言資源對(duì)于語(yǔ)義距離學(xué)習(xí)的影響相關(guān)的估計(jì)數(shù)據(jù);
[0042] 圖18示出了與層面級(jí)別情緒分類(lèi)的性能相關(guān)的估計(jì)數(shù)據(jù);
[0043] 圖19是根據(jù)實(shí)施方式的用于用生成的層級(jí)進(jìn)行產(chǎn)品層面識(shí)別的框架的流程圖;
[0044] 圖20示出了與在生成的層級(jí)的幫助下進(jìn)行層面識(shí)別的性能相關(guān)的估計(jì)數(shù)據(jù);
[0045] 圖21示出了與在層級(jí)的幫助下進(jìn)行含蓄層面識(shí)別的性能相關(guān)的估計(jì)數(shù)據(jù);
[0046] 圖22是根據(jù)實(shí)施方式的用于使用層級(jí)對(duì)層面進(jìn)行情緒分類(lèi)的框架的流程圖;
[0047] 圖23示出了與在層級(jí)的幫助下進(jìn)行層面級(jí)別情緒分類(lèi)的性能相關(guān)的估計(jì)數(shù)據(jù);
[0048] 圖24示出了對(duì)例子產(chǎn)品iPhone 3GS的數(shù)個(gè)例子層面;
[0049] 圖25是根據(jù)實(shí)施方式的用于層面分級(jí)的框架的流程圖;
[0050] 圖26示出了根據(jù)實(shí)施方式的概率層面分級(jí)算法的假代碼;
[0051] 圖27示出了與在NDCG@5方面進(jìn)行層面分級(jí)的性能相關(guān)的估計(jì)數(shù)據(jù);
[0052] 圖28示出了與在NDCG@10方面進(jìn)行層面分級(jí)的性能相關(guān)的估計(jì)數(shù)據(jù);
[0053] 圖29示出了與在NDCG@15方面進(jìn)行層面分級(jí)的性能相關(guān)的估計(jì)數(shù)據(jù);
[0054] 圖30示出了估計(jì)數(shù)據(jù),包括一表格,示出了用四種方法為iPhone3GS所分級(jí)出的 前10個(gè)層面;
[005引圖31示出了對(duì)例子產(chǎn)品i化one4的示范產(chǎn)品評(píng)價(jià);
[0056] 圖32是根據(jù)實(shí)施方式的具有層面分級(jí)結(jié)果的用于文件級(jí)別情緒分類(lèi)的框架的流 程圖;
[0057] 圖33示出了與由H個(gè)特征權(quán)重方法進(jìn)行的文件級(jí)別情緒分類(lèi)的性能相關(guān)的估計(jì) 數(shù)據(jù),即,布爾炬oolean)、術(shù)語(yǔ)頻率訂巧W及我們提出的層面分級(jí)AR權(quán)重;
[0058] 圖34是根據(jù)實(shí)施方式的具有層面分級(jí)結(jié)果的用于抽取式評(píng)價(jià)概要的框架的流程 圖;
[0059] 圖35a和3化示出了在ROUGE-I (35a)和R0UGE-2 (35b)方法與抽取式評(píng)價(jià)概要的 性能相關(guān)的估計(jì)數(shù)據(jù);
[0060] 圖36示出了估計(jì)數(shù)據(jù),包括一表格,示出了產(chǎn)品iPhone 3GS的樣本抽取概要;W 及,
[0061] 圖37是根據(jù)實(shí)施方式的計(jì)算機(jī)網(wǎng)絡(luò)裝置的示意圖。
【具體實(shí)施方式】
[0062] 各種實(shí)施方式涉及用于組織與產(chǎn)品相關(guān)的數(shù)據(jù)的方法、裝置W及計(jì)算機(jī)可讀介 質(zhì)。尤其,實(shí)施方式涉及用于生成修正層級(jí)的方法,用于識(shí)別產(chǎn)品層面的方法,用于確定層 面情緒的方法,用于分級(jí)產(chǎn)品層面的方法,用于確定產(chǎn)品情緒的方法,用于生成產(chǎn)品評(píng)價(jià)概 要的方法,W及對(duì)應(yīng)的裝置W及計(jì)算機(jī)可讀介質(zhì)。
[0063] W下的一部分說(shuō)明明確地或隱含地在計(jì)算機(jī)內(nèi)存中的數(shù)據(jù)中W算法和函數(shù)性或 圖像性表征操作的形式出現(xiàn)。該些算法的描述W及函數(shù)性或圖像性表征是數(shù)據(jù)處理領(lǐng)域的 技術(shù)人員使用的含義W將它們運(yùn)作的實(shí)質(zhì)最有效地傳遞給本領(lǐng)域的其他技術(shù)人員。此處, 算法通常設(shè)想為是步驟的自一致序列W形成期望結(jié)果。該些步驟是需要物理上操縱物理量 的步驟,物理量諸如能夠被存儲(chǔ)、傳遞、結(jié)合、比較W及W其他方式操作的電的、磁的或者光 學(xué)的信號(hào)。
[0064] 除非另有說(shuō)明,如W下可見(jiàn)的,將理解的是,在整個(gè)說(shuō)明書(shū)中,利用術(shù)語(yǔ)諸如"識(shí) 另IJ"、"抽取"、"分級(jí)"、"計(jì)算"、"確定"、"替換"、"生成"、"插入"、"分類(lèi)"、"輸出"等的討論指 代計(jì)算機(jī)系統(tǒng)或者類(lèi)似電子設(shè)備的行為W及處理,計(jì)算機(jī)系統(tǒng)或者類(lèi)似電子設(shè)備將計(jì)算機(jī) 系統(tǒng)內(nèi)表示為物理量的數(shù)據(jù)操縱及轉(zhuǎn)換為由計(jì)算機(jī)系統(tǒng)或其他信息存儲(chǔ)、傳遞或者顯示設(shè) 備內(nèi)的物理量類(lèi)似地表示的其他數(shù)據(jù)。
[0065] 本說(shuō)明書(shū)還公開(kāi)了用于執(zhí)行方法的操作的裝置。該種裝置可W專(zhuān)口構(gòu)造為用于所 需目的,或者可W包括選擇性地被激活或者由存儲(chǔ)在計(jì)算機(jī)中的計(jì)算機(jī)程序重構(gòu)的通用計(jì) 算機(jī)或者其他設(shè)備。此處提出的算法W及顯示器并不內(nèi)在地相關(guān)于任何特定計(jì)算機(jī)或者其 他裝置。各種通用機(jī)器可W用于根據(jù)此處教導(dǎo)的程序。可替換地,用來(lái)執(zhí)行所需方法步驟 的更專(zhuān)用裝置的的構(gòu)造可W是合適的。常規(guī)通用計(jì)算機(jī)的結(jié)構(gòu)件見(jiàn)于W下說(shuō)明中。
[0066] 此外,本說(shuō)明書(shū)還隱含公開(kāi)了計(jì)算機(jī)程序,因?yàn)閷?duì)本領(lǐng)域的技術(shù)人員來(lái)說(shuō)顯而易 見(jiàn)的是,此處描述的方法的各個(gè)步驟可W由計(jì)算機(jī)代碼實(shí)現(xiàn)。計(jì)算機(jī)程序不旨在限于任何 特定的程序語(yǔ)言W及其實(shí)施。將理解的是,可W使用各種程序語(yǔ)言W及其編碼來(lái)實(shí)施此處 包含的公開(kāi)的教導(dǎo)。而且,計(jì)算機(jī)程序不旨在限于任何特定的控制流。存在許多其他變型 的計(jì)算機(jī)程序,它們能夠使用不同的控制流,該并不超出本發(fā)明的精神或范圍。
[0067] 此外,一個(gè)或多個(gè)計(jì)算機(jī)程序的步驟可W并行執(zhí)行而不是順序執(zhí)行。該種計(jì)算機(jī) 程序可W存儲(chǔ)在任何計(jì)算機(jī)可讀介質(zhì)上。計(jì)算機(jī)可讀介質(zhì)可W包括存儲(chǔ)設(shè)備,諸如磁盤(pán)或 者光盤(pán)、內(nèi)存芯片、或者適合于與通用計(jì)算機(jī)接口的其他存儲(chǔ)設(shè)備。計(jì)算機(jī)可讀介質(zhì)還可W 包括諸如在因特網(wǎng)系統(tǒng)中典型的硬件介質(zhì),或者諸如在GSM移動(dòng)電話(huà)網(wǎng)絡(luò)中典型的無(wú)線(xiàn)介 質(zhì)。計(jì)算機(jī)程序當(dāng)在通用計(jì)算機(jī)上加載及實(shí)施時(shí)可有效地形成實(shí)施優(yōu)選方法的布置的裝 置。
[0068] 層級(jí)框架綜述
[0069] 對(duì)于特定產(chǎn)品,層級(jí)通常歸類(lèi)為數(shù)百個(gè)產(chǎn)品層面。例如,i化one3GS具有多于H百 個(gè)層面(見(jiàn)圖24),諸如"可用性"、"設(shè)計(jì)"、"應(yīng)用"、"3G網(wǎng)絡(luò)"等。某些層面可能比其他層 面更重要,并且對(duì)最終用戶(hù)決策W及廠(chǎng)商產(chǎn)品開(kāi)發(fā)策略具有更大影響。例如,i化one 3GS中 的某些層面如"易用性"和"電池"受到大多數(shù)用戶(hù)的關(guān)注,并且比其他層面如"USB"更重 要。對(duì)于相機(jī)產(chǎn)品,如"透鏡"和"圖像質(zhì)量"的層面可能會(huì)大大影響消費(fèi)者對(duì)于攝像機(jī)的 看法,該些層面比其他層面如"a/v連接線(xiàn)"和"腕帶"更加重要。因此,識(shí)別重要的產(chǎn)品層 面是對(duì)消費(fèi)者和廠(chǎng)商兩者都有利的。消費(fèi)者可W通過(guò)更多關(guān)注該些重要的層面方便地做出 明智的購(gòu)買(mǎi)決策,而廠(chǎng)商可W集中在提升該些層面的質(zhì)量上從而有效提升產(chǎn)品信譽(yù)。通常, 人們從眾多評(píng)價(jià)中手動(dòng)識(shí)別產(chǎn)品的重要層面是不現(xiàn)實(shí)的。
[0070] 各個(gè)實(shí)施方式涉及組織與產(chǎn)品相關(guān)的數(shù)據(jù)。特別地,實(shí)施方式涉及生成修正層級(jí) 的方法,識(shí)別產(chǎn)品層面的方法,確定層面情緒的方法,W及相應(yīng)的裝置和計(jì)算機(jī)可讀介質(zhì)。
[0071] "產(chǎn)品"可W是任意在售的商品或物品。比如,如,消費(fèi)性電子產(chǎn)品、食品、服裝、交 通工具、家具等等。其中,所述產(chǎn)品可W是移動(dòng)電話(huà)。
[007引"數(shù)據(jù)呵W包括任何與所述產(chǎn)品相關(guān)的信息。比如,如說(shuō)明書(shū)、評(píng)價(jià)、情況說(shuō)明書(shū)、 操作手冊(cè)、產(chǎn)品說(shuō)明、關(guān)于產(chǎn)品的文章等等。所述數(shù)據(jù)可W包含文本、圖形、表格等或其任何 組合。通常所述數(shù)據(jù)可能涉及產(chǎn)品或個(gè)別產(chǎn)品層面(如特點(diǎn))。所述數(shù)據(jù)可W包含對(duì)產(chǎn)品 及其中個(gè)別產(chǎn)品層面的觀(guān)點(diǎn)(如看法)或評(píng)論。所述觀(guān)點(diǎn)可W是離散的(如好或壞,或者 在1到10的整體數(shù)值范圍中)或者性質(zhì)上比較連續(xù)的。所述產(chǎn)品、觀(guān)點(diǎn)W及層面是可W從 作為文本、圖形、表格等或其任何組合的數(shù)據(jù)中推導(dǎo)出的。
[0073] 在下面的實(shí)施方式中,所述數(shù)據(jù)可W包括產(chǎn)品的觀(guān)點(diǎn)(如消費(fèi)者評(píng)價(jià))。所述觀(guān)點(diǎn) 可W是未經(jīng)組織的,將導(dǎo)致瀏覽和知識(shí)獲取上有難度。
[0074] 對(duì)于從所述數(shù)據(jù)生成評(píng)價(jià)層級(jí)的任務(wù),能夠涉及本體學(xué)習(xí)的傳統(tǒng)方法,首先從文 本中識(shí)別內(nèi)容,然后利用基于模式的方法或基于聚類(lèi)的方法在該些內(nèi)容中確定父子關(guān)系。 然而,基于模式的方法常常存在內(nèi)容中父子關(guān)系的不一致性,而基于聚類(lèi)的方法常導(dǎo)致低 查準(zhǔn)率。因此,通過(guò)直接利用該些方法從評(píng)價(jià)生成層面層級(jí),所產(chǎn)生的層級(jí)常常是不準(zhǔn)確 的,從而導(dǎo)致不符合要求的評(píng)價(jià)。此外,所生成的層級(jí)可能不符合消費(fèi)者的信息需求,消費(fèi) 者期望確定的子主題被呈現(xiàn)。
[0075] 另一方面,產(chǎn)品的領(lǐng)域知識(shí)可W從網(wǎng)絡(luò)得到。領(lǐng)域知識(shí)可W被理解為關(guān)于特定產(chǎn) 品的信息。所述信息可W從公知領(lǐng)域獲得。該些知識(shí)可W提供回答消費(fèi)者關(guān)鍵信息需求的 廣義結(jié)構(gòu)。例如,在論壇網(wǎng)站CNet. com上有多于248, 474個(gè)產(chǎn)品說(shuō)明書(shū)。圖1和圖2分別 不出了在維基百科(WWW. Wikipedia, com)和CNet. com上的移動(dòng)電話(huà)產(chǎn)品"iPhone3GS"的 產(chǎn)品說(shuō)明書(shū)。該些產(chǎn)品說(shuō)明書(shū)覆蓋了一些產(chǎn)品層面2 (如產(chǎn)品層面或特點(diǎn))并提供了產(chǎn)品 層面2的粗粒度父子關(guān)系4。該樣的領(lǐng)域知識(shí)有利于幫助將產(chǎn)品層面組織為層級(jí)。而從領(lǐng) 域知識(shí)獲得的最初層級(jí)有利于評(píng)價(jià)組織的大概結(jié)構(gòu),大概結(jié)構(gòu)常常太粗W至于不能覆蓋評(píng) 價(jià)中所評(píng)論(如消費(fèi)者觀(guān)點(diǎn))的具體產(chǎn)品層面。此外,在層級(jí)中的一些層面可W不是消費(fèi) 者對(duì)評(píng)價(jià)的興趣點(diǎn)。為了利于該兩者最佳,能夠整合初級(jí)領(lǐng)域知識(shí)結(jié)構(gòu)和評(píng)價(jià)的分布規(guī)律, 初級(jí)領(lǐng)域知識(shí)反映了產(chǎn)品中的消費(fèi)者感興趣,評(píng)價(jià)的分布規(guī)律指示當(dāng)前消費(fèi)者關(guān)也的興趣 點(diǎn)和主題。因此,初級(jí)評(píng)價(jià)層級(jí)可W被進(jìn)化成修正層級(jí),修正層級(jí)反映當(dāng)前消費(fèi)者觀(guān)點(diǎn)和興 趣點(diǎn)。
[0076] -實(shí)施方式提供了一種通過(guò)同時(shí)利用領(lǐng)域知識(shí)(如產(chǎn)品說(shuō)明書(shū))和與產(chǎn)品相關(guān)的 數(shù)據(jù)(如消費(fèi)者評(píng)價(jià))來(lái)生成評(píng)價(jià)層級(jí)組織的域輔助方法。該實(shí)施方式的結(jié)構(gòu)如圖3的流 程圖所示。
[0077] 在100處,尋找領(lǐng)域知識(shí)W確定某一產(chǎn)品的進(jìn)程描述。例如,領(lǐng)域知識(shí)可W從一個(gè) 或多個(gè)互聯(lián)網(wǎng)網(wǎng)站獲得,如,維基百科或者CNet。在102處,使用此領(lǐng)域知識(shí)來(lái)獲得初級(jí)層 面層級(jí),即用于將與產(chǎn)品相關(guān)的產(chǎn)品層面進(jìn)行組織的層級(jí)。在104處,與100和102串行或 者并行,從比如一個(gè)或多個(gè)互聯(lián)網(wǎng)網(wǎng)站獲得與產(chǎn)品相關(guān)的數(shù)據(jù)(如消費(fèi)者評(píng)價(jià))。在106 處,使用所獲得的數(shù)據(jù)來(lái)識(shí)別與產(chǎn)品相關(guān)的產(chǎn)品層面。
[0078] 在108處,基于102中開(kāi)發(fā)的初級(jí)層級(jí)和106中識(shí)別的產(chǎn)品層面來(lái)生成修正層級(jí)。 在一實(shí)施方式中,采用優(yōu)化方法遞增地將106中識(shí)別的層面插入到102中開(kāi)發(fā)的初級(jí)層級(jí) 的適當(dāng)位置,W獲得包含所有層面的層面層級(jí),即修正層級(jí)。W該方式,然后將104中獲得 的數(shù)據(jù)組織到108中開(kāi)發(fā)的修正層級(jí)中的相應(yīng)層面節(jié)點(diǎn)上。一個(gè)層面的最佳位置通過(guò)計(jì)算 目標(biāo)函數(shù)來(lái)獲得,目標(biāo)函數(shù)旨在優(yōu)化一個(gè)或多個(gè)標(biāo)準(zhǔn)。在一實(shí)施方式中,執(zhí)行多標(biāo)準(zhǔn)優(yōu)化。
[0079] 在110處,可W執(zhí)行情緒分類(lèi)W確定消費(fèi)者對(duì)所述層面的觀(guān)點(diǎn)。所述觀(guān)點(diǎn)可W從 與產(chǎn)品相關(guān)的數(shù)據(jù)中抽取。在112處,情緒可W增加到層級(jí)中W獲得更為詳盡的層級(jí)結(jié)構(gòu), 即包含觀(guān)點(diǎn)或情緒的層級(jí)結(jié)構(gòu)。在一實(shí)施方式中,上述方法可W通過(guò)帶有顯示屏的通用計(jì) 算機(jī)或者具有顯示屏的特別設(shè)計(jì)的硬件裝置執(zhí)行。相應(yīng)的,在112處,修正層級(jí)可W被送往 顯示屏W顯示給人類(lèi)消費(fèi)者。圖3b示出了依照一實(shí)施方式的修正層級(jí)。
[0080] 在圖3b的實(shí)施方式中,層級(jí)涉及特定產(chǎn)品(如iPhone 3G)且包括多種節(jié)點(diǎn),其 中每個(gè)節(jié)點(diǎn)代表不同的產(chǎn)品層面。例如,顯示了節(jié)點(diǎn)120(代表產(chǎn)品層面"軟件")和節(jié)點(diǎn) 122 (代表產(chǎn)品層面"多媒體")。節(jié)點(diǎn)120和122代表通過(guò)連接件124連接在一起的節(jié)點(diǎn) 對(duì)。連接件124指示節(jié)點(diǎn)120和122所代表的產(chǎn)品層面之間的父子關(guān)系。父節(jié)點(diǎn)是節(jié)點(diǎn) 120 (如軟件),因其比子節(jié)點(diǎn)122 (如多媒體)更靠近根節(jié)點(diǎn)126。層級(jí)的葉或根(如128 和130)可W代表對(duì)所述葉所連接的節(jié)點(diǎn)的產(chǎn)品層面的觀(guān)點(diǎn)。
[0081] 各個(gè)實(shí)施方式提供了基于產(chǎn)品相關(guān)的數(shù)據(jù)(如消費(fèi)者情緒)生成產(chǎn)品的修正層級(jí) 的方法。所述方法包括下面的內(nèi)容。生成產(chǎn)品的初始層級(jí),初始層級(jí)包括多個(gè)節(jié)點(diǎn),每個(gè)節(jié) 點(diǎn)代表不同的產(chǎn)品層面,多個(gè)節(jié)點(diǎn)取決于不同的產(chǎn)品層面之間的關(guān)系而相互連接。從所述 數(shù)據(jù)識(shí)別所述產(chǎn)品層面。通過(guò)計(jì)算目標(biāo)函數(shù)確定所識(shí)別出的產(chǎn)品層面在所述初始層級(jí)中的 優(yōu)化位置。將所識(shí)別出的產(chǎn)品層面插入初始層級(jí)中的優(yōu)化位置W生成修正層級(jí)。
[008引在實(shí)施方式中,基于產(chǎn)品的說(shuō)明書(shū)來(lái)生成初始層級(jí),例如,從諸如維基百科或CNet 的網(wǎng)站獲得的說(shuō)明書(shū)。
[0083] 在實(shí)施方式中,初始層級(jí)包括一個(gè)或多個(gè)節(jié)點(diǎn)對(duì),每個(gè)節(jié)點(diǎn)對(duì)具有連接在一起W 指示父子關(guān)系的父節(jié)點(diǎn)W及子節(jié)點(diǎn)。在實(shí)施方式中,初始層級(jí)包括根節(jié)點(diǎn),每個(gè)節(jié)點(diǎn)對(duì)的父 節(jié)點(diǎn)是最靠近根節(jié)點(diǎn)的節(jié)點(diǎn)。該可W是在接近度方面是最靠近的,或者在針對(duì)根節(jié)點(diǎn)的介 入節(jié)點(diǎn)的最小數(shù)量方面是最靠近的。
[0084] 在實(shí)施方式中,將所識(shí)別出的產(chǎn)品層面插入初始層級(jí)包括將所識(shí)別出的產(chǎn)品層面 關(guān)聯(lián)于現(xiàn)有節(jié)點(diǎn)W指示現(xiàn)有節(jié)點(diǎn)代表所識(shí)別出的產(chǎn)品層面。在實(shí)施方式中,將所識(shí)別出的 產(chǎn)品層面插入初始層級(jí)包括將新節(jié)點(diǎn)互連入初始層級(jí)W及將所識(shí)別出的產(chǎn)品層面關(guān)聯(lián)于 新節(jié)點(diǎn)W指示新節(jié)點(diǎn)代表所識(shí)別出的產(chǎn)品層面。例如,之前插入,節(jié)點(diǎn)A可W連接至節(jié)點(diǎn)B W形成節(jié)點(diǎn)對(duì)。節(jié)點(diǎn)A可W是父節(jié)點(diǎn),而節(jié)點(diǎn)B可W是子節(jié)點(diǎn)。例如,節(jié)點(diǎn)A可W代表產(chǎn)品 層面'硬件',而節(jié)點(diǎn)B可W代表產(chǎn)品層面'內(nèi)存'。新節(jié)點(diǎn)可W關(guān)聯(lián)于新產(chǎn)品層面'容 量',即內(nèi)存容量。因此,新節(jié)點(diǎn)C可W加入作為節(jié)點(diǎn)B的子節(jié)點(diǎn),從而代表著'容量'是父 特征'內(nèi)存'的子特征。
[0085] 層級(jí)組織框架
[0086] 如圖3所示的,一實(shí)施方式包括四個(gè)要素;(a)初始層面層級(jí)獲取;化)產(chǎn)品層面 識(shí)別;(C)層面層級(jí)生成;W及(d)產(chǎn)品層面上的情緒分類(lèi)。下面定義一些符號(hào)并詳細(xì)描述 該些要素。
[0087] 初步準(zhǔn)備W及符號(hào)
[0088] 在一實(shí)施方式中,層面層級(jí)可W是由一組節(jié)點(diǎn)組成的樹(shù)。每個(gè)節(jié)點(diǎn)可W代表(或 者關(guān)聯(lián)于)一個(gè)獨(dú)特的產(chǎn)品層面。此外,在該些節(jié)點(diǎn)及它們代表的層面中可W有一組父子 關(guān)系R。例如,兩個(gè)相鄰節(jié)點(diǎn)可W互聯(lián),W指示由該兩個(gè)節(jié)點(diǎn)(或者節(jié)點(diǎn)對(duì))代表的兩個(gè)層 面之間的父子關(guān)系。父節(jié)點(diǎn)可W是所述層級(jí)中最靠近根節(jié)點(diǎn)的那個(gè)節(jié)點(diǎn)。在一實(shí)施方式中, 最靠近可W是指物理上的靠近或僅僅是在兩者之間有較少的節(jié)點(diǎn)。
[0089] 在一實(shí)施方式中,給出了一產(chǎn)品的消費(fèi)者評(píng)價(jià),WA = {ai. ..,aj表示在所述評(píng)價(jià) 中論及的產(chǎn)品層面。tf(A°,於)表示從領(lǐng)域知識(shí)獲得的初始層級(jí)。它包括一組層面A°和一 組關(guān)系R°。各個(gè)實(shí)施方式旨在構(gòu)建一個(gè)層面層級(jí)H(A,時(shí),W包括A中的所有層面及其父子 關(guān)系R,從而所有的消費(fèi)者評(píng)價(jià)能夠分層級(jí)地組織起來(lái)。要注意的是可W是空的。
[0090] 初始層級(jí)獲得
[0091] 如前所述,在某些論壇網(wǎng)站(如維基百科,CNet)中產(chǎn)品說(shuō)明書(shū)覆蓋某些產(chǎn)品層面 和該些產(chǎn)品層面中的粗粒度父子關(guān)系。該樣的領(lǐng)域知識(shí)有利于幫助將層面組織到層級(jí)中。
[0092] 在一實(shí)施方式中,初始層面層級(jí)從產(chǎn)品說(shuō)明書(shū)中自動(dòng)獲得。方法首先識(shí)別覆蓋產(chǎn) 品說(shuō)明書(shū)的Web頁(yè)面區(qū)域并將不相干的內(nèi)容從Web頁(yè)面清除。然后該方法基于HTML標(biāo)簽 解析包含有產(chǎn)品信息的區(qū)域,識(shí)別層面及其結(jié)構(gòu)。通過(guò)規(guī)劃所述層面及其結(jié)構(gòu),該方法生成 初始層面層級(jí)。
[009引產(chǎn)品層面識(shí)別
[0094] 如圖4和圖5所示,消費(fèi)者評(píng)價(jià)由論壇網(wǎng)站上的不同格式組成。例如,諸如CNet. com的網(wǎng)站要求消費(fèi)者給出產(chǎn)品的總體評(píng)分,提供對(duì)某些產(chǎn)品層面的概要數(shù)據(jù)或簡(jiǎn)明的正 負(fù)面觀(guān)點(diǎn)(即贊成和反對(duì)),W及在自由文本156中寫(xiě)下一段詳細(xì)的評(píng)價(jià)。如圖4中尤其可 見(jiàn),某些其他網(wǎng)站,如Viewpoints, com,僅僅要求一個(gè)總體評(píng)分150, 一個(gè)提要式的標(biāo)題152 W及一段自由文本評(píng)價(jià)154。如圖5尤其可見(jiàn),某些其它網(wǎng)站,如Reevoo. com,在某些層面 上包括了一個(gè)總體評(píng)分158、簡(jiǎn)要肯定觀(guān)點(diǎn)160和反對(duì)觀(guān)點(diǎn)162。
[009引總么除了綜合評(píng)分,消費(fèi)者評(píng)價(jià)可W包括概要數(shù)據(jù)(如贊成和反對(duì))、自由文本 評(píng)價(jià)或者兩者都有。對(duì)于概要數(shù)據(jù)(如贊成和反對(duì)),層面可W通過(guò)抽取常用名詞術(shù)語(yǔ)來(lái)識(shí) 另IJ。該樣,通過(guò)從概要數(shù)據(jù)抽取常用名詞術(shù)語(yǔ)能夠獲得高度準(zhǔn)確的層面。此外,該些常用術(shù) 語(yǔ)有利于識(shí)別自由文本評(píng)價(jià)中的層面。
[0096] 圖6是根據(jù)一個(gè)實(shí)施方式的識(shí)別產(chǎn)品層面的方法的流程圖。下面描述此方法的細(xì) 節(jié)。
[0097] 在200處,如上述提出的那樣獲得消費(fèi)者評(píng)價(jià)??蒞理解的是,在本實(shí)施方式中, 消費(fèi)者評(píng)價(jià)代表與某一產(chǎn)品相關(guān)的數(shù)據(jù)。所述數(shù)據(jù)可W從各種互聯(lián)網(wǎng)網(wǎng)站獲得。在202處, 從200中獲得的數(shù)據(jù)中抽取數(shù)據(jù)段。例如,可W將在200中獲得的每個(gè)消費(fèi)者評(píng)價(jià)的自由文 本評(píng)價(jià)部分154分成句子。在204處,可W例如使用斯坦福解析器來(lái)解析每個(gè)數(shù)據(jù)段(例 女口,句子)??蒞使用此解析操作從所述數(shù)據(jù)中識(shí)別和清除不相關(guān)的內(nèi)容。
[0098] 在206處,然后可W從所述數(shù)據(jù)段解析樹(shù)中抽取常用名詞短語(yǔ)(N巧作為層面候 選。可W理解的是,名詞短語(yǔ)是從所述數(shù)據(jù)中抽取的數(shù)據(jù)段的特定類(lèi)型。因此,在其他實(shí)施 方式中,可W從所述數(shù)據(jù)抽取數(shù)據(jù)段(而不是名詞短語(yǔ))。
[0099] 該些NP候選可W包含噪聲(即不是層面的NP)。然而,可W規(guī)劃評(píng)價(jià)的其他部 分(比如概要數(shù)據(jù)(如贊成評(píng)價(jià)160和反對(duì)評(píng)價(jià)162))來(lái)提煉候選,因?yàn)樵撔┢渌糠挚?W更清楚地識(shí)別產(chǎn)品層面。尤其,在208處,可W獲得概要數(shù)據(jù)。在210處,概要數(shù)據(jù)中的 常用名詞術(shù)語(yǔ)可W被探查作為特征,并用于訓(xùn)練分類(lèi)器。例如,假設(shè)總共收集了 N個(gè)常用 名詞術(shù)語(yǔ),每個(gè)常用名詞術(shù)語(yǔ)可W認(rèn)為是一個(gè)樣本。也就是,每個(gè)常用名詞術(shù)語(yǔ)可W表示 為只有一個(gè)維度的N維矢量,即具有值1而其他都為0。基于該種表示法,可W訓(xùn)練分類(lèi) 器。分類(lèi)器可W是支持向量機(jī)(SVM)、樸素貝葉斯OJaive Bayes)和最大賭模型(Maximum 化tropyModel)。在一個(gè)實(shí)施方式中,分類(lèi)器是單類(lèi)支持向量機(jī)(SVM),該樣將NP候選分類(lèi) 為層面或者不分類(lèi)。
[0100] 可W理解的是,在一些其他實(shí)施方式中,贊成和反對(duì)評(píng)價(jià)可W是不必要的。反而, 可W提供一些其他數(shù)據(jù)(如文本,圖形,表格等),依賴(lài)于該些術(shù)語(yǔ)清楚地識(shí)別帶有關(guān)聯(lián)觀(guān) 點(diǎn)的產(chǎn)品層面。該數(shù)據(jù)可W指代一般意義上的"概要數(shù)據(jù)",其中贊成和反對(duì)評(píng)價(jià)可W是概 要數(shù)據(jù)的特定形式。該數(shù)據(jù)可W認(rèn)為是概要數(shù)據(jù),因?yàn)樗爬水a(chǎn)品層面W及其上對(duì)應(yīng)的 評(píng)價(jià)。概要數(shù)據(jù)可W從200中獲得的數(shù)據(jù)抽取。
[0101] 在212處,可W使用經(jīng)訓(xùn)練的分類(lèi)器識(shí)別候選中的真正層面??蒞理解的是,此處 理可W不僅僅只是簡(jiǎn)單比較每個(gè)候選和概要數(shù)據(jù)中所識(shí)別的每個(gè)層面。反而,此處理可W 使用機(jī)械學(xué)習(xí)來(lái)判斷是否新的術(shù)語(yǔ)與包括在概要數(shù)據(jù)中的不同但對(duì)應(yīng)的術(shù)語(yǔ)一樣。
[0102] 所獲得的層面可W包含一些同義詞術(shù)語(yǔ),比如,如"耳機(jī)"和"頭戴式耳機(jī)"。相應(yīng) 的,在214處,可W進(jìn)一步執(zhí)行同義詞聚類(lèi)W獲取獨(dú)特的層面。技術(shù)上,兩個(gè)層面之間的距 離可W通過(guò)余弦相似性測(cè)量。與所獲得的層面相關(guān)的同義詞術(shù)語(yǔ)可W從同義詞字典(如 http://thesaurus. com)中抽取,并作為用于聚類(lèi)的特征。然后在216中收集所識(shí)別的結(jié)果 層面。在一個(gè)實(shí)施方式中,可W通過(guò)帶有顯示屏的通用計(jì)算機(jī)或者帶有顯示屏的特別設(shè)計(jì) 的硬件裝置執(zhí)行所述方法。相應(yīng)的,在216處,可W將所識(shí)別的層面發(fā)送給顯示屏W顯示給 人類(lèi)消費(fèi)者。
[0103] 在一實(shí)施方式中,從與產(chǎn)品有關(guān)的數(shù)據(jù)識(shí)別產(chǎn)品層面包括從數(shù)據(jù)抽取一個(gè)或多個(gè) 名詞短語(yǔ)。
[0104] 在一實(shí)施方式中,如果所抽取的名詞短語(yǔ)與層面類(lèi)別有關(guān)聯(lián)的產(chǎn)品層面相一致, 則將所抽取的名詞短語(yǔ)分類(lèi)為層面類(lèi)別,所述層面類(lèi)別關(guān)聯(lián)于一個(gè)或多個(gè)不同的產(chǎn)品層 面。在一實(shí)施方式中,術(shù)語(yǔ)"相一致"可W包括但不限于"匹配"。例如,即使產(chǎn)品層面的精確 術(shù)語(yǔ)不包括在名詞短語(yǔ)中,分類(lèi)處理也可W識(shí)別所述名詞短語(yǔ)為對(duì)應(yīng)于特定的產(chǎn)品層面。 例如,分類(lèi)可W采用單類(lèi)SVM執(zhí)行。在一實(shí)施方式中,層面類(lèi)別可W與多個(gè)(例如,所有) 產(chǎn)品層面相關(guān)聯(lián)。該樣,所抽取的名詞短語(yǔ)既可W分類(lèi)也可W不分類(lèi),該取決于其是否為產(chǎn) 品層面。因此,真正的產(chǎn)品層面可W從所抽取的名詞短語(yǔ)識(shí)別。
[0105] 在一不同的實(shí)施方式中,可W將所抽取的名詞短語(yǔ)分類(lèi)到多個(gè)層面類(lèi)別中之一, 每個(gè)層面類(lèi)別關(guān)聯(lián)于不同的產(chǎn)品層面。W該方式,所抽取的名詞短語(yǔ)可W被識(shí)別為是否為 所識(shí)別的產(chǎn)品層面。
[0106] 在一實(shí)施方式中,可W將所抽取的多個(gè)不同的名詞短語(yǔ)聚類(lèi)在一起,其中所抽取 的多個(gè)不同的名詞短語(yǔ)中的每個(gè)包括對(duì)應(yīng)的同義詞術(shù)語(yǔ)。W該方式,與相同產(chǎn)品層面有關(guān) 的不同名詞短語(yǔ)可W被合并在一起。例如,各種名詞短語(yǔ)可W包括術(shù)語(yǔ)"頭戴式耳機(jī)",而 其他各種名詞短語(yǔ)可W包括術(shù)語(yǔ)"耳機(jī)"。由于"頭戴式耳機(jī)"和"耳機(jī)"涉及相同的產(chǎn)品層 面,所W所有該些名詞短語(yǔ)可W被合并在一起。在本實(shí)施方式中,"頭戴式耳機(jī)"和"耳機(jī)" 是對(duì)應(yīng)的同義詞術(shù)語(yǔ)。在一實(shí)施方式中,可W在上面提到的分類(lèi)步驟之后執(zhí)行同義詞聚類(lèi) 的步驟。
[0107] 層面層級(jí)的生成
[010引為了建立層級(jí),可W將新識(shí)別的層面遞增地插入初始層級(jí)內(nèi)的適當(dāng)位置。最優(yōu)位 置可W通過(guò)多標(biāo)準(zhǔn)優(yōu)化方法找到。下面對(duì)本實(shí)施方式的進(jìn)一步詳細(xì)說(shuō)明。
[0109] 公式化
[0110] 在一實(shí)施方式中,給出了從評(píng)價(jià)識(shí)別出的層面A = {ai. ..,ak},W及從領(lǐng)域知識(shí)中 獲得的初始層級(jí)tf(A°,R°),使用多標(biāo)準(zhǔn)優(yōu)化方法來(lái)生成層面(即修正)層級(jí)H*,該層級(jí)分 配A中的所有層面,包括初始層級(jí)中不包括的那些,如A-A"。該方法遞增地將新識(shí)別出的層 面插入初始層級(jí)內(nèi)的適當(dāng)位置。通過(guò)多標(biāo)準(zhǔn)找到最優(yōu)位置。該標(biāo)準(zhǔn)應(yīng)該保證每個(gè)層面將最 可能被分配在所述層級(jí)內(nèi)其父層面之下。
[0111] 在引入標(biāo)準(zhǔn)之前,首先需要定義度量,命名語(yǔ)義距離d(a,,ay), W確定層面a,和ay 之間的父子關(guān)系。d(ay,ay)用公式表示為一些W下特征的加權(quán)和,
[0112] d(ax,3y)=乙 J W jfjbx,3y) (3.1)
[011引其中,Wj是第j個(gè)特征函數(shù)?)的權(quán)值。特征函數(shù)f ( ?)的估計(jì)和d(ax,ay) 的學(xué)習(xí)(即權(quán)值《)將在后面描述。
[0114] 此外,引入信息函數(shù)In化(H) W測(cè)量層級(jí)H的整個(gè)語(yǔ)義距離。Info(H)用公式表示 為層級(jí)內(nèi)所有層面對(duì)的語(yǔ)義距離之和,如下:
[011 引
【權(quán)利要求】
1. 一種用于基于與產(chǎn)品有關(guān)的數(shù)據(jù)來(lái)生成用于所述產(chǎn)品的修正層級(jí)的方法,所述方法 包括: 生成用于所述產(chǎn)品的初始層級(jí),所述初始層級(jí)包括多個(gè)節(jié)點(diǎn),每個(gè)節(jié)點(diǎn)代表不同的產(chǎn) 品層面,所述多個(gè)節(jié)點(diǎn)取決于不同的產(chǎn)品層面之間的關(guān)系而相互連接; 從所述數(shù)據(jù)識(shí)別產(chǎn)品層面; 通過(guò)計(jì)算目標(biāo)函數(shù)為所識(shí)別出的產(chǎn)品層面確定在所述初始層級(jí)中的優(yōu)化位置;以及 將所識(shí)別出的產(chǎn)品層面插入所述初始層級(jí)中的所述優(yōu)化位置以生成所述修正層級(jí)。
2. 根據(jù)權(quán)利要求1所述的方法,其中,基于所述產(chǎn)品的說(shuō)明書(shū)來(lái)生成所述初始層級(jí)。
3. 根據(jù)權(quán)利要求1或2所述的方法,其中,所述初始層級(jí)包括一個(gè)或多個(gè)節(jié)點(diǎn)對(duì),每個(gè) 節(jié)點(diǎn)對(duì)具有連接在一起以指示父子關(guān)系的父節(jié)點(diǎn)以及子節(jié)點(diǎn)。
4. 根據(jù)權(quán)利要求3所述的方法,其中,所述初始層級(jí)包括根節(jié)點(diǎn),所述或每個(gè)節(jié)點(diǎn)對(duì)的 父節(jié)點(diǎn)是最靠近所述根節(jié)點(diǎn)的節(jié)點(diǎn)。
5. 根據(jù)前述任一權(quán)利要求所述的方法,其中,從所述數(shù)據(jù)識(shí)別產(chǎn)品層面包括從所述數(shù) 據(jù)抽取一個(gè)或多個(gè)名詞短語(yǔ)。
6. 根據(jù)權(quán)利要求5所述的方法,進(jìn)一步包括:如果抽取出的名詞短語(yǔ)符合與層面類(lèi)別 關(guān)聯(lián)的產(chǎn)品層面,則將抽取出的名詞短語(yǔ)分類(lèi)為所述層面類(lèi)別,所述層面類(lèi)別關(guān)聯(lián)于一個(gè) 或多個(gè)不同的產(chǎn)品層面。
7. 根據(jù)權(quán)利要求5或6所述的方法,進(jìn)一步包括將多個(gè)不同的抽取出的名詞短語(yǔ)聚集 在一起,其中,所述多個(gè)不同的抽取出的名詞短語(yǔ)中的每個(gè)包括對(duì)應(yīng)的同義術(shù)語(yǔ)。
8. 根據(jù)前述任一權(quán)利要求所述的方法,其中,確定所述優(yōu)化位置包括: 將所識(shí)別出的產(chǎn)品層面插入所述初始層級(jí)中的多個(gè)樣本位置中的每個(gè); 計(jì)算與每個(gè)樣本位置相關(guān)的定位分?jǐn)?shù),所述定位分?jǐn)?shù)是所述樣本位置的適當(dāng)性的測(cè) 度;以及 基于與每個(gè)樣本位置相關(guān)的所述定位分?jǐn)?shù)來(lái)確定所述優(yōu)化位置。
9. 根據(jù)權(quán)利要求8所述的方法,其中,所述定位分?jǐn)?shù)是層級(jí)語(yǔ)義距離的改變的測(cè)度,所 述層級(jí)語(yǔ)義距離是用于所述初始層級(jí)中的每個(gè)節(jié)點(diǎn)對(duì)的層面語(yǔ)義距離的總和,每個(gè)層面語(yǔ) 義距離是由節(jié)點(diǎn)對(duì)所代表的兩個(gè)產(chǎn)品層面的意思之間的類(lèi)似性的測(cè)度。
10. 根據(jù)權(quán)利要求8或9所述的方法,其中,所述定位分?jǐn)?shù)是所述初始層級(jí)的結(jié)構(gòu)中的 改變的測(cè)度。
11. 根據(jù)權(quán)利要求8、9或10所述的方法,其中,所述定位分?jǐn)?shù)是與所述初始層級(jí)中的節(jié) 點(diǎn)對(duì)相關(guān)的第一層面語(yǔ)義距離和第二層面語(yǔ)義距離之間的改變的測(cè)度,所述第一層面語(yǔ)義 距離和第二層面語(yǔ)義距離是由節(jié)點(diǎn)對(duì)所代表的兩個(gè)產(chǎn)品層面的意思之間的類(lèi)似性的測(cè)度, 基于所述初始層級(jí)來(lái)計(jì)算所述第一層面語(yǔ)義距離,基于與所述產(chǎn)品有關(guān)的輔助數(shù)據(jù)來(lái)計(jì)算 所述第二語(yǔ)義距離。
12. 根據(jù)前述任一權(quán)利要求所述的方法,其中,將所識(shí)別出的產(chǎn)品層面插入所述初始層 級(jí)包括將所識(shí)別出的產(chǎn)品層面關(guān)聯(lián)于現(xiàn)有節(jié)點(diǎn)以指示所述現(xiàn)有節(jié)點(diǎn)代表所識(shí)別出的產(chǎn)品 層面。
13. 根據(jù)前述任一權(quán)利要求所述的方法,其中,將所識(shí)別出的產(chǎn)品層面插入所述初始層 級(jí)包括將新節(jié)點(diǎn)互連到所述初始層級(jí)內(nèi)以及將所識(shí)別出的產(chǎn)品層面關(guān)聯(lián)于所述新節(jié)點(diǎn)以 指示所述新節(jié)點(diǎn)代表所識(shí)別出的產(chǎn)品層面。
14. 根據(jù)前述任一權(quán)利要求所述的方法,進(jìn)一步包括: 基于所述數(shù)據(jù)確定用于所識(shí)別出的產(chǎn)品層面的層面情緒;以及 將所述層面情緒關(guān)聯(lián)于所述修正層級(jí)中的識(shí)別出的產(chǎn)品層面。
15. 根據(jù)權(quán)利要求14所述的方法,其中,確定層面情緒包括: 從所述數(shù)據(jù)抽取一個(gè)或多個(gè)層面觀(guān)點(diǎn),所述或者每個(gè)層面觀(guān)點(diǎn)對(duì)識(shí)別出的產(chǎn)品層面以 及對(duì)應(yīng)觀(guān)點(diǎn)進(jìn)行識(shí)別; 基于所述對(duì)應(yīng)觀(guān)點(diǎn)將所述或者每個(gè)層面觀(guān)點(diǎn)分類(lèi)為多個(gè)觀(guān)點(diǎn)類(lèi)別之一,每個(gè)觀(guān)點(diǎn)類(lèi)別 關(guān)聯(lián)于不同的觀(guān)點(diǎn);以及 基于所述多個(gè)觀(guān)點(diǎn)類(lèi)別中哪一個(gè)包含最多層面觀(guān)點(diǎn)來(lái)確定用于識(shí)別出的產(chǎn)品層面的 層面情緒。
16. 根據(jù)權(quán)利要求15所述的方法,其中,所述多個(gè)觀(guān)點(diǎn)類(lèi)別包括正面觀(guān)點(diǎn)類(lèi)別以及負(fù) 面觀(guān)點(diǎn)類(lèi)別。
17. -種用于基于與產(chǎn)品有關(guān)的數(shù)據(jù)來(lái)生成用于所述產(chǎn)品的修正層級(jí)的裝置,所述裝 置包括: 至少一個(gè)處理器; 以及包括計(jì)算機(jī)程序代碼的至少一個(gè)內(nèi)存; 其中,所述至少一個(gè)內(nèi)存和所述計(jì)算機(jī)程序代碼構(gòu)造為通過(guò)所述至少一個(gè)處理器使得 所述裝置至少進(jìn)行以下步驟: 生成用于所述產(chǎn)品的初始層級(jí),所述初始層級(jí)包括多個(gè)節(jié)點(diǎn),每個(gè)節(jié)點(diǎn)代表不同的產(chǎn) 品層面,所述多個(gè)節(jié)點(diǎn)取決于不同的產(chǎn)品層面之間的關(guān)系而相互連接; 從所述數(shù)據(jù)識(shí)別產(chǎn)品層面; 通過(guò)計(jì)算目標(biāo)函數(shù)為所識(shí)別出的產(chǎn)品層面確定在所述初始層級(jí)中的優(yōu)化位置;以及 將所識(shí)別出的產(chǎn)品層面插入所述初始層級(jí)中的所述優(yōu)化位置以生成所述修正層級(jí)。
18. -種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序代碼,當(dāng)計(jì)算機(jī)程序代碼由計(jì)算 機(jī)執(zhí)行時(shí)使得所述計(jì)算機(jī)執(zhí)行用于基于與產(chǎn)品有關(guān)的數(shù)據(jù)來(lái)生成用于所述產(chǎn)品的修正層 級(jí)的方法,所述方法是根據(jù)權(quán)利要求1至16中任一項(xiàng)所述的方法。
19. 一種用于基于與產(chǎn)品有關(guān)的數(shù)據(jù)來(lái)識(shí)別產(chǎn)品層面的方法,所述方法包括: 從所述數(shù)據(jù)的第一部分識(shí)別數(shù)據(jù)段; 根據(jù)權(quán)利要求1至16中任一項(xiàng)所述的方法,基于所述數(shù)據(jù)的第二部分生成修正層級(jí); 以及 將所述數(shù)據(jù)段分類(lèi)為多個(gè)層面類(lèi)別之一,每個(gè)層面類(lèi)別關(guān)聯(lián)于由所述修正層級(jí)中的不 同節(jié)點(diǎn)所代表的產(chǎn)品層面以識(shí)別所述數(shù)據(jù)段相關(guān)于哪個(gè)產(chǎn)品層面。
20. 根據(jù)權(quán)利要求19所述的方法,其中,進(jìn)行分類(lèi)包括確定用于每個(gè)層面類(lèi)別的相關(guān) 性分?jǐn)?shù),所述相關(guān)性分?jǐn)?shù)指示所述數(shù)據(jù)段如何類(lèi)似于與所述層面類(lèi)別關(guān)聯(lián)的產(chǎn)品層面。
21. 根據(jù)權(quán)利要求20所述的方法,其中,識(shí)別所述數(shù)據(jù)段相關(guān)于哪個(gè)產(chǎn)品層面包括確 定相關(guān)性分?jǐn)?shù)低于預(yù)定閾值的層面類(lèi)別。
22. -種用于基于與產(chǎn)品有關(guān)的數(shù)據(jù)來(lái)識(shí)別產(chǎn)品層面的裝置,所述裝置包括: 至少一個(gè)處理器; 以及包括計(jì)算機(jī)程序代碼的至少一個(gè)內(nèi)存; 其中,所述至少一個(gè)內(nèi)存和所述計(jì)算機(jī)程序代碼構(gòu)造為通過(guò)所述至少一個(gè)處理器使得 所述裝置至少進(jìn)行以下步驟: 從所述數(shù)據(jù)的第一部分識(shí)別數(shù)據(jù)段; 使用根據(jù)權(quán)利要求17所述的裝置基于所述數(shù)據(jù)的第二部分生成修正層級(jí);以及 將所述數(shù)據(jù)段分類(lèi)為多個(gè)層面類(lèi)別之一,每個(gè)層面類(lèi)別關(guān)聯(lián)于由所述修正層級(jí)中的不 同節(jié)點(diǎn)所代表的產(chǎn)品層面以識(shí)別所述數(shù)據(jù)段相關(guān)于哪個(gè)產(chǎn)品層面。
23. -種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序代碼,當(dāng)計(jì)算機(jī)程序代碼由計(jì)算 機(jī)執(zhí)行時(shí)使得所述計(jì)算機(jī)執(zhí)行用于基于與產(chǎn)品有關(guān)的數(shù)據(jù)來(lái)識(shí)別產(chǎn)品層面的方法,所述方 法是根據(jù)權(quán)利要求19至21中任一項(xiàng)所述的方法。
24. -種用于通過(guò)與產(chǎn)品有關(guān)的數(shù)據(jù)確定用于產(chǎn)品層面的層面情緒的方法,所述方法 包括: 從所述數(shù)據(jù)的第一部分識(shí)別數(shù)據(jù)段; 根據(jù)權(quán)利要求1至16中任一項(xiàng)所述的方法,基于所述數(shù)據(jù)的第二部分生成修正層級(jí); 將所述數(shù)據(jù)段分類(lèi)為多個(gè)層面類(lèi)別之一,每個(gè)層面類(lèi)別關(guān)聯(lián)于由所述修正層級(jí)中的不 同節(jié)點(diǎn)所代表的產(chǎn)品層面以識(shí)別所述數(shù)據(jù)段相關(guān)于哪個(gè)產(chǎn)品層面; 從所述數(shù)據(jù)段抽取與所述數(shù)據(jù)段相關(guān)的產(chǎn)品層面所對(duì)應(yīng)的觀(guān)點(diǎn);以及 將抽取出的觀(guān)點(diǎn)分類(lèi)為多個(gè)觀(guān)點(diǎn)類(lèi)別中的一個(gè)觀(guān)點(diǎn)類(lèi)別,每個(gè)觀(guān)點(diǎn)類(lèi)別關(guān)聯(lián)于不同的 觀(guān)點(diǎn),所述層面情緒是與所述一個(gè)觀(guān)點(diǎn)類(lèi)別關(guān)聯(lián)的觀(guān)點(diǎn)。
25. 根據(jù)權(quán)利要求24所述的方法,其中,所述多個(gè)觀(guān)點(diǎn)類(lèi)別包括正面觀(guān)點(diǎn)類(lèi)別以及負(fù) 面觀(guān)點(diǎn)類(lèi)別。
26. -種用于從與產(chǎn)品有關(guān)的數(shù)據(jù)確定用于產(chǎn)品層面的層面情緒的裝置,所述裝置包 括: 至少一個(gè)處理器; 以及包括計(jì)算機(jī)程序代碼的至少一個(gè)內(nèi)存; 其中,所述至少一個(gè)內(nèi)存和所述計(jì)算機(jī)程序代碼構(gòu)造為通過(guò)所述至少一個(gè)處理器使得 所述裝置至少進(jìn)行以下步驟: 從所述數(shù)據(jù)的第一部分識(shí)別數(shù)據(jù)段; 使用根據(jù)權(quán)利要求17所述的裝置基于所述數(shù)據(jù)的第二部分生成修正層級(jí); 將所述數(shù)據(jù)段分類(lèi)為多個(gè)層面類(lèi)別之一,每個(gè)層面類(lèi)別關(guān)聯(lián)于由所述修正層級(jí)中的不 同節(jié)點(diǎn)所代表的產(chǎn)品層面以識(shí)別所述數(shù)據(jù)段相關(guān)于哪個(gè)產(chǎn)品層面; 從所述數(shù)據(jù)段抽取與所述數(shù)據(jù)段相關(guān)的產(chǎn)品層面所對(duì)應(yīng)的觀(guān)點(diǎn);以及 將抽取出的觀(guān)點(diǎn)分類(lèi)為多個(gè)觀(guān)點(diǎn)類(lèi)別中的一個(gè)觀(guān)點(diǎn)類(lèi)別,每個(gè)觀(guān)點(diǎn)類(lèi)別關(guān)聯(lián)于不同的 觀(guān)點(diǎn),所述層面情緒是與所述一個(gè)觀(guān)點(diǎn)類(lèi)別關(guān)聯(lián)的觀(guān)點(diǎn)。
27. -種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序代碼,當(dāng)計(jì)算機(jī)程序代碼由計(jì)算 機(jī)執(zhí)行時(shí)使得所述計(jì)算機(jī)執(zhí)行用于通過(guò)與產(chǎn)品有關(guān)的數(shù)據(jù)確定用于產(chǎn)品層面的層面情緒 的方法,所述方法是根據(jù)權(quán)利要求24至25中任一項(xiàng)所述的方法。
28. -種用于基于與產(chǎn)品有關(guān)的數(shù)據(jù)來(lái)分級(jí)產(chǎn)品層面的方法,所述方法包括: 從所述數(shù)據(jù)識(shí)別產(chǎn)品層面; 基于所述產(chǎn)品層面在所述數(shù)據(jù)中的出現(xiàn)頻率以及識(shí)別出的產(chǎn)品層面的影響的測(cè)度,生 成用于每個(gè)識(shí)別出的產(chǎn)品層面的權(quán)重因子;以及 基于所生成的權(quán)重因子來(lái)分級(jí)所述識(shí)別出的產(chǎn)品層面。
29. 根據(jù)權(quán)利要求28所述的方法,其中,從所述數(shù)據(jù)識(shí)別產(chǎn)品層面包括從所述數(shù)據(jù)抽 取一個(gè)或多個(gè)名詞短語(yǔ)。
30. 根據(jù)權(quán)利要求29所述的方法,進(jìn)一步包括:如果所抽取出的名詞短語(yǔ)符合與層面 類(lèi)別關(guān)聯(lián)的產(chǎn)品層面,則將所抽取出的名詞短語(yǔ)分類(lèi)為所述層面類(lèi)別,所述層面類(lèi)別關(guān)聯(lián) 于一個(gè)或多個(gè)不同的產(chǎn)品層面。
31. 根據(jù)權(quán)利要求29或30所述的方法,進(jìn)一步包括將多個(gè)不同的抽取出的名詞短語(yǔ)聚 集在一起,其中,所述多個(gè)不同的抽取出的名詞短語(yǔ)中的每個(gè)包括對(duì)應(yīng)的同義術(shù)語(yǔ)。
32. 根據(jù)權(quán)利要求28至31中任一項(xiàng)所述的方法,進(jìn)一步包括: 基于所述數(shù)據(jù)確定用于所識(shí)別出的產(chǎn)品層面的層面情緒;以及 使用所述層面情緒確定所識(shí)別出的產(chǎn)品層面的影響的測(cè)度。
33. 根據(jù)權(quán)利要求32所述的方法,其中,確定層面情緒包括: 從所述數(shù)據(jù)抽取一個(gè)或多個(gè)層面觀(guān)點(diǎn),所述或者每個(gè)層面觀(guān)點(diǎn)對(duì)識(shí)別出的產(chǎn)品層面以 及對(duì)應(yīng)觀(guān)點(diǎn)進(jìn)行識(shí)別; 基于所述對(duì)應(yīng)觀(guān)點(diǎn)將所述或者每個(gè)層面觀(guān)點(diǎn)分類(lèi)為多個(gè)觀(guān)點(diǎn)類(lèi)別之一,每個(gè)觀(guān)點(diǎn)類(lèi)別 關(guān)聯(lián)于不同的觀(guān)點(diǎn);以及 基于所述多個(gè)觀(guān)點(diǎn)類(lèi)別中哪一個(gè)包含最多層面觀(guān)點(diǎn)來(lái)確定用于所識(shí)別出的產(chǎn)品層面 的層面情緒。
34. 根據(jù)權(quán)利要求32所述的方法,其中,根據(jù)權(quán)利要求24所述的方法來(lái)確定層面情緒。
35. 根據(jù)權(quán)利要求32至34中任一項(xiàng)所述的方法,,其中,確定影響的測(cè)度包括: 從所述數(shù)據(jù)確定用于所述產(chǎn)品的產(chǎn)品情緒,所述產(chǎn)品情緒關(guān)聯(lián)于觀(guān)點(diǎn);以及 比較用于所識(shí)別出的產(chǎn)品層面的層面情緒和用于所述產(chǎn)品的產(chǎn)品情緒以確定所述影 響的測(cè)度。
36. 根據(jù)權(quán)利要求35所述的方法,其中,確定產(chǎn)品情緒包括: 從所述數(shù)據(jù)抽取一個(gè)或多個(gè)產(chǎn)品觀(guān)點(diǎn),所述或者每個(gè)產(chǎn)品觀(guān)點(diǎn)識(shí)別所述產(chǎn)品以及對(duì)應(yīng) 觀(guān)點(diǎn);基于所述對(duì)應(yīng)觀(guān)點(diǎn)將所述或者每個(gè)產(chǎn)品觀(guān)點(diǎn)分類(lèi)為多個(gè)觀(guān)點(diǎn)類(lèi)別之一,每個(gè)觀(guān)點(diǎn)類(lèi) 別關(guān)聯(lián)于不同的觀(guān)點(diǎn);以及 基于所述多個(gè)觀(guān)點(diǎn)類(lèi)別中哪一個(gè)包含最多產(chǎn)品觀(guān)點(diǎn)來(lái)確定用于所述產(chǎn)品的所述產(chǎn)品 情緒。
37. 根據(jù)權(quán)利要求28至36中任一項(xiàng)所述的方法,其中,根據(jù)權(quán)利要求19所述的方法來(lái) 執(zhí)行從所述數(shù)據(jù)識(shí)別產(chǎn)品層面的步驟。
38. -種用于基于與產(chǎn)品有關(guān)的數(shù)據(jù)來(lái)分級(jí)產(chǎn)品層面的裝置,所述裝置包括: 至少一個(gè)處理器; 以及包括計(jì)算機(jī)程序代碼的至少一個(gè)內(nèi)存; 其中,所述至少一個(gè)內(nèi)存和所述計(jì)算機(jī)程序代碼構(gòu)造為通過(guò)所述至少一個(gè)處理器使得 所述裝置至少進(jìn)行以下步驟: 從所述數(shù)據(jù)識(shí)別產(chǎn)品層面; 基于所述產(chǎn)品層面在所述數(shù)據(jù)中的出現(xiàn)頻率以及所識(shí)別出的產(chǎn)品層面的影響的測(cè)度, 生成用于每個(gè)所識(shí)別出的產(chǎn)品層面的權(quán)重因子;以及 基于所生成的權(quán)重因子來(lái)分級(jí)所識(shí)別出的產(chǎn)品層面。
39. -種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序代碼,當(dāng)計(jì)算機(jī)程序代碼由計(jì)算 機(jī)執(zhí)行時(shí)使得所述計(jì)算機(jī)執(zhí)行用于基于與產(chǎn)品有關(guān)的數(shù)據(jù)來(lái)分級(jí)產(chǎn)品層面的方法,所述方 法是根據(jù)權(quán)利要求28至37中任一項(xiàng)的方法。
40. -種用于從與產(chǎn)品有關(guān)的數(shù)據(jù)確定產(chǎn)品情緒的方法,所述方法包括: 根據(jù)權(quán)利要求28至36中任一項(xiàng)的方法,基于所述數(shù)據(jù)的第一部分來(lái)確定與所述產(chǎn)品 相關(guān)的所分級(jí)的產(chǎn)品層面; 從所述數(shù)據(jù)的第二部分識(shí)別一個(gè)或多個(gè)特征,所述或者每個(gè)特征識(shí)別所分級(jí)的產(chǎn)品層 面以及對(duì)應(yīng)觀(guān)點(diǎn); 基于所述對(duì)應(yīng)觀(guān)點(diǎn)將每個(gè)特征分類(lèi)為多個(gè)觀(guān)點(diǎn)類(lèi)別之一,每個(gè)觀(guān)點(diǎn)類(lèi)別關(guān)聯(lián)于不同的 觀(guān)點(diǎn);以及 基于所述多個(gè)觀(guān)點(diǎn)類(lèi)別中哪一個(gè)包含最多特征來(lái)確定所述產(chǎn)品情緒。
41. 根據(jù)權(quán)利要求40所述的方法,其中,所述產(chǎn)品情緒是基于對(duì)應(yīng)于所述特征的層面 分級(jí)來(lái)確定的。
42. 根據(jù)權(quán)利要求40或41所述的方法,其中,所述多個(gè)觀(guān)點(diǎn)類(lèi)別包括正面觀(guān)點(diǎn)類(lèi)別以 及負(fù)面觀(guān)點(diǎn)類(lèi)別。
43. 根據(jù)權(quán)利要求40至42中任一項(xiàng)所述的方法,其中,所述數(shù)據(jù)的第一部分包括所述 產(chǎn)品的多個(gè)獨(dú)立評(píng)價(jià),所述數(shù)據(jù)的第二部分包括所述產(chǎn)品的單個(gè)評(píng)價(jià)。
44. 根據(jù)權(quán)利要求40至42中任一項(xiàng)所述的方法,其中,所述數(shù)據(jù)的所述第二部分包括 所述產(chǎn)品的多個(gè)評(píng)價(jià),所述方法進(jìn)一步包括: 將所述數(shù)據(jù)的所述第二部分中的每個(gè)評(píng)價(jià)代表為向量,每個(gè)向量指示每個(gè)特征存在或 者不存在于關(guān)聯(lián)的評(píng)價(jià)中,其中,基于對(duì)應(yīng)于所述特征的層面分級(jí)將每個(gè)特征在向量中加 權(quán);以及 其中,基于每個(gè)向量來(lái)確定產(chǎn)品情緒以確定用于所述數(shù)據(jù)的所述第二部分中的每個(gè)評(píng) 價(jià)的廣品情緒。
45. -種用于從與產(chǎn)品有關(guān)的數(shù)據(jù)確定產(chǎn)品情緒的裝置,所述裝置包括: 至少一個(gè)處理器; 以及包括計(jì)算機(jī)程序代碼的至少一個(gè)內(nèi)存; 其中,所述至少一個(gè)內(nèi)存和所述計(jì)算機(jī)程序代碼構(gòu)造為通過(guò)所述至少一個(gè)處理器使得 所述裝置至少進(jìn)行以下步驟: 使用根據(jù)權(quán)利要求38所述的裝置,基于所述數(shù)據(jù)的第一部分確定與所述產(chǎn)品相關(guān)的 所分級(jí)的產(chǎn)品層面; 從所述數(shù)據(jù)的第二部分識(shí)別一個(gè)或多個(gè)特征,所述或者每個(gè)特征識(shí)別所分級(jí)的產(chǎn)品層 面以及對(duì)應(yīng)觀(guān)點(diǎn); 基于所述對(duì)應(yīng)觀(guān)點(diǎn)將每個(gè)特征分類(lèi)為多個(gè)觀(guān)點(diǎn)類(lèi)別之一,每個(gè)觀(guān)點(diǎn)類(lèi)別關(guān)聯(lián)于不同的 觀(guān)點(diǎn);以及 基于所述多個(gè)觀(guān)點(diǎn)類(lèi)別中哪一個(gè)包含最多特征來(lái)確定所述產(chǎn)品情緒。
46. -種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序代碼,當(dāng)計(jì)算機(jī)程序代碼由計(jì)算 機(jī)執(zhí)行時(shí)使得所述計(jì)算機(jī)執(zhí)行用于通過(guò)與產(chǎn)品有關(guān)的數(shù)據(jù)確定產(chǎn)品情緒的方法,所述方法 是根據(jù)權(quán)利要求40至44中任一項(xiàng)所述的方法。
47. -種用于基于與產(chǎn)品有關(guān)的數(shù)據(jù)來(lái)生成產(chǎn)品評(píng)價(jià)概要的方法,所述方法包括: 根據(jù)權(quán)利要求28至36中任一項(xiàng)所述的方法,基于所述數(shù)據(jù)的第一部分確定與所述產(chǎn) 品相關(guān)的所分級(jí)的產(chǎn)品層面; 從所述數(shù)據(jù)的第二部分抽取一個(gè)或多個(gè)數(shù)據(jù)段, 基于所述數(shù)據(jù)段是否識(shí)別出所分級(jí)的產(chǎn)品層面以及是否包含對(duì)應(yīng)觀(guān)點(diǎn)來(lái)計(jì)算用于所 述或者每個(gè)抽取出的數(shù)據(jù)段的相關(guān)性分?jǐn)?shù);以及, 取決于它們的相應(yīng)的相關(guān)性分?jǐn)?shù)來(lái)生成包括一個(gè)或多個(gè)抽取出的數(shù)據(jù)段的產(chǎn)品評(píng)價(jià) 概要。
48. 根據(jù)權(quán)利要求47所述的方法,其中,所抽取出的數(shù)據(jù)段的相關(guān)性分?jǐn)?shù)取決于對(duì)由 所述數(shù)據(jù)段識(shí)別出的所分級(jí)的產(chǎn)品層面的分級(jí)。
49. 根據(jù)權(quán)利要求47或48所述的方法,其中,所抽取出的數(shù)據(jù)段的相關(guān)性分?jǐn)?shù)取決于 其對(duì)應(yīng)觀(guān)點(diǎn)是否匹配所述產(chǎn)品的總體觀(guān)點(diǎn)。
50. 根據(jù)權(quán)利要求47至50中任一項(xiàng)所述的方法,進(jìn)一步包括: 對(duì)用于抽取出的數(shù)據(jù)段的所述相關(guān)性分?jǐn)?shù)與預(yù)定閾值進(jìn)行比較;以及, 取決于所述比較將抽取出的數(shù)據(jù)段包括在所述產(chǎn)品評(píng)價(jià)概要中。
51. -種用于基于與產(chǎn)品有關(guān)的數(shù)據(jù)來(lái)生成產(chǎn)品評(píng)價(jià)概要的裝置,所述裝置包括: 至少一個(gè)處理器; 以及包括計(jì)算機(jī)程序代碼的至少一個(gè)內(nèi)存; 其中,所述至少一個(gè)內(nèi)存和所述計(jì)算機(jī)程序代碼構(gòu)造為通過(guò)所述至少一個(gè)處理器使得 所述裝置至少進(jìn)行以下步驟: 使用根據(jù)權(quán)利要求38所述的裝置,基于所述數(shù)據(jù)的第一部分確定與所述產(chǎn)品相關(guān)的 所分級(jí)的產(chǎn)品層面; 從所述數(shù)據(jù)的第二部分抽取一個(gè)或多個(gè)數(shù)據(jù)段; 基于所述數(shù)據(jù)段是否識(shí)別出所分級(jí)的產(chǎn)品層面以及是否包含對(duì)應(yīng)觀(guān)點(diǎn)來(lái)計(jì)算用于所 述或者每個(gè)抽取出的數(shù)據(jù)段的相關(guān)性分?jǐn)?shù);以及, 取決于它們的相應(yīng)的相關(guān)性分?jǐn)?shù)來(lái)生成包括一個(gè)或多個(gè)抽取出的數(shù)據(jù)段的產(chǎn)品評(píng)價(jià) 概要。
52. -種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序代碼,當(dāng)計(jì)算機(jī)程序代碼由計(jì)算 機(jī)執(zhí)行時(shí)使得所述計(jì)算機(jī)執(zhí)行用于基于與產(chǎn)品有關(guān)的數(shù)據(jù)生成產(chǎn)品評(píng)價(jià)概要的方法,所述 方法是根據(jù)權(quán)利要求47至50中任一項(xiàng)所述的方法。
【文檔編號(hào)】G06F17/00GK104350490SQ201380029313
【公開(kāi)日】2015年2月11日 申請(qǐng)日期:2013年4月9日 優(yōu)先權(quán)日:2012年4月11日
【發(fā)明者】蔡達(dá)成, 余建興, 查正軍, 汪萌 申請(qǐng)人:新加坡國(guó)立大學(xué)