對(duì)網(wǎng)絡(luò)對(duì)象進(jìn)行多特征維度量化的方法及裝置制造方法
【專利摘要】本發(fā)明公開(kāi)了一種對(duì)網(wǎng)絡(luò)對(duì)象進(jìn)行多特征維度量化的方法及裝置,該方法包括:確定一網(wǎng)絡(luò)對(duì)象,獲得與該網(wǎng)絡(luò)對(duì)象相對(duì)應(yīng)的特征描述數(shù)據(jù);根據(jù)預(yù)先建立的不同特征描述數(shù)據(jù)與不同特征維度之間的對(duì)應(yīng)關(guān)系,將所述與該網(wǎng)絡(luò)對(duì)象對(duì)應(yīng)的特征描述數(shù)據(jù)與特征維度進(jìn)行匹配,并根據(jù)匹配結(jié)果獲得與該網(wǎng)絡(luò)對(duì)象對(duì)應(yīng)的各特征維度權(quán)重;依據(jù)所述各特征維度權(quán)重,得到該網(wǎng)絡(luò)對(duì)象的各特征維度的量化值。采用本發(fā)明的方法,通過(guò)對(duì)網(wǎng)絡(luò)對(duì)象的特征描述數(shù)據(jù)進(jìn)行處理,形成該網(wǎng)絡(luò)對(duì)象各個(gè)特征維度的量化值,直觀地反應(yīng)網(wǎng)絡(luò)對(duì)象的各個(gè)維度的特征。
【專利說(shuō)明】對(duì)網(wǎng)絡(luò)對(duì)象進(jìn)行多特征維度量化的方法及裝置
【技術(shù)領(lǐng)域】
[0001] 本申請(qǐng)涉及互聯(lián)網(wǎng)【技術(shù)領(lǐng)域】,尤其涉及一種對(duì)網(wǎng)絡(luò)對(duì)象進(jìn)行多特征維度量化的方 法及裝置。
【背景技術(shù)】
[0002] 隨著互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展,在網(wǎng)絡(luò)上存在著越來(lái)越多的網(wǎng)絡(luò)對(duì)象,例如視頻文 件、音頻文件、文本文件等,供廣大用戶去瀏覽或下載。另一方面,通過(guò)網(wǎng)絡(luò)爬蟲(chóng)等搜索技 術(shù),針對(duì)不同的網(wǎng)絡(luò)對(duì)象,可W在網(wǎng)絡(luò)上搜索獲取到大量相關(guān)的信息,例如針對(duì)該些網(wǎng)絡(luò)對(duì) 象的評(píng)論、推薦或標(biāo)簽數(shù)據(jù)等,該些信息很多都是基于UGC OJser Generated Content,用戶 生成內(nèi)容)的方式生成的。
[000引然而,針對(duì)網(wǎng)絡(luò)對(duì)象的大量相關(guān)信息,特別是UGC數(shù)據(jù)信息,由于不同網(wǎng)站對(duì)不同 網(wǎng)絡(luò)對(duì)象的主觀劃分,W及用戶在不同網(wǎng)站上的結(jié)構(gòu)性的輸入限制,造成了該些數(shù)據(jù)只能 孤立的存在于不同網(wǎng)站中,并散落在不同網(wǎng)站的不同網(wǎng)頁(yè)上,相互之間并不能產(chǎn)生很大的 參考意義,盡管有些網(wǎng)站也可能會(huì)對(duì)其中的一些信息數(shù)據(jù)進(jìn)行整合和量化,但鑒于不同網(wǎng) 站對(duì)同一網(wǎng)絡(luò)對(duì)象的信息標(biāo)準(zhǔn)并不統(tǒng)一,因此一般也僅僅局限于對(duì)本站內(nèi)的相關(guān)信息進(jìn)行 整合,而且該種整合后的量化數(shù)據(jù)在結(jié)構(gòu)上是非常單一和難W擴(kuò)展的,同時(shí)也造成了在量 化數(shù)據(jù)的展示方式上非常受限制。
【發(fā)明內(nèi)容】
[0004] 鑒于上述問(wèn)題,提出了本發(fā)明W便提供一種克服上述問(wèn)題或者至少部分地解決上 述問(wèn)題的對(duì)網(wǎng)絡(luò)對(duì)象進(jìn)行多特征維度量化的方法和相應(yīng)的裝置。
[0005] 根據(jù)本發(fā)明的一個(gè)方面,提供了一種對(duì)網(wǎng)絡(luò)對(duì)象進(jìn)行多特征維度量化的方法,包 括:確定一網(wǎng)絡(luò)對(duì)象,獲得與該網(wǎng)絡(luò)對(duì)象相對(duì)應(yīng)的特征描述數(shù)據(jù);根據(jù)預(yù)先建立的不同特 征描述數(shù)據(jù)與不同特征維度之間的對(duì)應(yīng)關(guān)系,將所述與該網(wǎng)絡(luò)對(duì)象對(duì)應(yīng)的特征描述數(shù)據(jù)與 特征維度進(jìn)行匹配,并根據(jù)匹配結(jié)果獲得與該網(wǎng)絡(luò)對(duì)象對(duì)應(yīng)的各特征維度權(quán)重;依據(jù)所述 各特征維度權(quán)重,得到該網(wǎng)絡(luò)對(duì)象的各特征維度的量化值。
[0006] 其中,獲得與該網(wǎng)絡(luò)對(duì)象相對(duì)應(yīng)的特征描述數(shù)據(jù)的步驟,包括:根據(jù)所述網(wǎng)絡(luò)對(duì)象 的類型,預(yù)先確定一個(gè)或多個(gè)網(wǎng)絡(luò)搜索地址;通過(guò)該網(wǎng)絡(luò)搜索地址獲取與該網(wǎng)絡(luò)對(duì)象相對(duì) 應(yīng)的特征描述數(shù)據(jù)。
[0007] 其中,獲得與該網(wǎng)絡(luò)對(duì)象相對(duì)應(yīng)的特征描述數(shù)據(jù)的步驟,包括:將來(lái)自于不同網(wǎng)絡(luò) 地址的特征描述數(shù)據(jù)進(jìn)行重合度匹配;將重合度低于闊值的描述數(shù)據(jù)刪除,生成最終的特 征描述數(shù)據(jù)集合。
[0008] 其中,獲得與該網(wǎng)絡(luò)對(duì)象相對(duì)應(yīng)的特征描述數(shù)據(jù)的步驟,包括:將來(lái)自于不同網(wǎng)絡(luò) 地址的特征描述數(shù)據(jù)進(jìn)行重合度匹配;根據(jù)重合度的高低為所述特征描述數(shù)據(jù)分配相應(yīng)的 權(quán)重,重合度越高則權(quán)重越高;將重復(fù)的特征描述數(shù)據(jù)刪除,生成帶權(quán)重的特征描述數(shù)據(jù)集 合。
[0009] 其中,獲得與該網(wǎng)絡(luò)對(duì)象相對(duì)應(yīng)的特征描述數(shù)據(jù)的步驟,進(jìn)一步包括:根據(jù)預(yù)先確 定的針對(duì)不同網(wǎng)絡(luò)地址設(shè)置的權(quán)重,進(jìn)一步對(duì)來(lái)自于不同網(wǎng)絡(luò)地址的特征描述數(shù)據(jù)的權(quán)重 進(jìn)行調(diào)整。
[0010] 其中,所述特征維度是根據(jù)所述網(wǎng)絡(luò)對(duì)象的類型確定的。
[0011] 其中,根據(jù)預(yù)先建立的不同特征描述數(shù)據(jù)與不同特征維度之間的對(duì)應(yīng)關(guān)系,將所 述與該網(wǎng)絡(luò)對(duì)象對(duì)應(yīng)的特征描述數(shù)據(jù)與特征維度進(jìn)行匹配,并根據(jù)匹配結(jié)果獲得與該網(wǎng)絡(luò) 對(duì)象對(duì)應(yīng)的各特征維度權(quán)重的步驟,包括;根據(jù)所述對(duì)應(yīng)關(guān)系,將全部特征描述數(shù)據(jù)分別與 特征維度進(jìn)行匹配,如果有重復(fù)的特征描述數(shù)據(jù)則進(jìn)行重復(fù)匹配;根據(jù)匹配結(jié)果確定對(duì)各 特征維度的命中次數(shù)的比例;根據(jù)所述命中次數(shù)的比例,獲得與該網(wǎng)絡(luò)對(duì)象對(duì)應(yīng)的各特征 維度權(quán)重。
[0012] 其中,根據(jù)預(yù)先建立的不同特征描述數(shù)據(jù)與不同特征維度之間的對(duì)應(yīng)關(guān)系,將所 述與該網(wǎng)絡(luò)對(duì)象對(duì)應(yīng)的特征描述數(shù)據(jù)與特征維度進(jìn)行匹配,并根據(jù)匹配結(jié)果獲得與該網(wǎng)絡(luò) 對(duì)象對(duì)應(yīng)的各特征維度權(quán)重的步驟,包括;根據(jù)所述對(duì)應(yīng)關(guān)系,將不同的特征描述數(shù)據(jù)分別 與特征維度進(jìn)行匹配;根據(jù)匹配結(jié)果確定對(duì)各特征維度的命中次數(shù)的比例;根據(jù)不同特征 描述數(shù)據(jù)的權(quán)重,將對(duì)特征維度的命中次數(shù)比例進(jìn)行調(diào)整;根據(jù)調(diào)整后的命中次數(shù)的比例, 獲得與該網(wǎng)絡(luò)對(duì)象對(duì)應(yīng)的各特征維度權(quán)重。
[0013] 其中,依據(jù)所述各特征維度權(quán)重,得到該網(wǎng)絡(luò)對(duì)象的各特征維度的量化值的步驟, 包括;獲取與該網(wǎng)絡(luò)對(duì)象對(duì)應(yīng)的分值描述數(shù)據(jù);將與該網(wǎng)絡(luò)對(duì)象相對(duì)應(yīng)的分值描述數(shù)據(jù)與 所述各特征維度權(quán)重分別相乘,得到該網(wǎng)絡(luò)對(duì)象的各特征維度的量化值。
[0014] 其中,獲取與該網(wǎng)絡(luò)對(duì)象對(duì)應(yīng)的分值描述數(shù)據(jù)的步驟,包括;獲取來(lái)自于不同網(wǎng)絡(luò) 地址的與該網(wǎng)絡(luò)對(duì)象對(duì)應(yīng)的分值描述數(shù)據(jù),并根據(jù)預(yù)先確定的針對(duì)不同網(wǎng)絡(luò)地址設(shè)置的權(quán) 重,將來(lái)自于不同網(wǎng)絡(luò)地址的分值描述數(shù)據(jù)進(jìn)行加權(quán)求和,作為最終的分值描述數(shù)據(jù)。
[0015] 其中,所述描述數(shù)據(jù)包括標(biāo)簽數(shù)據(jù)、評(píng)論數(shù)據(jù),和/或關(guān)鍵字?jǐn)?shù)據(jù)。
[0016] 其中,進(jìn)一步包括:從所述與該網(wǎng)絡(luò)對(duì)象相對(duì)應(yīng)的各特征維度中選取至少部分特 征維度;根據(jù)得到的與該選取的特征維度對(duì)應(yīng)的量化值,W多維圖的方式將所述量化值進(jìn) 行展示。
[0017] 其中,進(jìn)一步包括;根據(jù)得到的該網(wǎng)絡(luò)對(duì)象的各特征維度的量化值,從中選取至少 部分特征維度進(jìn)行展示。
[0018] 根據(jù)本發(fā)明的另一方面,提供了一種對(duì)網(wǎng)絡(luò)對(duì)象進(jìn)行多特征維度量化的裝置,獲 得模塊,用于確定一網(wǎng)絡(luò)對(duì)象,獲得與該網(wǎng)絡(luò)對(duì)象相對(duì)應(yīng)的特征描述數(shù)據(jù);匹配模塊,用于 根據(jù)預(yù)先建立的不同特征描述數(shù)據(jù)與不同特征維度之間的對(duì)應(yīng)關(guān)系,將所述與該網(wǎng)絡(luò)對(duì)象 對(duì)應(yīng)的特征描述數(shù)據(jù)與特征維度進(jìn)行匹配,并根據(jù)匹配結(jié)果獲得與該網(wǎng)絡(luò)對(duì)象對(duì)應(yīng)的各特 征維度權(quán)重;量化模塊,用于依據(jù)所述各特征維度權(quán)重,得到該網(wǎng)絡(luò)對(duì)象的各特征維度的量 化值。
[0019] 其中,所述獲得模塊包括:確定模塊,用于根據(jù)所述網(wǎng)絡(luò)對(duì)象的類型,預(yù)先確定一 個(gè)或多個(gè)網(wǎng)絡(luò)搜索地址;獲取模塊,用于通過(guò)該網(wǎng)絡(luò)搜索地址獲取與該網(wǎng)絡(luò)對(duì)象相對(duì)應(yīng)的 特征描述數(shù)據(jù)。
[0020] 其中,所述獲得模塊包括;第一重合度匹配模塊,用于將來(lái)自于不同網(wǎng)絡(luò)地址的特 征描述數(shù)據(jù)進(jìn)行重合度匹配;第一生成模塊,用于將重合度低于闊值的描述數(shù)據(jù)刪除,生成 最終的特征描述數(shù)據(jù)集合。
[0021] 其中,所述獲得模塊包括;第二重合度匹配模塊,用于將來(lái)自于不同網(wǎng)絡(luò)地址的特 征描述數(shù)據(jù)進(jìn)行重合度匹配;權(quán)重分配模塊,用于根據(jù)重合度的高低為所述特征描述數(shù)據(jù) 分配相應(yīng)的權(quán)重,重合度越高則權(quán)重越高;第二生成模塊,用于將重復(fù)的特征描述數(shù)據(jù)刪 除,生成帶權(quán)重的特征描述數(shù)據(jù)集合。
[0022] 其中,所述獲得模塊進(jìn)一步包括;權(quán)重調(diào)整模塊,用于根據(jù)預(yù)先確定的針對(duì)不同網(wǎng) 絡(luò)地址設(shè)置的權(quán)重,進(jìn)一步對(duì)來(lái)自于不同網(wǎng)絡(luò)地址的特征描述數(shù)據(jù)的權(quán)重進(jìn)行調(diào)整。
[0023] 其中,所述特征維度是根據(jù)所述網(wǎng)絡(luò)對(duì)象的類型確定的。
[0024] 其中,所述匹配模塊包括;第一匹配模塊,用于根據(jù)所述對(duì)應(yīng)關(guān)系,將全部特征描 述數(shù)據(jù)分別與特征維度進(jìn)行匹配,如果有重復(fù)的特征描述數(shù)據(jù)則進(jìn)行重復(fù)匹配;第一比例 確定模塊,用于根據(jù)匹配結(jié)果確定對(duì)各特征維度的命中次數(shù)的比例;第一權(quán)重獲得模塊,用 于根據(jù)所述命中次數(shù)的比例,獲得與該網(wǎng)絡(luò)對(duì)象對(duì)應(yīng)的各特征維度權(quán)重。
[00巧]其中,所述匹配模塊包括;第二匹配模塊,用于根據(jù)所述對(duì)應(yīng)關(guān)系,將不同的特征 描述數(shù)據(jù)分別與特征維度進(jìn)行匹配;第二比例確定模塊,用于根據(jù)匹配結(jié)果確定對(duì)各特征 維度的命中次數(shù)的比例;比例調(diào)整模塊,用于根據(jù)不同特征描述數(shù)據(jù)的權(quán)重,將對(duì)特征維度 的命中次數(shù)比例進(jìn)行調(diào)整;第二權(quán)重獲得模塊,用于根據(jù)調(diào)整后的命中次數(shù)的比例,獲得與 該網(wǎng)絡(luò)對(duì)象對(duì)應(yīng)的各特征維度權(quán)重。
[0026] 其中,所述量化模塊,包括;分值獲取模塊,用于獲取與該網(wǎng)絡(luò)對(duì)象對(duì)應(yīng)的分值描 述數(shù)據(jù);量化處理模塊,用于將與該網(wǎng)絡(luò)對(duì)象相對(duì)應(yīng)的分值描述數(shù)據(jù)與所述各特征維度權(quán) 重分別相乘,得到該網(wǎng)絡(luò)對(duì)象的各特征維度的量化值。
[0027] 其中,所述分值獲取模塊,進(jìn)一步用于;獲取來(lái)自于不同網(wǎng)絡(luò)地址的與該網(wǎng)絡(luò)對(duì)象 對(duì)應(yīng)的分值描述數(shù)據(jù),并根據(jù)預(yù)先確定的針對(duì)不同網(wǎng)絡(luò)地址設(shè)置的權(quán)重,將來(lái)自于不同網(wǎng) 絡(luò)地址的分值描述數(shù)據(jù)進(jìn)行加權(quán)求和,作為最終的分值描述數(shù)據(jù)。
[0028] 其中,所述描述數(shù)據(jù)包括標(biāo)簽數(shù)據(jù)、評(píng)論數(shù)據(jù),和/或關(guān)鍵字?jǐn)?shù)據(jù)。
[0029] 其中,進(jìn)一步包括:選取模塊,用于從所述與該網(wǎng)絡(luò)對(duì)象相對(duì)應(yīng)的各特征維度中選 取至少部分特征維度;第一展示模塊,用于根據(jù)得到的與該選取的特征維度對(duì)應(yīng)的量化值, W多維圖的方式將所述量化值進(jìn)行展示。
[0030] 其中,第二展示模塊,用于根據(jù)得到的該網(wǎng)絡(luò)對(duì)象的各特征維度的量化值,從中選 取至少部分特征維度進(jìn)行展示。
[0031] 根據(jù)本發(fā)明的技術(shù)方案,存在W下技術(shù)效果:
[0032] 本發(fā)明根據(jù)預(yù)先建立的不同特征描述數(shù)據(jù)與不同特征維度之間的對(duì)應(yīng)關(guān)系,將網(wǎng) 絡(luò)對(duì)象對(duì)應(yīng)的特征描述數(shù)據(jù)與特征維度進(jìn)行匹配,獲得與該網(wǎng)絡(luò)對(duì)象對(duì)應(yīng)的各特征維度權(quán) 重,進(jìn)而根據(jù)各特征維度的權(quán)重得到網(wǎng)絡(luò)對(duì)象各個(gè)特征維度的量化值,能夠直觀地反應(yīng)網(wǎng) 絡(luò)對(duì)象的各個(gè)特征維度的特征,同時(shí),由于可W根據(jù)不同的網(wǎng)絡(luò)對(duì)象類型而對(duì)特征維度進(jìn) 行增加或減少,并進(jìn)而對(duì)描述數(shù)據(jù)與特征維度之間的對(duì)應(yīng)關(guān)系隨時(shí)進(jìn)行調(diào)整,因此,本發(fā)明 提供的技術(shù)方案針對(duì)不同網(wǎng)絡(luò)對(duì)象的相關(guān)信息在整合后的量化數(shù)據(jù)的結(jié)構(gòu)上是非常富有 彈性并容易擴(kuò)展的,該也為提供更多樣化的展示方式提供了可能。
[0033] 上述說(shuō)明僅是本發(fā)明技術(shù)方案的概述,為了能夠更清楚了解本發(fā)明的技術(shù)手段, 而可依照說(shuō)明書(shū)的內(nèi)容予W實(shí)施,并且為了讓本發(fā)明的上述和其它目的、特征和優(yōu)點(diǎn)能夠 更明顯易懂,W下特舉本發(fā)明的【具體實(shí)施方式】。
【專利附圖】
【附圖說(shuō)明】
[0034] 此處所說(shuō)明的附圖用來(lái)提供對(duì)本申請(qǐng)的進(jìn)一步理解,構(gòu)成本申請(qǐng)的一部分,本申 請(qǐng)的示意性實(shí)施例及其說(shuō)明用于解釋本申請(qǐng),并不構(gòu)成對(duì)本申請(qǐng)的不當(dāng)限定。在附圖中:
[0035] 圖1是根據(jù)本發(fā)明的實(shí)施例的對(duì)網(wǎng)絡(luò)對(duì)象進(jìn)行多特征維度量化的方法的總流程 圖;
[0036] 圖2是根據(jù)本發(fā)明一個(gè)實(shí)施例的獲得與該網(wǎng)絡(luò)對(duì)象相對(duì)應(yīng)的特征描述數(shù)據(jù)的步 驟的流程圖;
[0037] 圖3是根據(jù)本發(fā)明一個(gè)實(shí)施例的根據(jù)預(yù)先建立的不同特征描述數(shù)據(jù)與不同特征 維度之間的對(duì)應(yīng)關(guān)系,將所述與該網(wǎng)絡(luò)對(duì)象對(duì)應(yīng)的特征描述數(shù)據(jù)與特征維度進(jìn)行匹配,并 根據(jù)匹配結(jié)果獲得與該網(wǎng)絡(luò)對(duì)象對(duì)應(yīng)的各特征維度權(quán)重的步驟的流程圖;
[0038] 圖4是根據(jù)本發(fā)明一個(gè)實(shí)施例的依據(jù)所述各特征維度權(quán)重,得到該網(wǎng)絡(luò)對(duì)象的各 特征維度的量化值的步驟的流程圖;
[0039] 圖5是根據(jù)本發(fā)明另一實(shí)施例的獲得與該網(wǎng)絡(luò)對(duì)象相對(duì)應(yīng)的特征描述數(shù)據(jù)的步 驟的流程圖;
[0040] 圖6是根據(jù)本發(fā)明另一實(shí)施例的根據(jù)預(yù)先建立的不同特征描述數(shù)據(jù)與不同特征 維度之間的對(duì)應(yīng)關(guān)系,將所述與該網(wǎng)絡(luò)對(duì)象對(duì)應(yīng)的特征描述數(shù)據(jù)與特征維度進(jìn)行匹配,并 根據(jù)匹配結(jié)果獲得與該網(wǎng)絡(luò)對(duì)象對(duì)應(yīng)的各特征維度權(quán)重的步驟的流程圖;
[0041] 圖7是根據(jù)本發(fā)明一個(gè)實(shí)施例的對(duì)網(wǎng)絡(luò)對(duì)象進(jìn)行多特征維度量化的裝置的結(jié)構(gòu) 框圖擬及
[0042] 圖8是根據(jù)本發(fā)明一個(gè)實(shí)施例的對(duì)一部電影的各個(gè)特征維度的量化值W多維圖 的方式進(jìn)行展示時(shí)的展示界面示例圖。
【具體實(shí)施方式】
[0043] 下面將參照附圖更詳細(xì)地描述本公開(kāi)的示例性實(shí)施例。雖然附圖中顯示了本公開(kāi) 的示例性實(shí)施例,然而應(yīng)當(dāng)理解,可W W各種形式實(shí)現(xiàn)本公開(kāi)而不應(yīng)被該里闡述的實(shí)施例 所限制。相反,提供該些實(shí)施例是為了能夠更透徹地理解本公開(kāi),并且能夠?qū)⒈竟_(kāi)的范圍 完整的傳達(dá)給本領(lǐng)域的技術(shù)人員。
[0044] 如圖1所示,圖1是根據(jù)本發(fā)明一個(gè)實(shí)施例的對(duì)網(wǎng)絡(luò)對(duì)象進(jìn)行多特征維度量化的 方法的總流程圖。
[0045] 在步驟SllO處,確定一網(wǎng)絡(luò)對(duì)象,獲得與該網(wǎng)絡(luò)對(duì)象相對(duì)應(yīng)的特征描述數(shù)據(jù)。
[0046] 具體地,可W根據(jù)用戶的搜索確定網(wǎng)絡(luò)對(duì)象,如,根據(jù)用戶輸入的搜索請(qǐng)求確定用 戶搜索的網(wǎng)絡(luò)對(duì)象;或者可W根據(jù)用戶對(duì)預(yù)置鏈接的訪問(wèn)確定網(wǎng)絡(luò)對(duì)象,如,用戶對(duì)預(yù)置鏈 接的點(diǎn)擊等。
[0047] 其中,網(wǎng)絡(luò)對(duì)象可W包括;互聯(lián)網(wǎng)上的資源,可W包括視頻文件、音頻文件、文本文 件等,如,電影、電視、音樂(lè)、文章、書(shū)籍等。與該網(wǎng)絡(luò)對(duì)象相對(duì)應(yīng)的特征描述數(shù)據(jù)可W包括: 該網(wǎng)絡(luò)對(duì)象的標(biāo)簽數(shù)據(jù)、評(píng)論數(shù)據(jù),和/或關(guān)鍵字?jǐn)?shù)據(jù)等。其中,標(biāo)簽數(shù)據(jù)例如可W為用戶 生成的用于對(duì)該網(wǎng)絡(luò)對(duì)象進(jìn)行推薦、介紹、評(píng)論的標(biāo)簽,例如,可W在網(wǎng)絡(luò)上搜索到大量的 電影標(biāo)簽;評(píng)論數(shù)據(jù)可W為用戶對(duì)該網(wǎng)絡(luò)對(duì)象進(jìn)行的評(píng)論;關(guān)鍵字?jǐn)?shù)據(jù)可W為對(duì)網(wǎng)絡(luò)對(duì)象 的推薦、評(píng)論數(shù)據(jù)進(jìn)行特定的處理(如,對(duì)評(píng)論文字進(jìn)行分詞處理)獲取到的該網(wǎng)絡(luò)對(duì)象的 關(guān)鍵字。本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解,本發(fā)明的實(shí)施例不限于此。
[0048] 根據(jù)本發(fā)明的一個(gè)實(shí)施例,可W利用下面的子步驟來(lái)獲得與該網(wǎng)絡(luò)對(duì)象相對(duì)應(yīng)的 特征描述數(shù)據(jù)。
[0049] 首先,根據(jù)所述網(wǎng)絡(luò)對(duì)象的類型,預(yù)先確定一個(gè)或多個(gè)網(wǎng)絡(luò)搜索地址。例如,互聯(lián) 網(wǎng)上有許多??诘木W(wǎng)站或者一些網(wǎng)站的??诘淖影鎵K,供用戶發(fā)布或者搜索特定類型的網(wǎng) 絡(luò)對(duì)象的特征描述數(shù)據(jù),如,針對(duì)電影、電視、書(shū)刊、雜志等提供發(fā)布或搜索資訊的網(wǎng)站或網(wǎng) 站子版塊等,因此,可W根據(jù)網(wǎng)絡(luò)對(duì)象的類型,預(yù)先確定搜索特征描述數(shù)據(jù)的網(wǎng)站,即確定 一個(gè)或多個(gè)網(wǎng)絡(luò)搜索地址。
[0050] 然后,通過(guò)該網(wǎng)絡(luò)搜索地址獲取與該網(wǎng)絡(luò)對(duì)象相對(duì)應(yīng)的特征描述數(shù)據(jù)。目P,通過(guò)確 定的該一個(gè)或多個(gè)網(wǎng)絡(luò)搜索地址獲取該網(wǎng)絡(luò)對(duì)象的特征描述數(shù)據(jù)。根據(jù)網(wǎng)絡(luò)對(duì)象的類型預(yù) 先確定網(wǎng)絡(luò)搜索地址,能夠使搜索更具方向性,避免從不相關(guān)的網(wǎng)站進(jìn)行搜索,提高搜索效 率。并且,從不同的網(wǎng)絡(luò)地址獲取網(wǎng)絡(luò)對(duì)象的特征描述數(shù)據(jù),可W將來(lái)自不同網(wǎng)站的與網(wǎng)絡(luò) 對(duì)象對(duì)應(yīng)的特征描述數(shù)據(jù)進(jìn)行比較全面、統(tǒng)一的整合,并根據(jù)不同特征描述數(shù)據(jù)之間的數(shù) 量關(guān)系W及特征描述數(shù)據(jù)與特征維度之間的對(duì)應(yīng)關(guān)系對(duì)網(wǎng)絡(luò)對(duì)象的特征進(jìn)行量化。
[0051] 在一個(gè)具體實(shí)施例中,可W通過(guò)網(wǎng)絡(luò)爬蟲(chóng)技術(shù)實(shí)現(xiàn)上述的子步驟,即,通過(guò)程序或 腳本自動(dòng)獲取與該網(wǎng)絡(luò)對(duì)象對(duì)應(yīng)的特征描述數(shù)據(jù)。
[0052] 參考圖2,圖2是根據(jù)本發(fā)明的一個(gè)實(shí)施例的獲得與該網(wǎng)絡(luò)對(duì)象相對(duì)應(yīng)的特征描 述數(shù)據(jù)的步驟的流程圖。
[0053] 如圖2所示,獲得與該網(wǎng)絡(luò)對(duì)象相對(duì)應(yīng)的特征描述數(shù)據(jù)的步驟,可W包括W下步 驟:
[0054] 步驟S210,將來(lái)自于不同網(wǎng)絡(luò)地址的特征描述數(shù)據(jù)進(jìn)行重合度匹配。
[00巧]來(lái)自于不同網(wǎng)絡(luò)地址的特征描述數(shù)據(jù)中可能存在許多重復(fù)的(相同的)數(shù)據(jù),即, 同一特征描述數(shù)據(jù)出現(xiàn)多次,其中,相似的數(shù)據(jù)(意義相同或相近的數(shù)據(jù))也可W看做重復(fù) 的(相同的)數(shù)據(jù)。具體而言,某一特征描述數(shù)據(jù)重復(fù)出現(xiàn)的次數(shù)越多,或者該特征描述數(shù) 據(jù)W及與其相似的特征描述數(shù)據(jù)出現(xiàn)的次數(shù)(重合次數(shù))越多,則可認(rèn)為該特征描述數(shù)據(jù) 的重合度越高。例如,針對(duì)某一部電影,存在來(lái)自各個(gè)不同網(wǎng)站的大量的標(biāo)簽(tag),該些標(biāo) 簽中可能包括許多相同的標(biāo)簽或相似的標(biāo)簽,則可W將獲取到的該電影的標(biāo)簽進(jìn)行重合度 匹配,某一標(biāo)簽重復(fù)出現(xiàn)的次數(shù)(重合次數(shù))越多,或者該標(biāo)簽W及與其相似的標(biāo)簽出現(xiàn)的 次數(shù)越多,則其重合度越高。
[0056] 步驟S220,將重合度低于闊值的特征描述數(shù)據(jù)刪除,生成最終的特征描述數(shù)據(jù)集 合。
[0057] 具體地,可W根據(jù)預(yù)先設(shè)置的重合度闊值,將重合度低于該闊值的特征描述數(shù)據(jù) 刪除,生成最終的特征描述數(shù)據(jù)集合。例如,可W根據(jù)預(yù)先設(shè)置的重合次數(shù)闊值。刪除與該 網(wǎng)絡(luò)對(duì)象對(duì)應(yīng)的特征描述數(shù)據(jù)中重合次數(shù)低于該重合次數(shù)闊值的數(shù)據(jù),生成最終的特征描 述數(shù)據(jù)集合。通過(guò)刪除重合度低于闊值的特征描述數(shù)據(jù),能夠減少后續(xù)過(guò)程需要處理的數(shù) 據(jù)數(shù)量,使后續(xù)過(guò)程中的數(shù)據(jù)處理更加簡(jiǎn)便。
[0058] 應(yīng)當(dāng)注意,生成的最終的特征描述數(shù)據(jù)集合中,可W包括刪除重合度低于該闊值 的特征描述數(shù)據(jù)后剩余的該網(wǎng)絡(luò)對(duì)象的全部特征描述數(shù)據(jù),也即是說(shuō),其中包括重復(fù)的或 相似的特征描述數(shù)據(jù)。
[0059] 返回圖1,在獲得了與該網(wǎng)絡(luò)對(duì)象相對(duì)應(yīng)的特征描述數(shù)據(jù)之后,接下來(lái),在步驟 S120處,根據(jù)預(yù)先建立的不同特征描述數(shù)據(jù)與不同特征維度之間的對(duì)應(yīng)關(guān)系,將所述與該 網(wǎng)絡(luò)對(duì)象對(duì)應(yīng)的特征描述數(shù)據(jù)與特征維度進(jìn)行匹配,并根據(jù)匹配結(jié)果獲得與該網(wǎng)絡(luò)對(duì)象對(duì) 應(yīng)的各特征維度權(quán)重。
[0060] 具體而言,可W先根據(jù)該網(wǎng)絡(luò)對(duì)象的類型確定所述網(wǎng)絡(luò)對(duì)象對(duì)應(yīng)的特征維度,再 根據(jù)預(yù)先建立的不同特征描述數(shù)據(jù)與不同特征維度之間的對(duì)應(yīng)關(guān)系將該網(wǎng)絡(luò)對(duì)象對(duì)應(yīng)的 特征描述數(shù)據(jù)與特征維度進(jìn)行匹配。例如,若該網(wǎng)絡(luò)對(duì)象為電影,則可W確定電影相關(guān)的特 征維度為該網(wǎng)絡(luò)對(duì)象對(duì)應(yīng)的特征維度,例如,電影相應(yīng)的特征維度可W包括:視聽(tīng)、情節(jié)、思 想、氛圍等特征維度,或者還可W包括其他屬性的特征維度,如,觀眾性別、年齡、星座等維 度。并且,還可W根據(jù)不同的網(wǎng)絡(luò)對(duì)象的類型、用戶的需求等方面,對(duì)網(wǎng)絡(luò)對(duì)象對(duì)應(yīng)的特征 維度進(jìn)行增加或減少,極具靈活性。
[0061] 其中,不同特征描述數(shù)據(jù)與不同特征維度之間的對(duì)應(yīng)關(guān)系可W通過(guò)W下步驟預(yù)先 建立:
[0062] 首先,獲取多個(gè)特征描述數(shù)據(jù),并確定多個(gè)特征維度。其中,所述多個(gè)特征維度可 W分別包括一個(gè)或多個(gè)特征維度類別中的每一個(gè)所包含的多個(gè)特征維度。也即是說(shuō),所述 多個(gè)特征維度包括一個(gè)或多個(gè)特征維度類別,其中每一個(gè)特征維度類別包含多個(gè)特征維 度。
[0063] 然后,確定所述多個(gè)特征描述數(shù)據(jù)與所述多個(gè)特征維度的對(duì)應(yīng)關(guān)系,例如,可W根 據(jù)對(duì)大量歷史數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析的結(jié)果確定特征描述數(shù)據(jù)與特征維度是否具有對(duì)應(yīng)關(guān)系。 并且,還可W將不同特征描述數(shù)據(jù)與不同特征維度之間的對(duì)應(yīng)關(guān)系配置為一對(duì)應(yīng)關(guān)系表。
[0064] W電影標(biāo)簽為例,配置各個(gè)電影標(biāo)簽(特征描述數(shù)據(jù))與各個(gè)特征維度之間的對(duì) 應(yīng)關(guān)系表可W如表1所示:
[0065]
【權(quán)利要求】
1. 一種對(duì)網(wǎng)絡(luò)對(duì)象進(jìn)行多特征維度量化的方法,包括: 確定一網(wǎng)絡(luò)對(duì)象,獲得與該網(wǎng)絡(luò)對(duì)象相對(duì)應(yīng)的特征描述數(shù)據(jù); 根據(jù)預(yù)先建立的不同特征描述數(shù)據(jù)與不同特征維度之間的對(duì)應(yīng)關(guān)系,將所述與該網(wǎng)絡(luò) 對(duì)象對(duì)應(yīng)的特征描述數(shù)據(jù)與特征維度進(jìn)行匹配,并根據(jù)匹配結(jié)果獲得與該網(wǎng)絡(luò)對(duì)象對(duì)應(yīng)的 各特征維度權(quán)重; 依據(jù)所述各特征維度權(quán)重,得到該網(wǎng)絡(luò)對(duì)象的各特征維度的量化值。
2. 如權(quán)利要求1所述的方法,其特征在于,獲得與該網(wǎng)絡(luò)對(duì)象相對(duì)應(yīng)的特征描述數(shù)據(jù) 的步驟,包括: 根據(jù)所述網(wǎng)絡(luò)對(duì)象的類型,預(yù)先確定一個(gè)或多個(gè)網(wǎng)絡(luò)搜索地址; 通過(guò)該網(wǎng)絡(luò)搜索地址獲取與該網(wǎng)絡(luò)對(duì)象相對(duì)應(yīng)的特征描述數(shù)據(jù)。
3. 如權(quán)利要求1-2任一項(xiàng)所述的方法,其特征在于,獲得與該網(wǎng)絡(luò)對(duì)象相對(duì)應(yīng)的特征 描述數(shù)據(jù)的步驟,包括: 將來(lái)自于不同網(wǎng)絡(luò)地址的特征描述數(shù)據(jù)進(jìn)行重合度匹配; 將重合度低于閾值的描述數(shù)據(jù)刪除,生成最終的特征描述數(shù)據(jù)集合。
4. 如權(quán)利要求1-3任一項(xiàng)所述的方法,其特征在于,獲得與該網(wǎng)絡(luò)對(duì)象相對(duì)應(yīng)的特征 描述數(shù)據(jù)的步驟,包括: 將來(lái)自于不同網(wǎng)絡(luò)地址的特征描述數(shù)據(jù)進(jìn)行重合度匹配; 根據(jù)重合度的高低為所述特征描述數(shù)據(jù)分配相應(yīng)的權(quán)重,重合度越高則權(quán)重越高; 將重復(fù)的特征描述數(shù)據(jù)刪除,生成帶權(quán)重的特征描述數(shù)據(jù)集合。
5. 如權(quán)利要求1-4任一項(xiàng)所述的方法,其特征在于,獲得與該網(wǎng)絡(luò)對(duì)象相對(duì)應(yīng)的特征 描述數(shù)據(jù)的步驟,進(jìn)一步包括: 根據(jù)預(yù)先確定的針對(duì)不同網(wǎng)絡(luò)地址設(shè)置的權(quán)重,進(jìn)一步對(duì)來(lái)自于不同網(wǎng)絡(luò)地址的特征 描述數(shù)據(jù)的權(quán)重進(jìn)行調(diào)整。
6. 如權(quán)利要求1-5任一項(xiàng)所述的方法,其特征在于,所述特征維度是根據(jù)所述網(wǎng)絡(luò)對(duì) 象的類型確定的。
7. 如權(quán)利要求1-6任一項(xiàng)所述的方法,其特征在于, 根據(jù)預(yù)先建立的不同特征描述數(shù)據(jù)與不同特征維度之間的對(duì)應(yīng)關(guān)系,將所述與該網(wǎng) 絡(luò)對(duì)象對(duì)應(yīng)的特征描述數(shù)據(jù)與特征維度進(jìn)行匹配,并根據(jù)匹配結(jié)果獲得與該網(wǎng)絡(luò)對(duì)象對(duì)應(yīng) 的各特征維度權(quán)重的步驟,包括: 根據(jù)所述對(duì)應(yīng)關(guān)系,將全部特征描述數(shù)據(jù)分別與特征維度進(jìn)行匹配,如果有重復(fù)的特 征描述數(shù)據(jù)則進(jìn)行重復(fù)匹配; 根據(jù)匹配結(jié)果確定對(duì)各特征維度的命中次數(shù)的比例; 根據(jù)所述命中次數(shù)的比例,獲得與該網(wǎng)絡(luò)對(duì)象對(duì)應(yīng)的各特征維度權(quán)重。
8. 如權(quán)利要求1-7任一項(xiàng)所述的方法,其特征在于, 根據(jù)預(yù)先建立的不同特征描述數(shù)據(jù)與不同特征維度之間的對(duì)應(yīng)關(guān)系,將所述與該網(wǎng) 絡(luò)對(duì)象對(duì)應(yīng)的特征描述數(shù)據(jù)與特征維度進(jìn)行匹配,并根據(jù)匹配結(jié)果獲得與該網(wǎng)絡(luò)對(duì)象對(duì)應(yīng) 的各特征維度權(quán)重的步驟,包括: 根據(jù)所述對(duì)應(yīng)關(guān)系,將不同的特征描述數(shù)據(jù)分別與特征維度進(jìn)行匹配; 根據(jù)匹配結(jié)果確定對(duì)各特征維度的命中次數(shù)的比例; 根據(jù)不同特征描述數(shù)據(jù)的權(quán)重,將對(duì)特征維度的命中次數(shù)比例進(jìn)行調(diào)整; 根據(jù)調(diào)整后的命中次數(shù)的比例,獲得與該網(wǎng)絡(luò)對(duì)象對(duì)應(yīng)的各特征維度權(quán)重。
9. 如權(quán)利要求1-8任一項(xiàng)所述的方法,其特征在于,依據(jù)所述各特征維度權(quán)重,得到該 網(wǎng)絡(luò)對(duì)象的各特征維度的量化值的步驟,包括: 獲取與該網(wǎng)絡(luò)對(duì)象對(duì)應(yīng)的分值描述數(shù)據(jù); 將與該網(wǎng)絡(luò)對(duì)象相對(duì)應(yīng)的分值描述數(shù)據(jù)與所述各特征維度權(quán)重分別相乘,得到該網(wǎng)絡(luò) 對(duì)象的各特征維度的量化值。
10. -種對(duì)網(wǎng)絡(luò)對(duì)象進(jìn)行多特征維度量化的裝置,包括: 獲得模塊,用于確定一網(wǎng)絡(luò)對(duì)象,獲得與該網(wǎng)絡(luò)對(duì)象相對(duì)應(yīng)的特征描述數(shù)據(jù); 匹配模塊,用于根據(jù)預(yù)先建立的不同特征描述數(shù)據(jù)與不同特征維度之間的對(duì)應(yīng)關(guān)系, 將所述與該網(wǎng)絡(luò)對(duì)象對(duì)應(yīng)的特征描述數(shù)據(jù)與特征維度進(jìn)行匹配,并根據(jù)匹配結(jié)果獲得與該 網(wǎng)絡(luò)對(duì)象對(duì)應(yīng)的各特征維度權(quán)重; 量化模塊,用于依據(jù)所述各特征維度權(quán)重,得到該網(wǎng)絡(luò)對(duì)象的各特征維度的量化值。
【文檔編號(hào)】G06F17/30GK104331429SQ201410564598
【公開(kāi)日】2015年2月4日 申請(qǐng)日期:2014年10月21日 優(yōu)先權(quán)日:2014年10月21日
【發(fā)明者】彭可飛, 尹紅光, 劉佳良, 詹金林 申請(qǐng)人:北京奇虎科技有限公司, 奇智軟件(北京)有限公司