一種用于獲取關(guān)鍵詞的應(yīng)用領(lǐng)域?qū)傩孕畔⒌姆椒?、裝置與設(shè)備的制作方法
【專(zhuān)利摘要】本發(fā)明的目的是提供一種用于獲取關(guān)鍵詞的應(yīng)用領(lǐng)域?qū)傩孕畔⒌姆椒?、裝置與設(shè)備。其中,本發(fā)明首先獲取待處理的多個(gè)關(guān)鍵詞集合中每個(gè)關(guān)鍵詞集合包括的至少一個(gè)關(guān)鍵詞的初始應(yīng)用領(lǐng)域特征值信息;接著根據(jù)至少一個(gè)關(guān)鍵詞的初始應(yīng)用領(lǐng)域特征值信息,對(duì)所述每個(gè)關(guān)鍵詞集合進(jìn)行分類(lèi)統(tǒng)計(jì)處理,以獲取每個(gè)關(guān)鍵詞集合的應(yīng)用領(lǐng)域分布特征值信息;隨后根據(jù)每個(gè)關(guān)鍵詞集合的應(yīng)用領(lǐng)域分布特征值信息,獲取每個(gè)關(guān)鍵詞的至少一個(gè)第一應(yīng)用領(lǐng)域特征值信息;隨后對(duì)每個(gè)關(guān)鍵詞的至少一個(gè)第一應(yīng)用領(lǐng)域特征值信息進(jìn)行統(tǒng)計(jì)處理,以獲取每個(gè)關(guān)鍵詞的第二應(yīng)用領(lǐng)域特征值信息。
【專(zhuān)利說(shuō)明】—種用于獲取關(guān)鍵詞的應(yīng)用領(lǐng)域?qū)傩孕畔⒌姆椒?、裝置與設(shè)備
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及計(jì)算機(jī)【技術(shù)領(lǐng)域】,尤其涉及一種用于獲取關(guān)鍵詞的應(yīng)用領(lǐng)域?qū)傩孕畔⒌姆椒ā⒀b置與設(shè)備。
【背景技術(shù)】
[0002]現(xiàn)有的網(wǎng)絡(luò)信息發(fā)布系統(tǒng)中,對(duì)信息發(fā)布用戶(hù)設(shè)定的多個(gè)關(guān)鍵詞的應(yīng)用領(lǐng)域劃分大多依靠人工完成,或利用統(tǒng)計(jì)型分類(lèi)方法對(duì)多個(gè)關(guān)鍵詞進(jìn)行分類(lèi),得到多個(gè)關(guān)鍵詞的初始應(yīng)用領(lǐng)域劃分,然后通過(guò)大量信息發(fā)布用戶(hù)對(duì)多個(gè)關(guān)鍵詞的購(gòu)買(mǎi)關(guān)系進(jìn)行迭代計(jì)算,最后得到多個(gè)關(guān)鍵詞的應(yīng)用領(lǐng)域?qū)傩孕畔ⅰ,F(xiàn)有技術(shù)由于主要依靠人的主觀意志來(lái)進(jìn)行關(guān)鍵詞的劃分,從而使得劃分結(jié)果的準(zhǔn)確性及客觀性較低,且由于信息發(fā)布用戶(hù)對(duì)其自身所屬領(lǐng)域?qū)傩詣澐植粔驕?zhǔn)確,通過(guò)大量信息發(fā)布用戶(hù)對(duì)多個(gè)關(guān)鍵詞的購(gòu)買(mǎi)關(guān)系獲取關(guān)鍵詞的應(yīng)用領(lǐng)域?qū)傩孕畔?zhǔn)確性也相對(duì)較低;同時(shí),隨著搜索技術(shù)的不斷發(fā)展,對(duì)關(guān)鍵詞的應(yīng)用領(lǐng)域劃分的準(zhǔn)確度及細(xì)分度要求也越來(lái)越高,現(xiàn)有的劃分方式不能滿(mǎn)足高準(zhǔn)確度及高細(xì)分度的需求。
[0003]因此,如何提供一種獲取關(guān)鍵詞的應(yīng)用領(lǐng)域?qū)傩孕畔⒌姆椒?、裝置及設(shè)備,從而能夠準(zhǔn)確地、且高效地獲取關(guān)鍵詞的應(yīng)用領(lǐng)域?qū)傩孕畔ⅲ蔀槟壳凹毙杞鉀Q的問(wèn)題之一。
【發(fā)明內(nèi)容】
[0004]本發(fā)明的目的是提供一種獲取關(guān)鍵詞的應(yīng)用領(lǐng)域?qū)傩孕畔⒌姆椒ā⒀b置與設(shè)備。
[0005]根據(jù)本發(fā)明的一個(gè)方面,提供了一種獲取關(guān)鍵詞的應(yīng)用領(lǐng)域?qū)傩孕畔⒌姆椒ǎ摲椒òㄒ韵虏襟E:
[0006]a獲取待處理的多個(gè)關(guān)鍵詞集合中每個(gè)關(guān)鍵詞集合包括的至少一個(gè)關(guān)鍵詞的初始應(yīng)用領(lǐng)域特征值信息,其中,所述每個(gè)關(guān)鍵詞集合包括多個(gè)關(guān)鍵詞;
[0007]b根據(jù)所述至少一個(gè)關(guān)鍵詞的初始應(yīng)用領(lǐng)域特征值信息,對(duì)所述每個(gè)關(guān)鍵詞集合進(jìn)行分類(lèi)統(tǒng)計(jì)處理,以獲取所述每個(gè)關(guān)鍵詞集合的應(yīng)用領(lǐng)域分布特征值信息;
[0008]c根據(jù)所述每個(gè)關(guān)鍵詞集合的應(yīng)用領(lǐng)域分布特征值信息,獲取每個(gè)關(guān)鍵詞的至少一個(gè)第一應(yīng)用領(lǐng)域特征值信息,其中,至少一個(gè)第一應(yīng)用領(lǐng)域特征值信息對(duì)應(yīng)該關(guān)鍵詞所屬的至少一個(gè)關(guān)鍵詞集合的應(yīng)用領(lǐng)域分布特征值信息;
[0009]d對(duì)所述每個(gè)關(guān)鍵詞的至少一個(gè)第一應(yīng)用領(lǐng)域特征值信息進(jìn)行統(tǒng)計(jì)處理,以獲取所述每個(gè)關(guān)鍵詞的第二應(yīng)用領(lǐng)域特征值信息;
[0010]將所述每個(gè)關(guān)鍵詞的第二應(yīng)用領(lǐng)域特征值信息作為該關(guān)鍵詞的初始應(yīng)用領(lǐng)域特征值信息,重復(fù)執(zhí)行步驟b、C、d,直至滿(mǎn)足預(yù)定停止條件;
[0011]其中,該方法還包括:
[0012]w當(dāng)滿(mǎn)足所述預(yù)定停止條件時(shí),根據(jù)所述每個(gè)關(guān)鍵詞的第二應(yīng)用領(lǐng)域特征值信息,獲取所述每個(gè)關(guān)鍵詞的應(yīng)用領(lǐng)域?qū)傩孕畔?。[0013]根據(jù)本發(fā)明的另一方面,還提供了一種獲取關(guān)鍵詞的應(yīng)用領(lǐng)域?qū)傩孕畔⒌墨@取裝置,該獲取設(shè)備包括:
[0014]初始特征值獲取裝置,用于獲取待處理的多個(gè)關(guān)鍵詞集合中每個(gè)關(guān)鍵詞集合包括的至少一個(gè)關(guān)鍵詞的初始應(yīng)用領(lǐng)域特征值信息,其中,所述每個(gè)關(guān)鍵詞集合包括多個(gè)關(guān)鍵詞;
[0015]應(yīng)用領(lǐng)域分布獲取裝置,用于根據(jù)所述至少一個(gè)關(guān)鍵詞的初始應(yīng)用領(lǐng)域特征值信息,對(duì)所述每個(gè)關(guān)鍵詞集合進(jìn)行分類(lèi)統(tǒng)計(jì)處理,以獲取所述每個(gè)關(guān)鍵詞集合的應(yīng)用領(lǐng)域分布特征值信息;
[0016]第一特征值獲取裝置,用于根據(jù)所述每個(gè)關(guān)鍵詞集合的應(yīng)用領(lǐng)域分布特征值信息,獲取每個(gè)關(guān)鍵詞的至少一個(gè)第一應(yīng)用領(lǐng)域特征值信息,其中,至少一個(gè)第一應(yīng)用領(lǐng)域特征值信息對(duì)應(yīng)該關(guān)鍵詞所屬的至少一個(gè)關(guān)鍵詞集合的應(yīng)用領(lǐng)域分布特征值信息;
[0017]第二特征值獲取裝置,用于對(duì)所述每個(gè)關(guān)鍵詞的至少一個(gè)第一應(yīng)用領(lǐng)域特征值信息進(jìn)行統(tǒng)計(jì)處理,以獲取所述每個(gè)關(guān)鍵詞的第二應(yīng)用領(lǐng)域特征值信息;
[0018]控制裝置,當(dāng)未滿(mǎn)足預(yù)定停止條件時(shí),將所述每個(gè)關(guān)鍵詞的第二應(yīng)用領(lǐng)域特征值信息作為該關(guān)鍵詞的初始應(yīng)用領(lǐng)域特征值信息,以控制所述應(yīng)用領(lǐng)域分布獲取裝置、所述第一特征值獲取裝置及所述第二特征值獲取裝置重復(fù)執(zhí)行相應(yīng)操作,直至滿(mǎn)足所述預(yù)定停止條件;
[0019]其中,該獲取裝置還包括:
[0020]應(yīng)用領(lǐng)域?qū)傩垣@取裝置,用于當(dāng)滿(mǎn)足所述預(yù)定停止條件時(shí),根據(jù)所述每個(gè)關(guān)鍵詞的第二應(yīng)用領(lǐng)域特征值信息,獲取所述每個(gè)關(guān)鍵詞的應(yīng)用領(lǐng)域?qū)傩孕畔ⅰ?br>
[0021]與現(xiàn)有技術(shù)相比,本發(fā)明具有以下優(yōu)點(diǎn):通過(guò)對(duì)每個(gè)關(guān)鍵詞集合的應(yīng)用領(lǐng)域分布特征值信息進(jìn)行獲取,從而能夠獲取每個(gè)關(guān)鍵詞屬于一個(gè)或多個(gè)關(guān)鍵詞集合的第一應(yīng)用領(lǐng)域特征值信息,進(jìn)而可從多個(gè)關(guān)鍵詞集合的角度獲取每個(gè)關(guān)鍵詞的第二應(yīng)用領(lǐng)域特征值信息,通過(guò)重復(fù)執(zhí)行上述步驟,迭代計(jì)算以獲取每個(gè)關(guān)鍵詞的準(zhǔn)確度較高的應(yīng)用領(lǐng)域?qū)傩孕畔?,?shí)現(xiàn)了對(duì)海量關(guān)鍵詞所屬應(yīng)用領(lǐng)域的準(zhǔn)確獲取,使得獲取結(jié)果更加具有客觀性;同時(shí),滿(mǎn)足了現(xiàn)有搜索技術(shù)對(duì)關(guān)鍵詞更為細(xì)化的應(yīng)用領(lǐng)域劃分的需求;進(jìn)一步,對(duì)關(guān)鍵詞所屬應(yīng)用領(lǐng)域的準(zhǔn)確分類(lèi),可以指導(dǎo)信息發(fā)布用戶(hù)建立合理的關(guān)鍵詞與發(fā)布信息的對(duì)應(yīng)關(guān)系,從而有效地優(yōu)化該用戶(hù)信息發(fā)布策略。
【專(zhuān)利附圖】
【附圖說(shuō)明】
[0022]通過(guò)閱讀參照以下附圖所作的對(duì)非限制性實(shí)施例所作的詳細(xì)描述,本發(fā)明的其它特征、目的和優(yōu)點(diǎn)將會(huì)變得更明顯:
[0023]圖1示出根據(jù)本發(fā)明一個(gè)方面的用于獲取關(guān)鍵詞的應(yīng)用領(lǐng)域?qū)傩孕畔⒌墨@取裝置的結(jié)構(gòu)示意圖;
[0024]圖2示出根據(jù)本發(fā)明一個(gè)優(yōu)選實(shí)施例的用于獲取每個(gè)關(guān)鍵詞與多個(gè)應(yīng)用領(lǐng)域?qū)傩孕畔⒌南嚓P(guān)度信息的獲取裝置的結(jié)構(gòu)示意圖;
[0025]圖3示出根據(jù)本發(fā)明另一個(gè)方面的獲取關(guān)鍵詞的應(yīng)用領(lǐng)域?qū)傩孕畔⒌姆椒鞒虉D;
[0026]圖4示出根據(jù)本發(fā)明一個(gè)優(yōu)選實(shí)施例的獲取每個(gè)關(guān)鍵詞與多個(gè)應(yīng)用領(lǐng)域?qū)傩孕畔⒌南嚓P(guān)度信息的方法流程圖。
[0027]附圖中相同或相似的附圖標(biāo)記代表相同或相似的部件。
【具體實(shí)施方式】
[0028]下面結(jié)合附圖對(duì)本發(fā)明作進(jìn)一步詳細(xì)描述。
[0029]圖1示出根據(jù)本發(fā)明一個(gè)方面的用于獲取關(guān)鍵詞的應(yīng)用領(lǐng)域?qū)傩孕畔⒌墨@取裝置的結(jié)構(gòu)示意圖。本實(shí)施例的獲取裝置包含于計(jì)算機(jī)設(shè)備中;該獲取裝置包括初始特征值獲取裝置1、應(yīng)用領(lǐng)域分布獲取裝置2、第一特征值獲取裝置3、第二特征值獲取裝置4、控制裝置5和應(yīng)用領(lǐng)域?qū)傩垣@取裝置6。
[0030]所述計(jì)算機(jī)設(shè)備包括但不限于網(wǎng)絡(luò)設(shè)備和用戶(hù)設(shè)備。其中,所述用戶(hù)設(shè)備包括但不限于PC機(jī)等;所述網(wǎng)絡(luò)設(shè)備包括但不限于單個(gè)網(wǎng)絡(luò)服務(wù)器、多個(gè)網(wǎng)絡(luò)服務(wù)器組成的服務(wù)器組或基于云計(jì)算(Cloud Computing)的由大量計(jì)算機(jī)或網(wǎng)絡(luò)服務(wù)器構(gòu)成的云,其中,云計(jì)算是分布式計(jì)算的一種,由一群松散耦合的計(jì)算機(jī)集組成的一個(gè)超級(jí)虛擬計(jì)算機(jī)。其中,所述用戶(hù)設(shè)備和網(wǎng)絡(luò)設(shè)備所處的網(wǎng)絡(luò)包括但不限于互聯(lián)網(wǎng)、廣域網(wǎng)、城域網(wǎng)、局域網(wǎng)、VPN網(wǎng)絡(luò)
坐寸ο
[0031]需要說(shuō)明的是,所述用戶(hù)設(shè)備和網(wǎng)絡(luò)設(shè)備僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的用戶(hù)設(shè)備、網(wǎng)絡(luò)設(shè)備或網(wǎng)絡(luò)如可適用于本發(fā)明,也應(yīng)包含在本發(fā)明保護(hù)范圍以?xún)?nèi),并以引用方式包含于此。
[0032]首先,初始特征值獲取裝置I獲取待處理的多個(gè)關(guān)鍵詞集合中每個(gè)關(guān)鍵詞集合包括的至少一個(gè)關(guān)鍵詞的初始應(yīng)用領(lǐng)域特征值信息,其中,所述每個(gè)關(guān)鍵詞集合包括多個(gè)關(guān)鍵詞。
[0033]其中,應(yīng)用領(lǐng)域是指所述關(guān)鍵詞被應(yīng)用于的領(lǐng)域,包括但不限于,行業(yè)等。
[0034]其中,所述特征值信息包括但不限于概率信息。
[0035]具體地,初始特征值獲取裝置I將每個(gè)關(guān)鍵詞集合中包括的多個(gè)關(guān)鍵詞在預(yù)設(shè)的應(yīng)用領(lǐng)域分類(lèi)表中進(jìn)行查詢(xún),來(lái)獲取該每個(gè)關(guān)鍵詞集合包括的至少一個(gè)關(guān)鍵詞的初始應(yīng)用領(lǐng)域特征值信息。
[0036]其中,所述預(yù)設(shè)的應(yīng)用領(lǐng)域分類(lèi)表包括多個(gè)關(guān)鍵詞與其分別對(duì)應(yīng)的初始應(yīng)用領(lǐng)域特征值信息,其可通過(guò)語(yǔ)料訓(xùn)練等方式獲取。優(yōu)選地,語(yǔ)料訓(xùn)練方式包括對(duì)預(yù)置的每個(gè)應(yīng)用領(lǐng)域的關(guān)鍵詞語(yǔ)料進(jìn)行應(yīng)用領(lǐng)域?qū)傩詷?biāo)注,并對(duì)關(guān)鍵詞語(yǔ)料進(jìn)行分詞和詞性標(biāo)注等處理,接著利用分類(lèi)算法,例如基于最大熵的文本分類(lèi)算法,對(duì)關(guān)鍵詞語(yǔ)料進(jìn)行訓(xùn)練,以獲得多個(gè)關(guān)鍵詞分別對(duì)應(yīng)的初始應(yīng)用領(lǐng)域特征值信息。
[0037]需要說(shuō)明的是,上述舉例僅為更好地說(shuō)明本發(fā)明的技術(shù)方案,而非對(duì)本發(fā)明的限制,本領(lǐng)域技術(shù)人員應(yīng)該理解,任何獲取待處理的多個(gè)關(guān)鍵詞集合中每個(gè)關(guān)鍵詞集合包括的至少一個(gè)關(guān)鍵詞的初始應(yīng)用領(lǐng)域特征值信息的實(shí)現(xiàn)方式,均應(yīng)包含在本發(fā)明的范圍內(nèi)。
[0038]接著,應(yīng)用領(lǐng)域分布獲取裝置2根據(jù)初始特征值獲取裝置I獲取的至少一個(gè)關(guān)鍵詞的初始應(yīng)用領(lǐng)域特征值信息,對(duì)所述每個(gè)關(guān)鍵詞集合進(jìn)行分類(lèi)統(tǒng)計(jì)處理,以獲取所述每個(gè)關(guān)鍵詞集合的應(yīng)用領(lǐng)域分布特征值信息。
[0039]具體地,應(yīng)用領(lǐng)域分布獲取裝置2根據(jù)已獲取的每個(gè)關(guān)鍵詞集合中至少一個(gè)關(guān)鍵詞的初始應(yīng)用領(lǐng)域特征值信息,對(duì)該至少一個(gè)關(guān)鍵詞的初始應(yīng)用領(lǐng)域特征值信息按應(yīng)用領(lǐng)域進(jìn)行應(yīng)用領(lǐng)域特征值統(tǒng)計(jì)處理,以獲取該每個(gè)關(guān)鍵詞集合的應(yīng)用領(lǐng)域分布特征值信息。
[0040]在一示例中,當(dāng)關(guān)鍵詞集合Unitl中包括關(guān)鍵詞wordp word2、word6、Word7,其中,Word1的初始應(yīng)用領(lǐng)域特征值信息為屬于應(yīng)用領(lǐng)域T1的概率為Wa,word2屬于應(yīng)用領(lǐng)域T1的的概率信息為Wb,則應(yīng)用領(lǐng)域分布獲取裝置2對(duì)Unitl進(jìn)行分類(lèi)統(tǒng)計(jì)處理,獲取Unitl的應(yīng)用領(lǐng)域特征值分布信息為Unitl屬于應(yīng)用領(lǐng)域T1的概率為P (T11 Unitl) = Wa/ (ffa+ffb),Unitl屬于應(yīng)用領(lǐng)域T2的概率為P (T21 Unitl) = Wb/ (ffa+ffb)。
[0041]需要說(shuō)明的是,上述舉例僅為更好地說(shuō)明本發(fā)明的技術(shù)方案,而非對(duì)本發(fā)明的限制,本領(lǐng)域技術(shù)人員應(yīng)該理解,任何根據(jù)所述至少一個(gè)關(guān)鍵詞的初始應(yīng)用領(lǐng)域特征值信息,對(duì)所述每個(gè)關(guān)鍵詞集合進(jìn)行分類(lèi)統(tǒng)計(jì)處理,以獲取所述每個(gè)關(guān)鍵詞集合的應(yīng)用領(lǐng)域分布特征值信息的實(shí)現(xiàn)方式,均應(yīng)包含在本發(fā)明的范圍內(nèi)。
[0042]隨后,第一特征值獲取裝置3根據(jù)應(yīng)用領(lǐng)域分布獲取裝置2獲取的每個(gè)關(guān)鍵詞集合的應(yīng)用領(lǐng)域分布特征值信息,獲取每個(gè)關(guān)鍵詞的至少一個(gè)第一應(yīng)用領(lǐng)域特征值信息,其中,至少一個(gè)第一應(yīng)用領(lǐng)域特征值信息對(duì)應(yīng)該關(guān)鍵詞所屬的至少一個(gè)關(guān)鍵詞集合的應(yīng)用領(lǐng)域分布特征值信息。
[0043]其中,每個(gè)關(guān)鍵詞可屬于一個(gè)或多個(gè)關(guān)鍵詞集合。
[0044]具體地,第一特征值獲取裝置3根據(jù)已獲取的每個(gè)關(guān)鍵詞集合的應(yīng)用領(lǐng)域分布特征值信息,將每個(gè)關(guān)鍵詞集合的應(yīng)用領(lǐng)域分布特征值信息離散化至該集合中包括的每個(gè)關(guān)鍵詞,來(lái)獲取每個(gè)關(guān)鍵詞的至少一個(gè)第一應(yīng)用領(lǐng)域特征值信息。
[0045]在一示例中,關(guān)鍵詞集合Unitl中包括關(guān)鍵詞wordpwordywordpwordp關(guān)鍵詞集合 Unitl 的應(yīng)用領(lǐng)域分布特征值信息為=P(TjUnitl) = Wa/ (ffa+ffb), P(T2| Unitl) =Wb/(ffa+ffb);第一特征值獲取裝置3將Unitl的應(yīng)用領(lǐng)域分布特征值信息離散化至該集合中的關(guān)鍵詞 word” word2、word6、word” 獲取:
[0046]關(guān)鍵詞wordp word2、word6、Word7屬于應(yīng)用領(lǐng)域T1的第一應(yīng)用領(lǐng)域特征值信息為P (T11 Word1) = P (T11 word2) = P (T1 word6) = P (T1 word7) = Wa/ (ffa+ffb),
[0047]而關(guān)鍵詞wordp word2、word6、Word7屬于應(yīng)用領(lǐng)域T2的第一應(yīng)用領(lǐng)域特征值信息為 P (T21 Word1) = P (T21 word2) = P (T2 word6) = P (T2 word7) = Wb/ (ffa+ffb);
[0048]另外,關(guān)鍵詞集合Unit2中包括關(guān)鍵詞word2、word3、word6、Word7,關(guān)鍵詞集合Unit2 的應(yīng)用領(lǐng)域分布特征值信息為:P(T2|Unit2) = Wb/(ffb+ffc), P(T3|Unit2) = ffc/(Wb+ffc);第一特征值獲取裝置3將Unit2的應(yīng)用領(lǐng)域分布特征值信息離散化至該集合中的關(guān)鍵詞 word2 > Word3 > word6 > word” 獲取:
[0049]關(guān)鍵詞word2、word3、word6、Word7屬于應(yīng)用領(lǐng)域T2的第一應(yīng)用領(lǐng)域特征值信息為P (T21 Word2) = P (T21 word3) = P (T2 word6) = P (T2 word7) = Wb/ (ffb+ffc);
[0050]關(guān)鍵詞word2、word3、word6、Word7屬于應(yīng)用領(lǐng)域T3的第一應(yīng)用領(lǐng)域特征值信息為P (T31 Word2) = P (T31 word3) = P (T3 word6) = P (T3 word7) = ffc/ (ffb+ffc)。
[0051]需要說(shuō)明的是,上述舉例僅為更好地說(shuō)明本發(fā)明的技術(shù)方案,而非對(duì)本發(fā)明的限制,本領(lǐng)域技術(shù)人員應(yīng)該理解,任何根據(jù)所述每個(gè)關(guān)鍵詞集合的應(yīng)用領(lǐng)域分布特征值信息,獲取每個(gè)關(guān)鍵詞的至少一個(gè)第一應(yīng)用領(lǐng)域特征值信息的實(shí)現(xiàn)方式,均應(yīng)包含在本發(fā)明的范圍內(nèi)。
[0052]隨后,第二特征值獲取裝置4對(duì)第一特征值獲取裝置3獲取的每個(gè)關(guān)鍵詞的至少一個(gè)第一應(yīng)用領(lǐng)域特征值信息進(jìn)行統(tǒng)計(jì)處理,以獲取所述每個(gè)關(guān)鍵詞的第二應(yīng)用領(lǐng)域特征
值信息。
[0053]具體地,對(duì)每個(gè)關(guān)鍵詞的至少一個(gè)第一應(yīng)用領(lǐng)域特征值信息進(jìn)行統(tǒng)計(jì)處理,以獲取所述每個(gè)關(guān)鍵詞的第二應(yīng)用領(lǐng)域特征值信息的方法包括但不限于:
[0054]I)第二特征值獲取裝置4從每個(gè)關(guān)鍵詞的至少一個(gè)第一應(yīng)用領(lǐng)域特征值信息中選擇第一應(yīng)用領(lǐng)域特征值信息的最大值作為第二應(yīng)用領(lǐng)域特征值信息;
[0055]在一示例中,接上例,在關(guān)鍵詞集合Unitl中,Word2屬于應(yīng)用領(lǐng)域T2的第一應(yīng)用領(lǐng)域特征值信息為P(T2Iword2) = Wb/ (ffa+ffb),在關(guān)鍵詞集合Unit2中,Word2屬于應(yīng)用領(lǐng)域T2的第一應(yīng)用領(lǐng)域特征值信息為P (T21 Word2) = Wb/ (ffb+ffc),則從該兩個(gè)第一應(yīng)用領(lǐng)域特征值信息中選擇最大值作為Word2的屬于應(yīng)用領(lǐng)域T2的第二應(yīng)用領(lǐng)域特征值信息。
[0056]2)第二特征值獲取裝置4根據(jù)下式1)對(duì)所述每個(gè)關(guān)鍵詞的至少一個(gè)第一應(yīng)用領(lǐng)域特征值信息進(jìn)行合并處理,以獲取所述每個(gè)關(guān)鍵詞的第二應(yīng)用領(lǐng)域特征值信息:
[0057]
【權(quán)利要求】
1.一種用于獲取關(guān)鍵詞的應(yīng)用領(lǐng)域?qū)傩孕畔⒌姆椒?,該方法包括以下步驟: a獲取待處理的多個(gè)關(guān)鍵詞集合中每個(gè)關(guān)鍵詞集合包括的至少一個(gè)關(guān)鍵詞的初始應(yīng)用領(lǐng)域特征值信息,其中,所述每個(gè)關(guān)鍵詞集合包括多個(gè)關(guān)鍵詞; b根據(jù)所述至少一個(gè)關(guān)鍵詞的初始應(yīng)用領(lǐng)域特征值信息,對(duì)所述每個(gè)關(guān)鍵詞集合進(jìn)行分類(lèi)統(tǒng)計(jì)處理,以獲取所述每個(gè)關(guān)鍵詞集合的應(yīng)用領(lǐng)域分布特征值信息; c根據(jù)所述每個(gè)關(guān)鍵詞集合的應(yīng)用領(lǐng)域分布特征值信息,獲取每個(gè)關(guān)鍵詞的至少一個(gè)第一應(yīng)用領(lǐng)域特征值信息,其中,至少一個(gè)第一應(yīng)用領(lǐng)域特征值信息對(duì)應(yīng)該關(guān)鍵詞所屬的至少一個(gè)關(guān)鍵詞集合的應(yīng)用領(lǐng)域分布特征值信息; d對(duì)所述每個(gè)關(guān)鍵詞的至少一個(gè)第一應(yīng)用領(lǐng)域特征值信息進(jìn)行統(tǒng)計(jì)處理,以獲取所述每個(gè)關(guān)鍵詞的第二應(yīng)用領(lǐng)域特征值信息; 將所述每個(gè)關(guān)鍵詞的第二應(yīng)用領(lǐng)域特征值信息作為該關(guān)鍵詞的初始應(yīng)用領(lǐng)域特征值信息,重復(fù)執(zhí)行步驟b、C、d,直至滿(mǎn)足預(yù)定停止條件; 其中,該方法還包括: W當(dāng)滿(mǎn)足所述預(yù)定停止條件時(shí),根據(jù)所述每個(gè)關(guān)鍵詞的第二應(yīng)用領(lǐng)域特征值信息,獲取所述每個(gè)關(guān)鍵詞的應(yīng)用領(lǐng)域?qū)傩孕畔ⅰ?br>
2.根據(jù)權(quán)利要求1所述的方法,其中,所述步驟a包括: -將所述每個(gè)關(guān)鍵詞集合中包括的多個(gè)關(guān)鍵詞在預(yù)設(shè)的應(yīng)用領(lǐng)域分類(lèi)表中進(jìn)行查詢(xún),來(lái)獲取所述每個(gè)關(guān)鍵詞集合包括的至少一個(gè)關(guān)鍵詞的初始應(yīng)用領(lǐng)域特征值信息。
3.根據(jù)權(quán)利要求1或2所述的方法,其中,對(duì)所述每個(gè)關(guān)鍵詞的至少一個(gè)第一應(yīng)用領(lǐng)域特征值信息進(jìn)行統(tǒng)計(jì)處理以獲取所述每個(gè)關(guān)鍵詞的第二應(yīng)用領(lǐng)域特征值信息的方式還包括: -根據(jù)下式對(duì)所述每個(gè)關(guān)鍵詞的至少一個(gè)第一應(yīng)用領(lǐng)域特征值信息進(jìn)行合并處理,以獲取所述每個(gè)關(guān)鍵詞的第二應(yīng)用領(lǐng)域特征值信息:
4.根據(jù)權(quán)利要求1至3任一項(xiàng)所述的方法,其中,該方法還包括: -獲取每個(gè)關(guān)鍵詞分別與多個(gè)應(yīng)用領(lǐng)域?qū)傩孕畔⒌南嚓P(guān)度信息; 其中,所述步驟c包括: -根據(jù)所述每個(gè)關(guān)鍵詞集合的應(yīng)用領(lǐng)域分布特征值信息,并結(jié)合所述相關(guān)度信息進(jìn)行加權(quán)計(jì)算,以獲取所述每個(gè)關(guān)鍵詞的至少一個(gè)第一應(yīng)用領(lǐng)域特征值信息。
5.根據(jù)權(quán)利要求4所述的方法,其中,所述獲取每個(gè)關(guān)鍵詞與多個(gè)應(yīng)用領(lǐng)域?qū)傩孕畔⒌南嚓P(guān)度信息的方法還包括以下步驟:-對(duì)所述每個(gè)關(guān)鍵詞進(jìn)行切詞處理,以獲取所述每個(gè)關(guān)鍵詞的至少一個(gè)關(guān)鍵詞切詞片段; -根據(jù)所述每個(gè)關(guān)鍵詞的至少一個(gè)關(guān)鍵詞切詞片段,在預(yù)置的多個(gè)應(yīng)用領(lǐng)域?qū)傩孕畔⒏髯詫?duì)應(yīng)的應(yīng)用領(lǐng)域切詞庫(kù)中進(jìn)行查詢(xún),來(lái)獲取該至少一個(gè)關(guān)鍵詞切詞片段分別在多個(gè)應(yīng)用領(lǐng)域?qū)傩孕畔⒏髯詫?duì)應(yīng)的應(yīng)用領(lǐng)域切詞庫(kù)中的出現(xiàn)頻率信息; -根據(jù)所述出現(xiàn)頻率信息,來(lái)獲取每個(gè)關(guān)鍵詞分別與多個(gè)應(yīng)用領(lǐng)域?qū)傩孕畔⒌南嚓P(guān)度信息。
6.一種用于獲取關(guān)鍵詞的應(yīng)用領(lǐng)域?qū)傩孕畔⒌墨@取裝置,該獲取裝置包括: 初始特征值獲取裝置,用于獲取待處理的多個(gè)關(guān)鍵詞集合中每個(gè)關(guān)鍵詞集合包括的至少一個(gè)關(guān)鍵詞的初始應(yīng)用領(lǐng)域特征值信息,其中,所述每個(gè)關(guān)鍵詞集合包括多個(gè)關(guān)鍵詞; 應(yīng)用領(lǐng)域分布獲取裝置,用于根據(jù)所述至少一個(gè)關(guān)鍵詞的初始應(yīng)用領(lǐng)域特征值信息,對(duì)所述每個(gè)關(guān)鍵詞集合進(jìn)行分類(lèi)統(tǒng)計(jì)處理,以獲取所述每個(gè)關(guān)鍵詞集合的應(yīng)用領(lǐng)域分布特征值信息; 第一特征值獲取裝置,用于根據(jù)所述每個(gè)關(guān)鍵詞集合的應(yīng)用領(lǐng)域分布特征值信息,獲取每個(gè)關(guān)鍵詞的至少一個(gè)第一應(yīng)用領(lǐng)域特征值信息,其中,至少一個(gè)第一應(yīng)用領(lǐng)域特征值信息對(duì)應(yīng)該關(guān)鍵詞所屬的至少一個(gè)關(guān)鍵詞集合的應(yīng)用領(lǐng)域分布特征值信息; 第二特征值獲取裝置,用于對(duì)所述每個(gè)關(guān)鍵詞的至少一個(gè)第一應(yīng)用領(lǐng)域特征值信息進(jìn)行統(tǒng)計(jì)處理,以獲取所述每個(gè)關(guān)鍵詞的第二應(yīng)用領(lǐng)域特征值信息; 控制裝置,當(dāng)未滿(mǎn)足預(yù)定停止條件時(shí),將所述每個(gè)關(guān)鍵詞的第二應(yīng)用領(lǐng)域特征值信息作為該關(guān)鍵詞的初始應(yīng)用領(lǐng)域特征值信息,以控制所述應(yīng)用領(lǐng)域分布獲取裝置、所述第一特征值獲取裝置及所述第二特征值獲取裝置重復(fù)執(zhí)行相應(yīng)操作,直至滿(mǎn)足所述預(yù)定停止條件; 其中,該獲取裝置還包括: 應(yīng)用領(lǐng)域?qū)傩垣@取裝置,用于當(dāng)滿(mǎn)足所述預(yù)定停止條件時(shí),根據(jù)所述每個(gè)關(guān)鍵詞的第二應(yīng)用領(lǐng)域特征值信息,獲取所述每個(gè)關(guān)鍵詞的應(yīng)用領(lǐng)域?qū)傩孕畔ⅰ?br>
7.根據(jù)權(quán)利要求6所述的獲取裝置,其中,所述初始特征值獲取裝置用于將所述每個(gè)關(guān)鍵詞集合中包括的多個(gè)關(guān)鍵詞在預(yù)設(shè)的應(yīng)用領(lǐng)域分類(lèi)表中進(jìn)行查詢(xún),來(lái)獲取所述每個(gè)關(guān)鍵詞集合包括的至少一個(gè)關(guān)鍵詞的初始應(yīng)用領(lǐng)域特征值信息。
8.根據(jù)權(quán)利要求6或7所述的獲取裝置,其中,對(duì)所述每個(gè)關(guān)鍵詞的至少一個(gè)第一應(yīng)用領(lǐng)域特征值信息進(jìn)行統(tǒng)計(jì)處理以獲取所述每個(gè)關(guān)鍵詞的第二應(yīng)用領(lǐng)域特征值信息的方式還包括: -根據(jù)下式對(duì)所述每個(gè)關(guān)鍵詞的至少一個(gè)第一應(yīng)用領(lǐng)域特征值信息進(jìn)行合并處理,以獲取所述每個(gè)關(guān)鍵詞的第二應(yīng)用領(lǐng)域特征值信息:
9.根據(jù)權(quán)利要求6至8任一項(xiàng)所述的獲取裝置,其中,該獲取裝置還包括: 第一相關(guān)度獲取裝置,用于獲取每個(gè)關(guān)鍵詞分別與多個(gè)應(yīng)用領(lǐng)域?qū)傩孕畔⒌南嚓P(guān)度信息; 其中,所述第一特征值獲取裝置包括: 加權(quán)裝置,用于根據(jù)所述每個(gè)關(guān)鍵詞集合的應(yīng)用領(lǐng)域分布特征值信息,并結(jié)合所述相關(guān)度信息進(jìn)行加權(quán)計(jì)算,以獲取所述每個(gè)關(guān)鍵詞的至少一個(gè)第一應(yīng)用領(lǐng)域特征值信息。
10.根據(jù)權(quán)利要求9所述的獲取裝置,其中,該獲取裝置還包括: 切分裝置,用于對(duì)所述每個(gè)關(guān)鍵詞進(jìn)行切詞處理,以獲取所述每個(gè)關(guān)鍵詞的至少一個(gè)關(guān)鍵詞切詞片段; 出現(xiàn)頻率獲取裝置,用于根據(jù)所述每個(gè)關(guān)鍵詞的至少一個(gè)關(guān)鍵詞切詞片段,在預(yù)置的多個(gè)應(yīng)用領(lǐng)域?qū)傩孕畔⒏髯詫?duì)應(yīng)的應(yīng)用領(lǐng)域切詞庫(kù)中進(jìn)行查詢(xún),來(lái)獲取該至少一個(gè)關(guān)鍵詞切詞片段分別在多個(gè)應(yīng)用領(lǐng)域?qū)傩孕畔⒏髯詫?duì)應(yīng)的應(yīng)用領(lǐng)域切詞庫(kù)中的出現(xiàn)頻率信息;第二相關(guān)度獲取裝置,用于根據(jù)所述出現(xiàn)頻率信息,來(lái)獲取每個(gè)關(guān)鍵詞分別與多個(gè)應(yīng)用領(lǐng)域?qū)傩孕畔⒌南嚓P(guān)度信息。
11.一種計(jì)算機(jī)設(shè)`備,包括如權(quán)利要求6至10中至少一項(xiàng)所述的獲取裝置。
【文檔編號(hào)】G06F17/30GK103678356SQ201210335806
【公開(kāi)日】2014年3月26日 申請(qǐng)日期:2012年9月11日 優(yōu)先權(quán)日:2012年9月11日
【發(fā)明者】高徽, 王平, 郎文靜 申請(qǐng)人:北京百度網(wǎng)訊科技有限公司