一種基于高階聚集系數(shù)的期刊評價(jià)方法
【專利摘要】本發(fā)明公開一種基于高階聚集系數(shù)的期刊評價(jià)方法,提出高階聚集系數(shù)的概念,以期刊作者的合作網(wǎng)絡(luò)數(shù)據(jù)為計(jì)算數(shù)據(jù),延伸Watts和Strogatz的聚集系數(shù),計(jì)算期刊合作者的高階聚集系數(shù)C(h),形成圖表并分析其高階聚集系數(shù)C(h)在圖中所表示的意義。通過采集國內(nèi)計(jì)算機(jī)類一級學(xué)報(bào)的大量合作者樣本數(shù)據(jù)并計(jì)算分析,結(jié)果表明合作者為20人左右時(shí),合作團(tuán)隊(duì)擁有廣泛的知識面和較高的合作水平,較易做出高水平的創(chuàng)新性成果,也意味著高水平的論文作者通常和20人左右的學(xué)者直接或者間接保持合作關(guān)系。本發(fā)明的高階聚集系數(shù)同樣可用于語言網(wǎng)絡(luò)等其他呈現(xiàn)出小世界效應(yīng)的網(wǎng)絡(luò)分析。
【專利說明】
-種基于高階聚集系數(shù)的期刊評價(jià)方法
技術(shù)領(lǐng)域
[0001] 本發(fā)明設(shè)及期刊質(zhì)量評價(jià)領(lǐng)域,具體設(shè)及一種基于高階聚集系數(shù)的期刊評價(jià)方 法。
【背景技術(shù)】
[0002] 網(wǎng)絡(luò)可W用來描述人與人之間的社會關(guān)系,計(jì)算機(jī)之間的網(wǎng)絡(luò)聯(lián)接,網(wǎng)頁之間的 超鏈接,科研文章之間的引用關(guān)系,統(tǒng)計(jì)物理學(xué)是從微觀到宏觀的橋梁。研究網(wǎng)絡(luò)中頂點(diǎn)與 邊的度值與權(quán)值等微觀性質(zhì)與網(wǎng)絡(luò)的幾何性質(zhì)、效率與穩(wěn)定性等宏觀性質(zhì)之間的關(guān)系正是 復(fù)雜網(wǎng)絡(luò)研究的核屯、內(nèi)容。因而,與圖論的研究有所不同,復(fù)雜網(wǎng)絡(luò)的研究更側(cè)重于從各種 實(shí)際網(wǎng)絡(luò)的現(xiàn)象之上抽象出一般的網(wǎng)絡(luò)幾何量,并用運(yùn)些一般性質(zhì)指導(dǎo)更多實(shí)際網(wǎng)絡(luò)的研 究,進(jìn)而通過討論實(shí)際網(wǎng)絡(luò)上的具體現(xiàn)象發(fā)展網(wǎng)絡(luò)上模型的一般方法,最后討論網(wǎng)絡(luò)本身 的形成機(jī)制。在模型研究、演化機(jī)制與結(jié)構(gòu)穩(wěn)定性方面的豐富的研究經(jīng)驗(yàn)是復(fù)雜網(wǎng)絡(luò)研究 領(lǐng)域得到廣泛應(yīng)用的原因,而圖論與社會網(wǎng)絡(luò)提供的網(wǎng)絡(luò)靜態(tài)幾何量及其分析方法是復(fù)雜 網(wǎng)絡(luò)研究的基礎(chǔ),并得到了充分的發(fā)展。合作網(wǎng)絡(luò)屬于復(fù)雜網(wǎng)絡(luò)中社會網(wǎng)絡(luò)的一種,它的提 出是復(fù)雜網(wǎng)絡(luò)系統(tǒng)研究的一種新的方向。小世界網(wǎng)絡(luò)中利用聚集度來評價(jià)網(wǎng)絡(luò)指標(biāo)、反映 網(wǎng)絡(luò)性質(zhì)的合作網(wǎng)絡(luò)已經(jīng)成為評價(jià)網(wǎng)絡(luò)指標(biāo)的一種重要評價(jià)方法主流。根據(jù)權(quán)威的國內(nèi)外 文獻(xiàn)表明合作網(wǎng)絡(luò)是一種優(yōu)化評價(jià)網(wǎng)絡(luò)指標(biāo)的評價(jià)系統(tǒng),自1993年到2010年,持續(xù)多年的 研究更表明了合作網(wǎng)絡(luò)的評價(jià)優(yōu)化??茖W(xué)合作的范圍隨著科學(xué)的進(jìn)步而逐漸增長。論文合 著是科學(xué)合作的表現(xiàn)之一,隨著不同領(lǐng)域的合作者的介入,科學(xué)合作成果的質(zhì)量也會越好, 合作網(wǎng)絡(luò)成為更復(fù)雜的網(wǎng)絡(luò)。
[0003] -個(gè)典型的網(wǎng)絡(luò)是由許多節(jié)點(diǎn)與連接兩個(gè)節(jié)點(diǎn)之間的一些邊組成的,而復(fù)雜網(wǎng)絡(luò) 簡單來說是呈現(xiàn)高度復(fù)雜性的網(wǎng)絡(luò),具有結(jié)構(gòu)復(fù)雜、網(wǎng)絡(luò)進(jìn)化、連接多樣性、動力學(xué)復(fù)雜性、 節(jié)點(diǎn)多樣性和多種復(fù)雜性融合的特點(diǎn)。復(fù)雜網(wǎng)絡(luò)是可具有自組織、自相似、吸引子、小世界、 無標(biāo)度網(wǎng)絡(luò)中部分或全部性質(zhì)的網(wǎng)絡(luò)。合作網(wǎng)絡(luò)是描述合作關(guān)系的網(wǎng)絡(luò),它屬于復(fù)雜網(wǎng)絡(luò) 中社會網(wǎng)絡(luò)的一種。小世界網(wǎng)絡(luò)中利用聚集度的計(jì)算來評價(jià)網(wǎng)絡(luò)指標(biāo)、反映網(wǎng)絡(luò)性質(zhì)的合 作網(wǎng)絡(luò)已經(jīng)成為評價(jià)網(wǎng)絡(luò)指標(biāo)的主流。
[0004] 兩個(gè)現(xiàn)實(shí)的復(fù)雜網(wǎng)絡(luò)模型被廣泛應(yīng)用:小世界模型和無尺度模型。小世界網(wǎng)絡(luò)的 特征是局部集群連接的長的線,平均距離之間的頂點(diǎn)的對數(shù)的增長與網(wǎng)絡(luò)中N的大小有關(guān)。 W日常語言看,它反映的是相互關(guān)系的數(shù)目可W很小但卻能夠連接世界的事實(shí),且小世界 模型社會網(wǎng)絡(luò)就是小世界的一種。科研人員合作網(wǎng)絡(luò)是描述科研人員合作關(guān)系的網(wǎng)絡(luò),通 常把每個(gè)科研人員作為網(wǎng)絡(luò)中的一個(gè)頂點(diǎn)(或稱節(jié)點(diǎn)),如果兩個(gè)科研人員之間共同發(fā)表過 一篇科研論文,運(yùn)兩個(gè)頂點(diǎn)之間就連接一條邊??蒲腥藛T之間形成了一個(gè)復(fù)雜的網(wǎng)絡(luò),該網(wǎng) 絡(luò)的節(jié)點(diǎn)的復(fù)雜性、網(wǎng)絡(luò)演化特性W及網(wǎng)絡(luò)的合作行為等問題,所呈現(xiàn)出的密集度可W作 為評價(jià)期刊的一個(gè)指標(biāo)。研究基于合作網(wǎng)絡(luò)的期刊高階聚集特性分析,通過其看聚集度的 計(jì)算發(fā)現(xiàn)目前研究熱點(diǎn),同時(shí)聚集度越大,合作越緊密,可作為評價(jià)期刊的一個(gè)重要指標(biāo)。
[0005] Watts和Strogatz構(gòu)造出了一種介于規(guī)則網(wǎng)絡(luò)和隨機(jī)網(wǎng)絡(luò)之間的網(wǎng)絡(luò)(WS網(wǎng)絡(luò)), 隨后Newman和Watts給出了一種新的網(wǎng)絡(luò)構(gòu)造方法,在NW網(wǎng)絡(luò)中,原有的連邊并不會被破 壞,而是W-個(gè)很小的概率在原來的規(guī)則網(wǎng)絡(luò)上添加新的連邊,運(yùn)樣構(gòu)造出來的網(wǎng)絡(luò)也同 時(shí)具有大的簇系數(shù)和小的平均距離。BarabasiA對科學(xué)合作社會網(wǎng)絡(luò)的演化進(jìn)行了研究,認(rèn) 為作者合作社會網(wǎng)絡(luò)是復(fù)雜網(wǎng)絡(luò)的代表。
[0006] Watts和Strogatz的研究方法是通過其中一個(gè)規(guī)則網(wǎng)絡(luò)可W轉(zhuǎn)化為小世界網(wǎng)絡(luò), 運(yùn)種方法很少或基本沒有改變頂點(diǎn)度的分布和量化參數(shù)。小世界網(wǎng)絡(luò)中一個(gè)重要特征就是 與隨機(jī)網(wǎng)絡(luò)相比有相當(dāng)高的聚集系數(shù),甚至比任意網(wǎng)絡(luò)的都要高。聚集系數(shù)的定義如下:頂 點(diǎn)V在圖G中有相鄰節(jié)點(diǎn)度k(v),運(yùn)個(gè)k(v)的相鄰節(jié)點(diǎn)可能被連接成4(>)(1(>)-1)/2個(gè)邊。 實(shí)際存在的最大的可能的邊的分?jǐn)?shù)數(shù)量就是圖G的聚集系數(shù)Cv,所有節(jié)點(diǎn)V平均聚集系數(shù)就 是網(wǎng)絡(luò)G的聚集度CX的值接近于1意味著網(wǎng)絡(luò)是高連通的。
[0007] 確定性小世界網(wǎng)絡(luò)的生成方式種類繁多,肖文俊通過化yley圖建立了一個(gè)確定性 小世界網(wǎng)絡(luò)模型,基于Cayley圖的小世界網(wǎng)絡(luò)具有結(jié)構(gòu)簡單和明顯的適應(yīng)性。網(wǎng)絡(luò)G= (V, E)作為圖論的概念是指由一個(gè)點(diǎn)集V(G)和一個(gè)邊集E(G)組成的一個(gè)圖,且E(G)中的每條邊 6:[有八6)的一對點(diǎn)(u,v)與之對應(yīng)。記頂點(diǎn)數(shù)為N= |v|,邊數(shù)為L= |E|。如果任意(u,v)與 (v,u)對應(yīng)同一條邊,則稱為無向網(wǎng)絡(luò),否則為有向網(wǎng)絡(luò);如果任意Iei 1=1,則稱為無權(quán)網(wǎng) 絡(luò),否則為加權(quán)網(wǎng)絡(luò)。從統(tǒng)計(jì)物理學(xué)的角度來看,網(wǎng)絡(luò)是一個(gè)包含了大量個(gè)體W及個(gè)體之間 相互作用的系統(tǒng),是把某種現(xiàn)象或某類關(guān)系抽象為個(gè)體(頂點(diǎn))W及個(gè)體之間相互作用(邊) 而形成的用來描述運(yùn)一現(xiàn)象或關(guān)系的圖。
[0008] 國內(nèi)外學(xué)者在合作網(wǎng)絡(luò)的構(gòu)造、靜態(tài)統(tǒng)計(jì)性質(zhì)分析和演化模型等方面進(jìn)行了研 究,2006年Cardillo A分析了Los Alamos的2000-2005年間cond-mat數(shù)據(jù)庫,發(fā)現(xiàn)該庫的成 長是通過合作網(wǎng)絡(luò)圖的連接增長體現(xiàn)的,主要特征體現(xiàn)在度度相關(guān)性W及節(jié)點(diǎn)的聚集相關(guān) 性。國內(nèi)學(xué)者針對合作者所形成的小型網(wǎng)絡(luò)進(jìn)行研究,周濤等提出的基于二分圖資源的推 薦算法,李曉佳等在自建的合作網(wǎng)絡(luò)上,實(shí)現(xiàn)了層次聚集法和介數(shù)聚集法,在化wman的Q函 數(shù)基礎(chǔ)上討論了聚集過程中的最佳集團(tuán)數(shù)。還有學(xué)者從不同角度對社團(tuán)網(wǎng)絡(luò)及其應(yīng)用做了 研究,如范超利用合作網(wǎng)絡(luò)及社會網(wǎng)絡(luò)的結(jié)構(gòu)知識對CNM算法作了改進(jìn),提高了社團(tuán)發(fā)現(xiàn)的 精度。
[0009] 黃開木等W近30年我國"競爭情報(bào)"領(lǐng)域作者合著發(fā)表期刊論文為研究對象,分析 表明該領(lǐng)域科學(xué)家的產(chǎn)量、最大合著群體的產(chǎn)量和所有合著群體的規(guī)模都滿足幕律分布。 通過對該合著網(wǎng)絡(luò)最大連通子圖統(tǒng)計(jì)分析,發(fā)現(xiàn)該合著群體具有高聚類和小世界性。
【發(fā)明內(nèi)容】
[0010] 本發(fā)明的目的是解決現(xiàn)有技術(shù)的缺陷,提供一種基于合作者網(wǎng)絡(luò)的高階聚集系數(shù) 的期刊評價(jià)方法,采用的技術(shù)方案如下:
[0011] -種基于合作者網(wǎng)絡(luò)的高階聚集系數(shù)的期刊評價(jià)方法,提出高階聚集系數(shù),并把 高階聚集系數(shù)應(yīng)用在期刊評價(jià)中,所述高階聚集系數(shù)為聚集系數(shù)的高度概括,具體由下式 定義:
[0012]
[OOK]其中,t = log2N,N為頂點(diǎn)數(shù),h為是相鄰頂點(diǎn)V與頂點(diǎn)G的距離。
[0014] 作為優(yōu)選,本發(fā)明具體包括:
[0015] 把期刊合作者的數(shù)據(jù)進(jìn)行高階聚集系數(shù)(Xh)的計(jì)算;
[0016] 制作高階聚集系數(shù)和期刊合作者數(shù)量之間的關(guān)系曲線;
[0017] 通過所述關(guān)系曲線的高峰得到期刊中合作者人數(shù)的普遍性,W及評價(jià)該期刊的水 平。
[0018] 進(jìn)一步地,所述關(guān)系曲線有兩個(gè)高峰,第一高峰表明期刊中合作者人數(shù)的普遍性, 第二高峰用于評價(jià)該期刊的優(yōu)劣。
[0019] 定義一個(gè)網(wǎng)絡(luò)或圖表G=(V,E),設(shè)V有N個(gè)頂點(diǎn)或節(jié)點(diǎn),設(shè)E有M個(gè)邊或線段,每個(gè)邊 定義為一對頂點(diǎn)(有序配對的有向圖),讓一個(gè)頂點(diǎn)V于G有相鄰節(jié)點(diǎn)k(v),運(yùn)個(gè)k(v)的相鄰 節(jié)點(diǎn)可能被連接成k(v)(l(v)-l)/2個(gè)邊,那個(gè)分?jǐn)?shù)的最大的邊事實(shí)上存在于相鄰的V和聚 集系數(shù)Cv之間,平均聚集系數(shù)對所有VGV是那個(gè)聚集系數(shù)C的網(wǎng)絡(luò)G。一個(gè)網(wǎng)絡(luò)C接近1可能 包括聚集和有高度的連接,或許稀疏的連接在本地群集中。
[0020] 本發(fā)明延伸Watts和Strogatz的聚集系數(shù),定義h是相鄰頂點(diǎn)V與頂點(diǎn)G的距離h。設(shè) V有鄰節(jié)點(diǎn)h和kh(v),ki(v)與k(v) -樣在前面已經(jīng)定義了,運(yùn)樣最多可W有kh(vKkh(v)- 1)/2條邊連接h的鄰節(jié)點(diǎn)V。分?jǐn)?shù)Cv化)允許的邊是真實(shí)存在于h鄰節(jié)點(diǎn)V與聚集系數(shù)h之間。 設(shè)當(dāng)kh(v) = l時(shí),Cv化)=1,運(yùn)也涵蓋了h = 0時(shí)的特例。平均Cv化)對所有vGG,考慮高階聚 集系數(shù)的概念,聚集系數(shù)為h時(shí)為(Xh)。聚集系數(shù)為1時(shí)C(I)是聚集系數(shù)定義在前面的C。
[0021] 頂點(diǎn)為N的網(wǎng)絡(luò)有M條邊,可得公式
[0022] Ps(O) = IZN and Ps( 1) = 2M/N^>1/N
[0023] 在h=m外,不能精確地表達(dá)該值為Ps(h),但是,很多網(wǎng)絡(luò)(小世界或反之),Ps化) 的值與h-起上升直到到達(dá)最大值,然后下降至距離h與網(wǎng)絡(luò)直徑D越來越接近。
[0024] 對于高階聚集系數(shù),運(yùn)一趨勢開始于聚集度減少,從C(O) = I到C(I) = C,然后其次 是進(jìn)一步減少。由于事實(shí)上h是在增加,Qh的節(jié)點(diǎn)數(shù)目按一定距離h的節(jié)點(diǎn)在增加,運(yùn)些節(jié)點(diǎn) 屬于幾個(gè)派系,因此,他們之間的很多邊是不可能。在h向D靠猶的過程中,會出現(xiàn)不同的效 果。一個(gè)極端的例子其中每個(gè)節(jié)點(diǎn)在網(wǎng)絡(luò)中到距離D的唯一節(jié)點(diǎn)(運(yùn)有一個(gè)截然相反的單節(jié) 點(diǎn)),運(yùn)導(dǎo)致C(D) = U在同樣的情況,C(D-I)可能廣泛地應(yīng)用于鑒別存在多個(gè)直徑和相同的 相對的頂點(diǎn)。應(yīng)注意前面所說的意思是在h向D靠猶的過程中CU)會變大,并非(Xh)-定要 大。
[0025] 因?yàn)镻s化)(上升,然后下降)和C化)(下降,然后上升)的趨勢是相反的,所WPs化)C 化)的乘積應(yīng)有一個(gè)上限值,因?yàn)槌?shù)C經(jīng)常接近1但很少超過1,得出:
[0026] Ps化)(Xh)《c log N/N (I)
[0027] h= I時(shí),方程(I)意味著Ps(I)CQ)^log N/N,從小世界網(wǎng)絡(luò)中知道Ps(I) = 2M/n2 ^log N/N,對于運(yùn)類的網(wǎng)絡(luò)是符合C(I)=Cd
[0028] 利用式(1)運(yùn)個(gè)確定性的小世界網(wǎng)絡(luò)本發(fā)明提出運(yùn)個(gè)模型,事實(shí)上,通過運(yùn)個(gè)模 型,可W發(fā)現(xiàn)運(yùn)種趨勢表現(xiàn)在方程(1)。反觀確定性的模型,運(yùn)是基于化yley的圖,提供了模 型所需的支撐信息,從而可得,該模型的聚集系數(shù):
[0029]
(2)
[0030] 在模型中,t=log2N和a=(2i-l)/t是一個(gè)自由調(diào)整參數(shù),運(yùn)關(guān)系到互連密度,從而 影響了C的價(jià)值。注意非常廣泛的網(wǎng)絡(luò)(N,t一-),當(dāng)a是常數(shù)時(shí)C趨向a2/(a+l)2。適當(dāng)?shù)剡x擇 曰,能獲得不同的聚集系數(shù),同時(shí)保持一個(gè)小的頂點(diǎn)等于atW-l = (a+l)log2N-l。
[0031] 不像現(xiàn)實(shí)網(wǎng)絡(luò)中計(jì)算(Xh)是非常困難的,本發(fā)明提出的確定性模型是服從數(shù)學(xué)分 析,能用封閉形式表達(dá)一個(gè)高階聚集系數(shù)。在運(yùn)個(gè)確定性模型中,對于數(shù)字m相鄰的頂點(diǎn)之 間,在相鄰頂點(diǎn)h的任何頂點(diǎn)給出表達(dá)式:
[0032] (3)
[0033]
[0034] (4)
[0035] 夏得到高階聚集系數(shù)為:
[0036] (5)
[0037] 因此,定義聚集系數(shù)是基于相鄰的節(jié)點(diǎn),高階聚集系數(shù)定義了設(shè)及到一個(gè)更廣泛 的相鄰距離參數(shù)h。利用實(shí)際上的更廣泛的復(fù)雜網(wǎng)絡(luò)的實(shí)驗(yàn)數(shù)據(jù),依據(jù)本發(fā)明提出的確定性 小世界網(wǎng)絡(luò)模型,將在網(wǎng)絡(luò)中有關(guān)(Xh)和Ps化)的距離分布,定義為有一定概率的隨機(jī)選擇 的距離為h的一對頂點(diǎn)。
[0038] 高階聚集系數(shù)是聚集系數(shù)的高度概括,并受聚集系統(tǒng)相關(guān)的公式所控制。通過利 用期刊作者所構(gòu)成的網(wǎng)絡(luò)數(shù)據(jù)提出了實(shí)驗(yàn)和分析證明,不等式Ps化)(Xh)《c log N/N在小 世界網(wǎng)絡(luò)中成立。運(yùn)一結(jié)果明顯表明該乘積Ps化)(Xh)有一個(gè)上限值,該上限值小于Ps化)和 C化)的最大值。
[0039] 高階聚集系數(shù)的計(jì)算可W應(yīng)用在期刊合作者上。把期刊合作者的數(shù)據(jù)進(jìn)行高階聚 集系數(shù)C化)的計(jì)算,可W得出一組關(guān)于頂點(diǎn)距離、階數(shù)、高階聚集系數(shù)(Xh)和Cd沖d等的數(shù) 據(jù)。通過實(shí)驗(yàn)把數(shù)據(jù)制作成圖表分析,期刊合作者的高階聚集系數(shù)能得出一組曲線圖。而運(yùn) 組曲線圖的高峰能表明運(yùn)時(shí)候合作者人數(shù)在期刊中的普遍性,W及能表明此時(shí)的合作者人 數(shù)能做出較好的科學(xué)研究成果。也可W根據(jù)曲線圖的高峰段來判斷合作者的作品情況,可 作為期刊的評價(jià)方法之一。
[0040] 作為優(yōu)選,所述高階聚集系數(shù)的計(jì)算方法包括如下步驟:
[0041] 計(jì)算最大連通子圖;
[0042] 計(jì)算出頂點(diǎn)數(shù)與平均距離;
[0043] 計(jì)算各距離的點(diǎn)對數(shù);
[0044] 根據(jù)平均距離數(shù)得到高階聚集系數(shù)。
[0045] 與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果:本文通過計(jì)算期刊合作者的高階聚集系數(shù) 來研究反映出期刊作者在不同階段的聚集度,通過對高階聚集系數(shù)的計(jì)算與分析,分析期 刊合作者情況,作為評價(jià)期刊的優(yōu)劣的指標(biāo)之一。
【附圖說明】
[0046] 圖1是本發(fā)明實(shí)施例S大期刊高階聚集系數(shù)分布情況示意圖。
【具體實(shí)施方式】
[0047]下面結(jié)合附圖和實(shí)施例對本發(fā)明做進(jìn)一步詳細(xì)說明。
[004引實(shí)施例:
[0049] 本發(fā)明的目的是解決現(xiàn)有技術(shù)的缺陷,提供一種基于合作者網(wǎng)絡(luò)的高階聚集系數(shù) 的期刊評價(jià)方法,采用的技術(shù)方案如下:
[0050] -種基于合作者網(wǎng)絡(luò)的高階聚集系數(shù)的期刊評價(jià)方法,提出高階聚集系數(shù),并把 高階聚集系數(shù)應(yīng)用在期刊評價(jià)中,所述高階聚集系數(shù)為聚集系數(shù)的高度概括,具體由下式 定義:
[0化1 ]
[0化2] 具甲,t = iog2lN,lN刃項(xiàng)點(diǎn)效,h為是相鄰頂點(diǎn)V與頂點(diǎn)G的距離。
[0053] 本發(fā)明具體包括:
[0054] 把期刊合作者的數(shù)據(jù)進(jìn)行高階聚集系數(shù)(Xh)的計(jì)算;
[0055] 制作高階聚集系數(shù)和期刊合作者數(shù)量之間的關(guān)系曲線;
[0056] 通過所述關(guān)系曲線的高峰得到期刊中合作者人數(shù)的普遍性,W及評價(jià)該期刊的水 平。
[0057] 進(jìn)一步地,所述關(guān)系曲線有兩個(gè)高峰,第一高峰表明期刊中合作者人數(shù)的普遍性, 第二高峰用于評價(jià)該期刊的優(yōu)劣。
[005引進(jìn)一步地,所述關(guān)系曲線有兩個(gè)高峰,第一高峰表明期刊中合作者人數(shù)的普遍性, 第二高峰用于評價(jià)該期刊的水平。
[0059] 定義一個(gè)網(wǎng)絡(luò)或圖表G=(V,E),設(shè)V有N個(gè)頂點(diǎn)或節(jié)點(diǎn),設(shè)E有M個(gè)邊或線段,每個(gè)邊 定義為一對頂點(diǎn)(有序配對的有向圖),讓一個(gè)頂點(diǎn)V于G有相鄰節(jié)點(diǎn)k(v),運(yùn)個(gè)k(v)的相鄰 節(jié)點(diǎn)可能被連接成k(v)(l(v)-l)/2個(gè)邊,那個(gè)分?jǐn)?shù)的最大的邊事實(shí)上存在于相鄰的V和聚 集系數(shù)Cv之間,平均聚集系數(shù)對所有VGV是那個(gè)聚集系數(shù)C的網(wǎng)絡(luò)G。一個(gè)網(wǎng)絡(luò)C接近1可能 包括聚集和有高度的連接,或許稀疏的連接在本地群集中。
[0060] 本發(fā)明延伸Watts和Strogatz的聚集系數(shù),定義h是相鄰頂點(diǎn)V與頂點(diǎn)G的距離h。設(shè) V有鄰節(jié)點(diǎn)h和kh(v),ki(v)與k(v) -樣在前面已經(jīng)定義了,運(yùn)樣最多可W有kh(vKkh(v)- 1)/2條邊連接h的鄰節(jié)點(diǎn)V。分?jǐn)?shù)Cv化)允許的邊是真實(shí)存在于h鄰節(jié)點(diǎn)V與聚集系數(shù)h之間。 設(shè)當(dāng)kh(v) = 1時(shí),Cv化)=1,運(yùn)也涵蓋了h = 0時(shí)的特例。平均Cv化)對所有vEG,考慮高階聚 集系數(shù)的概念,聚集系數(shù)為h時(shí)為(Xh)。聚集系數(shù)為1時(shí)C(I)是聚集系數(shù)定義在前面的C。 [0061 ]頂點(diǎn)為N的網(wǎng)絡(luò)有M條邊,可得公式
[0062] Ps(O) = IZN and Ps( 1) = 2M/N^>1/N
[0063] 在h=m外,不能精確地表達(dá)該值為Ps(h),但是,很多網(wǎng)絡(luò)(小世界或反之),Ps化) 的值與h-起上升直到到達(dá)最大值,然后下降至距離h與網(wǎng)絡(luò)直徑D越來越接近。
[0064] 對于高階聚集系數(shù),運(yùn)一趨勢開始于聚集度減少,從C(O) = I到C(I) = C,然后其次 是進(jìn)一步減少。由于事實(shí)上h是在增加,Qh的節(jié)點(diǎn)數(shù)目按一定距離h的節(jié)點(diǎn)在增加,運(yùn)些節(jié)點(diǎn) 屬于幾個(gè)派系,因此,他們之間的很多邊是不可能。在h向D靠猶的過程中,會出現(xiàn)不同的效 果。一個(gè)極端的例子其中每個(gè)節(jié)點(diǎn)在網(wǎng)絡(luò)中到距離D的唯一節(jié)點(diǎn)(運(yùn)有一個(gè)截然相反的單節(jié) 點(diǎn)),運(yùn)導(dǎo)致C(D) = 1。在同樣的情況,C(D-I)可能廣泛地應(yīng)用于鑒別存在多個(gè)直徑和相同的 相對的頂點(diǎn)。應(yīng)注意前面所說的意思是在h向D靠猶的過程中CU)會變大,并非(Xh)-定要 大。
[0065] 因?yàn)镻s化)(上升,然后下降)和C化)(下降,然后上升)的趨勢是相反的,所WPs化)C 化)的乘積應(yīng)有一個(gè)上限值,因?yàn)槌?shù)C經(jīng)常接近1但很少超過1,得出:
[0066] Ps化)(Xh)《c log N/N (I)
[0067] h= I時(shí),方程(I)意味著Ps(I)CQ)^log N/N,從小世界網(wǎng)絡(luò)中知道Ps(I) = 2M/n2 ^log N/N,對于運(yùn)類的網(wǎng)絡(luò)是符合C(I)=Cd
[0068] 利用式(1)運(yùn)個(gè)確定性的小世界網(wǎng)絡(luò)本發(fā)明提出運(yùn)個(gè)模型,事實(shí)上,通過運(yùn)個(gè)模 型,可W發(fā)現(xiàn)運(yùn)種趨勢表現(xiàn)在方程(1)。反觀確定性的模型,運(yùn)是基于化yley的圖,提供了模 型所需的支撐信息,從而可得,該模型的聚集系數(shù):
[0069]
(2)
[0070] 在模型中,t=log2N和a=(2i-l)/t是一個(gè)自由調(diào)整參數(shù),運(yùn)關(guān)系到互連密度,從而 影響了C的價(jià)值。注意非常廣泛的網(wǎng)絡(luò)(N,t一-),當(dāng)a是常數(shù)時(shí)C趨向a2/(a+l)2。適當(dāng)?shù)剡x擇 曰,能獲得不同的聚集系數(shù),同時(shí)保持一個(gè)小的頂點(diǎn)等于atW-l = (a+l)log2N-l。
[0071] 不像現(xiàn)實(shí)網(wǎng)絡(luò)中計(jì)算(Xh)是非常困難的,本發(fā)明提出的確定性模型是服從數(shù)學(xué)分 析,能用封閉形式表達(dá)一個(gè)高階聚集系數(shù)。在運(yùn)個(gè)確定性模型中,對于數(shù)字m相鄰的頂點(diǎn)之 間,在相鄰頂點(diǎn)h的任何頂點(diǎn)給出表達(dá)式:
[007^ 巧
[0073]
[0074] (4)
[0075] ?易得到高階聚集系數(shù)為:
[0076] (5)
[0077] 因此,定義聚集系數(shù)是基于相鄰的節(jié)點(diǎn),高階聚集系數(shù)定義了設(shè)及到一個(gè)更廣泛 的相鄰距離參數(shù)h。利用實(shí)際上的更廣泛的復(fù)雜網(wǎng)絡(luò)的實(shí)驗(yàn)數(shù)據(jù),依據(jù)本發(fā)明提出的確定性 小世界網(wǎng)絡(luò)模型,將在網(wǎng)絡(luò)中有關(guān)(Xh)和Ps化)的距離分布,定義為有一定概率的隨機(jī)選擇 的距離為h的一對頂點(diǎn)。
[0078] 高階聚集系數(shù)是聚集系數(shù)的高度概括,并受聚集系統(tǒng)相關(guān)的公式所控制。通過利 用期刊作者所構(gòu)成的網(wǎng)絡(luò)數(shù)據(jù)提出了實(shí)驗(yàn)和分析證明,不等式Ps化)(Xh)《c log N/N在小 世界網(wǎng)絡(luò)中成立。運(yùn)一結(jié)果明顯表明該乘積Ps化)(Xh)有一個(gè)上限值,該上限值小于Ps化)和 C化)的最大值。
[0079] 高階聚集系數(shù)的計(jì)算可W應(yīng)用在期刊合作者上。把期刊合作者的數(shù)據(jù)進(jìn)行高階聚 集系數(shù)C化)的計(jì)算,可W得出一組關(guān)于頂點(diǎn)距離、階數(shù)、高階聚集系數(shù)(Xh)和Cd沖d等的數(shù) 據(jù)。通過實(shí)驗(yàn)把數(shù)據(jù)制作成圖表分析,期刊合作者的高階聚集系數(shù)能得出一組曲線圖。而運(yùn) 組曲線圖的高峰能表明運(yùn)時(shí)候合作者人數(shù)在期刊中的普遍性,W及能表明此時(shí)的合作者人 數(shù)能做出較好的科學(xué)研究成果。也可W根據(jù)曲線圖的高峰段來判斷合作者的作品情況,可 作為期刊的評價(jià)方法之一。
[0080] 所述高階聚集系數(shù)的計(jì)算方法包括如下步驟:
[0081] 計(jì)算最大連通子圖;
[0082] 計(jì)算出頂點(diǎn)數(shù)與平均距離;
[0083] 計(jì)算各距離的點(diǎn)對數(shù);
[0084] 根據(jù)平均距離數(shù)得到高階聚集系數(shù)。
[0085] 本實(shí)施例從中國期刊網(wǎng)中把《計(jì)算機(jī)研究與發(fā)展》、《計(jì)算機(jī)學(xué)報(bào)》和《軟件學(xué)報(bào)》從 2000年至2010年的作者信息進(jìn)行數(shù)據(jù)采集,分別整理成3個(gè)單獨(dú)存放作者信息的文檔,再把 論文作者是兩位W上的作者進(jìn)行分離和融合,形成每行為兩位作者名稱的格式,然后利用 高階聚集系數(shù)計(jì)算方法對3大期刊的高階聚集系數(shù)進(jìn)行計(jì)算,結(jié)果如表1所示。
[00化]表1
[0087]
[0089]
[0090] 最后把數(shù)據(jù)信息分別整理成圖表,結(jié)果如圖I所示,圖I顯示了S大期刊高階聚集 系數(shù)的分布情況,其中點(diǎn)集表示了期刊合作者的高階聚集系數(shù)。從圖1中可W看出,圖中出 現(xiàn)了兩個(gè)高峰,在合作者為2-3人的平均距離實(shí)驗(yàn)結(jié)果圖中出現(xiàn)第一高峰,即2-3人的合作 情況比較普遍。隨著合作者數(shù)量增加高階聚集系數(shù)減小,但是合作者20人左右時(shí)出現(xiàn)第二 聚集系數(shù)高峰,此高峰表明合作者20人左右時(shí),合作團(tuán)隊(duì)擁有廣泛的知識面和較高的合作 水平,較易做出高水平的創(chuàng)新性成果,也意味著高水平的論文作者通常和20人左右的學(xué)者 直接或者間接保持合作關(guān)系??蒞看出,運(yùn)=組數(shù)據(jù)的第二高峰都處于相似的階段,證明高 水平的論文作者和20人左右的學(xué)者直接或間接保持合作關(guān)系。
[0091] 本發(fā)明提出的高階聚集系數(shù)是聚集系數(shù)的高度概括,并受聚集系數(shù)相關(guān)的公式所 控制,通過利用期刊作者所構(gòu)成的網(wǎng)絡(luò)數(shù)據(jù)提出了實(shí)驗(yàn)和分析,證明不等式Ps化)(Xh)《c log N/N在小世界網(wǎng)絡(luò)中成立。運(yùn)一結(jié)果表明該乘積Ps化)C化)有一個(gè)上限值,該上限值小 于Ps化)和CU)的最大值。因此,高階聚集系數(shù)提供了對小世界網(wǎng)絡(luò)結(jié)構(gòu)的新見解,為小世 界網(wǎng)絡(luò)的探索提供了一個(gè)新的渠道。
[0092] 通過實(shí)驗(yàn)數(shù)據(jù)結(jié)果看出,高階聚集系數(shù)越高,期刊合作者合作關(guān)系越緊密,越能做 出有水平的研究成果。2-3人的合作網(wǎng)絡(luò)比較普遍,但并不意味著2-3人的合作者模式容易 作出高水平成果,過第二聚集系數(shù)高峰進(jìn)行分析更具有說服力,在合作者規(guī)模為20左右的 合作關(guān)系是比較容易做出高水平創(chuàng)新研究成果。本發(fā)明所提出的高階聚集系數(shù)還可應(yīng)用于 語言網(wǎng)絡(luò)等其他呈現(xiàn)出小世界效應(yīng)的網(wǎng)絡(luò)分析。
【主權(quán)項(xiàng)】
1. 一種基于合作者網(wǎng)絡(luò)的高階聚集系數(shù)的期刊評價(jià)方法,其特征在于,提出高階聚集 系數(shù),并把高階聚集系數(shù)應(yīng)用在期刊評價(jià)中,所述高階聚集系數(shù)為聚集系數(shù)的高度概括,具 體由下式定義:其中,t = log2N,N為頂點(diǎn)數(shù),h為小世界網(wǎng)絡(luò)中相鄰頂點(diǎn)V與頂點(diǎn)G的距離。2. 根據(jù)權(quán)利要求1所述的一種基于合作者網(wǎng)絡(luò)的高階聚集系數(shù)的期刊評價(jià)方法,其特 征在于,具體包括: 把期刊合作者的數(shù)據(jù)進(jìn)行高階聚集系數(shù)C化)的計(jì)算; 制作高階聚集系數(shù)和期刊合作者數(shù)量之間的關(guān)系曲線; 通過所述關(guān)系曲線的高峰得到期刊中合作者人數(shù)的普遍性,W及評價(jià)該期刊的水平。3. 根據(jù)權(quán)利要求2所述的一種基于合作者網(wǎng)絡(luò)的高階聚集系數(shù)的期刊評價(jià)方法,其特 征在于,所述關(guān)系曲線有兩個(gè)高峰,第一高峰表明期刊中合作者人數(shù)的普遍性,第二高峰用 于評價(jià)該期刊的優(yōu)劣。4. 根據(jù)權(quán)利要求3所述的一種基于合作者網(wǎng)絡(luò)的高階聚集系數(shù)的期刊評價(jià)方法,其特 征在于,所述高階聚集系數(shù)的計(jì)算方法包括如下步驟: 計(jì)算最大連通子圖; 計(jì)算出頂點(diǎn)數(shù)與平均距離; 計(jì)算各距離的點(diǎn)對數(shù); 根據(jù)平均距離數(shù)得到高階聚集系數(shù)。
【文檔編號】G06F17/30GK105978743SQ201610589947
【公開日】2016年9月28日
【申請日】2016年7月25日
【發(fā)明人】楊忠明, 余君, 吳偉美, 秦勇, 常亞萍
【申請人】廣東科學(xué)技術(shù)職業(yè)學(xué)院