国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種學(xué)術(shù)期刊論文作者信息挖掘方法及系統(tǒng)的制作方法

      文檔序號(hào):6362753閱讀:393來源:國知局
      專利名稱:一種學(xué)術(shù)期刊論文作者信息挖掘方法及系統(tǒng)的制作方法
      技術(shù)領(lǐng)域
      本發(fā)明涉及知識(shí)工程領(lǐng)域,具體涉及一種學(xué)術(shù)期刊論文作者信息挖掘方法及系統(tǒng)。
      背景技術(shù)
      學(xué)術(shù)期刊論文作者信息是指正式發(fā)表在期刊上的學(xué)術(shù)論文中給出的作者姓名、性別、出生年份、籍貫、職稱和研究方向等基本信息,一般出現(xiàn)在論文首頁的腳注或論文最后的尾注位置,如圖I所示。相對(duì)于圖書,學(xué)術(shù)期刊論文中作者信息具有內(nèi)容簡短、格式固定、 用詞規(guī)范等特點(diǎn)。作者與文獻(xiàn)之間的數(shù)量關(guān)系的分析是指以揭示作者與文獻(xiàn)數(shù)量之間的關(guān)系,描述作者的科學(xué)生產(chǎn)力為目的信息分析方法。在作者與文獻(xiàn)之間的數(shù)量關(guān)系的分析方面,比較有代表性的是洛特卡定律(Lotka’s Law)——作者數(shù)量與論文數(shù)量的關(guān)系遵循一種平方反比規(guī)律,即F(x) =C/x2,其中x、F(x),C分別代表論文數(shù)、寫X篇論文的作者占作者總數(shù)的比例和常數(shù)。在洛特卡定律的基礎(chǔ)上,非拉奇等學(xué)者提出了影響洛特卡分布的兩個(gè)因素一是研究者本人所處的時(shí)代或環(huán)境直接影響著研究結(jié)果;二是統(tǒng)計(jì)樣本中的作者數(shù)量與研究結(jié)果有關(guān)。作者與文獻(xiàn)之間的數(shù)量關(guān)系分析的優(yōu)點(diǎn)是較好地揭示了作者頻率與論文數(shù)量之間的關(guān)系,缺點(diǎn)是沒有分析作者的其他信息,包括出生年份、籍貫、職稱、研究方向等信息。普賴斯利用每位作者合作數(shù)量的分布來研究合作問題,得出了如下方程
      權(quán)利要求
      1.一種學(xué)術(shù)期刊論文作者信息挖掘方法,其特征在于,包括步驟I,選擇目標(biāo)學(xué)科領(lǐng)域,建立OWL領(lǐng)域本體;步驟2,從目標(biāo)學(xué)科領(lǐng)域內(nèi)的學(xué)術(shù)期刊論文中抽取作者信息;步驟3,對(duì)抽取的作者信息進(jìn)行格式轉(zhuǎn)換,并存入作者信息庫中,并計(jì)算出唯一的作者ID ;步驟4,根據(jù)作者ID和論文ID計(jì)算作者與學(xué)術(shù)論文關(guān)聯(lián)矩陣;步驟5,根據(jù)作者與學(xué)術(shù)論文關(guān)聯(lián)矩陣、研究方向和年份計(jì)算作者在同一研究方向的累計(jì)發(fā)表論文絕對(duì)數(shù)量并生成作者學(xué)術(shù)成長路線圖;步驟6,根據(jù)作者與學(xué)術(shù)論文關(guān)聯(lián)矩陣得到作者的合作者網(wǎng)絡(luò)圖;步驟7,根據(jù)作者的合作者網(wǎng)絡(luò)圖計(jì)算作者之間的學(xué)術(shù)合作距離;步驟8,根據(jù)OWL領(lǐng)域本體、作者ID及研究方向生成熱點(diǎn)研究方向地圖;步驟9,根據(jù)作者ID以及作者的合作者網(wǎng)絡(luò)圖生成作者學(xué)術(shù)聲望地圖。
      2.如權(quán)利要求I所述的方法,其特征在于,步驟I中,OWL領(lǐng)域本體包含領(lǐng)域術(shù)語之間的繼承關(guān)系、等同關(guān)系和集合運(yùn)算關(guān)系。
      3.如權(quán)利要求2所述的方法,其特征在于,步驟2中,作者信息包括作者姓名、性別、 出生年份、籍貫、職稱、研究方向、論文標(biāo)題、期刊名稱、發(fā)表時(shí)間以及作者所在單位;步驟3 中,唯一的作者ID包括作者的姓名、出生年份、性別、籍貫、所在單位名稱以及隨機(jī)碼。
      4.如權(quán)利要求3所述的方法,其特征在于,步驟4中,作者與學(xué)術(shù)論文關(guān)聯(lián)矩陣Smxn= (Sij)mxn,其中i和j分別為論文ID和作者ID,m和n分別代表論文篇數(shù)和作者人數(shù),Sij代表作者權(quán)重,作者權(quán)重的計(jì)算公式如下
      5.如權(quán)利要求4所述的方法,其特征在于,步驟5中,第i個(gè)作者在研究方向z上的累積發(fā)表論文絕對(duì)數(shù)量y的計(jì)算公式如下
      6.如權(quán)利要求5所述的方法,其特征在于,步驟6中,作者合作網(wǎng)絡(luò)圖包括作者集合和論文集合,作者為結(jié)點(diǎn),論文為紐帶,兩個(gè)結(jié)點(diǎn)之間的加權(quán)值計(jì)算方法如下D (i, j, k) = I S (i, k) -S (j, k) I ;其中,D(i,j,k)為第i個(gè)作者和第j個(gè)作者在第k篇論文中的權(quán)重之差,ff(i, k)和 W(j, k)分別為第i個(gè)作者和第j個(gè)作者在第k篇論文中的權(quán)重。
      7.如權(quán)利要求6所述的方法,其特征在于,步驟7中,作者之間的學(xué)術(shù)合作距離的計(jì)算公式如下L ( i, j ) =^二。(眾XS(灸,眾+ 1)),其中L(i,j)為結(jié)點(diǎn)i和結(jié)點(diǎn)j對(duì)應(yīng)的作者之間的學(xué)術(shù)合作距離,k為作者合作網(wǎng)絡(luò)圖中在結(jié)點(diǎn)i和結(jié)點(diǎn)j之間最短路徑上存在的中間結(jié)點(diǎn),N為中間結(jié)點(diǎn)的個(gè)數(shù)。
      8.如權(quán)利要求7所述的方法,其特征在于,步驟8中,根據(jù)下式生成熱點(diǎn)研究方向地圖H(I)=^x d_0(H(k) X D(i,k))2 ,其中n為從事第i個(gè)研究方向的子類研究方向的作者個(gè)數(shù),(H(k)為第k個(gè)子類的研究方向的熱點(diǎn)程度,D(i,k)代表研究方向i 和研究方向k之間的最短路徑上的中間結(jié)點(diǎn)數(shù),H(O)代表第i個(gè)研究方向上的作者人數(shù), D(i,0) = I ;0WL本體中的葉結(jié)點(diǎn)對(duì)應(yīng)的研究方向?yàn)樽宇愌芯糠较颉?br> 9.如權(quán)利要求7所述的方法,其特征在于,作者學(xué)術(shù)聲望地圖以第一作者為傳播者結(jié)點(diǎn),以合作者為接受者結(jié)點(diǎn)的有向圖;“作者學(xué)術(shù)聲望的計(jì)算方法如下I(1)= (Z:=0(/WxD_);其中,I (i)為第i個(gè)作者的聲望,n為第i個(gè)作者的合作作者人數(shù),k為第i個(gè)作者的第k個(gè)合作者,D (i,k)為第i個(gè)作者與第k個(gè)作者之間的距離,I (0)代表與第i個(gè)作者直接合作人數(shù),且D(0, k) = I。
      10.一種實(shí)現(xiàn)如權(quán)利要求1-9任意一項(xiàng)所述的方法的系統(tǒng),其特征在于,包括ETL模塊、 領(lǐng)域本體、唯一標(biāo)識(shí)模塊、作者與學(xué)術(shù)論文關(guān)聯(lián)矩陣計(jì)算模塊、作者學(xué)術(shù)成長路線圖生成模塊、作者合作網(wǎng)絡(luò)圖生成模塊、學(xué)術(shù)合作距離生成模塊、熱點(diǎn)研究方向地圖生成模塊以及作者學(xué)術(shù)聲望地圖生成模塊;ETL模塊,用于從目標(biāo)學(xué)科領(lǐng)域內(nèi)的學(xué)術(shù)期刊論文中抽取作者信息,對(duì)抽取的作者信息進(jìn)行格式轉(zhuǎn)換并存入作者信息庫中;領(lǐng)域本體為根據(jù)所選擇的目標(biāo)學(xué)科領(lǐng)域所建立OWL領(lǐng)域本體;唯一標(biāo)識(shí)模塊,用于計(jì)算出唯一的作者ID ;作者與學(xué)術(shù)論文關(guān)聯(lián)矩陣計(jì)算模塊,用于根據(jù)作者ID和論文ID計(jì)算作者與學(xué)術(shù)論文關(guān)聯(lián)矩陣;作者學(xué)術(shù)成長路線圖生成模塊,用于根據(jù)作者與學(xué)術(shù)論文關(guān)聯(lián)矩陣、研究方向和年份計(jì)算作者在同一研究方向的累計(jì)發(fā)表論文絕對(duì)數(shù)量并生成作者學(xué)術(shù)成長路線圖;作者合作網(wǎng)絡(luò)圖生成模塊,用于根據(jù)作者與學(xué)術(shù)論文關(guān)聯(lián)矩陣得到作者的合作者網(wǎng)絡(luò)圖;學(xué)術(shù)合作距離生成模塊,用于根據(jù)作者的合作者網(wǎng)絡(luò)圖計(jì)算作者之間的學(xué)術(shù)合作距離;熱點(diǎn)研究方向地圖生成模塊,用于根據(jù)OWL領(lǐng)域本體、作者ID、研究方向及其熱點(diǎn)程度生成熱點(diǎn)研究方向地圖;作者學(xué)術(shù)聲望地圖生成模塊,用于根據(jù)作者ID以及作者的合作者網(wǎng)絡(luò)圖生成作者學(xué)術(shù)聲望地圖。
      全文摘要
      本發(fā)明公開了一種學(xué)術(shù)期刊論文作者信息挖掘方法及系統(tǒng)。該方法中,首先選擇目標(biāo)學(xué)科領(lǐng)域,建立OWL領(lǐng)域本體;其次,從目標(biāo)學(xué)科領(lǐng)域內(nèi)的學(xué)術(shù)期刊論文中抽取作者信息;再次,對(duì)抽取的作者信息進(jìn)行格式轉(zhuǎn)換,并存入作者信息庫中,并計(jì)算出唯一的作者ID;最后利用上述信息得到作者與學(xué)術(shù)論文關(guān)聯(lián)矩陣,作者學(xué)術(shù)成長路線圖,作者的合作者網(wǎng)絡(luò)圖,作者之間的學(xué)術(shù)合作距離,熱點(diǎn)研究方向地圖以及作者學(xué)術(shù)聲望地圖。本發(fā)明改變了作者信息挖掘方法的數(shù)據(jù)來源,在作者學(xué)術(shù)合作距離、熱點(diǎn)研究方向的計(jì)算過程中引入OWL領(lǐng)域本體技術(shù),提高了語義計(jì)算效果。
      文檔編號(hào)G06F17/30GK102609546SQ20121007264
      公開日2012年7月25日 申請(qǐng)日期2012年3月19日 優(yōu)先權(quán)日2011年12月8日
      發(fā)明者孫一鋼, 張勇, 朝樂門, 朱先忠, 邢春曉 申請(qǐng)人:國家圖書館, 清華大學(xué)
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1