一種文獻(xiàn)查新的方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及科技文獻(xiàn)查新技術(shù)領(lǐng)域,特別是涉及一種文獻(xiàn)查新的方法及裝置。
【背景技術(shù)】
[0002] 隨著對(duì)科技文獻(xiàn)查新的需求不斷增加,對(duì)科技文獻(xiàn)查新工作的要求也在不斷提 升。
[0003] 目前的文獻(xiàn)查新方法依賴于科技查新人員基于對(duì)查新項(xiàng)目的理解,制定相應(yīng)的檢 索式,提交相應(yīng)的數(shù)據(jù)庫進(jìn)行相關(guān)文獻(xiàn)的檢索,得到相關(guān)文獻(xiàn)后再人工分析和總結(jié)相關(guān)文 獻(xiàn),并在此基礎(chǔ)上進(jìn)行人工對(duì)比和分析得出查新結(jié)論。在這一過程中,不僅受到查新員的知 識(shí)領(lǐng)域的限制,而且為了得到更準(zhǔn)確的查新結(jié)果需要進(jìn)行大量的文獻(xiàn)檢索。
[0004] 由此可見,如何減輕查新員的工作量以提高工作效率是本領(lǐng)域技術(shù)人員亟待解決 的問題。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明的目的是提供一種文獻(xiàn)查新的方法,用于減輕查新員的工作量以提高工作 效率。此外,本發(fā)明的目的還提供一種文獻(xiàn)查新的裝置。
[0006] 為解決上述技術(shù)問題,本發(fā)明提供一種文獻(xiàn)查新的方法,包括:
[0007] 根據(jù)查新項(xiàng)目自動(dòng)檢索所述查新項(xiàng)目對(duì)應(yīng)的第一相關(guān)文獻(xiàn)集合;
[0008] 將所述第一相關(guān)文獻(xiàn)集合與人工分析得到的第二相關(guān)文獻(xiàn)集合綜合分析得到目 標(biāo)相關(guān)文獻(xiàn)集合;
[0009]在所述目標(biāo)相關(guān)文獻(xiàn)集合的基礎(chǔ)上計(jì)算所述查新項(xiàng)目中每個(gè)技術(shù)要點(diǎn)的差異型 或創(chuàng)新型得到計(jì)算結(jié)果;
[0010] 根據(jù)所述計(jì)算結(jié)果形成所述查新項(xiàng)目的查新結(jié)論。
[0011] 優(yōu)選地,所述根據(jù)查新項(xiàng)目自動(dòng)檢索所述查新項(xiàng)目對(duì)應(yīng)的第一相關(guān)文獻(xiàn)集合具體 包括:
[0012] 構(gòu)造所述查新項(xiàng)目對(duì)應(yīng)的各檢索式;
[0013] 將所述檢索式分別輸入至文獻(xiàn)數(shù)據(jù)庫檢索接口或網(wǎng)絡(luò)檢索接口得到各個(gè)檢索式 對(duì)應(yīng)的多篇相關(guān)文獻(xiàn);
[0014] 根據(jù)與所述查新項(xiàng)目的相關(guān)度對(duì)各個(gè)檢索式得到的多篇相關(guān)文獻(xiàn)進(jìn)行排序得到 所述第一相關(guān)文獻(xiàn)集合。
[0015] 優(yōu)選地,所述構(gòu)造所述查新項(xiàng)目對(duì)應(yīng)的各檢索式具體包括:
[0016] 獲取所述查新項(xiàng)目對(duì)應(yīng)的各關(guān)鍵詞;
[0017] 對(duì)任意三個(gè)關(guān)鍵詞做與運(yùn)算得到所述檢索式。
[0018] 優(yōu)選地,所述構(gòu)造所述查新項(xiàng)目對(duì)應(yīng)的各檢索式具體包括:
[0019] 獲取所述查新項(xiàng)目對(duì)應(yīng)的各關(guān)鍵詞;
[0020] 對(duì)任意三個(gè)關(guān)鍵詞做和運(yùn)算得到所述檢索式。
[0021 ]優(yōu)選地,所述將所述檢索式分別輸入至文獻(xiàn)數(shù)據(jù)庫檢索接口或網(wǎng)絡(luò)檢索接口得到 各個(gè)檢索式對(duì)應(yīng)的多篇相關(guān)文獻(xiàn)具體包括:
[0022] 將所述檢索式分別輸入至文獻(xiàn)數(shù)據(jù)庫檢索接口或網(wǎng)絡(luò)檢索接口得到各個(gè)檢索式 對(duì)應(yīng)的相關(guān)文獻(xiàn);
[0023] 保留各個(gè)檢索式對(duì)應(yīng)的前10篇相關(guān)文獻(xiàn)。
[0024] 優(yōu)選地,所述根據(jù)與所述查新項(xiàng)目的相關(guān)度對(duì)各個(gè)檢索式得到的多篇相關(guān)文獻(xiàn)進(jìn) 行排序得到所述第一相關(guān)文獻(xiàn)集合具體包括:
[0025] 在所述各個(gè)檢索式對(duì)應(yīng)的前10篇相關(guān)文獻(xiàn)的基礎(chǔ)上,從關(guān)鍵詞影響因子和篇章影 響因子計(jì)算每篇相關(guān)文獻(xiàn)與所述查新項(xiàng)目的相關(guān)度;
[0026] 按照所述相關(guān)度的大小對(duì)每篇相關(guān)文獻(xiàn)進(jìn)行排序得到排序結(jié)果;
[0027] 根據(jù)所述排序結(jié)果篩選出預(yù)定數(shù)目的相關(guān)文獻(xiàn)以得到所述第一相關(guān)文獻(xiàn)集合。
[0028] 優(yōu)選地,所述每個(gè)技術(shù)要點(diǎn)的差異型或創(chuàng)新型根據(jù)如下公式計(jì)算得到:
[0029]
[0030]其中,at為目標(biāo)相關(guān)文獻(xiàn)集合中的第t個(gè)相關(guān)文獻(xiàn)dt的文獻(xiàn)摘要,at為at的段落向 量表示為查新項(xiàng)目d的第i個(gè)技術(shù)要點(diǎn);^為。的段落向量表示;Sim(dt,d)為dt與d的相關(guān) 度
Η為閾值參數(shù);η為目標(biāo)相關(guān)文獻(xiàn)集合中的相關(guān)文獻(xiàn)個(gè)數(shù)。
[0031] -種文獻(xiàn)查新的裝置,包括:
[0032]檢索單元,用于根據(jù)查新項(xiàng)目自動(dòng)檢索所述查新項(xiàng)目對(duì)應(yīng)的第一相關(guān)文獻(xiàn)集合; [0033]獲取單元,用于將所述第一相關(guān)文獻(xiàn)集合與人工分析得到的第二相關(guān)文獻(xiàn)集合綜 合分析得到目標(biāo)相關(guān)文獻(xiàn)集合;
[0034] 計(jì)算單元,用于在所述目標(biāo)相關(guān)文獻(xiàn)集合的基礎(chǔ)上計(jì)算所述查新項(xiàng)目中每個(gè)技術(shù) 要點(diǎn)的差異型或創(chuàng)新型得到計(jì)算結(jié)果;
[0035] 編寫單元,用于根據(jù)所述計(jì)算結(jié)果形成所述查新項(xiàng)目的查新結(jié)論。
[0036] 本發(fā)明所提供的文獻(xiàn)查新的方法,首先是根據(jù)查新項(xiàng)目自動(dòng)獲取對(duì)應(yīng)的第一相關(guān) 文獻(xiàn)集合,然后將第一相關(guān)文獻(xiàn)集合與人工分析得到的第二相關(guān)文獻(xiàn)集合進(jìn)行綜合分析以 得到最終的目標(biāo)相關(guān)文獻(xiàn)集合,在目標(biāo)相關(guān)文獻(xiàn)集合的基礎(chǔ)上計(jì)算查新項(xiàng)目中每個(gè)技術(shù)要 點(diǎn)的差異型或創(chuàng)新型得到計(jì)算結(jié)果,最后根據(jù)計(jì)算結(jié)果形成查新項(xiàng)目的查新結(jié)論。由于采 用了第一相關(guān)文獻(xiàn)集合和第二相關(guān)文獻(xiàn)集合綜合得到目標(biāo)相關(guān)文獻(xiàn)集合,且第一相關(guān)文獻(xiàn) 集合是自動(dòng)獲取的,降低了受知識(shí)領(lǐng)域限制帶來的影響,因此,減少了人工檢索的工作量, 且能夠提高查新的準(zhǔn)確性。
【附圖說明】
[0037] 為了更清楚地說明本發(fā)明實(shí)施例,下面將對(duì)實(shí)施例中所需要使用的附圖做簡單的 介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人 員來講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
[0038] 圖1為本發(fā)明提供的文獻(xiàn)查新的方法的流程圖;
[0039] 圖2為本發(fā)明提供的一種文獻(xiàn)查新的裝置的結(jié)構(gòu)圖。
【具體實(shí)施方式】
[0040] 下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完 整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部實(shí)施例。基于本 發(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動(dòng)前提下,所獲得的所有其他 實(shí)施例,都屬于本發(fā)明保護(hù)范圍。
[0041 ]本發(fā)明的核心是提供一種文獻(xiàn)查新的方法及裝置。
[0042]為了使本技術(shù)領(lǐng)域的人員更好地理解本發(fā)明方案,下面結(jié)合附圖和【具體實(shí)施方式】 對(duì)本發(fā)明作進(jìn)一步的詳細(xì)說明。
[0043] 實(shí)施例一
[0044] 圖1為本發(fā)明提供的文獻(xiàn)查新的方法的流程圖。如圖1所示,文獻(xiàn)查新的方法,包 括:
[0045] S10:根據(jù)查新項(xiàng)目自動(dòng)檢索查新項(xiàng)目對(duì)應(yīng)的第一相關(guān)文獻(xiàn)集合;
[0046] S11:將第一相關(guān)文獻(xiàn)集合與人工分析得到的第二相關(guān)文獻(xiàn)集合綜合分析得到目 標(biāo)相關(guān)文獻(xiàn)集合;
[0047] S12:在目標(biāo)相關(guān)文獻(xiàn)集合的基礎(chǔ)上計(jì)算查新項(xiàng)目中每個(gè)技術(shù)要點(diǎn)的差異型或創(chuàng) 新型得到計(jì)算結(jié)果;
[0048] S13:根據(jù)計(jì)算結(jié)果形成查新項(xiàng)目的查新結(jié)論。
[0049] 在具體實(shí)施中,在獲得查新項(xiàng)目后,根據(jù)查新項(xiàng)目自動(dòng)檢索對(duì)應(yīng)的第一相關(guān)文獻(xiàn) 集合。需要說明的是這里的第一相關(guān)文獻(xiàn)集合是與第二相關(guān)文獻(xiàn)集合相區(qū)別的,第一相關(guān) 文獻(xiàn)集合是通過相應(yīng)的檢索模型自動(dòng)獲取的,而第二相關(guān)文獻(xiàn)集合是人工分析得到的。由 于人工分析中會(huì)受到知識(shí)領(lǐng)域的限制等因素,因此,本發(fā)明中將自動(dòng)獲取的第一相關(guān)文獻(xiàn) 集合和第二相關(guān)文獻(xiàn)集合進(jìn)行綜合分析,例如,去冗余,因?yàn)榈谝幌嚓P(guān)文獻(xiàn)和第二相關(guān)文獻(xiàn) 可能會(huì)有重復(fù)出現(xiàn)的相關(guān)文獻(xiàn)。以此,能夠避免只有人工分析時(shí)帶來的主觀因素,使得查新 的準(zhǔn)確性也相應(yīng)的提高。另外,由于可以根據(jù)查新項(xiàng)目自動(dòng)獲取,因此,在一定程度上減輕 了人工檢索的工作量。
[0050] 通過步驟S12確定了目標(biāo)相關(guān)文獻(xiàn)集合后,在其基礎(chǔ)上計(jì)算查新項(xiàng)目中每個(gè)技術(shù) 要點(diǎn)的差異型或創(chuàng)新型得到計(jì)算結(jié)果。最后根據(jù)計(jì)算結(jié)果形成查新項(xiàng)目的查新結(jié)論。
[0051] 需要說明的是,本發(fā)明中提到的查新項(xiàng)目指的是待查新的文獻(xiàn)。
[0052] 本實(shí)施例提供的文獻(xiàn)查新的方法,首先是根據(jù)查新項(xiàng)目自動(dòng)獲取對(duì)應(yīng)的第一相關(guān) 文獻(xiàn)集合,然后將第一相關(guān)文獻(xiàn)集合與人工分析得到的第二相關(guān)文獻(xiàn)集合進(jìn)行綜合分析以 得到最終的目標(biāo)相關(guān)文獻(xiàn)集合,在目標(biāo)相關(guān)文獻(xiàn)集合的基礎(chǔ)上計(jì)算查新項(xiàng)目中每個(gè)技術(shù)要 點(diǎn)的差異型或創(chuàng)新型得到計(jì)算結(jié)果,最后根據(jù)計(jì)算結(jié)果形成查新項(xiàng)目的查新結(jié)論。由于采 用了第一相關(guān)文獻(xiàn)集合和第二相關(guān)文獻(xiàn)集合綜合得到目標(biāo)相關(guān)文獻(xiàn)集合,且第一相關(guān)文獻(xiàn) 集合是自動(dòng)獲取的,降低了受知識(shí)領(lǐng)域限制帶來的影響,因此,減少了人工檢索的工作量, 且能夠提高查新的準(zhǔn)確性。
[0053]其中,根據(jù)查新項(xiàng)目自動(dòng)檢索查新項(xiàng)目對(duì)應(yīng)的第一相關(guān)文獻(xiàn)集合具體包括:
[0054]構(gòu)造查新項(xiàng)目對(duì)應(yīng)的各檢索式;
[0055] 將檢索式分別輸入至文獻(xiàn)數(shù)據(jù)庫檢索接口或網(wǎng)絡(luò)檢索接口得到各個(gè)檢索式對(duì)應(yīng) 的多篇相關(guān)文獻(xiàn);
[0056] 根據(jù)與查新項(xiàng)目的相關(guān)度對(duì)各個(gè)檢索式得到的多篇相關(guān)文獻(xiàn)進(jìn)行排序得到第一 相關(guān)文獻(xiàn)集合。
[0057] 為了后續(xù)方便描述,以下給出本發(fā)明中用到的變量的定義。查新項(xiàng)目記為d,其向 量表示記為d;查新項(xiàng)目的關(guān)鍵詞集合記為W,其中的關(guān)鍵詞 Wl(WleW)的向量表示記為Wl;相 關(guān)文獻(xiàn)集合記為DMd^cb,…,d n},其中相關(guān)文獻(xiàn)dt(dteD)的向量表示記為dt;d t的關(guān)鍵詞 集合記為Wt,其中的關(guān)鍵詞wP(wPeWt)的向量表示記為w P;檢索式記為Q。
[0058]獲取第一相關(guān)文獻(xiàn)集合可以包括三個(gè)步驟,第一是構(gòu)造查新項(xiàng)目對(duì)應(yīng)的各檢索 式。所謂的檢索式就是由關(guān)鍵詞的邏輯運(yùn)算構(gòu)成,用到的邏輯運(yùn)算可以為和運(yùn)算或與運(yùn)算。 由于一篇查新項(xiàng)目有若干個(gè)關(guān)鍵詞,那么關(guān)鍵詞經(jīng)過邏輯運(yùn)算后就會(huì)產(chǎn)生多個(gè)檢索式。
[0059] 其中,構(gòu)造查新項(xiàng)目對(duì)應(yīng)的各檢索式具體包括:
[0060] 獲取查新項(xiàng)目對(duì)應(yīng)的各關(guān)鍵詞;
[0061] 對(duì)任意三個(gè)關(guān)鍵詞做與運(yùn)算得到檢索式。
[0062] 或者構(gòu)造查新項(xiàng)目對(duì)應(yīng)的各檢索式具體包括:
[0063]獲取查新項(xiàng)目對(duì)應(yīng)的各關(guān)鍵詞;
[0064]對(duì)任意三個(gè)關(guān)鍵詞做和運(yùn)算得到檢索式。
[0065] 從查新項(xiàng)目中抽取查新關(guān)鍵詞W。為同時(shí)保證查全率及查準(zhǔn)率,分別自動(dòng)構(gòu)造兩種 不同的檢索式,一種為其中任意三個(gè)關(guān)鍵詞Wi、Wj、Wk的與運(yùn)算,即(^二^^八^^八界卜另一種為 其中任意三個(gè)關(guān)鍵詞Wi、Wj、wk的和運(yùn)算,即Q = Wi Vwj Vwk。對(duì)于包含| w|個(gè)(通常I w| < 6)關(guān) 鍵詞的查新項(xiàng)目,可以構(gòu)造的檢索式有2?^種不同的檢索式。
[0066] 其中,將檢索式分別輸入至文獻(xiàn)數(shù)據(jù)庫檢索接口或網(wǎng)絡(luò)檢索接口得到各個(gè)檢索式 對(duì)應(yīng)的多篇相關(guān)文獻(xiàn)具體包括: