一種文獻檢索及分析系統(tǒng)的制作方法
【技術領域】
[0001]本發(fā)明涉及信息檢索領域,具體涉及一種文獻檢索及分析系統(tǒng)。
【背景技術】
[0002]隨著信息技術的迅速發(fā)展,電子文件由于其形式多樣、容量大、體積小且便于信息共享和易于復制的優(yōu)點而正在取代部分傳統(tǒng)紙質出版物。隨之而來的電子文獻檢索已經成為信息獲取的較為有效的途徑。
[0003]現(xiàn)今存在的電子文獻檢索方法通常是以統(tǒng)計詞頻的方式為基礎實現(xiàn)的,這類方法都是機械式的進行統(tǒng)計和匹配,忽視了詞語本身在語義上的實際意義和詞語之間在語義上的關聯(lián)性,檢索效果并不理想。
[0004]同時各企業(yè)為了避免在技術推廣應用方面出現(xiàn)不必要的專利糾紛,在進行市場評估時都會進行相應的風險分析。目前,這種方式主要是靠人工進行,即通過人工方式對企業(yè)競爭對手在有關國家或地區(qū)的專利申請、分析有關專利申請的保護范圍進行分析。與企業(yè)相關的專利文獻數量可能非常龐大,同時在對專利文獻進行分析時需要依賴人員的專業(yè)知識及工作經驗,人工成本較高,對專利風險評估是較為不利的。
【發(fā)明內容】
[0005]本發(fā)明的目的在于克服上述現(xiàn)有技術存在的技術缺陷,提供一種新的文獻檢索及分析系統(tǒng)。
[0006]本發(fā)明的目的是通過以下技術方案實現(xiàn)的:
一方面,本發(fā)明提供了一種文獻檢索及分析系統(tǒng),包括:
基本檢索模塊,用于根據所述搜索請求在結構化數據庫中進行搜索;
拓展檢索模塊,用于根據所述請求結合自然語言處理技術在數據庫中進行搜索;
多數據源集成檢索模塊,用于對專利數據庫的多數據源整合以及用戶的跨庫檢索和多庫檢索等功能;
檢索結果處理模塊,用于對上述模塊檢索到的專利信息根據相關度進行抽取,獲得特定技術領域術語集;
語義庫建設模塊,利用檢索結果處理模塊得到的特定技術領域的術語集并結合關聯(lián)分析、專家評估等步驟,構建特定技術領域語義庫,實現(xiàn)對專利的智能檢索功能;
數據挖掘和自然語言處理模塊,用于對檢索到的專利信息數據的深入挖掘和自然語言的進一步處理;
專利信息智能分析結果可視化技術研究模塊,用于對檢索到的專利信息數據進行智能分析與可視化研究;
用戶管理模塊,用于將上述分析得到的數據匯總到用戶管理模塊進行總體管理,并根據用戶需求進行最終端等輸出。
[0007]所述多數據源集成檢索模塊包括多技術領域專業(yè)詞庫的詞典型搜索和以語義分析為核心的語義網文檔搜索兩種檢索策略;
所述語義庫建設模塊還包括相關度選擇模塊,用于選擇檢索處理模塊得到的特定技術領域術語集中的語義相關的詞條,構建特定技術領域語義庫;
所述用戶管理模塊得到的文獻檢索分析匯總結果,能夠根據用戶需求選擇在計算器終端進行顯示或從終端進行最后的結果輸出。
[0008]所述文獻檢索及分析系統(tǒng)中,以數據采集及加工為基礎,從年份、申請人、發(fā)明人、關鍵詞等多個專利著錄項的角度出發(fā),對專利數據進行統(tǒng)計、關聯(lián)等分析,同時結合可視化技術對分析結果予以展示;可視化作為專利分析的一種手段,將數據挖掘、知識發(fā)現(xiàn)等技術綜合運用到整個系統(tǒng)中;并且將信息對象進行綜合、抽象、概念化、知識化、從而更方便簡潔地實現(xiàn)可視化,并進一步發(fā)現(xiàn)專利之間地關系以及專利作者的信息等。
[0009]與現(xiàn)有技術相比,本發(fā)明的優(yōu)點在于:實現(xiàn)了對專利信息的智能檢索,并在此基礎上對專利數據進行統(tǒng)計、關聯(lián)等分析,同時結合可視化技術,對分析結果進行可視化展示。
【附圖說明】
[0010]圖1位本發(fā)明文獻檢索及分析系統(tǒng)示意圖。
【具體實施方式】
[0011]為了使本發(fā)明的目的、技術方案及優(yōu)點更加清楚明白,以下結合具體實施例對本發(fā)明進一步詳細說明。應當理解,此處所描述的【具體實施方式】僅僅用以解釋本發(fā)明,但并不用于限定本發(fā)明。
[0012]圖1位本發(fā)明文獻檢索及分析系統(tǒng)一個實施例示意圖,如圖1所示,文獻檢索及分析系統(tǒng)包括:
基本檢索模塊101,用于根據所述搜索請求在結構化數據庫中進行搜索。
[0013]拓展檢索模塊102,用于根據所述請求結合自然語言處理技術在數據庫中進行搜索。
[0014]多數據源集成檢索模塊103,用于對專利數據庫的多數據源整合以及用戶的跨庫檢索和多庫檢索等功能。
[0015]檢索結果處理模塊104,用于對專利信息進行抽取,獲得特定技術領域術語集。
[0016]語義庫建設模塊105,利用檢索結果處理模塊得到的術語集并結合關聯(lián)分析、專家評估等步驟,構建特定技術領域語義庫。
[0017]數據挖掘和自然語言處理模塊106,用于數據的深入挖掘和自然語言的進一步處理。
[0018]專利信息智能分析結果可視化技術研究模塊107,用于對檢索到的專利信息數據進行智能分析與可視化研究。
[0019]用戶管理模塊108,用于將上述分析得到的數據匯總到用戶管理模塊,最終完成對所需文獻的檢索及分析匯總,并根據用戶需求進行最終的輸出。
[0020]基于本發(fā)明上述實施例提供的文獻檢索及分析系統(tǒng),以國內外專利數據庫技術為核心,通過構建特定技術領域語義庫,綜合運用以多技術領域專業(yè)詞庫為核心詞典型搜索與語義分析為核心的與以往文檔搜索兩種檢索策略,實現(xiàn)對專利數據倉庫的多數據源整合以及用戶的跨庫檢索和多庫檢索等功能,結合自然語言處理技術,實現(xiàn)對專利信息的智能檢索;通過對檢索的專利數據進行統(tǒng)計、關聯(lián)分析,完成對專利信息的分析研究,結合可視化技術對分析結果進行可視化展示。
[0021]本發(fā)明的描述是為了示例和描述起見而給出的,并不是無遺漏的或者將本發(fā)明限于所公開的形式。其中很多修改和變化對于本領域的普通技術人員而言是顯然的。選擇和描述實施例是為了更好地說明本發(fā)明的原理和實際應用,并且使本領域的普通技術人員能夠理解本發(fā)明從而設計適于特定用途的帶有各種修改的各種實施例。
【主權項】
1.一種文獻檢索及分析系統(tǒng),包括:基本檢索模塊、拓展檢索模塊、多數據源集成檢索模塊、檢索結果處理模塊、語義庫建設模塊、數據挖掘和自然語言處理模塊、專利信息智能分析結果可視化技術研究模塊、用戶管理模塊; 所述基本檢索模塊,用于根據所述搜索請求在結構化數據庫中進行搜索; 所述拓展檢索模塊,用于根據所述請求結合自然語言處理技術在數據庫中進行搜索; 所述多數據源集成檢索模塊,用于對專利數據庫的多數據源整合以及用戶的跨庫檢索和多庫檢索等功能; 所述檢索結果處理模塊,用于對上述模塊檢索到的專利信息根據相關度進行抽取,獲得特定技術領域術語集; 所述語義庫建設模塊,利用檢索結果處理模塊得到的特定技術領域的術語集并結合關聯(lián)分析、專家評估等步驟,構建特定技術領域語義庫,實現(xiàn)對專利的智能檢索功能; 所述數據挖掘和自然語言處理模塊,用于對檢索到的專利信息數據的深入挖掘和自然語言的進一步處理; 所述專利信息智能分析結果可視化技術研究模塊,用于對檢索到的專利信息數據進行智能分析與可視化研究; 所述用戶管理子模塊,用于將上述分析得到的數據匯總到用戶管理模塊進行總體管理,并根據用戶需求進行最終輸出。2.根據權利要求1所述的一種文獻檢索及分析系統(tǒng),其特征在于, 所述多數據源集成檢索模塊包括多技術領域專業(yè)詞庫的詞典型搜索和以語義分析為核心的語義網文檔搜索兩種檢索策略。3.根據權利要求1所述的一種文獻檢索及分析系統(tǒng),其特征在于,所述語義庫建設模塊還包括相關度選擇模塊,用于選擇檢索處理模塊得到的特定技術領域術語集中的語義相關的詞條,構建特定技術領域語義庫。4.根據權利要求1所述的一種文獻檢索及分析系統(tǒng),其特征在于,所述專利信息智能分析結果可視化技術研究模塊,將專利信息進行綜合、抽象、概念化、知識化,并自動化生成專利化分析的可視化圖譜,得到最后的可視化的專利分析結果。5.根據權利要求1所述的一種文獻檢索及分析系統(tǒng),其特征在于, 所述用戶管理模塊得到的文獻檢索分析匯總結果,能夠根據用戶需求選擇在計算器終端進行顯示或從終端進行最后的結果輸出。
【專利摘要】本發(fā)明提供一種文獻檢索及分析系統(tǒng),包括:基本檢索模塊、拓展檢索模塊、多數據源集成檢索模塊、檢索結果處理模塊、語義庫建設模塊、數據挖掘和自然語言處理模塊、專利信息智能分析結果可視化技術研究模塊、用戶管理模塊;該文獻檢索及分析系統(tǒng)以數據采集及加工為基礎,從年份、申請人、發(fā)明人、關鍵詞等多個專利著錄項的角度出發(fā),對專利數據進行統(tǒng)計、關聯(lián)等分析,同時結合可視化技術對分析結果予以展示,并進一步發(fā)現(xiàn)專利之間地關系以及專利作者的信息等。與現(xiàn)有技術相比,本發(fā)明的優(yōu)點在于:實現(xiàn)了對專利信息的智能檢索,并在此基礎上對專利數據進行統(tǒng)計、關聯(lián)等分析,同時結合可視化技術,對分析結果進行可視化展示。
【IPC分類】G06F17/30
【公開號】CN105354325
【申請?zhí)枴緾N201510804564
【發(fā)明人】劉延淮, 孫瑞陽
【申請人】上海熠派信息科技有限公司
【公開日】2016年2月24日
【申請日】2015年11月20日