專利名稱:森林分類經(jīng)營知識庫全文搜索引擎系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā) 明涉及一種計算機網(wǎng)絡(luò)技術(shù),尤其是涉及數(shù)據(jù)林業(yè)技術(shù),是一套集森林分類 經(jīng)營技術(shù)的知識庫全文搜索引擎系統(tǒng)。實現(xiàn)森林分類經(jīng)營技術(shù)的科學(xué)化、數(shù)字化、規(guī)范化。
背景技術(shù):
目前,搜索引擎是隨著因特網(wǎng)的迅猛發(fā)展、TOB信息的迅速增力卩,從1995年開始逐 漸發(fā)展起來的搜索引擎技術(shù)正成為計算機工業(yè)界和學(xué)術(shù)界爭相研究、開發(fā)的對象。搜索引 擎以一定的策略在互聯(lián)網(wǎng)中搜集、發(fā)現(xiàn)信息,對信息進行理解、提取、組織和處理,并為用戶 提供檢索服務(wù),從而起到信息導(dǎo)航的目的。搜索引擎提供的導(dǎo)航服務(wù)已經(jīng)成為互聯(lián)網(wǎng)上非 常重要的網(wǎng)絡(luò)服務(wù),搜索引擎站點也被美譽為“網(wǎng)絡(luò)門戶”。搜索引擎技術(shù)因而成為計算機 工業(yè)界和學(xué)術(shù)界爭相研究、開發(fā)的對象。在這種情況下,把搜索引擎技術(shù)應(yīng)用在森林分類經(jīng) 營技術(shù)管理中,為用戶提供了很好的互聯(lián)網(wǎng)搜索服務(wù),受到了用戶的好評,拓展了數(shù)字林業(yè) 領(lǐng)域的研究。在森林分類經(jīng)營技術(shù)不斷更新的情況下,結(jié)合搜索、數(shù)據(jù)庫、網(wǎng)絡(luò)等多種技術(shù),實 現(xiàn)了森林分類經(jīng)營知識庫搜索引擎,打破原有的單機系統(tǒng)模式,通過B/S/D架構(gòu)體系和基 于的Web瀏覽器的界面,由用戶端程序為用戶提供文件類別、關(guān)鍵詞等全文搜索功能。實現(xiàn) 最廣泛的森林分類經(jīng)營技術(shù)共享系統(tǒng),操作簡便、界面信息豐富、維護容易。該搜索引擎經(jīng) 過測試,滿足信息查詢的需求,達(dá)到預(yù)期的設(shè)計效果,對森林分類經(jīng)營技術(shù)數(shù)字化具有一定 的現(xiàn)實意義,同時也為其他相關(guān)項目的設(shè)計提供了參考。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種森林分類經(jīng)營知識庫全文搜索引擎系統(tǒng)。為了達(dá)到上述目的,本發(fā)明采用的技術(shù)方案是將信息發(fā)布到互聯(lián)網(wǎng)搜索引擎中, 本系統(tǒng)采用(1)、分類經(jīng)營技術(shù)網(wǎng)絡(luò)化通過構(gòu)建包括森林立地分類與功能區(qū)劃、過伐林生 態(tài)系統(tǒng)恢復(fù)及經(jīng)營技術(shù)、天然闊葉混交林可持續(xù)經(jīng)營技術(shù)、珍貴闊葉樹種定向培育技術(shù)、低 質(zhì)林結(jié)構(gòu)與功能優(yōu)化調(diào)控技術(shù)、人工林天然化經(jīng)營技術(shù)、速生樹種用材林高效經(jīng)營技術(shù)、經(jīng) 濟林優(yōu)化經(jīng)營技術(shù)等在內(nèi)的專家知識庫,研制基于網(wǎng)絡(luò)技術(shù)的智能化搜索引擎,為森林分 類經(jīng)營提供基于計算機的專家技術(shù)指導(dǎo),(2)、構(gòu)建知識庫運用Mysql這個最流行的開放 源碼Sql數(shù)據(jù)庫管理系統(tǒng)建立數(shù)據(jù)庫,收集整理與森林分類經(jīng)營相關(guān)的技術(shù)、文獻等資料, 建立多數(shù)據(jù)表的關(guān)鍵詞索引數(shù)據(jù)庫,收集整理了一些包括森林立地分類與功能區(qū)劃、過伐 林生態(tài)系統(tǒng)恢復(fù)及經(jīng)營技術(shù)、天然闊葉混交林可持續(xù)經(jīng)營技術(shù)、珍貴闊葉樹種定向培育技 術(shù)、低質(zhì)林結(jié)構(gòu)與功能優(yōu)化調(diào)控技術(shù)、人工林天然化經(jīng)營技術(shù)、速生樹種用材林高效經(jīng)營技 術(shù)、經(jīng)濟林優(yōu)化經(jīng)營技術(shù)等在內(nèi)的數(shù)據(jù)資料,用于構(gòu)建知識庫,數(shù)據(jù)庫采用標(biāo)準(zhǔn)建模工具建 模,完成對其ER圖的維護,便于對數(shù)據(jù)庫的整體把握和后期擴展,數(shù)據(jù)庫模型圖包括業(yè)務(wù) 模型和物理模型,描述了各種業(yè)務(wù)實體及其對應(yīng)關(guān)系,業(yè)務(wù)模型圖可以生成物理模型圖和 Java實體類,(3)、多文檔全文搜索引擎實現(xiàn)基于JAVA技術(shù)的Lucene來開發(fā)全文搜索引擎,基于Lucene的全文檢索系統(tǒng)采用接口方式,統(tǒng)一處理html、中/英文pdf、word和Excel 常用文檔。本發(fā)明的優(yōu)點是
1、數(shù)據(jù)庫采用標(biāo)準(zhǔn)建模工具建模,完成對其ER圖的維護,便于對數(shù)據(jù)庫的整體把 握和后期擴展,數(shù)據(jù)庫模型圖包括業(yè)務(wù)模型和物理模型,描述了各種業(yè)務(wù)實體及其對應(yīng)關(guān) 系,業(yè)務(wù)模型圖可以生成物理模型圖和Java實體類,大大提高程序效率,物理模型描述了 數(shù)據(jù)庫表及其表之間的關(guān)系,通過物理模型生成數(shù)據(jù)庫表,完成對數(shù)據(jù)庫的整體控制,通過 該物理模型可以生成Sql語句等,便于日后維護;2、本發(fā)明最大限度地為用戶屏蔽多種格式文檔差異性的同時,極大地擴展了 Lucene可以處理的格式文檔類型。在系統(tǒng)的功能設(shè)計方面,為達(dá)到用戶靈活多變的檢索需 求,系統(tǒng)要充分考慮數(shù)據(jù)的合理性,各類數(shù)據(jù)有效輸入相關(guān)信息的鏈接和處理,以及信息的 提供類型和方式,并且可以進行全文檢索和下載;3、本發(fā)明最大限度地為用戶屏蔽各種格式文檔差異性的同時,極大地擴展了 Lucene可以處理的格式文檔類型;4、本發(fā)明基于Iucene技術(shù)實現(xiàn)的搜索引擎,為用戶提供檢索服務(wù),從而起到信息 導(dǎo)航的作用;5、本發(fā)明采用倒排樹結(jié)構(gòu)存儲索引,使得索引的更新不會導(dǎo)致大量的輸入輸出操 作,而且其更新策略可以定制,批次大小可以調(diào)整,索引文件維護容易;6、本發(fā)明以全文檢索的方式來達(dá)到技術(shù)文獻數(shù)據(jù)的快速定位;7、本發(fā)明數(shù)據(jù)庫模型圖包括業(yè)務(wù)模型和物理模型,業(yè)務(wù)模型圖可以生成物理模型 圖和Java實體類,大大提高程序效率,物理模型描述了數(shù)據(jù)庫表及其表之間的關(guān)系,通過 物理模型生成數(shù)據(jù)庫表,完成對數(shù)據(jù)庫的整體控制,通過該物理模型可以生成Sql語句等, 便于日后維護。
圖1是本發(fā)明全文檢索系統(tǒng)結(jié)構(gòu)方框圖;圖2是本發(fā)明分詞、建立索引和檢索方框圖;圖3是本發(fā)明遠(yuǎn)程調(diào)用數(shù)據(jù)模型方框圖。
具體實施例方式下面結(jié)合附圖對本發(fā)明的實施例作進一步詳細(xì)描述。由圖1-圖3可知,本發(fā)明將信息發(fā)布到互聯(lián)網(wǎng)搜索引擎中,本系統(tǒng)采用(1)、分類 經(jīng)營技術(shù)網(wǎng)絡(luò)化通過構(gòu)建包括森林立地分類與功能區(qū)劃、過伐林生態(tài)系統(tǒng)恢復(fù)及經(jīng)營技 術(shù)、天然闊葉混交林可持續(xù)經(jīng)營技術(shù)、珍貴闊葉樹種定向培育技術(shù)、低質(zhì)林結(jié)構(gòu)與功能優(yōu)化 調(diào)控技術(shù)、人工林天然化經(jīng)營技術(shù)、速生樹種用材林高效經(jīng)營技術(shù)、經(jīng)濟林優(yōu)化經(jīng)營技術(shù)等 在內(nèi)的專家知識庫,研制基于網(wǎng)絡(luò)技術(shù)的智能化搜索引擎,為森林分類經(jīng)營提供基于計算 機的專家技術(shù)指導(dǎo),(2)、構(gòu)建知識庫運用Mysql這個最流行的開放源碼Sql數(shù)據(jù)庫管理系 統(tǒng)建立數(shù)據(jù)庫,收集整理與森林分類經(jīng)營相關(guān)的技術(shù)、文獻等資料,建立多數(shù)據(jù)表的關(guān)鍵詞 索引數(shù)據(jù)庫,收集整理了一些包括森林立地分類與功能區(qū)劃、過伐林生態(tài)系統(tǒng)恢復(fù)及經(jīng)營技術(shù)、天然闊葉混交林可持續(xù)經(jīng)營技術(shù)、珍貴闊葉樹種定向培育技術(shù)、低質(zhì)林結(jié)構(gòu)與功能優(yōu) 化調(diào)控技術(shù)、人工林天然化經(jīng)營技術(shù)、速生樹種用材林高效經(jīng)營技術(shù)、經(jīng)濟林優(yōu)化經(jīng)營技術(shù) 等在內(nèi)的數(shù)據(jù)資料,用于構(gòu)建知識庫,數(shù)據(jù)庫采用標(biāo)準(zhǔn)建模工具建模,完成對其ER圖的維 護,便于對數(shù)據(jù)庫的整體把握和后期擴展,數(shù)據(jù)庫模型圖包括業(yè)務(wù)模型和物理模型,描述了 各種業(yè)務(wù)實體及其對應(yīng)關(guān)系,業(yè)務(wù)模型圖可以生成物理模型圖和Java實體類,(3)、多文檔 全文搜索引擎實現(xiàn)基于JAVA技術(shù)的Lucene來開發(fā)全文搜索引擎, 基于Lucene的全文檢 索系統(tǒng)采用接口方式,統(tǒng)一處理html、中/英文pdf、word和Excel常用文檔。2.根據(jù)權(quán)利要求1所述的森林分類經(jīng)營知識庫全文搜索引擎系統(tǒng),其特征在于 所述的數(shù)據(jù)庫采用標(biāo)準(zhǔn)建模工具建模,為四個核心模塊數(shù)據(jù)處理模塊、索引模塊、檢索模 塊、結(jié)果處理模塊(1)數(shù)據(jù)處理模塊主要完成html、中/英文pdf、word和Excel等多種 常用文檔解析,在預(yù)處理這些文檔的時候,不能簡單地從文件讀取字符,需要根據(jù)他們特殊 的格式提取內(nèi)容,分別使用不同的開源解析模塊,獲取文本信息,文檔的標(biāo)題、作者、關(guān)鍵詞 等屬性,采用了直接的Jdbc方式來向數(shù)據(jù)庫寫入數(shù)據(jù),在寫入之前,首先調(diào)用GetNextId方 法取得所要插入的Id號,并隨著方法返回給調(diào)用者,以便調(diào)用者可以將這個Id傳到Lucene 的索引中,以此將數(shù)據(jù)庫記錄和Lucene的索引對應(yīng)起來,(2)索引模塊索引是全文搜索引 擎工作的關(guān)鍵一步,采用目錄索引的方法,在經(jīng)過數(shù)據(jù)處理模塊后,文檔完成了預(yù)處理,建 立了一種便于檢索的數(shù)據(jù)結(jié)構(gòu),當(dāng)文檔數(shù)量增多時,建立索引能夠顯著提高信息檢索速度, 在建立索引的時候,文章的內(nèi)容是要先分詞后建立索引,(3)檢索模塊根據(jù)用戶的要求, 使用了詞條檢索、短語檢索、布爾檢索以及模糊檢索的方法,在完成檢索功能后,還實現(xiàn)了 對檢索的結(jié)果進行排序、過濾、分頁處理,優(yōu)先將最相關(guān)的內(nèi)容送出,用戶檢索時,只需對有 限的關(guān)鍵字進行檢索,然后從索引中獲取數(shù)據(jù)庫的一個Id號,進而轉(zhuǎn)用數(shù)據(jù)庫來讀取大量 數(shù)據(jù),傳回頁面,分詞、建索和檢索圖,(4)結(jié)果處理模塊包括搜索頁面和詳細(xì)信息頁面, 使用了 Dwr框架,把檢索到的數(shù)據(jù)列表以Web頁面的形式體現(xiàn),遠(yuǎn)程調(diào)用數(shù)據(jù)模型圖。1、分類經(jīng)營技術(shù)網(wǎng)絡(luò)化通過構(gòu)建包括森林立地分類與功能區(qū)劃、過伐林生態(tài)系統(tǒng)恢復(fù)及經(jīng)營技術(shù)、天然 闊葉混交林可持續(xù)經(jīng)營技術(shù)、珍貴闊葉樹種定向培育技術(shù)、低質(zhì)林結(jié)構(gòu)與功能優(yōu)化調(diào)控技 術(shù)、人工林天然化經(jīng)營技術(shù)、速生樹種用材林高效經(jīng)營技術(shù)、經(jīng)濟林優(yōu)化經(jīng)營技術(shù)等在內(nèi)的 專家知識庫,研制基于網(wǎng)絡(luò)技術(shù)的智能化搜索引擎,為森林分類經(jīng)營提供基于計算機的專 家技術(shù)指導(dǎo)。在對中國黑龍江省小興安嶺林區(qū)典型分類經(jīng)營功能區(qū)立地因子及林木生長動 態(tài)狀況實地調(diào)研和資源、氣象、病蟲害等資料收集、分析的基礎(chǔ)上,結(jié)合項目其它課題的研 究成果,開展森林分類經(jīng)營專家知識庫構(gòu)建及搜索引擎研制的研究。2、構(gòu)建知識庫采用Mysql這個最流行的開放源碼Sql數(shù)據(jù)庫管理系統(tǒng)建立數(shù)據(jù)庫,收集整理與 森林分類經(jīng)營相關(guān)的技術(shù)、文獻等資料,建立多數(shù)據(jù)表的關(guān)鍵詞索引數(shù)據(jù)庫。收集整理了一 些包括森林立地分類與功能區(qū)劃、過伐林生態(tài)系統(tǒng)恢復(fù)及經(jīng)營技術(shù)、天然闊葉混交林可持 續(xù)經(jīng)營技術(shù)、珍貴闊葉樹種定向培育技術(shù)、低質(zhì)林結(jié)構(gòu)與功能優(yōu)化調(diào)控技術(shù)、人工林天然化 經(jīng)營技術(shù)、速生樹種用材林高效經(jīng)營技術(shù)、經(jīng)濟林優(yōu)化經(jīng)營技術(shù)等在內(nèi)的數(shù)據(jù)資料,用于構(gòu) 建知識庫。數(shù)據(jù)庫采用標(biāo)準(zhǔn)建模工具建模,完成對其ER圖的維護,便于對數(shù)據(jù)庫的整體把握和后期擴展,數(shù)據(jù)庫模型圖包括業(yè)務(wù)模型和物理模型,描述了各種業(yè)務(wù)實體及其對應(yīng)關(guān)系, 業(yè)務(wù)模型圖可以生成物理模型圖和Java實體類,大大提高程序效率;物理模型描述了數(shù)據(jù) 庫表及其表之間的關(guān)系,通過物理模型生成數(shù)據(jù)庫表,完成對數(shù)據(jù)庫的整體控制,通過該物 理模型可以生成Sql語句等,便于日后維護。3、多文檔全文搜索引擎實現(xiàn)基于JAVA技術(shù)的Lucene來開發(fā)全文搜索引擎。目前由于Lucene能對純文本的 數(shù)據(jù)進行索引,多種常用文檔,多媒體文檔已日益成為網(wǎng)絡(luò)中信息交換的主體。因此,基于 Lucene的全文檢索系統(tǒng)采用接口方式,統(tǒng)一處理html、中/英文pdf、word和Excel常用文 檔,使索引此類文檔成為可能,其突出的優(yōu)點與特點是在最大限度地為用戶屏蔽各種格式 文檔差異性的同時,極大地擴展了 Lucene可以處理的格式文檔的類型。在系統(tǒng)的功能設(shè)計 方面,為達(dá)到用戶靈活多變的檢索需求,系統(tǒng)要充分考慮數(shù)據(jù)的合理性,各類數(shù)據(jù)有效輸入 相關(guān)信息的鏈接和處理,以及信息的提供類型和方式,并且可以進行全文檢索和下載。4、核心模塊設(shè)計出中文版的全文檢索系統(tǒng)結(jié)構(gòu)(如圖1)整個系統(tǒng)將設(shè)計四個核心模塊數(shù)據(jù) 處理模塊、索引模塊、檢索模塊、結(jié)果處理模塊。1)數(shù)據(jù)處理模塊 主要完成html、中/英文pdf、word和Excel等多種常用文檔解析。在預(yù)處理這 些文檔的時候,不能簡單地從文件讀取字符,需要根據(jù)他們特殊的格式提取內(nèi)容,分別使用 不同的開源解析模塊,獲取文本信息。文檔的標(biāo)題、作者、關(guān)鍵詞等屬性,采用了直接的Jdbc 方式來向數(shù)據(jù)庫寫入數(shù)據(jù),在寫入之前,首先調(diào)用GetNextId方法取得所要插入的Id號,并 隨著方法返回給調(diào)用者,以便調(diào)用者可以將這個Id傳到Lucene的索引中,以此將數(shù)據(jù)庫記 錄和Lucene的索引對應(yīng)起來。2)索引模塊索引是全文搜索引擎工作的關(guān)鍵一步,采用目錄索引的方法,在經(jīng)過數(shù)據(jù)處理模 塊后,文檔完成了預(yù)處理,建立了一種便于檢索的數(shù)據(jù)結(jié)構(gòu),當(dāng)文檔數(shù)量增多時,建立索引 能夠顯著提高信息檢索速度。在建立索引的時候,文章的內(nèi)容是要先分詞后建立索引。3)檢索模塊這一個模塊是用戶體驗最深的,接觸最多的部分,它的性能決定了是否能夠達(dá)到 用戶的要求。使用了詞條檢索、短語檢索、布爾檢索以及模糊檢索的方法,在完成檢索功能 后,還實現(xiàn)了對檢索的結(jié)果進行排序、過濾、分頁處理,優(yōu)先將最相關(guān)的內(nèi)容送出。用戶檢索 時,只需對有限的關(guān)鍵字進行檢索,然后從索引中獲取數(shù)據(jù)庫的一個Id號,進而轉(zhuǎn)用數(shù)據(jù) 庫來讀取大量數(shù)據(jù),傳回頁面。分詞、建索和檢索圖(如圖2)。4)結(jié)果處理模塊包括搜索頁面和詳細(xì)信息頁面,使用了 Dwr框架,把檢索到的數(shù)據(jù)列表以Web頁面 的形式體現(xiàn)。遠(yuǎn)程調(diào)用數(shù)據(jù)模型圖(如圖3)。
權(quán)利要求
1.一種森林分類經(jīng)營知識庫全文搜索引擎系統(tǒng),本系統(tǒng)是通過計算機互聯(lián)網(wǎng)絡(luò)利用 設(shè)置在服務(wù)器上的軟件系統(tǒng)而實現(xiàn),其特征在于將信息發(fā)布到互聯(lián)網(wǎng)搜索引擎中,本系 統(tǒng)采用(1)、分類經(jīng)營技術(shù)網(wǎng)絡(luò)化通過構(gòu)建包括森林立地分類與功能區(qū)劃、過伐林生態(tài)系 統(tǒng)恢復(fù)及經(jīng)營技術(shù)、天然闊葉混交林可持續(xù)經(jīng)營技術(shù)、珍貴闊葉樹種定向培育技術(shù)、低質(zhì)林 結(jié)構(gòu)與功能優(yōu)化調(diào)控技術(shù)、人工林天然化經(jīng)營技術(shù)、速生樹種用材林高效經(jīng)營技術(shù)、經(jīng)濟林 優(yōu)化經(jīng)營技術(shù)等在內(nèi)的專家知識庫,研制基于網(wǎng)絡(luò)技術(shù)的智能化搜索引擎,為森林分類經(jīng) 營提供基于計算機的專家技術(shù)指導(dǎo),( 、構(gòu)建知識庫運用Mysql這個最流行的開放源碼 Sql數(shù)據(jù)庫管理系統(tǒng)建立數(shù)據(jù)庫,收集整理與森林分類經(jīng)營相關(guān)的技術(shù)、文獻等資料,建立 多數(shù)據(jù)表的關(guān)鍵詞索引數(shù)據(jù)庫,收集整理了一些包括森林立地分類與功能區(qū)劃、過伐林生 態(tài)系統(tǒng)恢復(fù)及經(jīng)營技術(shù)、天然闊葉混交林可持續(xù)經(jīng)營技術(shù)、珍貴闊葉樹種定向培育技術(shù)、低 質(zhì)林結(jié)構(gòu)與功能優(yōu)化調(diào)控技術(shù)、人工林天然化經(jīng)營技術(shù)、速生樹種用材林高效經(jīng)營技術(shù)、經(jīng) 濟林優(yōu)化經(jīng)營技術(shù)等在內(nèi)的數(shù)據(jù)資料,用于構(gòu)建知識庫,數(shù)據(jù)庫采用標(biāo)準(zhǔn)建模工具建模,完 成對其ER圖的維護,便于對數(shù)據(jù)庫的整體把握和后期擴展,數(shù)據(jù)庫模型圖包括業(yè)務(wù)模型和 物理模型,描述了各種業(yè)務(wù)實體及其對應(yīng)關(guān)系,業(yè)務(wù)模型圖可以生成物理模型圖和Java實 體類,(3)、多文檔全文搜索引擎實現(xiàn)基于JAVA技術(shù)的Lucene來開發(fā)全文搜索引擎,基于 Lucene的全文檢索系統(tǒng)采用接口方式,統(tǒng)一處理html、中/英文pdf、word和Excel常用文 檔。
2.根據(jù)權(quán)利要求1所述的森林分類經(jīng)營知識庫全文搜索引擎系統(tǒng),其特征在于所述 的數(shù)據(jù)庫采用標(biāo)準(zhǔn)建模工具建模,為四個核心模塊數(shù)據(jù)處理模塊、索引模塊、檢索模塊、結(jié) 果處理模塊(1)數(shù)據(jù)處理模塊主要完成html、中/英文pdf、word和Excel等多種常用 文檔解析,在預(yù)處理這些文檔的時候,不能簡單地從文件讀取字符,需要根據(jù)他們特殊的格 式提取內(nèi)容,分別使用不同的開源解析模塊,獲取文本信息,文檔的標(biāo)題、作者、關(guān)鍵詞等屬 性,采用了直接的Jdbc方式來向數(shù)據(jù)庫寫入數(shù)據(jù),在寫入之前,首先調(diào)用GetNextId方法取 得所要插入的Id號,并隨著方法返回給調(diào)用者,以便調(diào)用者可以將這個Id傳到Lucene的 索引中,以此將數(shù)據(jù)庫記錄和Lucene的索引對應(yīng)起來,⑵索引模塊索引是全文搜索引 擎工作的關(guān)鍵一步,采用目錄索引的方法,在經(jīng)過數(shù)據(jù)處理模塊后,文檔完成了預(yù)處理,建 立了一種便于檢索的數(shù)據(jù)結(jié)構(gòu),當(dāng)文檔數(shù)量增多時,建立索引能夠顯著提高信息檢索速度, 在建立索引的時候,文章的內(nèi)容是要先分詞后建立索引,(3)檢索模塊根據(jù)用戶的要求, 使用了詞條檢索、短語檢索、布爾檢索以及模糊檢索的方法,在完成檢索功能后,還實現(xiàn)了 對檢索的結(jié)果進行排序、過濾、分頁處理,優(yōu)先將最相關(guān)的內(nèi)容送出,用戶檢索時,只需對有 限的關(guān)鍵字進行檢索,然后從索引中獲取數(shù)據(jù)庫的一個Id號,進而轉(zhuǎn)用數(shù)據(jù)庫來讀取大量 數(shù)據(jù),傳回頁面,分詞、建立索引和檢索圖,(4)結(jié)果處理模塊包括搜索頁面和詳細(xì)信息頁 面,使用了 Dwr框架,把檢索到的數(shù)據(jù)列表以Web頁面的形式體現(xiàn),遠(yuǎn)程調(diào)用數(shù)據(jù)模型圖。
全文摘要
本發(fā)明涉及一種森林分類經(jīng)營知識庫全文搜索引擎系統(tǒng),涉及計算機網(wǎng)絡(luò)技術(shù),尤其是涉及數(shù)據(jù)林業(yè)技術(shù),實現(xiàn)森林分類經(jīng)營技術(shù)的科學(xué)化、數(shù)字化、規(guī)范化,全文索引和檢索技術(shù)是架構(gòu)于Internet上的搜索系統(tǒng)與Web平臺集成,極大地提高了從大量紛繁復(fù)雜的數(shù)據(jù)中查找特定信息的效率。本發(fā)明是整合森林分類經(jīng)營的研究成果建立知識庫,結(jié)合搜索、數(shù)據(jù)庫、Java網(wǎng)絡(luò)等多種技術(shù),開發(fā)出標(biāo)準(zhǔn)的B/S/D模式下的全文搜索引擎。在系統(tǒng)的功能設(shè)計方面,達(dá)到用戶靈活多變的檢索需求,系統(tǒng)充分考慮數(shù)據(jù)的合理組織,各類數(shù)據(jù)方便有效的輸入,以及信息的提供類型和方式。設(shè)計出中文版的全文檢索系統(tǒng)結(jié)構(gòu),整個系統(tǒng)分四個核心模塊數(shù)據(jù)處理模塊、索引模塊、檢索模塊、結(jié)果處理模塊。
文檔編號G06Q10/00GK102096845SQ20091007338
公開日2011年6月15日 申請日期2009年12月10日 優(yōu)先權(quán)日2009年12月10日
發(fā)明者祝彥杰, 程顯峰, 許譚, 陳迪 申請人:黑龍江省森林工程與環(huán)境研究所