專利名稱:可攜式數(shù)據(jù)庫搜尋代理器處理系統(tǒng)及修正方法
技術(shù)領(lǐng)域:
本發(fā)明是關(guān)于一種可攜式數(shù)據(jù)庫搜尋代理器處理系統(tǒng)及修正方法,特別是關(guān)于一種培育、訓(xùn)練可攜式數(shù)據(jù)庫搜尋代理器,并利用該數(shù)據(jù)庫搜尋代理器進(jìn)行資料搜尋的處理系統(tǒng)及修正方法。
背景技術(shù):
隨著計算機(jī)應(yīng)用普及以及互聯(lián)網(wǎng)的大量應(yīng)用,透過互聯(lián)網(wǎng)在各種大型數(shù)據(jù)庫系統(tǒng)中搜尋有用的資料,已成為每一個人日常生活及工作上一件重要的活動?,F(xiàn)代的計算機(jī)系統(tǒng),不但已將各種有用的信息,結(jié)合成巨大的數(shù)據(jù)庫,互聯(lián)網(wǎng)更將這些大型數(shù)據(jù)庫連結(jié)成更大的數(shù)據(jù)庫。雖然這個正在急速擴(kuò)大的數(shù)據(jù)庫提供了大量的文件、信息,但如何在這個大型數(shù)據(jù)庫中搜尋有用的資料,已成為一個技術(shù)上重要的課題。
跟隨互聯(lián)網(wǎng)的興起,各種在互聯(lián)網(wǎng)上搜尋文件的搜尋引擎(searchengine)應(yīng)運而生。這種搜尋引擎通常是以網(wǎng)站的形式存在。使用者進(jìn)入這種搜尋網(wǎng)站后,只要在網(wǎng)頁上打入所謂的「關(guān)鍵詞」(keywords),搜尋引擎即自動在所連結(jié)的各大網(wǎng)站中搜尋符合搜尋條件的文章,呈現(xiàn)在讀者所指定的網(wǎng)頁上。
在上述已知技術(shù)中,對于文件的搜尋,有兩種主要的作法。最常見的作法乃是所謂的關(guān)鍵詞檢索。這種搜尋技術(shù)是依據(jù)使用者打入的關(guān)鍵詞(keywords),在所有可能搜尋的數(shù)據(jù)庫中,找尋具有輸入的關(guān)鍵詞的文章,加以顯示,另一種作法是令使用者輸入文章所可能包含的詞,以及不應(yīng)包含的詞。在搜尋條件中,也可能對所輸入的搜尋用詞,賦其特性參數(shù)(attributes)。運算單元依據(jù)其輸入搜尋用詞的存在或不存在某篇文章中,以“與(AND)”、“或(OR)”等運算單元,計算每一篇文章的相關(guān)值,稱為布林值(Boolean Value),依序排列,作為搜尋結(jié)果。
由于在互聯(lián)網(wǎng)等大型數(shù)據(jù)庫系統(tǒng),搜尋文件等信息,乃是一件艱巨的工作,大多數(shù)的公司、政府機(jī)關(guān),以及中小企業(yè)中,經(jīng)常能正確搜尋到有用的結(jié)果。已成為工作上重要的技能。由公司雇主的角度言,正確搜尋能力,除靠先天的秉賦之外,尚需長期的練習(xí)與經(jīng)驗累積。然而,這種經(jīng)驗的累積,并無法加以傳承或傳播。尤其在公司職員更迭時,新任職員必須重行訓(xùn)練,花費幾乎相同的時間,才能造就出具有相同搜尋資料經(jīng)驗與能力的后繼者。
發(fā)明內(nèi)容
本發(fā)明的目的乃在提供一種可攜式數(shù)據(jù)庫搜尋代理器,該代理器可代替使用者在互聯(lián)網(wǎng)等大型數(shù)據(jù)庫中進(jìn)行搜尋。
本發(fā)明的目的也在提供一種可攜帶式數(shù)據(jù)庫搜尋代理器,可記錄使用者的搜尋參數(shù)而自動在互聯(lián)網(wǎng)等大型數(shù)據(jù)庫中進(jìn)行資料搜尋,得到與本人搜尋相同的結(jié)果。
本發(fā)明的目的也在提供一種可攜帶式數(shù)據(jù)庫搜尋代理器,該代理器可記錄使用者資料檢索的行為模式,而代替使用者在大型數(shù)據(jù)庫中進(jìn)行搜尋,并可提供于他人用來搜尋大量的資料。
本發(fā)明的目的也在提供一種可攜帶式數(shù)據(jù)庫搜尋代理器,可隨時對其搜尋參數(shù)加以修正,以符合使用者檢索的目的。
為達(dá)上述目的,本發(fā)明采用的技術(shù)手段如下一種可攜式數(shù)據(jù)庫搜尋代理器處理系統(tǒng),包括一個搜尋代理器存儲器,用以儲存多數(shù)的數(shù)據(jù)庫搜尋代理器;其中,任一數(shù)據(jù)庫搜尋代理器均記錄一組搜尋參數(shù),各搜尋參數(shù)包括至少一個搜尋指標(biāo)及其相對應(yīng)的權(quán)值;任一數(shù)據(jù)庫搜尋代理器并均記錄一群經(jīng)標(biāo)示以「符合」或「不符」搜尋目的的代表性資料文件;一個搜尋引擎,可依據(jù)該搜尋代理器存儲器中所儲存的數(shù)據(jù)庫搜尋代理器中所含的搜尋參數(shù),作為搜尋條件,在一數(shù)據(jù)庫中尋找近似的資料文件,集合成一群近似資料文件;一資料文件暫存裝置,用以儲存該搜尋引擎所搜尋的近似資料文件;一訓(xùn)練模塊,可將該搜尋所得的近似資料文件內(nèi)容,顯示提供于使用者,并接受使用者對各近似資料文件的評價;其中,該評價包括任一近似資料文件「符合」或「不符」搜尋目的的評價;該訓(xùn)練模塊并可依據(jù)經(jīng)使用者評價的資料文件內(nèi)容及其相對應(yīng)的評價,以及該代表性資料文件所含的資料文件內(nèi)容及其相對應(yīng)的評價產(chǎn)生一修正用數(shù)據(jù)庫搜尋代理器,該搜尋代理器包括一組搜尋參數(shù),任一參數(shù)均包括一搜尋指標(biāo)及其權(quán)值;一修正模塊,可依據(jù)該修正用數(shù)據(jù)庫搜尋代理器的內(nèi)容,修正該數(shù)據(jù)庫搜尋代理器的內(nèi)容;及一使用者介面,用以供使用者操作至少該搜尋代理器存儲器、該搜尋引擎、該訓(xùn)練模塊及該修正模塊。
本發(fā)明的目的也在提供一種依據(jù)使用者檢索資料的目的,修正可攜帶式數(shù)據(jù)庫搜尋代理器的修正方法。
為達(dá)上述目的,本發(fā)明采用的技術(shù)手段如下一種可攜式數(shù)據(jù)庫搜尋代理器修正方法,包括取得一個可攜式數(shù)據(jù)庫搜尋代理器中所記錄的一組資料搜尋參數(shù);各搜尋參數(shù)包括至少一搜尋指標(biāo)及其相對應(yīng)的權(quán)值;取得一群與該可攜式數(shù)據(jù)庫搜尋代理器相關(guān)的資料文件;該群資料文件包括多數(shù)經(jīng)標(biāo)示為與該可攜式數(shù)據(jù)庫搜尋代理器的搜尋目的「相符」的數(shù)據(jù)文件及多數(shù)經(jīng)標(biāo)示為與該可攜式數(shù)據(jù)庫搜尋代理器的搜尋目的「不符」的數(shù)據(jù)文件;依據(jù)該一組資料搜尋參數(shù)在特定的數(shù)據(jù)庫中進(jìn)行搜尋,得到多數(shù)符合或接近搜尋條件的資料文件;在所得的資料文件中選取特定數(shù)量的資料文件,提供使用者閱讀;接受使用者對所提供的資料文件的評價,并將評價結(jié)果加以記錄;該評價包括代表「符合」或「不符」搜尋目的的評價;將經(jīng)使用者評價的資料文件及其標(biāo)示加入該群資料文件中;分析該群資料文件,產(chǎn)生一修正用數(shù)據(jù)庫搜尋代理器;該修正用數(shù)據(jù)庫搜尋代理器記錄一組資料搜尋參數(shù);各搜尋參數(shù)包括至少一搜尋指標(biāo)及其相對應(yīng)的權(quán)值;以該修正用數(shù)據(jù)庫搜尋代理器在該群資料文件中進(jìn)行比對,判斷預(yù)定數(shù)量的資料文件分別為符合搜尋目的或不符搜尋目的;計算以該修正用數(shù)據(jù)庫搜尋代理器所比對結(jié)果與該預(yù)定數(shù)量資料文件所標(biāo)示相符的比例,作為正確率;以該正確率調(diào)整該修正用數(shù)據(jù)庫搜尋代理器的參數(shù)權(quán)值;合并該可攜式數(shù)據(jù)庫搜尋代理器與該調(diào)整后修正用數(shù)據(jù)庫搜尋代理器;及獲得修正的可攜式數(shù)據(jù)庫搜尋代理器。
在本發(fā)明的實施例中,并可包括重復(fù)該正確率計算及依據(jù)該正確率修正數(shù)據(jù)庫搜尋代理器,直到正確率達(dá)到所需的步驟。在本發(fā)明的實例中,另外包括刪除該群數(shù)據(jù)文件中資料文件的步驟。
綜上所述,本發(fā)明揭示一種可攜式數(shù)據(jù)庫搜尋代理器,該代理器記錄一組資料搜尋參數(shù),以提供數(shù)據(jù)庫檢索系統(tǒng)據(jù)以在大量的數(shù)據(jù)庫中,搜尋所需的資料。該可攜式數(shù)據(jù)庫搜尋代理器于置入本發(fā)明的可攜式數(shù)據(jù)庫搜尋代理器處理系統(tǒng)后,該處理系統(tǒng)可依據(jù)使用者的指示,修正該代理器中所記錄的資料搜尋參數(shù),而使利用修正后代理器進(jìn)行資料搜尋的結(jié)果,更符合該使用者的搜尋目的。
圖1表示本發(fā)明可攜式數(shù)據(jù)庫搜尋代理器處理系統(tǒng)的系統(tǒng)圖。
圖2即表示一種自一文字文件產(chǎn)生一個數(shù)據(jù)庫搜尋代理器的方法流程圖。
圖3表示本發(fā)明的可攜式數(shù)據(jù)庫搜尋代理器修正方法流程圖。
圖中符號說明
具體實施方法圖1表示本發(fā)明可攜式數(shù)據(jù)庫搜尋代理器處理系統(tǒng)的系統(tǒng)圖。如圖所示,本發(fā)明的可攜式數(shù)據(jù)庫搜尋代理器處理系統(tǒng)包括一個搜尋代理器存儲器11,用以儲存多數(shù)的數(shù)據(jù)庫搜尋代理器11a-11n;其中,任一數(shù)據(jù)庫搜尋代理器均記錄一組搜尋參數(shù),各搜尋參數(shù)包括至少一個搜尋指標(biāo)及其相對應(yīng)的權(quán)值;該搜尋參數(shù)可表以Si=(xi1,wi1),(xi2,wi2),...(xin,win)其中,Si表第i搜尋代理器,x表其指標(biāo),w表權(quán)值;一個搜尋引擎12,可依據(jù)該搜尋代理器存儲器11中所儲存的數(shù)據(jù)庫搜尋代理器中所含的搜尋參數(shù),作為搜尋條件,在一數(shù)據(jù)庫13中尋找近似的資料文件,集合成一群近似資料文件;一資料文件暫存裝置14,用以儲存該搜尋引擎12所搜尋的近似資料文件;一訓(xùn)練模塊15,可將該搜尋所得的近似資料文件內(nèi)容,顯示提供于使用者,并接受使用者對各近似資料文件的評價;其中,該評價包括任一近似資料文件是否符合搜尋目的的評價;該訓(xùn)練模塊15并可依據(jù)經(jīng)使用者評價的資料文件內(nèi)容及其相對應(yīng)的評價,產(chǎn)生一修正用數(shù)據(jù)庫搜尋代理器,該搜尋代理器包括一組搜尋參數(shù),任一參數(shù)均包括一搜尋指標(biāo)及其權(quán)值;一修正模塊16,可依據(jù)該修正用數(shù)據(jù)庫搜尋代理器的內(nèi)容,修正該搜尋代理器存儲器11中的數(shù)據(jù)庫搜尋代理器的內(nèi)容;及一使用者介面17,用以供使用者操作至少該搜尋代理器存儲器11、該搜尋引擎12、該訓(xùn)練模塊15及該修正模塊16。
利用上述系統(tǒng),使用者可以在該搜尋代理器存儲器11中置入一外來數(shù)據(jù)庫搜尋代理器,而以該數(shù)據(jù)庫搜尋代理器在該搜尋引擎12對該數(shù)據(jù)庫13進(jìn)行搜尋,并依據(jù)搜尋結(jié)果修正該數(shù)據(jù)庫搜尋代理器,以更符合使用者所需。
在本發(fā)明中,數(shù)據(jù)庫搜尋代理器Si可表為Si=(xi1,wi1),(xi2,wi2),...(xin,win)其中,x表搜尋用指標(biāo),如所搜尋的檔案為文字文件,則x可為一關(guān)鍵詞詞,如為影像,則為一特征,如為聲音,則可為一段波形或其它特征;w則表其相對應(yīng)的權(quán)值。該權(quán)值代表相對應(yīng)的指標(biāo)與特定搜尋目的的關(guān)系值,其值可為正或負(fù)。
該數(shù)據(jù)庫搜尋代理器可以利用任何已知技術(shù)產(chǎn)生。例如,TW專利申請案第92123876號,即揭示一種以手動方式,將一搜尋用關(guān)鍵詞,轉(zhuǎn)化成一串搜尋用指標(biāo)的技術(shù)。
又例如TW專利申請案93105874號,則揭示一種對一個或數(shù)個資料文件內(nèi)容進(jìn)行分析,自動產(chǎn)生一串搜尋用指標(biāo)的技術(shù)。
茲以該93105874號專利申請案新揭示的技術(shù)為例,說明該數(shù)據(jù)庫搜尋代理器的產(chǎn)生方法。以下的說明,以對一文字文件文章進(jìn)行分析,產(chǎn)生描述該文章特性的搜尋代理器為實例。
圖2即表示一種自一文字文件產(chǎn)生一個數(shù)據(jù)庫搜尋代理器的方法流程圖。如圖所示,于201取得一資料文件,該資料文件為一文字文件;于202將該文字文件轉(zhuǎn)換成文字資料格式,以供處理。于203對該文字文件進(jìn)行字詞分割處理,而將該文字文件轉(zhuǎn)換成一串以「詞」word為單位的連續(xù)資料。接著,于204計算各「詞」在該文字文件中出現(xiàn)的次數(shù),得到一串由「詞」與「詞頻」所組合的指標(biāo)集合,稱為「指標(biāo)資料串」。其次,于205對該指標(biāo)資料串進(jìn)行正規(guī)化處理normalization。正規(guī)化處理可消除文字文件長短對指標(biāo)及其權(quán)值所造成的影響。在實際應(yīng)用上,可以設(shè)定一文字文件標(biāo)準(zhǔn)長度。將所有待處理文章與該設(shè)定值比較,而將其詞頻值以該比較值作正規(guī)化處理。
再次,于206對于詞頻極高,但并無指標(biāo)意義的詞,進(jìn)行調(diào)整。在進(jìn)行調(diào)整時,可對某些在大多數(shù)文字文件都會出現(xiàn)的詞,降低其權(quán)值。
進(jìn)行調(diào)整時,乃是將前步驟所得的詞頻值,乘以一調(diào)整值。使得當(dāng)一個詞所出現(xiàn)的文章數(shù)量越大比例越高時,其權(quán)值即趨近于0。
經(jīng)過上述處理步驟后,于207得到所有詞的權(quán)值,分別加以記錄,成為一數(shù)據(jù)庫搜尋代理器。在該過程中,如果是利用多數(shù)文字文件,并包括「符合」該搜尋目的及「不符」該搜尋目的的文字文件,則所得的數(shù)據(jù)庫搜尋代理器可包括權(quán)值為正的指標(biāo)及權(quán)值為負(fù)的指標(biāo)。
經(jīng)過上述步驟之后,將在步驟中曾經(jīng)分析過的文字文件,加以挑選,取得預(yù)訂數(shù)量的代表性文字文件,較好包括經(jīng)判斷為「符合」該搜尋目的及「不符」該搜尋目的的文字文件,連同其「符合」該搜尋目的及「不符」該搜尋目的的標(biāo)示,加以存盤備用。在選擇具代表性文字文件時,可挑選近似度<詳下述>的絕對值較高的文字文件。
除上述方法外,其它可以建立類似結(jié)構(gòu)的數(shù)據(jù)庫搜尋代理器的方法,也可應(yīng)用在本發(fā)明。
該搜尋引擎12可在該數(shù)據(jù)庫13中,取得資料文件A,并與該數(shù)據(jù)庫搜尋代理器所含的指標(biāo)比對,標(biāo)示出在該數(shù)據(jù)庫中所存在的指標(biāo),計算近似度SimilaritySimilarity=∑xjwjxj∈(A)其中,A代表所檢索的資料文件,A表其內(nèi)含資料的集合;xj該數(shù)據(jù)庫搜尋代理器所含的指標(biāo),wj為其權(quán)值。
該搜尋引擎12將近似值計算結(jié)果與一臨界值比較,挑選出近似值大于臨界值的資料文件,作為搜尋結(jié)果,存在該資料文件暫存裝置14備用。
上述搜尋的目的,在測試該外來數(shù)據(jù)庫搜尋代理器所搜尋的結(jié)果,是否與使用者的檢索目的相同。在本發(fā)明中,該外來數(shù)據(jù)庫搜尋代理器為經(jīng)過他人建立,訓(xùn)練的代理器,可以使該他人在數(shù)據(jù)庫中檢索出所需的資料文件,但所檢索的結(jié)果,未必符合另一人的需求。
為使外來的數(shù)據(jù)庫搜尋代理器能符合特定使用者的需求,該訓(xùn)練模塊15乃將上述搜尋的結(jié)果顯示在該使用者介面17,供使用者進(jìn)行評價。該使用者可閱讀其內(nèi)容,并進(jìn)行評價。該評價通常包括是否符合搜尋目的的評價。在實際應(yīng)用上,可提供一按鈕,使用者僅需鍵入「相符」及「不符」,即可完成評價。當(dāng)然,其它評價方式,例如令使用者給予評分,也屬可行。
經(jīng)過使用者評價的數(shù)據(jù)文件,給予標(biāo)記。當(dāng)使用者已評價過特定數(shù)量的資料文件,或者使用者指示停止評價后,該訓(xùn)練模塊15即將經(jīng)過評價的文字文件,加入該外來數(shù)據(jù)庫搜尋代理器所附的該群代表性文字文件中,并對該群代表性文字文件進(jìn)行分析,得到一個修正用數(shù)據(jù)庫搜尋代理器,該代理器St仍以下式表示St=(xt1,wt1),(xt2,wt2),...(xtm,wtm)x、w定義同前。
其中,對使用者評為「不符」的資料文件,由該資料文件所產(chǎn)生的指標(biāo),其權(quán)值可標(biāo)為負(fù)值。綜合使用者已評價的資料文件及該外來數(shù)據(jù)庫搜尋代理器所附的該群代表性文字文件的內(nèi)容,可產(chǎn)生一修正用數(shù)據(jù)庫搜尋代理器。建立修正用數(shù)據(jù)庫搜尋代理器的方式,可以參考上述93105874號專利申請案所揭示的技術(shù),于此不再贅述。
在實際操作上,該修正用數(shù)據(jù)庫搜尋代理器St包括大量與該外來數(shù)據(jù)庫搜尋代理器相同的搜尋用指標(biāo)。這是因為一個外來數(shù)據(jù)庫搜尋代理器乃是經(jīng)過他人長期使用,訓(xùn)練所得的結(jié)果。
該修正模塊16以所得的修正用數(shù)據(jù)庫搜尋代理器,再度對該群加入新數(shù)據(jù)文件的代表性資料文件進(jìn)行比對,測試各文字文件比對結(jié)果是否與所標(biāo)示的「符合」或「不符」相同。其后,對比對結(jié)果進(jìn)行統(tǒng)計,計算該修正數(shù)據(jù)庫搜尋代理器的正確率(acc)。
其次,該修正模塊16以該正確率acc修正該修正用數(shù)據(jù)庫搜尋代理器,并將該修正用數(shù)據(jù)庫搜尋代理器St與該外來數(shù)據(jù)庫搜尋代理器Si合并,成為測試用數(shù)據(jù)庫搜尋代理器SsSs={(xsk,wsk)}其中, k∈N丅接者,該修正模塊(16)再度對該群加入新文字文件的文字文件進(jìn)行比對,并將所得知正確率與一標(biāo)準(zhǔn)值比較。如該正確率已達(dá)標(biāo)準(zhǔn)值,則該測試用數(shù)據(jù)庫搜尋代理器即為合格的數(shù)據(jù)庫搜尋代理器,所搜尋的結(jié)果足以符合使用者的需求。
如該正確率未達(dá)該標(biāo)準(zhǔn)值,則修正模塊16繼續(xù)對該外來數(shù)據(jù)庫搜尋代理器進(jìn)行修正。其修正方式可例如將該修正用數(shù)據(jù)庫搜尋代理器所含的權(quán)值,全部乘以該正確率或歷次正確率的乘積,再與該外來數(shù)據(jù)庫搜尋代理器合并。或以其它方法,修正該修正用數(shù)據(jù)庫搜尋代理器的指標(biāo)或其權(quán)值。此外,也可分別修正該外來數(shù)據(jù)庫搜尋代理器及該修正用數(shù)據(jù)庫搜尋代理器,再予合并,均無不可。
將修正后的測試用數(shù)據(jù)庫搜尋代理器,再度進(jìn)行搜尋、評價,計算其正確率,直到其正確率超過該標(biāo)準(zhǔn)值。即可獲得符合所需的數(shù)據(jù)庫搜尋代理器。
綜合上述,本發(fā)明的可攜式數(shù)據(jù)庫搜尋代理器處理系統(tǒng)修正該外來數(shù)據(jù)庫搜尋代理器的流程,如圖3的可攜式數(shù)據(jù)庫搜尋代理器修正流程圖所示,而包括下列步驟于301取得一個外來數(shù)據(jù)庫搜尋代理器中所記錄的一組資料搜尋參數(shù);該參數(shù)包括至少一搜尋條件及其相對應(yīng)的權(quán)值;于302取得一群與該組資料搜尋參數(shù)相關(guān)的資料文件;該群資料文件包括多數(shù)經(jīng)標(biāo)示為與該可攜式數(shù)據(jù)庫搜尋代理器的搜尋目的「相符」的數(shù)據(jù)文件及多數(shù)經(jīng)標(biāo)示為與該可攜式數(shù)據(jù)庫搜尋代理器的搜尋目的「不符」的數(shù)據(jù)文件;于303依據(jù)該一組資料搜尋參數(shù)在數(shù)據(jù)庫13中進(jìn)行搜尋,得到若干符合或接近搜尋條件的資料文件;于304在所得的資料文件中選取特定數(shù)量的資料文件,顯示于該使用者介面17供使用者閱讀;于305接受使用者對所提供的資料文件的評價;該評價包括代表是否符合搜尋目的的評價;于306將經(jīng)使用者評價的資料文件及其標(biāo)示加入該群資料文件中;
于307分析該群資料文件,產(chǎn)生一修正用數(shù)據(jù)庫搜尋代理器;該修正用數(shù)據(jù)庫搜尋代理器記錄一組資料搜尋參數(shù);各搜尋參數(shù)包括至少一搜尋指標(biāo)及其相對應(yīng)的權(quán)值;于308以該修正用數(shù)據(jù)庫搜尋代理器在該群資料文件中進(jìn)行比對,判斷預(yù)定數(shù)量的資料文件分別為符合搜尋目的或不符搜尋目的;于309計算以該修正用數(shù)據(jù)庫搜尋代理器所比對結(jié)果與該預(yù)定數(shù)量資料文件所標(biāo)示的符合搜尋目的或不符搜尋目的相符的比例,作為正確率;于310以該正確率調(diào)整該修正用數(shù)據(jù)庫搜尋代理器的參數(shù)權(quán)值;于311合并該可攜式數(shù)據(jù)庫搜尋代理器與該調(diào)整后修正用數(shù)據(jù)庫搜尋代理器,得到修正后數(shù)據(jù)庫搜尋代理器;于312輸出該修正后的數(shù)據(jù)庫搜尋代理器,作為修正結(jié)果。
最后,于313在該群資料文件中刪除對訓(xùn)練效果較無影響的資料文件,以防止資料文件所占記憶空間過大。
在本發(fā)明中,該使用者介面也可提供一個隨時修正的功能,以在使用者激活后,進(jìn)行數(shù)據(jù)庫搜尋代理器的修正。
如上所述,本發(fā)明的可攜式數(shù)據(jù)庫搜尋代理器處理系統(tǒng),可對一外來數(shù)據(jù)庫搜尋代理器進(jìn)行修正,使其搜尋的結(jié)果符合所需。如此一來,數(shù)據(jù)庫搜尋代理器可以成為一獨立的搜尋工具,在不同計算機(jī)系統(tǒng)中使用,且可長期使用達(dá)于成熟的數(shù)據(jù)庫搜尋代理器,可由他人借用,傳承經(jīng)驗,該他人也可利用本發(fā)明加以修正,而符合自己的搜尋需求。此外,本人他可隨時修正其數(shù)據(jù)庫搜尋代理器。本發(fā)明使得數(shù)據(jù)庫搜尋代理器達(dá)到完全可攜的目標(biāo)。
以上是對本發(fā)明可攜式數(shù)據(jù)庫搜尋代理器處理系統(tǒng)的說明,習(xí)于斯藝的人士不難由上述的說明,明了本發(fā)明的精神進(jìn)而作出不同的衍伸與變化,唯只要不超出本發(fā)明的精神,均應(yīng)包含于其權(quán)利要求范圍內(nèi)。
權(quán)利要求
1.一種可攜式數(shù)據(jù)庫搜尋代理器處理系統(tǒng),其特征是,包括一個搜尋代理器存儲器,用以儲存多數(shù)的數(shù)據(jù)庫搜尋代理器;其中,任一數(shù)據(jù)庫搜尋代理器均記錄一組搜尋參數(shù),各搜尋參數(shù)包括至少一個搜尋指標(biāo)及其相對應(yīng)的權(quán)值;任一數(shù)據(jù)庫搜尋代理器并均記錄一群經(jīng)標(biāo)示以「符合」或「不符」搜尋目的的代表性資料文件;一個搜尋引擎,可依據(jù)該搜尋代理器存儲器中所儲存的數(shù)據(jù)庫搜尋代理器中所含的搜尋參數(shù),作為搜尋條件,在一數(shù)據(jù)庫中尋找近似的資料文件,集合成一群近似資料文件;一資料文件暫存裝置,用以儲存該搜尋引擎所搜尋的近似資料文件;一訓(xùn)練模塊,可將該搜尋所得的近似資料文件內(nèi)容,顯示提供于使用者,并接受使用者對各近似資料文件的評價;其中,該評價包括任一近似資料文件「符合」或「不符」搜尋目的的評價;該訓(xùn)練模塊并可依據(jù)經(jīng)使用者評價的資料文件內(nèi)容及其相對應(yīng)的評價,以及該代表性資料文件所含的資料文件內(nèi)容及其相對應(yīng)的評價產(chǎn)生一修正用數(shù)據(jù)庫搜尋代理器,該搜尋代理器包括一組搜尋參數(shù),任一參數(shù)均包括一搜尋指標(biāo)及其權(quán)值;一修正模塊,可依據(jù)該修正用數(shù)據(jù)庫搜尋代理器的內(nèi)容,修正該數(shù)據(jù)庫搜尋代理器的內(nèi)容;及一使用者介面,用以供使用者操作至少該搜尋代理器存儲器、該搜尋引擎、該訓(xùn)練模塊及該修正模塊。
2.如權(quán)利要求1所述的可攜式數(shù)據(jù)庫搜尋代理器處理系統(tǒng),其特征是,該數(shù)據(jù)庫搜尋代理器包括Si=(xi1,wi1),(xi2,wi2),…(xin,win)其中,Si表第i搜尋代理器,x表其指標(biāo),w表權(quán)值。
3.如權(quán)利要求2所述的可攜式數(shù)據(jù)庫搜尋代理器處理系統(tǒng),其中,所搜尋的檔案為文字文件,且x為一關(guān)鍵詞詞。
4.如權(quán)利要求1所述的可攜式數(shù)據(jù)庫搜尋代理器處理系統(tǒng),其特征是,該搜尋引擎可在該數(shù)據(jù)庫中,取得資料文件,并與該數(shù)據(jù)庫搜尋代理器所含的搜尋指標(biāo)比對,標(biāo)示出在該數(shù)據(jù)庫中所存在的搜尋指標(biāo),計算近似度SimilaritySimilarity=∑xjwjxj∈(A)其中,A代表所檢索的資料文件,A表其內(nèi)含資料的集合;xj該數(shù)據(jù)庫搜尋代理器所含的指標(biāo),wj為其權(quán)值;且該搜尋引擎將近似值計算結(jié)果與一臨界值比較,挑選出近似值大于臨界值的資料文件,作為近似的資料文件搜尋結(jié)果。
5.如權(quán)利要求1所述的可攜式數(shù)據(jù)庫搜尋代理器處理系統(tǒng),其特征是,經(jīng)使用者評為不符合搜尋目的的資料文件,即將由該資料文件所產(chǎn)生的指標(biāo)所對應(yīng)的權(quán)值標(biāo)為負(fù)值。
6.如權(quán)利要求1所述的可攜式數(shù)據(jù)庫搜尋代理器處理系統(tǒng),其特征是,該修正模塊以下式將該修正用數(shù)據(jù)庫搜尋代理器St={(xtk,wtk)}與該外來數(shù)據(jù)庫搜尋代理器Si={(xik,wik)}合并,成為修正后數(shù)據(jù)庫搜尋代理器SsSs={(xsk,wsk)}其中,x表一指標(biāo),w表其權(quán)值,acc表該修正用數(shù)據(jù)庫搜尋代理器搜尋該經(jīng)使用者評價的資料文件以及該代表性資料文件所含的資料文件的結(jié)果正確率。
7.如權(quán)利要求6所述的可攜式數(shù)據(jù)庫搜尋代理器處理系統(tǒng),其特征是,該修正模塊可反復(fù)根據(jù)該修正后數(shù)據(jù)庫搜尋代理器搜尋該經(jīng)使用者評價的資料文件以及該代表性資料文件所含的資料文件的結(jié)果正確率,修正該數(shù)據(jù)庫搜尋代理器,直到該正確率達(dá)于一定值。
8.如權(quán)利要求6所述的可攜式數(shù)據(jù)庫搜尋代理器處理系統(tǒng),其特征是,該修正模塊分別修正該外來數(shù)據(jù)庫搜尋代理器及該修正用數(shù)據(jù)庫搜尋代理器,再予合并。
9.一種可攜式數(shù)據(jù)庫搜尋代理器修正方法,其特征是,包括取得一個可攜式數(shù)據(jù)庫搜尋代理器中所記錄的一組資料搜尋參數(shù);各搜尋參數(shù)包括至少一搜尋指標(biāo)及其相對應(yīng)的權(quán)值;取得一群與該可攜式數(shù)據(jù)庫搜尋代理器相關(guān)的資料文件;該群資料文件包括多數(shù)經(jīng)標(biāo)示為與該可攜式數(shù)據(jù)庫搜尋代理器的搜尋目的「相符」的數(shù)據(jù)文件及多數(shù)經(jīng)標(biāo)示為與該可攜式數(shù)據(jù)庫搜尋代理器的搜尋目的「不符」的數(shù)據(jù)文件;依據(jù)該一組資料搜尋參數(shù)在特定的數(shù)據(jù)庫中進(jìn)行搜尋,得到多數(shù)符合或接近搜尋條件的資料文件;在所得的資料文件中選取特定數(shù)量的資料文件,提供使用者閱讀;接受使用者對所提供的資料文件的評價,并將評價結(jié)果加以記錄;該評價包括代表「符合」或「不符」搜尋目的的評價;將經(jīng)使用者評價的資料文件及其標(biāo)示加入該群資料文件中;分析該群資料文件,產(chǎn)生一修正用數(shù)據(jù)庫搜尋代理器;該修正用數(shù)據(jù)庫搜尋代理器記錄一組資料搜尋參數(shù);各搜尋參數(shù)包括至少一搜尋指標(biāo)及其相對應(yīng)的權(quán)值;以該修正用數(shù)據(jù)庫搜尋代理器在該群資料文件中進(jìn)行比對,判斷預(yù)定數(shù)量的資料文件分別為符合搜尋目的或不符搜尋目的;計算以該修正用數(shù)據(jù)庫搜尋代理器所比對結(jié)果與該預(yù)定數(shù)量資料文件所標(biāo)示相符的比例,作為正確率;以該正確率調(diào)整該修正用數(shù)據(jù)庫搜尋代理器的參數(shù)權(quán)值;合并該可攜式數(shù)據(jù)庫搜尋代理器與該調(diào)整后修正用數(shù)據(jù)庫搜尋代理器;及獲得修正的可攜式數(shù)據(jù)庫搜尋代理器。
10.如權(quán)利要求9所述的可攜式數(shù)據(jù)庫搜尋代理器修正方法,其特征是,該數(shù)據(jù)庫搜尋代理器Si包括Si=(xi1,wi1),(xi2,wi2),…(xin,win)其中,x表一指標(biāo),w表其權(quán)值;
11.如權(quán)利要求9所述的可攜式數(shù)據(jù)庫搜尋代理器修正方法,其特征是,所搜尋的檔案為文字文件,x為一關(guān)鍵詞。
12.如權(quán)利要求9所述的可攜式數(shù)據(jù)庫搜尋代理器修正方法,其特征是,該搜尋結(jié)果以近似度Similarity值超出一臨界值的檔案,該近似度的計算方式為Similarity=∑xjwjxj∈(A)其中,A代表所檢索的資料文件,A表其內(nèi)含資料的集合;xj該數(shù)據(jù)庫搜尋代理器Sj所含的指標(biāo),wj為其權(quán)值。
13.如權(quán)利要求9所述的可攜式數(shù)據(jù)庫搜尋代理器修正方法,其特征是,經(jīng)使用者評為不符搜尋目的的資料文件,則將由該資料文件所產(chǎn)生的指標(biāo)權(quán)值標(biāo)為負(fù)值。
14.如權(quán)利要求9所述的可攜式數(shù)據(jù)庫搜尋代理器修正方法,其特征是,該合并一數(shù)據(jù)庫搜尋代理器Si={(xik,wik)}與另一數(shù)據(jù)庫搜尋代理器St={(xtk,wtk)}成為修正用數(shù)據(jù)庫搜尋代理器Ss的方式包括Ss={(Ssk,wsk)}其中,x表一指標(biāo),w表其權(quán)值,acc表該修正用數(shù)據(jù)庫搜尋代理器搜尋該經(jīng)使用者評價的資料文件以及該代表性資料文件所含的資料文件的結(jié)果正確率。
15.如權(quán)利要求14所述的可攜式數(shù)據(jù)庫搜尋代理器修正方法,其特征是,另包括反復(fù)根據(jù)該修正后數(shù)據(jù)庫搜尋代理器搜尋該經(jīng)使用者評價的資料文件以及該代表性資料文件所含的資料文件的結(jié)果正確率,修正該數(shù)據(jù)庫搜尋代理器,直到該正確率達(dá)于一定值的步驟。
16.如權(quán)利要求14所述的可攜式數(shù)據(jù)庫搜尋代理器修正方法,其特征是,該一數(shù)據(jù)庫搜尋代理器Si及該另一數(shù)據(jù)庫搜尋代理器,均經(jīng)調(diào)整所含參數(shù)值,再予合并。
全文摘要
本發(fā)明揭示一種可攜式數(shù)據(jù)庫搜尋代理器處理系統(tǒng)及修正方法,該代理器記錄一組資料搜尋參數(shù),以提供數(shù)據(jù)庫檢索系統(tǒng)據(jù)以在大量的數(shù)據(jù)庫中,搜尋所需的資料。該可攜式數(shù)據(jù)庫搜尋代理器于置入本發(fā)明的可攜式數(shù)據(jù)庫搜尋代理器處理系統(tǒng)后,該處理系統(tǒng)可依據(jù)使用者的指示,修正該代理器中所記錄的資料搜尋參數(shù),而使利用修正后代理器進(jìn)行資料搜尋的結(jié)果,更符合該使用者的搜尋目的。
文檔編號G06F17/30GK1811756SQ20051000631
公開日2006年8月2日 申請日期2005年1月26日 優(yōu)先權(quán)日2005年1月26日
發(fā)明者周培林 申請人:宇匯知識科技股份有限公司