国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種提供即時(shí)個(gè)性化動(dòng)態(tài)專題服務(wù)的方法

      文檔序號(hào):6598490閱讀:285來(lái)源:國(guó)知局
      專利名稱:一種提供即時(shí)個(gè)性化動(dòng)態(tài)專題服務(wù)的方法
      技術(shù)領(lǐng)域
      本發(fā)明涉及一種對(duì)信息進(jìn)行處理的方法,具體的說(shuō)是一種提供即時(shí)個(gè)性化動(dòng)態(tài)專題服務(wù)的方法。
      背景技術(shù)
      傳統(tǒng)意義上的專題,就是以所包含全文內(nèi)容的布爾邏輯表達(dá)式(多個(gè)詞之間的與或非)和屬性內(nèi)容的布爾表達(dá)式的布爾邏輯組合,是表達(dá)知識(shí)的知識(shí)。
      專題的形成過(guò)程對(duì)于傳統(tǒng)模式下的計(jì)算機(jī)系統(tǒng),實(shí)際上是一個(gè)包含全文和屬性的復(fù)雜檢索過(guò)程,這種模式無(wú)法解決大量專題需要根據(jù)信息源的變化動(dòng)態(tài)更新的要求,將對(duì)系統(tǒng)造成巨大的壓力如果信息源發(fā)生變化,有十萬(wàn)個(gè)專題就意味著需要并發(fā)或順序進(jìn)行十萬(wàn)次復(fù)雜檢索,這實(shí)際上是低效和不可行的。

      發(fā)明內(nèi)容
      我們的動(dòng)態(tài)專題是基于動(dòng)態(tài)監(jiān)控技術(shù)和即時(shí)專題技術(shù)相結(jié)合的產(chǎn)物。動(dòng)態(tài)是指系統(tǒng)具有主動(dòng)監(jiān)控信息變化的能力。通過(guò)對(duì)系統(tǒng)的監(jiān)控,任何文檔和信息源的變化,將直接傳遞到即時(shí)動(dòng)態(tài)個(gè)性化專題系統(tǒng),通過(guò)獨(dú)特的專題算法和策略,使專題自主更新,無(wú)需通過(guò)定時(shí)由應(yīng)用觸發(fā)掃描專題或以n次復(fù)雜檢索來(lái)更新專題,是基于創(chuàng)新技術(shù)的專題更新模式。
      由于專題的定制方式是無(wú)限制的,如果有5萬(wàn)個(gè)用戶,每個(gè)用戶定義20個(gè)專題,就會(huì)存在100萬(wàn)個(gè)專題,意味著更新一次專題需要進(jìn)行100萬(wàn)次復(fù)雜檢索,但實(shí)際上,即使不排除可能的完全一樣的專題,在專題數(shù)增加到一定程度后,如1萬(wàn)個(gè)專題,實(shí)際專題中出現(xiàn)的不同的檢索詞的總量將出現(xiàn)相對(duì)穩(wěn)定,不會(huì)隨著專題數(shù)量的增加而快速變大。假設(shè)1萬(wàn)個(gè)專題中出現(xiàn)了3000個(gè)不同的檢索詞,那么10萬(wàn)個(gè)專題可能是7000個(gè),100萬(wàn)個(gè)專題可能是2萬(wàn)個(gè),1000萬(wàn)個(gè)專題可能是2.5萬(wàn)個(gè)。因?yàn)槌S玫脑~畢竟是有限的,而人們的信息的需求的雷同性也是毋庸置疑的。
      基于這樣的合理假設(shè),我們采用將所有專題中不同的檢索詞(我們稱之為檢索元詞)進(jìn)行提取,并建立專用的索引算法,在動(dòng)態(tài)引擎察覺(jué)到信息源變化時(shí),立即通過(guò)后臺(tái)的進(jìn)程對(duì)這n個(gè)檢索元詞與新建立的全文索引和屬性數(shù)據(jù)庫(kù)進(jìn)行n次檢索匹配,并對(duì)產(chǎn)生的結(jié)果生成一個(gè)動(dòng)態(tài)表。這時(shí),即時(shí)個(gè)性化動(dòng)態(tài)專題引擎將利用數(shù)據(jù)庫(kù)的動(dòng)態(tài)視圖能力,根據(jù)每一個(gè)專題的檢索元詞組合,更新數(shù)據(jù)庫(kù)中原來(lái)的視圖,使專題發(fā)生主動(dòng)的變化。
      為了加快即時(shí)專題更新的速度,提高效率,我們采用了兩個(gè)技術(shù)和算法方面的策略1、對(duì)全文索引采用分段索引分段優(yōu)化的方式,使每次系統(tǒng)主動(dòng)更新即時(shí)專題時(shí),只需要對(duì)最近增加或修改的那一段索引進(jìn)行索引及檢索,其他絕大多數(shù)的專題列表已經(jīng)存在于數(shù)據(jù)庫(kù)視圖中,可直接讀取,大大提高了專題的即時(shí)性。
      2、為了能使即時(shí)專題的更新能充分利用多線程應(yīng)用的效率,體現(xiàn)將大多數(shù)人的利益放在第一位的原則,在檢索元詞的索引生成過(guò)程中,按照一定的策略,系統(tǒng)主動(dòng)將按使用次數(shù)較多的單個(gè)檢索元詞的專題、使用次數(shù)較少單個(gè)檢索元詞的專題(按照由多到少的順序)、兩個(gè)、三個(gè)檢索元詞的專題的順序,將能影響最大多數(shù)專題的檢索元詞先完成檢索更新,以使最大量的用戶能更快獲得個(gè)性化的即時(shí)專題服務(wù),提高巨量即時(shí)專題平均更新速度。
      實(shí)現(xiàn)提供即時(shí)個(gè)性化動(dòng)態(tài)專題服務(wù)的方法,包括如下步驟首先,對(duì)所有用戶輸入的專題中需要在全文中查找的關(guān)鍵字進(jìn)行提取,根據(jù)關(guān)鍵字出現(xiàn)的次數(shù)多少按由多到少進(jìn)行排序;對(duì)于那些專題中只有一個(gè)全文查找關(guān)鍵字的專題,這個(gè)關(guān)鍵字的優(yōu)先級(jí)將被提高;同時(shí)建立全文關(guān)鍵字結(jié)果表,表中各個(gè)關(guān)鍵字的查找結(jié)果均為0;然后根據(jù)每個(gè)專題中涉及到的全文關(guān)鍵字的數(shù)量建立專題關(guān)鍵字表,根據(jù)涉及到的全文關(guān)鍵字的數(shù)量由少到多進(jìn)行排序;當(dāng)發(fā)現(xiàn)有文件變化時(shí),按照以前關(guān)鍵字的排序順序?qū)υ撐募膬?nèi)容進(jìn)行查找,如發(fā)現(xiàn)匹配,則將該關(guān)鍵字的查找結(jié)果置為1,然后在所有專題的關(guān)鍵字表中將這個(gè)結(jié)果帶入進(jìn)行匹配,如發(fā)現(xiàn)某個(gè)專題的計(jì)算結(jié)果不為0,則表示這個(gè)專題發(fā)生變化,就可以立即通知用戶。
      通過(guò)這種方法,每個(gè)人都可以通過(guò)即時(shí)動(dòng)態(tài)個(gè)性化專題服務(wù)體系的平臺(tái),擁有完全符合自己信息需求的專題或在企業(yè)主專題之下定義自己的子專題,充分實(shí)現(xiàn)個(gè)性化的特色,并可以以專題的方式實(shí)現(xiàn)個(gè)人知識(shí)門戶。通過(guò)動(dòng)態(tài)專題自定義訂閱機(jī)制和獨(dú)創(chuàng)的即時(shí)專題技術(shù),徹底使“我找信息”轉(zhuǎn)變?yōu)椤靶畔⒄椅摇敝灰淮涡愿嬖V系統(tǒng)您對(duì)信息的需求,權(quán)限范圍內(nèi)相符合的信息就會(huì)源源不斷地自動(dòng)進(jìn)入定義的動(dòng)態(tài)目錄,做到“信息找我”。如果某些信息實(shí)時(shí)性要求很高,用戶還可以將專題設(shè)定為活躍專題,專題服務(wù)體系把信息的最新變化在第一時(shí)間通過(guò)手機(jī)短信或郵件方式,主動(dòng)通知您或有權(quán)限的其他人。


      圖1是本發(fā)明實(shí)現(xiàn)即時(shí)個(gè)性化動(dòng)態(tài)專題服務(wù)的方法的流程圖。
      實(shí)施例一例如,有6個(gè)專題,其中的ABCD表示出現(xiàn)在全文中的關(guān)鍵字,OR AND表示這些關(guān)鍵字間的關(guān)系。
      A OR B OR C OR DA OR C AND DA AND(B OR C)B AND DAC首先進(jìn)行關(guān)鍵字抽取,可以看到,這些專題中涉及到的全文關(guān)鍵字有A B C D這四個(gè)。然后按照在每個(gè)關(guān)鍵字出現(xiàn)的數(shù)量進(jìn)行排序??梢钥吹皆谶@些專題中,A出現(xiàn)了4次,B出現(xiàn)了3次,C出現(xiàn)了4次,D出現(xiàn)了3次。由于A和C都作為某個(gè)專題中的唯一一個(gè)關(guān)鍵字出現(xiàn)過(guò)了,所以A和C都應(yīng)乘以該唯一關(guān)鍵字專題的數(shù)目的1000倍。最后的排序結(jié)果就變成了A 4*1*1000=4000B 3C 4*1*1000=4000D 3根據(jù)這個(gè)結(jié)果對(duì)這些關(guān)鍵字進(jìn)行排序,我們就得到了A C B D的關(guān)鍵字查找順序。
      然后對(duì)各個(gè)專題建立專題關(guān)鍵字表,該表中各個(gè)專題的排序按照專題中出現(xiàn)的全文關(guān)鍵字的數(shù)量按照由少到多的順序進(jìn)行??梢钥吹?,第一個(gè)專題中有4個(gè)關(guān)鍵字,第二個(gè)中有3個(gè),第三個(gè)中有3個(gè),第四個(gè)中有2個(gè),第五和第六個(gè)專題中只有1個(gè)。然后,對(duì)各個(gè)專題中的關(guān)鍵字用它們的查詢結(jié)果替換,如關(guān)鍵字A的查詢結(jié)果為RA,默認(rèn)為0,以此類推。對(duì)AND OR等邏輯關(guān)系運(yùn)算符用*、+替換。結(jié)果如下專題6RC
      專題5RA專題4RB*RD專題3RA*(RB+RC)專題2RA+RC*RD專題1RA+RB+RC+RD當(dāng)發(fā)現(xiàn)文件變化時(shí),利用最開(kāi)始生成的關(guān)鍵字順序表逐一對(duì)各個(gè)關(guān)鍵字進(jìn)行查找,并將是否查到的結(jié)果放到相應(yīng)的查詢結(jié)果變量中。如先查詢關(guān)鍵字C,結(jié)果查到了,則RC=1,帶入專題關(guān)鍵字表中,可以得到專題61專題50專題40*0專題30*(0+1)專題20+1*0專題10+0+1+0進(jìn)行表達(dá)式計(jì)算后,可以得到最后結(jié)果如下專題61專題50專題40專題30專題20專題11由于專題1和專題6的計(jì)算結(jié)果不為0,我們就可以知道專題6和專題1發(fā)生改變了。然后利用適當(dāng)?shù)姆椒ㄍㄖ脩舨膶n}關(guān)鍵字表中刪除這兩個(gè)專題。同樣道理,如果我們接下去查找關(guān)鍵字A,如果查到了,則RA=1,帶入計(jì)算后得到專題51 1專題40*0 0專題31*(0+1)1專題21+1*0 1除了專題4,其它專題都發(fā)生變化了,通知完用戶后將這些專題從專題關(guān)鍵字表中刪除,然后查找關(guān)鍵字B,結(jié)果沒(méi)找到,則RB=0,帶入得專題40*00最后查找完關(guān)鍵字D后,發(fā)現(xiàn)找到,則RD=1,帶入得專題40*10可見(jiàn),專題4沒(méi)有發(fā)生任何變化。
      以上所述僅為本發(fā)明所述方法的一個(gè)示例,任何依據(jù)本發(fā)明說(shuō)明書(shū)及圖示所述方法的產(chǎn)品均在本發(fā)明的保護(hù)范圍之內(nèi)。
      權(quán)利要求
      1.一種提供即時(shí)個(gè)性化動(dòng)態(tài)專題服務(wù)的方法,包括如下步驟首先,對(duì)所有用戶輸入的專題中需要在全文中查找的關(guān)鍵字進(jìn)行提取,根據(jù)關(guān)鍵字出現(xiàn)的次數(shù)多少按由多到少進(jìn)行排序;對(duì)于那些專題中只有一個(gè)全文查找關(guān)鍵字的專題,這個(gè)關(guān)鍵字的優(yōu)先級(jí)將被提高;同時(shí)建立全文關(guān)鍵字結(jié)果表,表中各個(gè)關(guān)鍵字的查找結(jié)果均為0;然后根據(jù)每個(gè)專題中涉及到的全文關(guān)鍵字的數(shù)量建立專題關(guān)鍵字表,根據(jù)涉及到的全文關(guān)鍵字的數(shù)量由少到多進(jìn)行排序;當(dāng)發(fā)現(xiàn)有文件變化時(shí),按照以前關(guān)鍵字的排序順序?qū)υ撐募膬?nèi)容進(jìn)行查找,如發(fā)現(xiàn)匹配,則將該關(guān)鍵字的查找結(jié)果置為1,然后在所有專題的關(guān)鍵字表中將這個(gè)結(jié)果帶入進(jìn)行匹配,如發(fā)現(xiàn)某個(gè)專題的計(jì)算結(jié)果不為0,則表示這個(gè)專題發(fā)生變化,就可以立即通知用戶。
      全文摘要
      本發(fā)明是一種提供即時(shí)個(gè)性化動(dòng)態(tài)專題服務(wù)的方法。通過(guò)對(duì)系統(tǒng)的監(jiān)控,任何文檔和信息源的變化,將直接傳遞到即時(shí)個(gè)性化動(dòng)態(tài)專題系統(tǒng),通過(guò)分段索引分段優(yōu)化的方式和排序的方法,使專題自主更新。通過(guò)這種方法,每個(gè)人都可以通過(guò)即時(shí)動(dòng)態(tài)個(gè)性化專題服務(wù)體系的平臺(tái),擁有完全符合自己信息需求的專題或在企業(yè)主專題之下定義自己的子專題,充分實(shí)現(xiàn)個(gè)性化的特色,并可以以專題的方式實(shí)現(xiàn)個(gè)人知識(shí)門戶。
      文檔編號(hào)G06F17/30GK1499401SQ0214930
      公開(kāi)日2004年5月26日 申請(qǐng)日期2002年11月7日 優(yōu)先權(quán)日2002年11月7日
      發(fā)明者邵建宇 申請(qǐng)人:邵建宇
      網(wǎng)友詢問(wèn)留言 已有0條留言
      • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1