国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      文章關(guān)鍵詞登錄系統(tǒng)及方法

      文檔序號(hào):6588343閱讀:142來(lái)源:國(guó)知局
      專利名稱:文章關(guān)鍵詞登錄系統(tǒng)及方法
      技術(shù)領(lǐng)域
      本發(fā)明涉及一種文章關(guān)鍵詞登錄系統(tǒng)及方法,且特別涉及一種可以自動(dòng)將文章中重復(fù)出現(xiàn)的關(guān)鍵詞進(jìn)行登錄的文章關(guān)鍵詞登錄系統(tǒng)及方法。
      背景技術(shù)
      面對(duì)信息泛濫的時(shí)代,一般人并無(wú)法擁有足夠的時(shí)間來(lái)消化大量的文章。也正由于此原因,若有有效的方法來(lái)確認(rèn)文章的主題或文章論及的相關(guān)領(lǐng)域,使用者便可直接閱讀經(jīng)過(guò)篩選,且符合使用者期望領(lǐng)域的文章,而不需花費(fèi)大量的時(shí)間來(lái)閱讀所有的文章。
      對(duì)于文章的主題或文章的相關(guān)領(lǐng)域的確認(rèn),通常是以文章中最常提及的關(guān)鍵詞來(lái)進(jìn)行判斷。熟知對(duì)于文章的關(guān)鍵詞的剖析與登錄方法主要以人工方式進(jìn)行篩選。圖1是顯示熟知文章關(guān)鍵詞的剖析與登錄方法的示意圖。首先,大量的文章10經(jīng)過(guò)人工的逐一剖析(11)之后,可以由每一文章10中得到其相關(guān)的關(guān)鍵詞12。之后,剖析人員藉由人工登錄(13)的方式將關(guān)鍵詞登錄至關(guān)鍵詞數(shù)據(jù)庫(kù)14之中。
      由于熟知的文章關(guān)鍵詞的剖析與登錄是透過(guò)人力逐一對(duì)于文章進(jìn)行剖析,因此需要耗費(fèi)大量時(shí)間與人力方可完成關(guān)鍵詞剖析。此外,對(duì)于一些同義字詞而言,也必須透過(guò)剖析人員的記憶與經(jīng)驗(yàn)方可正確地完成同義關(guān)鍵詞的剖析。

      發(fā)明內(nèi)容
      有鑒于此,本發(fā)明的主要目的為提供一種可以自動(dòng)將文章中重復(fù)出現(xiàn)的關(guān)鍵詞進(jìn)行登錄的文章關(guān)鍵詞登錄系統(tǒng)及方法。此外,本發(fā)明亦可對(duì)于文章中的同義字詞自動(dòng)進(jìn)行辨認(rèn),以增加關(guān)鍵詞剖析的正確性。
      為了實(shí)現(xiàn)本發(fā)明的上述目的,可藉由本發(fā)明所提供的文章關(guān)鍵詞登錄系統(tǒng)及方法來(lái)實(shí)現(xiàn)。
      依據(jù)本發(fā)明實(shí)施例的文章關(guān)鍵詞登錄系統(tǒng),包括具有一符號(hào)庫(kù)、一虛字詞庫(kù)與一關(guān)鍵詞數(shù)據(jù)庫(kù)的數(shù)據(jù)儲(chǔ)存裝置與一處理器。處理器將文章與符號(hào)庫(kù)進(jìn)行對(duì)比,進(jìn)而將文章中與符號(hào)庫(kù)中所紀(jì)錄相同的符號(hào)刪除,并將文章中與虛字詞庫(kù)中所紀(jì)錄相同的虛字刪除,之后,計(jì)算文章中所有字詞出現(xiàn)的次數(shù),從而得到多個(gè)候選字詞與其相應(yīng)的出現(xiàn)次數(shù),最后,依據(jù)一設(shè)定條件由候選字詞中選擇多個(gè)關(guān)鍵詞,并將選取的關(guān)鍵詞登錄至關(guān)鍵詞數(shù)據(jù)庫(kù)。
      數(shù)據(jù)儲(chǔ)存裝置中還可具有一同義詞庫(kù)。處理器還將文章與同義詞庫(kù)進(jìn)行對(duì)比,進(jìn)而將文章中與同義詞庫(kù)中所紀(jì)錄相同的同義詞刪除,且紀(jì)錄文章中同義詞出現(xiàn)的次數(shù),并將與同義詞同義的字詞與同義詞出現(xiàn)的次數(shù)紀(jì)錄于一同義詞緩沖區(qū)。此外,處理器還將同義詞緩沖區(qū)中紀(jì)錄的與同義詞同義的字詞與同義詞出現(xiàn)的次數(shù)與候選字詞與其相應(yīng)的出現(xiàn)次數(shù)結(jié)合。
      依據(jù)本發(fā)明實(shí)施例的文章關(guān)鍵詞登錄方法,首先,接收一文章,接著,將文章與符號(hào)庫(kù)進(jìn)行對(duì)比,進(jìn)而將文章中與符號(hào)庫(kù)中所紀(jì)錄相同的符號(hào)刪除。之后,將文章中與虛字詞庫(kù)中所紀(jì)錄相同的虛字刪除。
      之后,計(jì)算文章中所有字詞出現(xiàn)的次數(shù),從而得到多個(gè)候選字詞與其相應(yīng)的出現(xiàn)次數(shù)。最后,依據(jù)一設(shè)定條件由候選字詞中選擇多個(gè)關(guān)鍵詞,且將關(guān)鍵詞登錄至關(guān)鍵詞數(shù)據(jù)庫(kù)中。
      此外,還可以將文章與同義詞庫(kù)進(jìn)行對(duì)比,進(jìn)而將文章中與同義詞庫(kù)中所紀(jì)錄相同的同義詞刪除,且紀(jì)錄文章中同義詞出現(xiàn)的次數(shù),并將與同義詞同義的字詞與同義詞出現(xiàn)的次數(shù)紀(jì)錄于一同義詞緩沖區(qū)。之后,還將同義詞緩沖區(qū)中紀(jì)錄的與同義詞同義的字詞及同義詞出現(xiàn)的次數(shù)加入相應(yīng)候選字詞及其相應(yīng)的出現(xiàn)次數(shù)。
      依據(jù)本發(fā)明實(shí)施例,設(shè)定條件可以是一既定次數(shù)下限,而出現(xiàn)次數(shù)大于既定次數(shù)下限的候選字詞則選擇為關(guān)鍵詞,并登錄至關(guān)鍵詞數(shù)據(jù)庫(kù)。此外,處理器還可將候選字詞依據(jù)其相應(yīng)的出現(xiàn)次數(shù)進(jìn)行排序。此時(shí),設(shè)定條件可以是一排序名次下限,而排序大于排序名次下限的候選字詞則選擇為關(guān)鍵詞,并登錄至關(guān)鍵詞數(shù)據(jù)庫(kù)。


      為使本發(fā)明的上述目的、特征和優(yōu)點(diǎn)能更明顯易懂,下文特舉實(shí)施例,并配合所附圖示,進(jìn)行詳細(xì)說(shuō)明如下圖1是顯示熟知文章關(guān)鍵詞的剖析與登錄方法的示意圖。
      圖2為一示意圖,顯示依據(jù)本發(fā)明實(shí)施例的文章關(guān)鍵詞登錄系統(tǒng)的系統(tǒng)架構(gòu)。
      圖3是顯示依據(jù)本發(fā)明實(shí)施例的文章關(guān)鍵詞登錄方法的流程圖。
      具體實(shí)施例方式
      圖2為一示意圖,顯示依據(jù)本發(fā)明實(shí)施例的文章關(guān)鍵詞登錄系統(tǒng)的系統(tǒng)架構(gòu)。
      依據(jù)本發(fā)明實(shí)施例的文章關(guān)鍵詞登錄系統(tǒng),包括一數(shù)據(jù)儲(chǔ)存裝置200與一處理器210。數(shù)據(jù)儲(chǔ)存裝置200中具有一同義詞庫(kù)201、一符號(hào)庫(kù)202、一虛字詞庫(kù)203、一關(guān)鍵詞數(shù)據(jù)庫(kù)204、與一同義詞緩沖區(qū)205。
      同義詞庫(kù)201中紀(jì)錄同義字詞間的對(duì)應(yīng)關(guān)系,例如同義于“VIA”的同義詞有“VIA Tech”與“VIA Technologies,Inc.”等。符號(hào)庫(kù)202中紀(jì)錄一些特殊符號(hào),如標(biāo)點(diǎn)符號(hào)等。虛字詞庫(kù)203中紀(jì)錄一般文章中不具任何意義的虛詞,如動(dòng)詞、形容詞、副詞、助詞、或其它不具意義的字詞,舉例來(lái)說(shuō),“a”、“is”、“on”與“he”等等。關(guān)鍵詞數(shù)據(jù)庫(kù)204中則可用以存放剖析出的關(guān)鍵詞。
      處理器210可以將文章與同義詞庫(kù)201進(jìn)行對(duì)比,進(jìn)而將文章中與同義詞庫(kù)201中所紀(jì)錄相同的同義詞由文章之中刪除,且紀(jì)錄文章中同義詞出現(xiàn)的次數(shù),并將與同義詞同義的字詞與同義詞出現(xiàn)的次數(shù)紀(jì)錄于同義詞緩沖區(qū)205之中。
      處理器210可以將文章與符號(hào)庫(kù)202進(jìn)行對(duì)比,進(jìn)而將文章中與符號(hào)庫(kù)202中所紀(jì)錄相同的符號(hào)由文章之中刪除。處理器210還可將文章與虛字詞庫(kù)203進(jìn)行對(duì)比,進(jìn)而將文章中與虛字詞庫(kù)203中所紀(jì)錄相同的虛字刪除。
      接著,處理器210計(jì)算文章中所有剩下的字詞所出現(xiàn)的次數(shù),從而得到多個(gè)候選字詞與其相應(yīng)的出現(xiàn)次數(shù)。之后,處理器210將同義詞緩沖區(qū)205中紀(jì)錄的與同義詞同義的字詞及同義詞出現(xiàn)的次數(shù)加入相應(yīng)候選字詞及其相應(yīng)的出現(xiàn)次數(shù)。
      最后,處理器210將候選字詞依據(jù)其出現(xiàn)次數(shù)進(jìn)行排序,并依據(jù)一設(shè)定條件,如一既定次數(shù)下限(如,出現(xiàn)次數(shù)為10次以上)或一排序名次下限(如,前5名),由候選字詞中選擇關(guān)鍵詞,并將選取的關(guān)鍵詞登錄至關(guān)鍵詞數(shù)據(jù)庫(kù)204中。
      圖3是顯示依據(jù)本發(fā)明實(shí)施例的文章關(guān)鍵詞登錄方法的流程圖。參考圖2與圖3,依據(jù)本發(fā)明實(shí)施例的文章關(guān)鍵詞登錄方法將說(shuō)明于下。
      依據(jù)本發(fā)明實(shí)施例的文章關(guān)鍵詞登錄方法,首先,如步驟S30,接收一文章,接著,如步驟S31,將文章與同義詞庫(kù)201進(jìn)行對(duì)比,進(jìn)而將文章中與同義詞庫(kù)201中所紀(jì)錄相同的同義詞由文章之中刪除,且紀(jì)錄文章中同義詞出現(xiàn)的次數(shù),并將與同義詞同義的字詞與同義詞出現(xiàn)的次數(shù)紀(jì)錄于同義詞緩沖區(qū)205之中。
      接著,如步驟S32,將文章與符號(hào)庫(kù)202進(jìn)行對(duì)比,進(jìn)而將文章中與符號(hào)庫(kù)202中所紀(jì)錄相同的符號(hào)刪除。并如步驟S33,將文章與符號(hào)庫(kù)203進(jìn)行對(duì)比,進(jìn)而將文章中與虛字詞庫(kù)203中所紀(jì)錄相同的虛字刪除。
      之后,如步驟S34,計(jì)算文章中所有剩下的字詞所出現(xiàn)的次數(shù),從而得到多個(gè)候選字詞與其相應(yīng)的出現(xiàn)次數(shù)。接著,如步驟S35,將同義詞緩沖區(qū)205中紀(jì)錄的與同義詞同義的字詞及同義詞出現(xiàn)的次數(shù)加入相應(yīng)候選字詞及其相應(yīng)的出現(xiàn)次數(shù)。
      最后,如步驟S36,將候選字詞依據(jù)其出現(xiàn)次數(shù)進(jìn)行排序,并如步驟S37,依據(jù)設(shè)定條件,如既定次數(shù)下限或排序名次下限,由候選字詞中選擇符合設(shè)定條件的關(guān)鍵詞,并如步驟S38,將選取的關(guān)鍵詞登錄至關(guān)鍵詞數(shù)據(jù)庫(kù)204之中。
      其中,設(shè)定條件若是既定次數(shù)下限,則出現(xiàn)次數(shù)大于既定次數(shù)下限的候選字詞便會(huì)被選擇為關(guān)鍵詞,并登錄至關(guān)鍵詞數(shù)據(jù)庫(kù)204中。而設(shè)定條件若是排序名次下限,則排序大于排序名次下限的候選字詞便會(huì)被選擇為關(guān)鍵詞,并登錄至關(guān)鍵詞數(shù)據(jù)庫(kù)204中。
      值得注意的是,在本發(fā)明實(shí)施例中,由于步驟S31、步驟S32、與步驟S33對(duì)于文章刪除的標(biāo)的不同,且是分別獨(dú)立地,因此其順序可以相互的變更。此外,若設(shè)定條件僅是既定次數(shù)下限時(shí),則步驟S36(將候選字詞依據(jù)其出現(xiàn)次數(shù)進(jìn)行排序)則可以省略。
      另外,依據(jù)另一型態(tài),由于提供符號(hào)庫(kù)202與虛字詞庫(kù)203的目的為相同,即由文章中刪去特殊符號(hào)與虛字,因此,符號(hào)庫(kù)202與虛字詞庫(kù)203亦可結(jié)合為一個(gè)字詞庫(kù),其中紀(jì)錄文章中必須刪除的符號(hào)與字詞。
      接下來(lái),舉一實(shí)例進(jìn)行說(shuō)明。
      假設(shè)一文章原文如下文章原文

      另外,同義詞庫(kù)如下同義詞庫(kù)

      首先,文章經(jīng)過(guò)同義詞庫(kù)對(duì)比之后,文章中與同義詞庫(kù)中紀(jì)錄的同義詞,如“VIA Technologies,Inc”會(huì)被刪除,并計(jì)算其于文章中出現(xiàn)的次數(shù)。之后,再將與此同義詞同一的字詞“VIA”與出現(xiàn)次數(shù)紀(jì)錄至同義詞緩沖區(qū),如下所示同義詞緩沖區(qū)

      刪除同義詞后的文章如下所示文章


      假設(shè)符號(hào)庫(kù)與虛字詞庫(kù)如下所示符號(hào)庫(kù)

      虛字詞庫(kù)

      文章再經(jīng)過(guò)符號(hào)庫(kù)與虛字詞庫(kù)對(duì)比且刪除符號(hào)與虛字之后,文章如下所示文章

      之后,計(jì)算文章中所有剩下字詞所出現(xiàn)的次數(shù),因此,候選字詞及其出現(xiàn)次數(shù)(括號(hào)內(nèi))如下候選字詞

      之后,加入同義詞緩沖區(qū)內(nèi)的數(shù)據(jù)候選字詞

      接著,依據(jù)每一候選字詞的出現(xiàn)次數(shù)進(jìn)行排序,排序結(jié)果如下排序結(jié)果

      最后,便可依據(jù)設(shè)定條件,由候選字詞中選擇符合設(shè)定條件的關(guān)鍵詞,并將選取的關(guān)鍵詞登錄至關(guān)鍵詞數(shù)據(jù)庫(kù)之中。其中,若設(shè)定條件是于文章中出現(xiàn)3次以上,則“processor”、“VIA”、與“1GHz”便會(huì)被選擇為關(guān)鍵詞,并登錄至關(guān)鍵詞數(shù)據(jù)庫(kù)。而若設(shè)定條件是排序名次4以上,則“processor”、“VIA”、“1GHz”與“C3”便會(huì)被選擇為關(guān)鍵詞,并登錄至關(guān)鍵詞數(shù)據(jù)庫(kù)中。
      此外,依據(jù)本發(fā)明另一變形,亦可以編碼于計(jì)算機(jī)讀取媒介中的計(jì)算機(jī)程序來(lái)致能計(jì)算機(jī)進(jìn)行文章關(guān)鍵詞登錄,如本發(fā)明實(shí)施例所述。
      因此,藉由本發(fā)明所提供的文章關(guān)鍵詞登錄系統(tǒng)及方法,可以自動(dòng)將文章中重復(fù)出現(xiàn)的關(guān)鍵詞進(jìn)行登錄。此外,本發(fā)明亦可對(duì)于文章中的同義字詞自動(dòng)進(jìn)行辨認(rèn),以增加關(guān)鍵詞剖析的正確性。
      雖然本發(fā)明已以較佳實(shí)施例公開如上,然其并非用以限定本發(fā)明,任何本領(lǐng)域技術(shù)人員,在不脫離本發(fā)明的精神和范圍內(nèi),當(dāng)可做些許更動(dòng)與潤(rùn)飾,因此本發(fā)明的保護(hù)范圍當(dāng)視后附的申請(qǐng)專利范圍所界定者為準(zhǔn)。
      權(quán)利要求
      1.一種文章關(guān)鍵詞登錄系統(tǒng),包括一數(shù)據(jù)儲(chǔ)存裝置,具有一符號(hào)庫(kù)、一虛字詞庫(kù)與一關(guān)鍵詞數(shù)據(jù)庫(kù);以及一處理器,將一文章與該符號(hào)庫(kù)進(jìn)行對(duì)比,進(jìn)而將該文章中與該符號(hào)庫(kù)中所紀(jì)錄相同的符號(hào)刪除,并將該文章與該虛字詞庫(kù)進(jìn)行對(duì)比,進(jìn)而將該文章中與該虛字詞庫(kù)中所紀(jì)錄相同的虛字刪除,之后,計(jì)算該文章中所有字詞出現(xiàn)的次數(shù),從而得到多個(gè)候選字詞與其相應(yīng)的出現(xiàn)次數(shù),最后,依據(jù)一設(shè)定條件由所述候選字詞中選擇多個(gè)關(guān)鍵詞,并將所述關(guān)鍵詞登錄至該關(guān)鍵詞數(shù)據(jù)庫(kù)。
      2.如權(quán)利要求1所述的文章關(guān)鍵詞登錄系統(tǒng),其中該數(shù)據(jù)儲(chǔ)存裝置還具有一同義詞庫(kù),且該處理器還將該文章與該同義詞庫(kù)進(jìn)行對(duì)比,進(jìn)而將該文章中與該同義詞庫(kù)中所紀(jì)錄相同的同義詞刪除,且紀(jì)錄該文章中該同義詞出現(xiàn)的次數(shù),并將與該同義詞同義的字詞與該同義詞出現(xiàn)的次數(shù)紀(jì)錄于一同義詞緩沖區(qū)。
      3.如權(quán)利要求2所述的文章關(guān)鍵詞登錄系統(tǒng),其中該處理器還包括將該同義詞緩沖區(qū)中紀(jì)錄的與同義詞同義的字詞及同義詞出現(xiàn)的次數(shù)加入相應(yīng)候選字詞及其相應(yīng)的出現(xiàn)次數(shù)。。
      4.如權(quán)利要求1所述的文章關(guān)鍵詞登錄系統(tǒng),其中該設(shè)定條件為一既定次數(shù)下限,且出現(xiàn)次數(shù)大于該既定次數(shù)下限的所述候選字詞方選擇為所述關(guān)鍵詞,并登錄至該關(guān)鍵詞數(shù)據(jù)庫(kù)。
      5.如權(quán)利要求1所述的文章關(guān)鍵詞登錄系統(tǒng),其中該設(shè)定條件為一排序名次下限,且該處理器還將所述候選字詞依據(jù)其相應(yīng)的出現(xiàn)次數(shù)進(jìn)行排序,其中排序大于該排序名次下限的所述候選字詞方選擇為所述關(guān)鍵詞,并登錄至該關(guān)鍵詞數(shù)據(jù)庫(kù)。
      6.一種文章關(guān)鍵詞登錄方法,包括下列步驟接收一文章;將該文章與一符號(hào)庫(kù)進(jìn)行對(duì)比,進(jìn)而將該文章中與該符號(hào)庫(kù)中所紀(jì)錄相同的符號(hào)刪除;將該文章與一虛字詞庫(kù)進(jìn)行對(duì)比,進(jìn)而將該文章中與該虛字詞庫(kù)中所紀(jì)錄相同的虛字刪除;計(jì)算該文章中所有字詞出現(xiàn)的次數(shù),從而得到多個(gè)候選字詞與其相應(yīng)的出現(xiàn)次數(shù);依據(jù)一設(shè)定條件由所述候選字詞中選擇多個(gè)關(guān)鍵詞;以及將所述關(guān)鍵詞登錄至一關(guān)鍵詞數(shù)據(jù)庫(kù)中。
      7.如權(quán)利要求6所述的文章關(guān)鍵詞登錄方法,還包括下列步驟將該文章與一同義詞庫(kù)進(jìn)行對(duì)比,進(jìn)而將該文章中與該同義詞庫(kù)中所紀(jì)錄相同的同義詞刪除;紀(jì)錄該文章中該同義詞出現(xiàn)的次數(shù);以及將與該同義詞同義的字詞與該同義詞出現(xiàn)的次數(shù)紀(jì)錄于一同義詞緩沖區(qū)。
      8.如權(quán)利要求7所述的文章關(guān)鍵詞登錄方法,還包括將該同義詞緩沖區(qū)中紀(jì)錄的與同義詞同義的字詞及同義詞出現(xiàn)的次數(shù)加入相應(yīng)候選字詞及其相應(yīng)的出現(xiàn)次數(shù)。
      9.如權(quán)利要求6所述的文章關(guān)鍵詞登錄方法,其中該設(shè)定條件為一既定次數(shù)下限,且出現(xiàn)次數(shù)大于該既定次數(shù)下限的所述候選字詞方選擇為所述關(guān)鍵詞,并登錄至該關(guān)鍵詞數(shù)據(jù)庫(kù)。
      10.如權(quán)利要求6所述的文章關(guān)鍵詞登錄方法,其中該設(shè)定條件為一排序名次下限,且還包括將所述候選字詞依據(jù)其相應(yīng)的出現(xiàn)次數(shù)進(jìn)行排序,其中排序大于該排序名次下限的所述候選字詞方選擇為所述關(guān)鍵詞,并登錄至該關(guān)鍵詞數(shù)據(jù)庫(kù)。
      全文摘要
      一種文章關(guān)鍵詞登錄系統(tǒng),包括具有一符號(hào)庫(kù)、一虛字詞庫(kù)與一關(guān)鍵詞數(shù)據(jù)庫(kù)的數(shù)據(jù)儲(chǔ)存裝置與一處理器。處理器將一文章與符號(hào)庫(kù)進(jìn)行對(duì)比,進(jìn)而將文章中與符號(hào)庫(kù)中所紀(jì)錄相同的符號(hào)刪除,并將文章中與虛字詞庫(kù)中所紀(jì)錄相同的虛字刪除,之后,計(jì)算文章中所有字詞出現(xiàn)的次數(shù),從而得到多個(gè)候選字詞與其相應(yīng)的出現(xiàn)次數(shù),最后,依據(jù)一設(shè)定條件由候選字詞中選擇多個(gè)關(guān)鍵詞,并將選取的關(guān)鍵詞登錄至關(guān)鍵詞數(shù)據(jù)庫(kù)。
      文檔編號(hào)G06F17/20GK1480875SQ02131859
      公開日2004年3月10日 申請(qǐng)日期2002年9月6日 優(yōu)先權(quán)日2002年9月6日
      發(fā)明者陳丁豪, 賴文樹 申請(qǐng)人:威盛電子股份有限公司
      網(wǎng)友詢問(wèn)留言 已有0條留言
      • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1