国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種文件的分類及檢索方法

      文檔序號(hào):6551319閱讀:344來(lái)源:國(guó)知局
      一種文件的分類及檢索方法
      【專利摘要】本發(fā)明提供了一種文件的分類方法,包括以下步驟:A、為已獲取文件添加索引,并對(duì)所述文件的內(nèi)容進(jìn)行分詞;B、將分詞中達(dá)到設(shè)定活躍度的詞語(yǔ)作為所述文件的標(biāo)簽;C、創(chuàng)建數(shù)量與所述文件的標(biāo)簽數(shù)量相同的文件夾,并將所述標(biāo)簽分別分配給所述文件夾,作為所述文件夾的屬性使用;D、創(chuàng)建數(shù)量與所述文件的標(biāo)簽相同且通過(guò)所述文件索引與所述文件的物理存儲(chǔ)地址相關(guān)聯(lián)的所述文件的快捷方式,并以各所述標(biāo)簽分別標(biāo)識(shí)所述文件的快捷方式;E、將所述文件的快捷方式分別放入與其標(biāo)簽對(duì)應(yīng)的所述文件夾中。以解決現(xiàn)有文件分類技術(shù)中存在的問(wèn)題。
      【專利說(shuō)明】一種文件的分類及檢索方法

      【技術(shù)領(lǐng)域】
      [0001]本發(fā)明涉及一種文件的分類及檢索方法。

      【背景技術(shù)】
      [0002]在現(xiàn)有的業(yè)務(wù)系統(tǒng)的文件分類檢索方法中,一般根據(jù)文件類型和文件自身的屬性來(lái)創(chuàng)建與文件屬性相同的文件夾來(lái)存儲(chǔ)文件。這其中,文件屬性和文件類型是固定不變的。由于一份文件有可能同時(shí)存在于多個(gè)文件夾下,這樣在查找文件時(shí)需要根據(jù)文件的屬性來(lái)執(zhí)行文件的查找。
      [0003]根據(jù)文件自身屬性創(chuàng)建文件夾,會(huì)限制文件夾類型,使文件夾分類層次和分類特征固定化,導(dǎo)致文件夾不能按照不同的應(yīng)用要求進(jìn)行文件分類,可擴(kuò)展性差。而且存在將屬性相同的同一份文件存放在多個(gè)文件夾下的情況,造成文件數(shù)據(jù)的冗余。此外,在同一文件夾下存放了大量同一屬性文件的情況下,會(huì)極大地影響文件查找速度。


      【發(fā)明內(nèi)容】

      [0004]有鑒于此,本發(fā)明的主要目的在于提供一種文件的分類及檢索方法,以解決現(xiàn)有技術(shù)中存在的上述問(wèn)題。
      [0005]本發(fā)明提供了一種文件的分類方法,包括以下步驟:
      [0006]A、為已獲取文件添加索引,并對(duì)所述文件的內(nèi)容進(jìn)行分詞;
      [0007]B、將分詞中達(dá)到設(shè)定活躍度的詞語(yǔ)作為所述文件的標(biāo)簽;
      [0008]C、創(chuàng)建數(shù)量與所述文件的標(biāo)簽數(shù)量相同的文件夾,并將所述標(biāo)簽分別分配給所述文件夾,作為所述文件夾的屬性使用;
      [0009]D、創(chuàng)建數(shù)量與所述文件的標(biāo)簽相同且通過(guò)所述文件索引與所述文件的物理存儲(chǔ)地址相關(guān)聯(lián)的所述文件的快捷方式,并以各所述標(biāo)簽分別標(biāo)識(shí)所述文件的快捷方式;
      [0010]E、將所述文件的快捷方式分別放入與其標(biāo)簽對(duì)應(yīng)的所述文件夾中。
      [0011]由上可以看出,根據(jù)文件內(nèi)容中的“活躍度”滿足一定標(biāo)準(zhǔn)的分詞作為文件夾標(biāo)簽,可以按照不同的應(yīng)用要求進(jìn)行文件分類。且同一份文件僅被存放在一個(gè)物理地址下的情況,不會(huì)造成文件數(shù)據(jù)的冗余。此外,在同一文件夾下只存放具有一種標(biāo)簽的文件快捷方式,因此會(huì)極大地提高文件查找速度。
      [0012]在上述的方法中,還包括:
      [0013]F、在所述文件的內(nèi)容發(fā)生變化時(shí),對(duì)所述文件的內(nèi)容重新進(jìn)行分詞,然后返回上述步驟B,以重新確定所述文件的標(biāo)簽和更新所述文件對(duì)應(yīng)的所述文件夾及所述文件的快捷方式。
      [0014]由上可以看出,文件的標(biāo)簽可隨著文件內(nèi)容的變化而更新,由此可實(shí)時(shí)增減對(duì)應(yīng)文件夾及文件快捷方式的數(shù)量。
      [0015]在上述的方法中,所述分詞的方法為機(jī)械分詞法。
      [0016]在上述的方法中,所述活躍度是詞語(yǔ)的使用頻率。
      [0017]在上述的方法中,所述活躍度是詞語(yǔ)出現(xiàn)頻率大于一定值的度量。
      [0018]本發(fā)明還提供了一種基于上述任意一項(xiàng)所述文件分類方法的文件檢索方法,其特征在于,包括以下步驟:
      [0019]根據(jù)輸入的關(guān)鍵詞檢索所述文件夾的屬性:如果命中,則返回該文件夾中的文件快捷方式;
      [0020]否則,根據(jù)輸入的關(guān)鍵詞檢索所述文件的快捷方式:如果命中,則返回對(duì)應(yīng)的文件快捷方式,否則,退出檢索。

      【專利附圖】

      【附圖說(shuō)明】
      [0021]圖1為本發(fā)明的文件分類方法的流程圖。

      【具體實(shí)施方式】
      [0022]下面結(jié)合附圖,詳細(xì)介紹以下本發(fā)明提供的一種文件的分類及檢索方法。
      [0023]如圖1所示,上述文件的分類方法包括以下步驟:
      [0024]步驟100:為已獲取文件添加索引,并對(duì)該文件的內(nèi)容進(jìn)行分詞。
      [0025]在本實(shí)施例中,可采用一些常用的分詞方法對(duì)文件的內(nèi)容進(jìn)行分詞,例如,基于字典、詞庫(kù)匹配的分詞方法(機(jī)械分詞法)。
      [0026]這種方法按照一定策略將待分析的漢字串與一個(gè)“充分大的”機(jī)器詞典中的詞條進(jìn)行匹配,若在詞典中找到某個(gè)字符串,則匹配成功。識(shí)別出一個(gè)詞,根據(jù)掃描方向的不同分為正向匹配和逆向匹配。根據(jù)不同長(zhǎng)度優(yōu)先匹配的情況,分為最大(最長(zhǎng))匹配和最小(最短)匹配。根據(jù)與詞性標(biāo)注過(guò)程是否相結(jié)合,又可以分為單純分詞方法和分詞與標(biāo)注相結(jié)合的一體化方法。常用的方法如最大正向匹配法、逆向最大匹配法、最少切分法:使每一句中切出的詞數(shù)最小及雙向匹配法。由于上述分詞方法較為常用,故在此不再贅述。
      [0027]步驟200:將分詞中“活躍度”較高的詞語(yǔ)作為文件的標(biāo)簽。
      [0028]在本實(shí)施例中,所謂詞語(yǔ)的“活躍度”可意指詞語(yǔ)的使用頻率(即在文件中出現(xiàn)的次數(shù))。可按照“活躍度”由高至低的順序,依次選出多個(gè)詞語(yǔ),分別作為文件的多個(gè)標(biāo)簽。例如,在文件內(nèi)容中,“世界杯”、“巴西”、“奪冠”三個(gè)詞出現(xiàn)的頻率排在該內(nèi)容中所有詞語(yǔ)的前三位,則以分別以這三個(gè)詞作為文件的標(biāo)簽?;蛘?,將出現(xiàn)頻率大于一定值的詞語(yǔ)作為具有高“活躍度”標(biāo)簽使用。
      [0029]步驟300:創(chuàng)建與文件標(biāo)簽數(shù)量相對(duì)應(yīng)的文件夾,并以各標(biāo)簽作為文件夾屬性,分別分配給新建的文件夾。
      [0030]以上述標(biāo)簽為例,創(chuàng)建三個(gè)屬性分別為“世界杯”、“巴西”和“奪冠”的文件夾。
      [0031]步驟400:按照標(biāo)簽的數(shù)量,創(chuàng)建通過(guò)文件索引與上述文件物理存儲(chǔ)地址相關(guān)聯(lián)的上述文件的快捷方式,并以各標(biāo)簽分別標(biāo)識(shí)文件的快捷方式。
      [0032]例如,所述文件具有三個(gè)文件標(biāo)簽,則創(chuàng)建三個(gè)快捷方式。通過(guò)向文件快捷方式中添加邏輯關(guān)聯(lián)標(biāo)識(shí),將文件快捷方式與文件索引建立邏輯關(guān)聯(lián)關(guān)系,本例中,分別以標(biāo)簽“世界杯”、“巴西”和“奪冠”標(biāo)識(shí)所述文件的三個(gè)快捷方式。
      [0033]步驟500:將所述文件的快捷方式分別放入與其標(biāo)簽對(duì)應(yīng)的文件夾中。
      [0034]例如,屬性為“世界杯”的文件夾內(nèi)存放標(biāo)簽為“世界杯”的文件快捷方式,屬性為“巴西”的文件夾內(nèi)存放標(biāo)簽為“巴西”的文件快捷方式,以此類推。
      [0035]步驟600:在文件內(nèi)容發(fā)生變化時(shí),對(duì)該文件的內(nèi)容重新進(jìn)行分詞,然后返回上述步驟200,重新確定文件標(biāo)簽,以實(shí)時(shí)更新該文件對(duì)應(yīng)的文件夾及文件快捷方式。
      [0036]在本實(shí)施例中,如果文件內(nèi)容發(fā)生變化后,“意大利” 一詞也滿足作為標(biāo)簽的條件(具有高“活躍度”),則將“意大利”一詞作為該文件的新標(biāo)簽,創(chuàng)建一個(gè)新的文件屬性為“意大利”的文件以及一個(gè)以標(biāo)簽“意大利”標(biāo)識(shí)的文件快捷方式,并將該快捷方式放入這一新文件中。對(duì)于其他未發(fā)生變化的標(biāo)簽則不作任何變動(dòng)。具體步驟同上,不再贅述。這樣便實(shí)現(xiàn)了隨文件內(nèi)容變化實(shí)時(shí)更新文件分類的目的。
      [0037]基于上述文件分類方法,本發(fā)明還提供一種文件檢索方法,該方法包括以下步驟:
      [0038]首先,根據(jù)輸入的關(guān)鍵詞檢索上述文件夾的屬性。如果命中(具有與上述關(guān)鍵詞對(duì)應(yīng)的文件夾屬性),則返回其中的文件快捷方式;否則,根據(jù)輸入的關(guān)鍵詞檢索上述文件快捷方式:如果命中,則返回對(duì)應(yīng)的文件快捷方式,否則,退出檢索。
      [0039]在上述檢索過(guò)程中,不同的檢索條件可能對(duì)應(yīng)于不同的文件夾(具有不同的文件夾屬性),而不同文件夾雖然存放不同的文件快捷方式,但這些快捷方式可能同時(shí)指向一個(gè)文件(具體原因參照上文)。這樣,在檢索文件過(guò)程中,只需檢索文件夾或文件快捷方式便可找到對(duì)應(yīng)文件的物理地址,而無(wú)需直接檢索文件的物理地址。這樣大大節(jié)省了檢索時(shí)間,提高了檢索效率。
      [0040]以上所述僅為本發(fā)明的較佳實(shí)施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
      【權(quán)利要求】
      1.一種文件的分類方法,其特征在于,包括以下步驟: A、為已獲取文件添加索引,并對(duì)所述文件的內(nèi)容進(jìn)行分詞; B、將分詞中達(dá)到設(shè)定活躍度的詞語(yǔ)作為所述文件的標(biāo)簽; C、創(chuàng)建數(shù)量與所述文件的標(biāo)簽數(shù)量相同的文件夾,并將所述標(biāo)簽分別分配給所述文件夾,作為所述文件夾的屬性使用; D、創(chuàng)建數(shù)量與所述文件的標(biāo)簽相同且通過(guò)所述文件索引與所述文件的物理存儲(chǔ)地址相關(guān)聯(lián)的所述文件的快捷方式,并以各所述標(biāo)簽分別標(biāo)識(shí)所述文件的快捷方式; E、將所述文件的快捷方式分別放入與其標(biāo)簽對(duì)應(yīng)的所述文件夾中。
      2.根據(jù)權(quán)利要求1所述的方法,其特征在于,還包括: F、在所述文件的內(nèi)容發(fā)生變化時(shí),對(duì)所述文件的內(nèi)容重新進(jìn)行分詞,然后返回上述步驟B,以重新確定所述文件的標(biāo)簽和更新所述文件對(duì)應(yīng)的所述文件夾及所述文件的快捷方式。
      3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述分詞的方法為機(jī)械分詞法。
      4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述活躍度是詞語(yǔ)的使用頻率。
      5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述活躍度是詞語(yǔ)出現(xiàn)頻率大于一定值的度量。
      6.一種基于上述任意一項(xiàng)所述文件分類方法的文件檢索方法,其特征在于,包括以下步驟: 根據(jù)輸入的關(guān)鍵詞檢索所述文件夾的屬性:如果命中,則返回該文件夾中的文件快捷方式; 否則,根據(jù)輸入的關(guān)鍵詞檢索所述文件的快捷方式:如果命中,則返回對(duì)應(yīng)的文件快捷方式,否則,退出檢索。
      【文檔編號(hào)】G06F17/30GK104077385SQ201410301532
      【公開日】2014年10月1日 申請(qǐng)日期:2014年6月27日 優(yōu)先權(quán)日:2014年6月27日
      【發(fā)明者】管延軍, 蔣紅宇, 鄭永瑩 申請(qǐng)人:北京海泰方圓科技有限公司
      網(wǎng)友詢問(wèn)留言 已有0條留言
      • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1