本公開涉及數(shù)據(jù)處理,尤其涉及文本數(shù)據(jù)的處理,具體涉及一種文本數(shù)據(jù)的處理方法及裝置、電子設(shè)備、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)和計(jì)算機(jī)程序產(chǎn)品。
背景技術(shù):
1、隨著互聯(lián)網(wǎng)業(yè)務(wù)與用戶量的增長,基于在線的文檔工具越來越普及。其中一些是企業(yè)內(nèi)網(wǎng)的在線文檔工具,還有一些是針對(duì)所有互聯(lián)網(wǎng)用戶的在線文檔工具,比如有道筆記、印象筆記等。
2、在線文檔在便利了人們的內(nèi)容編輯與共享交流的同時(shí),也暴露出來了一些問題,比如文檔創(chuàng)作者可能會(huì)在共享文檔中存放業(yè)務(wù)平臺(tái)登錄密碼、訪問憑證、在線支付密碼等不宜出現(xiàn)的信息。這些信息的內(nèi)容一旦存放到在線文檔中,容易泄露,從而造成用戶不必要的損失。
3、在此部分中描述的方法不一定是之前已經(jīng)設(shè)想到或采用的方法。除非另有指明,否則不應(yīng)假定此部分中描述的任何方法僅因其包括在此部分中就被認(rèn)為是現(xiàn)有技術(shù)。類似地,除非另有指明,否則此部分中提及的問題不應(yīng)認(rèn)為在任何現(xiàn)有技術(shù)中已被公認(rèn)。
技術(shù)實(shí)現(xiàn)思路
1、本公開提供了一種文本數(shù)據(jù)的處理方法及裝置、電子設(shè)備、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)和計(jì)算機(jī)程序產(chǎn)品。
2、根據(jù)本公開的一方面,提供了一種文本數(shù)據(jù)的處理方法,包括:對(duì)待處理文本進(jìn)行關(guān)鍵詞檢索,以確定待處理文本是否包括預(yù)設(shè)的關(guān)鍵詞集合中的關(guān)鍵詞;響應(yīng)于確定待處理文本包括關(guān)鍵詞集合中的至少一個(gè)關(guān)鍵詞,將待處理文本輸入到文本分類模型中,根據(jù)文本分類模型的預(yù)測(cè)結(jié)果確定待處理文本是否為包含重要信息的文本;響應(yīng)于確定待處理文本為包含重要信息的文本,至少根據(jù)待處理文本包括的關(guān)鍵詞確定待處理文本的相關(guān)系數(shù);以及根據(jù)相關(guān)系數(shù)對(duì)待處理文本中的至少部分字符進(jìn)行隱藏處理。
3、根據(jù)本公開的另一方面,提供了一種文本數(shù)據(jù)的處理裝置,包括:第一檢索單元,配置成對(duì)待處理文本進(jìn)行關(guān)鍵詞檢索,以確定待處理文本是否包括預(yù)設(shè)的關(guān)鍵詞集合中的關(guān)鍵詞;分類單元,配置成響應(yīng)于確定待處理文本包括關(guān)鍵詞集合中的至少一個(gè)關(guān)鍵詞,將待處理文本輸入到文本分類模型中,根據(jù)文本分類模型的預(yù)測(cè)結(jié)果確定待處理文本是否為包含重要信息的文本;確定單元,配置成響應(yīng)于確定待處理文本為包含重要信息的文本,至少根據(jù)待處理文本包括的關(guān)鍵詞確定待處理文本的相關(guān)系數(shù);以及處理單元,配置成根據(jù)相關(guān)系數(shù)對(duì)待處理文本中的至少部分字符進(jìn)行隱藏處理。
4、根據(jù)本公開的另一方面,提供了一種電子設(shè)備,包括:至少一個(gè)處理器;以及與至少一個(gè)處理器通信連接的存儲(chǔ)器;其中存儲(chǔ)器存儲(chǔ)有可被至少一個(gè)處理器執(zhí)行的指令,指令被至少一個(gè)處理器執(zhí)行,以使至少一個(gè)處理器能夠執(zhí)行上述的方法。
5、根據(jù)本公開的又一方面,提供了一種存儲(chǔ)有計(jì)算機(jī)指令的非瞬時(shí)計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其中,計(jì)算機(jī)指令用于使計(jì)算機(jī)執(zhí)行根據(jù)上述的方法。
6、根據(jù)本公開的又一方面,提供了一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序,其中,計(jì)算機(jī)程序在被處理器執(zhí)行時(shí)實(shí)現(xiàn)上述的方法。
7、根據(jù)本公開的一個(gè)或多個(gè)實(shí)施例,不僅可以檢測(cè)判斷待處理文本是否為包含重要信息的文本,還可以根據(jù)檢測(cè)結(jié)果對(duì)文本中的重要信息進(jìn)行一定程度的安全保護(hù)處理,從而進(jìn)一步確保了在線文本的安全性。
8、應(yīng)當(dāng)理解,本部分所描述的內(nèi)容并非旨在標(biāo)識(shí)本公開的實(shí)施例的關(guān)鍵或重要特征,也不用于限制本公開的范圍。本公開的其它特征將通過以下的說明書而變得容易理解。
1.一種文本數(shù)據(jù)的處理方法,包括:
2.根據(jù)權(quán)利要求1所述的方法,其中,所述至少根據(jù)所述待處理文本包括的所述關(guān)鍵詞確定所述待處理文本的相關(guān)系數(shù)包括:
3.根據(jù)權(quán)利要求2所述的方法,其中,所述根據(jù)所述待處理文本包括的所述關(guān)鍵詞的數(shù)量以及所述文本分類模型針對(duì)所述待處理文本輸出的置信度兩者共同確定所述待處理文本的相關(guān)系數(shù)包括:
4.根據(jù)權(quán)利要求1-3中任一項(xiàng)所述的方法,其中,在所述將所述待處理文本進(jìn)行文本分類,以確定所述待處理文本是否為包含重要信息的文本之前還包括:
5.根據(jù)權(quán)利要求4所述的方法,其中,所述預(yù)設(shè)類型的字符串包括以下至少一種:
6.根據(jù)權(quán)利要求5所述的方法,還包括:
7.根據(jù)權(quán)利要求4所述的方法,其中,所述根據(jù)所述相關(guān)系數(shù)對(duì)所述待處理文本中的至少部分字符進(jìn)行隱藏處理包括:
8.一種文本數(shù)據(jù)的處理裝置,包括:
9.根據(jù)權(quán)利要求8所述的裝置,其中,所述確定單元還配置成:
10.根據(jù)權(quán)利要求9所述的裝置,其中,所述確定單元還包括:
11.根據(jù)權(quán)利要求8-10中任一項(xiàng)所述的裝置,還包括:
12.根據(jù)權(quán)利要求11所述的裝置,還包括:
13.根據(jù)權(quán)利要求11所述的裝置,其中,所述處理單元還配置成:
14.一種電子設(shè)備,包括:
15.一種存儲(chǔ)有計(jì)算機(jī)指令的非瞬時(shí)計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其中,所述計(jì)算機(jī)指令用于使所述計(jì)算機(jī)執(zhí)行根據(jù)權(quán)利要求1-7中任一項(xiàng)所述的方法。
16.一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序,其中,所述計(jì)算機(jī)程序在被處理器執(zhí)行時(shí)實(shí)現(xiàn)權(quán)利要求1-7中任一項(xiàng)所述的方法。