国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種信息分類方法及裝置的制造方法

      文檔序號:10725096閱讀:449來源:國知局
      一種信息分類方法及裝置的制造方法
      【專利摘要】本發(fā)明公開了一種信息分類方法及裝置,涉及信息分類領(lǐng)域,所述方法包括:根據(jù)目標(biāo)文本的分詞結(jié)果中的特征詞,確定所述分詞結(jié)果對應(yīng)的特征序列;確定所述特征序列中與自定義的公共對象庫中的特征對象匹配的特征對象;根據(jù)所述特征碼中的特征對象確定所述目標(biāo)文本的類別屬性。通過分詞結(jié)果對應(yīng)的特征序列進(jìn)行匹配,提高了分類準(zhǔn)確度,通過自定義的公共對象庫中的特征對象進(jìn)行匹配實(shí)現(xiàn)了分類的靈活性,提高了目標(biāo)文本分類的效率。
      【專利說明】
      _種信息分類方法及裝置
      技術(shù)領(lǐng)域
      [0001 ]本發(fā)明涉信息分類領(lǐng)域,尤其涉及一種信息分類方法及裝置。
      【背景技術(shù)】
      [0002] 伴隨信息技術(shù)的飛速發(fā)展,特別是移動通信技術(shù)和計算機(jī)互聯(lián)網(wǎng)技術(shù)飛速發(fā)展, 移動通信網(wǎng)絡(luò)已經(jīng)發(fā)生了革命性的變革。信息中蘊(yùn)含著巨大的信息內(nèi)容和價值,面對信息 的數(shù)據(jù)量增長等問題,人們提出了對信息進(jìn)行分類的需求,以便對分類后的信息或與信息 相對應(yīng)的對象進(jìn)行處理和分析。
      [0003] 現(xiàn)有技術(shù)中,對信息的分類方法主要是更具人工定義好特定的短信模版,然后建 立正則表達(dá)式處理,結(jié)構(gòu)化出所需數(shù)據(jù)項(xiàng),并對模版進(jìn)行數(shù)據(jù)集的分類。具體來說,對信息 的分類方法主要有兩種,一種是根據(jù)關(guān)鍵詞進(jìn)行判斷,即首先人工的對所有信息進(jìn)行歸類, 然后在對每類信息提取特定的關(guān)鍵詞作為入此數(shù)據(jù)集的標(biāo)識。但是上述方法中,不同數(shù)據(jù) 集的信息有可能都會匹配到同一個或一組關(guān)鍵詞,造成分類不準(zhǔn)確。
      [0004] 另一種方法是對每個信息定義正則表達(dá)式,并對每一條正則表達(dá)式定義數(shù)據(jù)集。 即為每一個信息都進(jìn)行一次分類,但是上述方法中,需要對每一個信息定義正則表達(dá)式,隨 著信息量的不斷增加,工作量激增,分類的效率不高。
      [0005] 總體來說,現(xiàn)有技術(shù)中的對信息的分類方法,分類的精度低,效率不高。

      【發(fā)明內(nèi)容】

      [0006] 本發(fā)明提供一種信息分類方法及裝置,用于解決現(xiàn)有技術(shù)中的對信息的分類方 法,分類的精度低,效率不高的問題。
      [0007] 本發(fā)明實(shí)施例提供一種信息分類方法,所述方法包括:
      [0008] 根據(jù)目標(biāo)文本的分詞結(jié)果中的特征詞,確定所述分詞結(jié)果對應(yīng)的特征序列;
      [0009] 確定所述特征序列中與自定義的公共對象庫中的特征對象匹配的特征對象;
      [0010] 根據(jù)所述特征碼中的特征對象確定所述目標(biāo)文本的類別屬性。
      [0011] 本發(fā)明實(shí)施例中,根據(jù)目標(biāo)文本的分詞結(jié)果中的特征詞確定分詞結(jié)果對應(yīng)的特征 序列,并根據(jù)特征序列匹配特征對象,根據(jù)確定的特征對象確定目標(biāo)文本的類別屬性,在本 發(fā)明實(shí)施例中,通過分詞結(jié)果對應(yīng)的特征序列進(jìn)行匹配,提高了分類準(zhǔn)確度,通過自定義的 公共對象庫中的特征對象進(jìn)行匹配實(shí)現(xiàn)了分類的靈活性,提高了目標(biāo)文本分類的效率。
      [0012] 進(jìn)一步地,所述根據(jù)目標(biāo)文本的分詞結(jié)果中的特征詞,確定所述分詞結(jié)果對應(yīng)的 特征序列,包括:
      [0013] 根據(jù)特征詞與特征碼的對應(yīng)關(guān)系,確定所述分詞結(jié)果中所述特征詞對應(yīng)的特征 碼。
      [0014] 本發(fā)明實(shí)施例中,確定分詞結(jié)果中的特征詞并將所述特征詞用特征碼來表示,能 夠有效的對目標(biāo)文本進(jìn)行初步分類,提高目標(biāo)文本分類的準(zhǔn)確度。
      [0015] 進(jìn)一步地,所述根據(jù)所述分詞結(jié)果中的特征標(biāo)記確定所述分詞結(jié)果對應(yīng)的特征序 列,包括:
      [0016] 根據(jù)所述分詞結(jié)果中的特征詞的順序,將所述分詞結(jié)果中特征詞對應(yīng)的特征碼組 合成所述特征序列。
      [0017] 本發(fā)明實(shí)施例中,根據(jù)特征詞將目標(biāo)文本的分詞結(jié)果轉(zhuǎn)化為特征序列,再將特征 序列進(jìn)行分類能夠有效的提高分類的準(zhǔn)確度。
      [0018] 進(jìn)一步地,所述根據(jù)所述特征碼中的特征對象確定所述目標(biāo)文本的類別屬性,包 括:
      [0019] 根據(jù)所述特征碼中特征對象的屬性,確定所述特征碼對應(yīng)的類別屬性;
      [0020] 將所述特征碼對應(yīng)的類別屬性確定為所述特征碼對應(yīng)的所述目標(biāo)文本的類型屬 性。
      [0021 ]本發(fā)明實(shí)施例中,根據(jù)特征碼中特征對象的屬性對應(yīng)的類別屬性確定為目標(biāo)文本 的類別屬性,提高了目標(biāo)文本分類的準(zhǔn)確性。
      [0022] 進(jìn)一步地,所述目標(biāo)文本按照下列步驟進(jìn)行分詞:
      [0023] 根據(jù)所述目標(biāo)文本中的特征信息,確定所述目標(biāo)文本對應(yīng)的初步分詞文本;
      [0024] 根據(jù)特定字符對所述初步分詞文本進(jìn)行分詞,得到所述目標(biāo)文本的分詞結(jié)果;其 中,所述目標(biāo)文本由所述特征信息構(gòu)成。
      [0025] 本發(fā)明實(shí)施例中,不需要詞典庫和語料庫可以正確對目標(biāo)文本進(jìn)行分詞,提高了 分詞的精度并提高了對目標(biāo)文本分詞的速度,繼而可以提高目標(biāo)文本分類的準(zhǔn)確性。
      [0026] 本發(fā)明還提供一種信息分類裝置,包括:
      [0027] 特征序列確定單元,用于根據(jù)目標(biāo)文本的分詞結(jié)果中的特征詞,確定所述分詞結(jié) 果對應(yīng)的特征序列;
      [0028] 特征對象確定單元,用于確定所述特征序列中與自定義的公共對象庫中的特征對 象匹配的特征對象;
      [0029]類別屬性確定單元,用于根據(jù)所述特征碼中的特征對象確定所述目標(biāo)文本的類別 屬性。
      [0030] 本發(fā)明實(shí)施例中,根據(jù)目標(biāo)文本的分詞結(jié)果中的特征詞確定分詞結(jié)果對應(yīng)的特征 序列,并根據(jù)特征序列匹配特征對象,根據(jù)確定的特征對象確定目標(biāo)文本的類別屬性,在本 發(fā)明實(shí)施例中,通過分詞結(jié)果對應(yīng)的特征序列進(jìn)行匹配,提高了分類準(zhǔn)確度,通過自定義的 公共對象庫中的特征對象進(jìn)行匹配實(shí)現(xiàn)了分類的靈活性,提高了目標(biāo)文本分類的效率。
      [0031] 進(jìn)一步地,所述特征序列確定單元,具體用于:
      [0032]根據(jù)特征詞與特征碼的對應(yīng)關(guān)系,確定所述分詞結(jié)果中所述特征詞對應(yīng)的特征 碼。
      [0033] 進(jìn)一步地,所述特征序列確定單元,具體用于:
      [0034] 根據(jù)所述分詞結(jié)果中的特征詞的順序,將所述分詞結(jié)果中特征詞對應(yīng)的特征碼組 合成所述特征序列。
      [0035] 進(jìn)一步地,所述類別屬性確定單元,具體用于:
      [0036]根據(jù)所述特征碼中特征對象的屬性,確定所述特征碼對應(yīng)的類別屬性;
      [0037]將所述特征碼對應(yīng)的類別屬性確定為所述特征碼對應(yīng)的所述目標(biāo)文本的類型屬 性。
      [0038] 進(jìn)一步地,所述裝置還包括:
      [0039] 分詞單元,用于根據(jù)所述目標(biāo)文本中的特征信息,確定所述目標(biāo)文本對應(yīng)的初步 分詞文本;
      [0040] 根據(jù)特定字符對所述初步分詞文本進(jìn)行分詞,得到所述目標(biāo)文本的分詞結(jié)果;其 中,所述目標(biāo)文本由所述特征信息構(gòu)成。
      【附圖說明】
      [0041] 為了更清楚地說明本發(fā)明實(shí)施例中的技術(shù)方案,下面將對實(shí)施例描述中所需要使 用的附圖作簡要介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對于本 領(lǐng)域的普通技術(shù)人員來講,在不付出創(chuàng)造性勞動性的前提下,還可以根據(jù)這些附圖獲得其 他的附圖。
      [0042] 圖1為本發(fā)明實(shí)施例提供一種信息分類方法的流程圖;
      [0043] 圖2為本發(fā)明實(shí)施例提供的另一種金融服務(wù)信息分類方法的流程圖;
      [0044] 圖3為本發(fā)明實(shí)施例提供一種信息分類裝置的結(jié)構(gòu)示意圖。
      【具體實(shí)施方式】
      [0045] 為了使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合附圖對本發(fā)明作進(jìn) 一步地詳細(xì)描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部份實(shí)施例,而不是全部的實(shí)施 例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的 所有其它實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
      [0046] 本發(fā)明提供一種信息分類方法,如圖1所示,包括:
      [0047] 步驟101,根據(jù)目標(biāo)文本的分詞結(jié)果中的特征詞,確定所述分詞結(jié)果對應(yīng)的特征序 列;
      [0048] 步驟102,確定所述特征序列中與自定義的公共對象庫中的特征對象匹配的特征 對象;
      [0049]步驟103,根據(jù)所述特征碼中的特征對象確定所述目標(biāo)文本的類別屬性。
      [0050]在本發(fā)明實(shí)施例中,需要進(jìn)行分詞的目標(biāo)文本指的是由文字、數(shù)字、英文等字符構(gòu) 成的文本,可以為在通訊過程中產(chǎn)生的短信,可選的,在本發(fā)明實(shí)施例中,需要進(jìn)行分詞的 目標(biāo)文本為金融服務(wù)短信,即銀行或者其它金融機(jī)構(gòu)向用戶發(fā)送的服務(wù)短信。
      [0051 ]在本發(fā)明實(shí)施例中,首先需要將目標(biāo)文本進(jìn)行分詞,然后根據(jù)目標(biāo)文本的分詞結(jié) 果,再對目標(biāo)文本進(jìn)行分類。在本發(fā)明實(shí)施例中,對目標(biāo)文本的分詞可以使用字符匹配法、 統(tǒng)計法或者是理解法進(jìn)行分詞,可選的,在本發(fā)明實(shí)施例中,使用的分詞方法為:
      [0052] 根據(jù)所述目標(biāo)文本中的特征信息,確定所述目標(biāo)文本對應(yīng)的初步分詞文本;
      [0053] 根據(jù)特定字符對所述初步分詞文本進(jìn)行分詞,得到所述目標(biāo)文本的分詞結(jié)果;其 中,所述目標(biāo)文本由所述特征信息構(gòu)成。
      [0054] 在本發(fā)明實(shí)施例中,需要進(jìn)行分詞的目標(biāo)文本可以是移動終端中保存的目標(biāo)文 本,也可以是移動終端將自身保存的目標(biāo)文本發(fā)送給服務(wù)器后,服務(wù)器中保存的多個移動 終端中的目標(biāo)文本。
      [0055] 可選的,在本發(fā)明實(shí)施例中,還可以獲取一定時間段內(nèi)移動終端保存的,或者是服 務(wù)器中保存的目標(biāo)文本。
      [0056] 例如,在本發(fā)明實(shí)施例中,需要獲取的發(fā)送時間在2016年5月的所有目標(biāo)文本,則 在終端保存的所有目標(biāo)文本中查找發(fā)送時間為2016年5月1日00:00:00至發(fā)送時間為2016 年5月31日24:00:00的目標(biāo)文本。當(dāng)然在本發(fā)明實(shí)施例中,也可以在服務(wù)器保存的所有目標(biāo) 文本中查找發(fā)送時間為2016年5月1日00:00:00至發(fā)送時間為2016年5月31日24:00:00的目 標(biāo)文本。
      [0057] 在獲取到需要進(jìn)行分詞的目標(biāo)文本后,需要刪除目標(biāo)文本中的標(biāo)點(diǎn),以保證分詞 結(jié)果的正確性,例如,在本發(fā)明實(shí)施例中,獲取了 100個需要進(jìn)行分詞的目標(biāo)文本,其中,100 個目標(biāo)文本中的一個目標(biāo)文本的內(nèi)容為:
      [0058]尊敬的張三,您好,您在我行的中行信用卡1234的USD賬戶于03月08日12時賬單分 期成功:分期金額USD111.11,分期期數(shù)11期,手續(xù)費(fèi)USD1.11,USD賬戶賬單剩余還款金額 USD111.11,最小還款額USD11.11。【中國銀行】
      [0059]刪除上述文本中的標(biāo)點(diǎn)符號,刪除掉上述標(biāo)點(diǎn)符號的目標(biāo)文本變?yōu)椋?br>[0060]尊敬的張三您好您在我行的中行信用卡1234的USD賬戶于03月08日12時賬單分期 成功分期金額USD111 . 11分期期數(shù)11期手續(xù)費(fèi)USD1 . 11,USD賬戶賬單剩余還款金額 USD111.11最小還款額USD11.11中國銀行
      [0061] 可選的,為了在刪除標(biāo)點(diǎn)符號的目標(biāo)文本中標(biāo)識出原標(biāo)點(diǎn)符號的位置,在本發(fā)明 實(shí)施例中,可以在原標(biāo)點(diǎn)符號的位置上加入切分標(biāo)記。在本發(fā)明實(shí)施例中,切分標(biāo)記可以為 數(shù)字、字母和ASCII字符,可選的,可以使用"\"標(biāo)記作為切分標(biāo)記。
      [0062] 則在本發(fā)明上述實(shí)施例中刪除標(biāo)點(diǎn)符號后的目標(biāo)文本中加入"\"標(biāo)記,加入標(biāo)記 后的目標(biāo)文本為:
      [0063]尊敬的張三\您好\您在我行的中行信用卡1234的USD賬戶于03月08日12時賬單分 期成功\分期金額USD111.11\分期期數(shù)11期\手續(xù)費(fèi)USD1.11,USD賬戶賬單剩余還款金額 USD111.11 \最小還款額USD11.11 \中國銀行\(zhòng)
      [0064] 在刪除目標(biāo)文本中的標(biāo)點(diǎn)符號并在原標(biāo)點(diǎn)符號的位置上加入切分標(biāo)記后,需要確 定所述目標(biāo)文本中的特征信息,在本發(fā)明實(shí)施例中,特征信息指的是區(qū)分目標(biāo)文本中不同 屬性的字符串,例如目標(biāo)文本中包括三種不同屬性的字符串,分別為數(shù)字、英文以及漢字, 則特征信息就是數(shù)字、英文以及漢字。
      [0065] 在本發(fā)明實(shí)施例中,若目標(biāo)文本為金融服務(wù)短信,則在短信文本中可能會存在時 間的特征,例如X年X月X日X時X分等,若在短信文本中可以按照時間特征的模版查找到對應(yīng) 的數(shù)字,則認(rèn)為在短信文本中這些特征屬于時間特征而不是屬于數(shù)字特征。
      [0066] 在本發(fā)明實(shí)施例中,若目標(biāo)文本為金融服務(wù)短信,則在短信文本中可能會存在金 額特征信息,在本發(fā)明實(shí)施例中,金額為表示數(shù)值的數(shù)字,為了與數(shù)字特征信息進(jìn)行區(qū)分, 一般來說,金額中有小數(shù)點(diǎn)的信息,所以在本發(fā)明實(shí)施例中,在確定目標(biāo)文本中的數(shù)字部分 有小數(shù)點(diǎn)存在時,則認(rèn)為該數(shù)字部分屬于金額特征信息。
      [0067] 在本發(fā)明實(shí)施例中,若在本發(fā)明實(shí)施例中,刪除標(biāo)點(diǎn)符號的目標(biāo)文本中加入"標(biāo) 記后的目標(biāo)文本為:
      [0068]尊敬的張三\您好\您在我行的中行信用卡1234的USD賬戶于03月08日12時賬單分 期成功\分期金額USD111.11\分期期數(shù)11期\手續(xù)費(fèi)USD1.11\USD賬戶賬單剩余還款金額 USD111.11 \最小還款額USD11.11 \中國銀行\(zhòng)
      [0069] 若特征信息包括漢字、英文、數(shù)字、時間以及金額,則根據(jù)特征信息能夠確定上述 目標(biāo)文本中的漢字特征信息為:尊敬的張三\您好\您在我行的中行信用卡,的,賬戶于,時 賬單分期成功\分期金額,分期期數(shù),期,手續(xù)費(fèi),賬戶賬單剩余還款金額,最小還款額,中國 銀行;
      [0070] 根據(jù)特征信息確定的上述目標(biāo)文本中的英文特征信息為:USD,USD,USD,USD,USD, USD;
      [0071] 根據(jù)特征信息確定的上述目標(biāo)文本中的數(shù)字特征信息為:1234,11;
      [0072] 根據(jù)特征信息確定的上述目標(biāo)文本中的金額特征信息為:111. 11,11,1.11, 111.11,11.11;
      [0073] 根據(jù)特征信息確定的上述目標(biāo)文本中的時間特征信息為:03月08日12時。
      [0074] 可選的,在確定了目標(biāo)文本中的特征信息后,在不同的特征信息之間也需要插入 切分標(biāo)記,目標(biāo)文本中根據(jù)插入的切分標(biāo)記自然的分成若干個字符串,便于確定目標(biāo)文本 的特征序列,在本發(fā)明實(shí)施例中,在目標(biāo)文本中的不同信息之間插入切分標(biāo)記具體如下所 示:
      [0075]尊敬的張三\您好\您在我行的中行信用卡\1234\的\1^0\賬戶于\03月08日12時\ 賬單分期成功\分期金額\1^0\111.11\分期期數(shù)\11\期\手續(xù)費(fèi)\USD\1.11\1^0\賬戶賬單 剩余還款金額\USD\111.11\最小還款額\USD\11.11\中國銀行\(zhòng)
      [0076] 在本發(fā)明實(shí)施例中,可以根據(jù)不同的特征信息與不同的表征特征信息的特征標(biāo)識 之間的對應(yīng)關(guān)系,對上述實(shí)施例中的特征信息利用特征標(biāo)識進(jìn)行特征標(biāo)記,可選的,在本發(fā) 明實(shí)施例中,可以使用不同的字母代表不同的特征信息。
      [0077] 在本發(fā)明上述實(shí)施例中,確定了目標(biāo)文本的特征碼序列即確定了目標(biāo)文本的初步 分詞文本,但是在初步分詞文本中,還存在著一些不能通過上述方法分詞的字符串,例如字 符串"尊敬的張三",或者是字符串"您在我行的中行信用卡"等,在本發(fā)明實(shí)施例中,還需要 確定初步分詞文本中的特定字符,根據(jù)特定字符對所述初步分詞文本進(jìn)行分詞,得到所述 目標(biāo)文本的分詞結(jié)果。
      [0078] 在本發(fā)明實(shí)施例中,特定字符可以根據(jù)不同的分詞需要自行定義,例如,需要對金 融短信進(jìn)行分詞,則特定字符一般可以包括"行"、"賬單"、"成功"等特定字符。
      [0079] 在本發(fā)明實(shí)施例中,在對初步分詞文本中的特定字符的的前和/或后的位置上加 入切分標(biāo)記前,還需要在初步分詞文本中去掉無實(shí)際意義的詞語,提高分詞的準(zhǔn)確性。在本 發(fā)明實(shí)施例中,可選的,可以去掉初步分詞文本中存在的"的"等詞語,并且在刪除"的"的位 置上插入切分標(biāo)記,例如在本發(fā)明實(shí)施例中,將字符串"尊敬的張三""您在我行的中行信用 卡"中的"的"刪除,并在"的"的位置上插入切分標(biāo)記,結(jié)果為"尊敬\張三""您在我行\(zhòng)中行 信用卡"。
      [0080] 在本發(fā)明上述實(shí)施例中,在確定了將初步分詞文本中的無實(shí)際意義的詞語刪除 后,再確定初步分詞文本中包含的特定字符,以上述實(shí)施例為例,上述初步分詞文本中存在 的特定字符為"在","分期","分期金額","賬戶",可選的,在"分期"的特定字符的前和后都 加入切分標(biāo)記,其它特定字符的后面加入切分標(biāo)記,則根據(jù)特定字符對所述初步分詞文本 進(jìn)行分詞,得到所述目標(biāo)文本的分詞結(jié)果為:
      [0081 ] 尊敬\張三\您好\您在\我行\(zhòng)中行信用卡\1234\USD\賬戶\于\03月08日12時\賬 單\分期\成功\分期金額\1^0\111.11\分期期數(shù)\11\期\手續(xù)費(fèi)\1^0\1.11\1^0\賬戶\賬 單\剩余還款金額\USD\111.11\最小還款額\USD\11.11\中國銀行\(zhòng)
      [0082] 在確定了目標(biāo)文本的分詞結(jié)果后,需要確定分詞結(jié)果中的特征詞,在本發(fā)明實(shí)施 例中,特征詞指的是能夠表示在信息中存在的不變詞匯以及可變詞匯,以金融信息為例,在 金融信息中,姓名、卡號、卡名稱、金額、時間、幣種、期數(shù)等詞語是可變信息,例如姓名為張 三或者姓名為李四,張三的卡號為123456以及張三的另一張銀行卡的卡號為234567;同樣 的,在金融信息中,對金融的處理行為,例如分期,還款等詞語為不變詞匯。在本發(fā)明實(shí)施例 中,特征詞就包括了可變詞匯以及不變詞匯。
      [0083] 以上述實(shí)施例中的分詞結(jié)果為例,確定上述分詞結(jié)果中的特征詞,上述分詞結(jié)果 中,卡的種類"中行信息用卡"、"1234"的卡號、幣種"USD"、分期時間"03月08日12時"、分期 金額"111.1Γ、分期數(shù)"1Γ、手續(xù)費(fèi)"1.1Γ、剩余還款金額"111.1Γ、最小還款金額"11.1Γ 等為可變詞匯,而"分期金額"、"分期期數(shù)"、"手續(xù)費(fèi)"、"最小還款額"等為不變詞匯,根據(jù)目 標(biāo)文本的分詞結(jié)果中的特征詞與特征碼的對應(yīng)關(guān)系,確定目標(biāo)文本的分詞結(jié)果中的特征 碼。
      [0084] 在本發(fā)明實(shí)施例中,特征詞與特征碼之間存在著對應(yīng)關(guān)系,如表1所示,在本發(fā)明 實(shí)施例中,分詞時使用的特征標(biāo)記與下文中的特征碼可以相同,也可以不同,在本發(fā)明實(shí)施 例中,為了表示對金融操作行為是否成功的狀態(tài),將"成功"或者"失敗"等詞語也認(rèn)為是可 變詞語,在表1中標(biāo)識:
      [0087] 表1:特征詞與特征碼的對應(yīng)關(guān)系表
      [0088] 根據(jù)上述對應(yīng)表,能夠確定目標(biāo)文本中特征詞對應(yīng)的特征碼,并且按照特征詞的 順序能夠確定特征碼序列為:NCXYDSEYAPBYAYRYAQYA。在本發(fā)明實(shí)施例中,每一個目標(biāo)文本 都對應(yīng)一個唯一的特征碼序列。
      [0089] 當(dāng)然,在本發(fā)明實(shí)施例中,特征詞還可以包括其它的特征詞,例如支出,消費(fèi),理財 等詞語,為了方便特征詞的管理,在本發(fā)明實(shí)施例中,還可以對特征詞進(jìn)行分類,例如代表 交易行為的特征標(biāo)記有:支出、消費(fèi)、轉(zhuǎn)賬、扣繳、存入、收入、匯入等;代表交易渠道的特征 標(biāo)記有:網(wǎng)銀、柜臺、atm、p 〇s、營業(yè)網(wǎng)點(diǎn)、銀行端、客戶端等;代表交易目的的特征標(biāo)記有:取 現(xiàn)、電費(fèi)、理財、股票、等;代表貸款類型的特征標(biāo)記有:個人經(jīng)營貸款、一手住房貸款、汽車 貸款等;代表貸款狀態(tài)的特征標(biāo)記有:已放款、已結(jié)清等;代表金額的特征標(biāo)記有:剩余額 度、可用余額、手續(xù)費(fèi)、賬單金額、余額、等等。在本發(fā)明實(shí)施例中只給出了一部分特征詞,其 它類型的特征詞也屬于本發(fā)明的保護(hù)范圍內(nèi)。
      [0090] 在步驟102中,在確定目標(biāo)文本對應(yīng)的特征碼序列后,根據(jù)目標(biāo)文本的特征碼序列 在自定義的公共對象庫中進(jìn)行匹配。
      [0091] 在本發(fā)明實(shí)施例中,自定義的公共對象庫中包含所有目標(biāo)信息中可提取的特征對 象,例如自定義的公共對象庫中包括的特征對象有分期金額、還款金額,剩余還款金額等。 在本發(fā)明實(shí)施例中,自定義的公共對象庫可以是一個寬表,表中包括了所有特征對象,例如 如表2所示:
      [0093] 表2:特征對象表
      [0094] 可選的,在本發(fā)明實(shí)施例中,還可以將特征對象的特征碼保存在表2中,利用特征 對象的特征碼與特征序列進(jìn)行匹配。
      [0095] 例如,在本發(fā)明實(shí)施例中,目標(biāo)文本的特征序列為NCXYDSEYAPBYAYRYAQYA,則將特 征序列與自定義的公共對象庫中的特征對象進(jìn)行匹配,匹配的結(jié)果為與特征對象"分期金 額",然后查詢"分期期數(shù)"與"分期金額"的值是否為空,在本方實(shí)施例中,分期期數(shù)的值為 P,即等于11,分期金額的值為A,等于111.11,則認(rèn)為本發(fā)明實(shí)施例中的目標(biāo)文本的分類是 屬于分期的,因?yàn)榫哂袃蓚€分期類別屬性的特征對象與特征序列匹配成功,并且兩個特征 對象的值都不為空。
      [0096] 在本發(fā)明實(shí)施例中,若匹配成功的特征對象是"賬單結(jié)欠"、"最小還款金額",并且 匹配成功的特征對象的值都不為空值,則認(rèn)為目標(biāo)文本的分類屬于賬單類。
      [0097] 或者,在本發(fā)明實(shí)施例中,若匹配成功的特征對象是"快捷支付"或者是"P0S存入" 等特征對象,并且匹配成功的特征對象的值都不為空值,則認(rèn)為目標(biāo)文本的分類屬于賬動 類。
      [0098] 在本發(fā)明上述實(shí)施例中,所述特征對象表還可以是特征詞以及可變詞匯轉(zhuǎn)義后形 成的常量,比如可以首先定義下列特征詞的分類為輸出分類以及輸入分類,并且為輸出分 類中的每個輸出的不同的特征詞賦予不同的數(shù)字,〇.支出1.消費(fèi)2.轉(zhuǎn)出3.取款4.繳費(fèi) 5.代付6.代發(fā)7.轉(zhuǎn)理財,同理可以為輸入分類中的每個輸入的不同的特征詞賦予不同的 數(shù)字0.存入1.收入2.轉(zhuǎn)入3.撤銷4.購匯5.代存6.繳交7.定期轉(zhuǎn)活期。
      [0099] 在本發(fā)明實(shí)施例中,當(dāng)確定了目標(biāo)文本對應(yīng)的特征碼后,可以將特征碼中的每個 特征進(jìn)行轉(zhuǎn)義,并根據(jù)轉(zhuǎn)義后的特征碼在特征對象庫中匹配,例如,在特征對象庫中確定了 特征對象為賬單金額、剩余應(yīng)還金額以及還款日,目標(biāo)文本中的金額部分也對應(yīng)了特征對 象中的賬單具體金額、剩余應(yīng)還具體金額、以及還款日期,g卩,在特征對象庫中,目標(biāo)文本中 可變部分也對應(yīng)了不同的特征對象,則查找特征對象對應(yīng)的值是否為空可以使用下列語 句:
      [0100] if((this.bill . length( )>0 | | this. leftAmt. length()>0 this.repayDay.length()>0)
      [0101] 上述語句表面邏輯為賬單金額不為空、剩余應(yīng)還金額不為空、還款日不為空,則可 以確定目標(biāo)文本的分類規(guī)則為還款類型。
      [0102] 當(dāng)然,在本發(fā)明實(shí)施例中,還有很多種匹配結(jié)果,在此不做贅述。
      [0103] 為了更加詳細(xì)的說明本發(fā)明實(shí)施例,在此舉例說明。
      [0104] 如圖2所示,本發(fā)明實(shí)施例提供一種信息分類方法,具體步驟如下所示:
      [0105] 步驟201,獲取需要進(jìn)行分詞的目標(biāo)文本,在本發(fā)明實(shí)施例中,獲取的需要進(jìn)行分 詞的目標(biāo)文本為保存在任一終端中的目標(biāo)文本,并且所述目標(biāo)文本為金融服務(wù)信息;
      [0106] 步驟202,對獲取的目標(biāo)文本進(jìn)行分詞,即對獲取的金融服務(wù)信息進(jìn)行分詞;
      [0107] 步驟203,確定金融服務(wù)信息中的特征詞;
      [0108] 步驟204,確定金融服務(wù)信息中的特征詞對應(yīng)的特征碼,并確定金融服務(wù)信息對應(yīng) 的特征序列;
      [0109] 步驟205,將特征序列與公共對象庫中的特征對象進(jìn)行匹配;
      [0110] 步驟206,確定匹配成功的特征對象,并確定匹配成功的特征對象的值不為空;
      [0111] 步驟207,根據(jù)特征對象的類別確定金融服務(wù)信息的類別。
      [0112] 基于相同的發(fā)明構(gòu)思,本發(fā)明實(shí)施例還提供一種信息分類裝置,該裝置可以執(zhí)行 上述方法。
      [0113] 基于同樣的構(gòu)思,本發(fā)明還提供一種信息分類裝置,如圖3所示,包括:
      [0114]特征序列確定單元301,用于根據(jù)目標(biāo)文本的分詞結(jié)果中的特征詞,確定所述分詞 結(jié)果對應(yīng)的特征序列;
      [0115]特征對象確定單元302,用于確定所述特征序列中與自定義的公共對象庫中的特 征對象匹配的特征對象;
      [0116]類別屬性確定單元303,用于根據(jù)所述特征碼中的特征對象確定所述目標(biāo)文本的 類別屬性。
      [0117] 進(jìn)一步地,所述特征序列確定單元301,具體用于:
      [0118] 根據(jù)特征詞與特征碼的對應(yīng)關(guān)系,確定所述分詞結(jié)果中所述特征詞對應(yīng)的特征 碼。
      [0119] 進(jìn)一步地,所述特征序列確定單元301,具體用于:
      [0120] 根據(jù)所述分詞結(jié)果中的特征詞的順序,將所述分詞結(jié)果中特征詞對應(yīng)的特征碼組 合成所述特征序列。
      [0121 ]進(jìn)一步地,所述類別屬性確定單元303,具體用于:
      [0122] 根據(jù)所述特征碼中特征對象的屬性,確定所述特征碼對應(yīng)的類別屬性;
      [0123] 將所述特征碼對應(yīng)的類別屬性確定為所述特征碼對應(yīng)的所述目標(biāo)文本的類型屬 性。
      [0124] 進(jìn)一步地,所述裝置還包括:
      [0125] 分詞單元304,用于根據(jù)所述目標(biāo)文本中的特征信息,確定所述目標(biāo)文本對應(yīng)的初 步分詞文本;
      [0126] 根據(jù)特定字符對所述初步分詞文本進(jìn)行分詞,得到所述目標(biāo)文本的分詞結(jié)果;其 中,所述目標(biāo)文本由所述特征信息構(gòu)成。
      [0127] 本發(fā)明是參照根據(jù)本發(fā)明實(shí)施例的方法、設(shè)備(系統(tǒng))、和計算機(jī)程序產(chǎn)品的流程 圖和/或方框圖來描述的。應(yīng)理解可由計算機(jī)程序指令實(shí)現(xiàn)流程圖和/或方框圖中的每一流 程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結(jié)合。可提供這些計算機(jī)程序 指令到通用計算機(jī)、專用計算機(jī)、嵌入式處理機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器以產(chǎn) 生一個機(jī)器,使得通過計算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器執(zhí)行的指令產(chǎn)生用于實(shí) 現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的裝置。
      [0128] 這些計算機(jī)程序指令也可存儲在能引導(dǎo)計算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備以特 定方式工作的計算機(jī)可讀存儲器中,使得存儲在該計算機(jī)可讀存儲器中的指令產(chǎn)生包括指 令裝置的制造品,該指令裝置實(shí)現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或 多個方框中指定的功能。
      [0129] 這些計算機(jī)程序指令也可裝載到計算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備上,使得在計 算機(jī)或其他可編程設(shè)備上執(zhí)行一系列操作步驟以產(chǎn)生計算機(jī)實(shí)現(xiàn)的處理,從而在計算機(jī)或 其他可編程設(shè)備上執(zhí)行的指令提供用于實(shí)現(xiàn)在流程圖一個流程或多個流程和/或方框圖一 個方框或多個方框中指定的功能的步驟。
      [0130]盡管已描述了本發(fā)明的優(yōu)選實(shí)施例,但本領(lǐng)域內(nèi)的技術(shù)人員一旦得知了基本創(chuàng)造 性概念,則可對這些實(shí)施例作出另外的變更和修改。所以,所附權(quán)利要求意欲解釋為包括優(yōu) 選實(shí)施例以及落入本發(fā)明范圍的所有變更和修改。
      [0131]顯然,本領(lǐng)域的技術(shù)人員可以對本發(fā)明進(jìn)行各種改動和變型而不脫離本發(fā)明的精 神和范圍。這樣,倘若本發(fā)明的這些修改和變型屬于本發(fā)明權(quán)利要求及其等同技術(shù)的范圍 之內(nèi),則本發(fā)明也意圖包含這些改動和變型在內(nèi)。
      【主權(quán)項(xiàng)】
      1. 一種信息分類方法,其特征在于,所述方法包括: 根據(jù)目標(biāo)文本的分詞結(jié)果中的特征詞,確定所述分詞結(jié)果對應(yīng)的特征序列; 確定所述特征序列中與自定義的公共對象庫中的特征對象匹配的特征對象; 根據(jù)所述特征碼中的特征對象確定所述目標(biāo)文本的類別屬性。2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)目標(biāo)文本的分詞結(jié)果中的特征 詞,確定所述分詞結(jié)果對應(yīng)的特征序列,包括: 根據(jù)特征詞與特征碼的對應(yīng)關(guān)系,確定所述分詞結(jié)果中所述特征詞對應(yīng)的特征碼。3. 根據(jù)權(quán)利要求2所述的方法,其特征在于,所述根據(jù)所述分詞結(jié)果中的特征標(biāo)記確定 所述分詞結(jié)果對應(yīng)的特征序列,包括: 根據(jù)所述分詞結(jié)果中的特征詞的順序,將所述分詞結(jié)果中特征詞對應(yīng)的特征碼組合成 所述特征序列。4. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述特征碼中的特征對象確定所 述目標(biāo)文本的類別屬性,包括: 根據(jù)所述特征碼中特征對象的屬性,確定所述特征碼對應(yīng)的類別屬性; 將所述特征碼對應(yīng)的類別屬性確定為所述特征碼對應(yīng)的所述目標(biāo)文本的類型屬性。5. 根據(jù)權(quán)利要求1所述權(quán)利的方法,其特征在于,所述目標(biāo)文本按照下列步驟進(jìn)行分 詞: 根據(jù)所述目標(biāo)文本中的特征信息,確定所述目標(biāo)文本對應(yīng)的初步分詞文本; 根據(jù)特定字符對所述初步分詞文本進(jìn)行分詞,得到所述目標(biāo)文本的分詞結(jié)果;其中,所 述目標(biāo)文本由所述特征信息構(gòu)成。6. -種信息分類裝置,其特征在于,包括: 特征序列確定單元,用于根據(jù)目標(biāo)文本的分詞結(jié)果中的特征詞,確定所述分詞結(jié)果對 應(yīng)的特征序列; 特征對象確定單元,用于確定所述特征序列中與自定義的公共對象庫中的特征對象匹 配的特征對象; 類別屬性確定單元,用于根據(jù)所述特征碼中的特征對象確定所述目標(biāo)文本的類別屬 性。7. 根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述特征序列確定單元,具體用于: 根據(jù)特征詞與特征碼的對應(yīng)關(guān)系,確定所述分詞結(jié)果中所述特征詞對應(yīng)的特征碼。8. 根據(jù)權(quán)利要求7所述的方法,其特征在于,所述特征序列確定單元,具體用于: 根據(jù)所述分詞結(jié)果中的特征詞的順序,將所述分詞結(jié)果中特征詞對應(yīng)的特征碼組合成 所述特征序列。9. 根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述類別屬性確定單元,具體用于: 根據(jù)所述特征碼中特征對象的屬性,確定所述特征碼對應(yīng)的類別屬性; 將所述特征碼對應(yīng)的類別屬性確定為所述特征碼對應(yīng)的所述目標(biāo)文本的類型屬性。10. 根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述裝置還包括: 分詞單元,用于根據(jù)所述目標(biāo)文本中的特征信息,確定所述目標(biāo)文本對應(yīng)的初步分詞 文本; 根據(jù)特定字符對所述初步分詞文本進(jìn)行分詞,得到所述目標(biāo)文本的分詞結(jié)果;其中,所
      【文檔編號】G06F17/27GK106095972SQ201610440565
      【公開日】2016年11月9日
      【申請日】2016年6月17日
      【發(fā)明人】唐翌飛, 陳瑛綺, 吳鋒海, 趙曉慶
      【申請人】聯(lián)動優(yōu)勢科技有限公司
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
      1