本發(fā)明實(shí)施例涉及信息處理的技術(shù)領(lǐng)域,尤其涉及一種信息處理的方法及裝置。
背景技術(shù):
當(dāng)前,全球正進(jìn)行著物聯(lián)網(wǎng)、移動互聯(lián)網(wǎng)、云計(jì)算等新一輪信息技術(shù)變革,信息資源已經(jīng)成為重要的上市公司監(jiān)管利器。基于信息化武裝的的股轉(zhuǎn)系統(tǒng)不僅成為推動信息監(jiān)管變革的重要引擎,也會對上市企業(yè)的監(jiān)管過程帶來深刻變化。但目前處理相關(guān)文檔的手段還是基于最古老的人工肉眼掃描方式。這不僅需要投入大量的人力,耗費(fèi)寶貴的時(shí)間和精力。
雖然目前已經(jīng)開始使用新的文件管理系統(tǒng)進(jìn)行結(jié)構(gòu)化信息簡單錄入式存儲,但過往文件及歷史文件還需要人工處理。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明實(shí)施例的目的在于提出一種信息處理的方法及裝置,旨在解決如何實(shí)現(xiàn)對歷史、現(xiàn)有及未來的所有半結(jié)構(gòu)化文件按照業(yè)務(wù)規(guī)則進(jìn)行針對性的提取、入庫、分析的目的。
為達(dá)此目的,本發(fā)明實(shí)施例采用以下技術(shù)方案:
第一方面,一種信息處理的方法,所述方法包括:
在預(yù)設(shè)時(shí)間閾值內(nèi)從預(yù)設(shè)網(wǎng)址獲取披露信息,所述披露信息包括公司公告的掛牌公司、公司公告的兩網(wǎng)及退市公司、業(yè)務(wù)周知的掛牌公司、業(yè)務(wù)周知的兩網(wǎng)及退市公司、全部新增公告的代碼、標(biāo)題、日期以及公告正式文件;
獲取公告網(wǎng)站標(biāo)題以及公告文件內(nèi)的正文標(biāo)題,根據(jù)預(yù)設(shè)的業(yè)務(wù)提取規(guī)則判斷公告所屬的業(yè)務(wù)類型;
針對網(wǎng)站披露的所有掛牌公司公告數(shù)據(jù)進(jìn)行關(guān)鍵詞檢索,檢索的關(guān)鍵詞支持單個(gè)關(guān)鍵詞和多個(gè)關(guān)鍵詞的組合查詢;
針對不同業(yè)務(wù)類型公告內(nèi)容按照設(shè)定的規(guī)則進(jìn)行內(nèi)容抽取,抽取結(jié)果生成通知單。
優(yōu)選地,所述根據(jù)預(yù)設(shè)的業(yè)務(wù)提取規(guī)則判斷公告所屬的業(yè)務(wù)類型之后,還包括:
對識別不屬于業(yè)務(wù)類型的公告加入到問題公告列表,以使得對應(yīng)管理員及業(yè)務(wù)管理員進(jìn)行驗(yàn)證和處理。
優(yōu)選地,所述根據(jù)預(yù)設(shè)的業(yè)務(wù)提取規(guī)則判斷公告所屬的業(yè)務(wù)類型之后,還包括:
使用分頁列表形式對抽取結(jié)果整體情況進(jìn)行展示,公告列表用于提供日期時(shí)間范圍和業(yè)務(wù)類型的篩選功能,并實(shí)現(xiàn)對數(shù)據(jù)項(xiàng)的選擇、反選和全選功能;
所述公告列表的上方包括公告日期時(shí)間范圍、業(yè)務(wù)類型的篩選選項(xiàng),所述篩選選項(xiàng)用于接收變更篩選條件后即時(shí)刷新公告列表內(nèi)容;所述公告列表的每頁顯示條數(shù)依照系統(tǒng)全局配置和用戶首選項(xiàng)決定的,超過每頁顯示條數(shù)的公告通過分頁進(jìn)行顯示;所述公告列表的審核狀態(tài)包括:未審核、已審核、駁回和已完成。
優(yōu)選地,所述根據(jù)預(yù)設(shè)的業(yè)務(wù)提取規(guī)則判斷公告所屬的業(yè)務(wù)類型之后,還包括:
根據(jù)當(dāng)前選定的時(shí)間范圍和業(yè)務(wù)類型,統(tǒng)計(jì)符合條件公告數(shù)量并在公告表的最上方進(jìn)行提示。
優(yōu)選地,所述方法還包括:
通過所述公告列表頁面中的審核按鈕接收用戶觸發(fā)的進(jìn)入數(shù)據(jù)審核頁面的請求,以使得所述用戶根據(jù)數(shù)據(jù)記錄對應(yīng)的原始公告對抽取結(jié)果進(jìn)行人工校對;
進(jìn)入審核頁面后,所述公告列表頁面頂部顯示從某種業(yè)務(wù)類型的公告抽取出來的數(shù)據(jù)指標(biāo)及其值,并顯示對應(yīng)的原始預(yù)設(shè)類型的公告;
接收所述用戶點(diǎn)擊的指標(biāo)項(xiàng)的按鍵后,在當(dāng)前頁面中提供給所述用戶進(jìn)行數(shù)據(jù)準(zhǔn)確性確認(rèn)的界面;
若所述用戶對抽取有誤的指標(biāo)項(xiàng)進(jìn)行修改,則對原始數(shù)據(jù)進(jìn)行更新,所述公告列表中相應(yīng)的數(shù)據(jù)記錄由未審核變?yōu)橐褜徍耍?/p>
接收所述用戶點(diǎn)擊的返回按鈕,并返回到公告列表頁面。
優(yōu)選地,所述方法還包括:
通過監(jiān)管責(zé)任列表接收用戶向管理員分配的管理員權(quán)限,所述監(jiān)管責(zé)任列表是公司管理員對監(jiān)管員及掛牌公司和券商進(jìn)行授權(quán)的入口;
若當(dāng)前情況屬于預(yù)設(shè)特殊情況時(shí),接收所述管理員根據(jù)所述管理員權(quán)限進(jìn)行操作,所述管理員權(quán)限包括負(fù)責(zé)查看和處理本管理員管轄范圍的掛牌公司公告;
根據(jù)所述操作反饋問題公告并生成通知單完成掛牌公司相應(yīng)的業(yè)務(wù)處理。
第二方面,一種信息處理的裝置,所述裝置包括:
第一獲取模塊,用于在預(yù)設(shè)時(shí)間閾值內(nèi)從預(yù)設(shè)網(wǎng)址獲取披露信息,所述披露信息包括公司公告的掛牌公司、公司公告的兩網(wǎng)及退市公司、業(yè)務(wù)周知的掛牌公司、業(yè)務(wù)周知的兩網(wǎng)及退市公司、全部新增公告的代碼、標(biāo)題、日期以及公告正式文件;
第二獲取模塊,用于獲取公告網(wǎng)站標(biāo)題以及公告文件內(nèi)的正文標(biāo)題,根據(jù)預(yù)設(shè)的業(yè)務(wù)提取規(guī)則判斷公告所屬的業(yè)務(wù)類型;
查詢模塊,用于針對網(wǎng)站披露的所有掛牌公司公告數(shù)據(jù)進(jìn)行關(guān)鍵詞檢索,檢索的關(guān)鍵詞支持單個(gè)關(guān)鍵詞和多個(gè)關(guān)鍵詞的組合查詢;
生成模塊,用于針對不同業(yè)務(wù)類型公告內(nèi)容按照設(shè)定的規(guī)則進(jìn)行內(nèi)容抽取,抽取結(jié)果生成通知單。
優(yōu)選地,所述裝置還包括:
加入模塊,用于在根據(jù)預(yù)設(shè)的業(yè)務(wù)提取規(guī)則判斷公告所屬的業(yè)務(wù)類型之后,對識別不屬于業(yè)務(wù)類型的公告加入到問題公告列表,以使得對應(yīng)管理員及業(yè)務(wù)管理員進(jìn)行驗(yàn)證和處理;
展示模塊,用于在根據(jù)預(yù)設(shè)的業(yè)務(wù)提取規(guī)則判斷公告所屬的業(yè)務(wù)類型之后,使用分頁列表形式對抽取結(jié)果整體情況進(jìn)行展示,公告列表用于提供日期時(shí)間范圍和業(yè)務(wù)類型的篩選功能,并實(shí)現(xiàn)對數(shù)據(jù)項(xiàng)的選擇、反選和全選功能;所述公告列表的上方包括公告日期時(shí)間范圍、業(yè)務(wù)類型的篩選選項(xiàng),所述篩選選項(xiàng)用于接收變更篩選條件后即時(shí)刷新公告列表內(nèi)容;所述公告列表的每頁顯示條數(shù)依照系統(tǒng)全局配置和用戶首選項(xiàng)決定的,超過每頁顯示條數(shù)的公告通過分頁進(jìn)行顯示;所述公告列表的審核狀態(tài)包括:未審核、已審核、駁回和已完成;
統(tǒng)計(jì)模塊,用于在根據(jù)預(yù)設(shè)的業(yè)務(wù)提取規(guī)則判斷公告所屬的業(yè)務(wù)類型之后,根據(jù)當(dāng)前選定的時(shí)間范圍和業(yè)務(wù)類型,統(tǒng)計(jì)符合條件公告數(shù)量并在公告表的最上方進(jìn)行提示。
優(yōu)選地,所述裝置還包括:
第一處理模塊,用于通過所述公告列表頁面中的審核按鈕接收用戶觸發(fā)的進(jìn)入數(shù)據(jù)審核頁面的請求,以使得所述用戶根據(jù)數(shù)據(jù)記錄對應(yīng)的原始公告對抽取結(jié)果進(jìn)行人工校對;進(jìn)入審核頁面后,所述公告列表頁面頂部顯示從某種業(yè)務(wù)類型的公告抽取出來的數(shù)據(jù)指標(biāo)及其值,并顯示對應(yīng)的原始預(yù)設(shè)類型的公告;接收所述用戶點(diǎn)擊的指標(biāo)項(xiàng)的按鍵后,在當(dāng)前頁面中提供給所述用戶進(jìn)行數(shù)據(jù)準(zhǔn)確性確認(rèn)的界面;若所述用戶對抽取有誤的指標(biāo)項(xiàng)進(jìn)行修改,則對原始數(shù)據(jù)進(jìn)行更新,所述公告列表中相應(yīng)的數(shù)據(jù)記錄由未審核變?yōu)橐褜徍?;接收所述用戶點(diǎn)擊的返回按鈕,并返回到公告列表頁面。
優(yōu)選地,所述裝置還包括:
第二處理模塊,用于通過監(jiān)管責(zé)任列表接收用戶向管理員分配的管理員權(quán)限,所述監(jiān)管責(zé)任列表是公司管理員對監(jiān)管員及掛牌公司和券商進(jìn)行授權(quán)的入口;若當(dāng)前情況屬于預(yù)設(shè)特殊情況時(shí),接收所述管理員根據(jù)所述管理員權(quán)限進(jìn)行操作,所述管理員權(quán)限包括負(fù)責(zé)查看和處理本管理員管轄范圍的掛牌公司公告;根據(jù)所述操作反饋問題公告并生成通知單完成掛牌公司相應(yīng)的業(yè)務(wù)處理。
本發(fā)明實(shí)施例提供的一種信息處理的方法及裝置,在預(yù)設(shè)時(shí)間閾值內(nèi)從預(yù)設(shè)網(wǎng)址獲取披露信息,所述披露信息包括公司公告的掛牌公司、公司公告的兩網(wǎng)及退市公司、業(yè)務(wù)周知的掛牌公司、業(yè)務(wù)周知的兩網(wǎng)及退市公司、全部新增公告的代碼、標(biāo)題、日期以及公告正式文件;獲取公告網(wǎng)站標(biāo)題以及公告文件內(nèi)的正文標(biāo)題,根據(jù)預(yù)設(shè)的業(yè)務(wù)提取規(guī)則判斷公告所屬的業(yè)務(wù)類型;針對網(wǎng)站披露的所有掛牌公司公告數(shù)據(jù)進(jìn)行關(guān)鍵詞檢索,檢索的關(guān)鍵詞支持單個(gè)關(guān)鍵詞和多個(gè)關(guān)鍵詞的組合查詢;針對不同業(yè)務(wù)類型公告內(nèi)容按照設(shè)定的規(guī)則進(jìn)行內(nèi)容抽取,抽取結(jié)果生成通知單。本系統(tǒng)可以面向所有企事業(yè)單位,針對單位文件整體的識別分析,進(jìn)行簡單的業(yè)務(wù)配置并根據(jù)標(biāo)準(zhǔn)化功能,實(shí)現(xiàn)智能化識別。通過本項(xiàng)目的實(shí)施,將顯著提升企事業(yè)單位的辦公效率;大幅縮減了對于手動填單、人為關(guān)聯(lián)的工作量。將多個(gè)工具類系統(tǒng)進(jìn)行集成,完善了整個(gè)系統(tǒng)的多樣性和規(guī)范性。
附圖說明
圖1是本發(fā)明實(shí)施例提供的一種信息處理的方法的流程示意圖;
圖2是本發(fā)明實(shí)施例提供的另一種信息處理的方法的流程示意圖;
圖3是本發(fā)明實(shí)施例提供的另一種信息處理的方法的流程示意圖;
圖4是本發(fā)明實(shí)施例提供的另一種信息處理的方法的流程示意圖;
圖5是本發(fā)明實(shí)施例提供的另一種信息處理的方法的流程示意圖;
圖6是本發(fā)明實(shí)施例提供的另一種信息處理的方法的流程示意圖;
圖7是本發(fā)明實(shí)施例通過的一種信息處理的裝置的功能模塊示意圖。
具體實(shí)施方式
下面結(jié)合附圖和實(shí)施例對本發(fā)明實(shí)施例作進(jìn)一步的詳細(xì)說明??梢岳斫獾氖牵颂幩枋龅木唧w實(shí)施例僅僅用于解釋本發(fā)明實(shí)施例,而非對本發(fā)明實(shí)施例的限定。另外還需要說明的是,為了便于描述,附圖中僅示出了與本發(fā)明實(shí)施例相關(guān)的部分而非全部結(jié)構(gòu)。
參考圖1,圖1是本發(fā)明實(shí)施例提供的一種信息處理的方法的流程示意圖。
如圖1所示,所述信息處理的方法包括:
步驟101,在預(yù)設(shè)時(shí)間閾值內(nèi)從預(yù)設(shè)網(wǎng)址獲取披露信息,所述披露信息包括公司公告的掛牌公司、公司公告的兩網(wǎng)及退市公司、業(yè)務(wù)周知的掛牌公司、業(yè)務(wù)周知的兩網(wǎng)及退市公司、全部新增公告的代碼、標(biāo)題、日期以及公告正式文件;
具體的,采用自主研發(fā)的半結(jié)構(gòu)化文檔識別技術(shù),結(jié)合業(yè)務(wù)規(guī)則庫,進(jìn)行復(fù)雜的文檔結(jié)構(gòu)化提取。系統(tǒng)基于現(xiàn)有的信息披露平臺,獲取券商、企業(yè)發(fā)布的公告信息,完成PDF公告文件的信息結(jié)構(gòu)化過程,識別公告對應(yīng)的業(yè)務(wù)類型并提取對應(yīng)的業(yè)務(wù)指標(biāo)項(xiàng)信息。
具體的,系統(tǒng)通過互聯(lián)網(wǎng),每日定時(shí)從固定網(wǎng)址進(jìn)行披露信息抓取。主要文件包括:
首頁-信息披露-公司公告-掛牌公司
首頁-信息披露-公司公告-兩網(wǎng)及退市公司
首頁-信息披露-業(yè)務(wù)周知-掛牌公司
首頁-信息披露-業(yè)務(wù)周知-兩網(wǎng)及退市公司
四個(gè)分頁的全部新增公告的代碼、標(biāo)題、日期,以及公告正式文件。
因網(wǎng)絡(luò)、系統(tǒng)故障或目標(biāo)網(wǎng)站問題抓取失敗時(shí),每隔30分鐘進(jìn)行再次嘗試,至業(yè)務(wù)管理員用戶登錄時(shí)仍存在未成功的抓取任務(wù),則進(jìn)行頁面顯示。
具體的,可以通過neeqpretreatment:提取字段的正則信息,以PDF/WORD/EXCEL文件及其相關(guān)聯(lián)的數(shù)據(jù)庫信息作為數(shù)據(jù)源,將半結(jié)構(gòu)化文件進(jìn)行結(jié)構(gòu)化提取,并將信息提取到全文數(shù)據(jù)庫和關(guān)系型數(shù)據(jù)庫中。
或者,通過crawler爬蟲程序從相關(guān)網(wǎng)站獲取半結(jié)構(gòu)化文件及其相關(guān)信息。文件寫到本地,描述信息寫到數(shù)據(jù)庫中,由neeqpretreatment進(jìn)行調(diào)用。
或者,通過fileimport:從mongdb等數(shù)據(jù)庫中獲取xbrl等文件數(shù)據(jù),獲取相關(guān)業(yè)務(wù)數(shù)據(jù)。并根據(jù)不同數(shù)據(jù)進(jìn)行關(guān)聯(lián)分析。
步驟102,獲取公告網(wǎng)站標(biāo)題以及公告文件內(nèi)的正文標(biāo)題,根據(jù)預(yù)設(shè)的業(yè)務(wù)提取規(guī)則判斷公告所屬的業(yè)務(wù)類型;
具體的,系統(tǒng)通過獲取的公告網(wǎng)站標(biāo)題以及公告文件內(nèi)的正文標(biāo)題,依據(jù)預(yù)設(shè)的業(yè)務(wù)提取規(guī)則判斷公告所屬的業(yè)務(wù)類型。使用核心技術(shù)識別文件內(nèi)容關(guān)鍵信息。
對識別或不屬于業(yè)務(wù)類型的公告加入到問題公告列表,由對應(yīng)管理員及業(yè)務(wù)管理員進(jìn)行驗(yàn)證和處理。
步驟103,針對網(wǎng)站披露的所有掛牌公司公告數(shù)據(jù)進(jìn)行關(guān)鍵詞檢索,檢索的關(guān)鍵詞支持單個(gè)關(guān)鍵詞和多個(gè)關(guān)鍵詞的組合查詢;
具體的,針對網(wǎng)站披露的所有掛牌公司公告數(shù)據(jù)進(jìn)行關(guān)鍵詞檢索,檢索的關(guān)鍵詞支持單個(gè)關(guān)鍵詞和多個(gè)關(guān)鍵詞的組合查詢。系統(tǒng)默認(rèn)查詢公告時(shí)間范圍是7天(參數(shù)可配)。
具體的,通過rule正則表達(dá)式等相關(guān)技術(shù)進(jìn)行文件標(biāo)題、文件地址、文件內(nèi)容的多重篩選過濾。
具體的,基于SOLR自主開發(fā)了一套基于簡單查詢、組合查詢、拼音查詢等多功能的檢索系統(tǒng);系統(tǒng)根據(jù)用戶指定的關(guān)鍵詞、時(shí)間范圍按照多維度檢索,(券商緯度、公告分類緯度等),用戶錄入的關(guān)鍵詞支持單個(gè)或多個(gè)關(guān)鍵詞的組合,提供用戶多種查詢方式和多種查詢結(jié)果,以滿足用戶檢索需求。
步驟104,針對不同業(yè)務(wù)類型公告內(nèi)容按照設(shè)定的規(guī)則進(jìn)行內(nèi)容抽取,抽取結(jié)果生成通知單。
具體的,系統(tǒng)針對不同業(yè)務(wù)類型公告內(nèi)容按照設(shè)定的規(guī)則進(jìn)行內(nèi)容抽取,抽取結(jié)果生成通知單,整體識別技術(shù)通過簡單的界面展示,方便所有人進(jìn)行快捷部署。
系統(tǒng)采用自主研發(fā)的規(guī)則管理設(shè)計(jì),結(jié)合正則表達(dá)式提供的校驗(yàn)功能,集合而成了一套可擴(kuò)展可應(yīng)用的綜合性嵌入式功能模塊。
系統(tǒng)通過采用規(guī)則庫管理,釋放了規(guī)則對于整個(gè)系統(tǒng)的耦合性。并增加了整個(gè)產(chǎn)品的可擴(kuò)展能力及知識積累能力,本系統(tǒng)通過核心功能和規(guī)則庫的解耦,實(shí)現(xiàn)了產(chǎn)品的高復(fù)用性。
本發(fā)明實(shí)施例提供的一種信息處理的方法,在預(yù)設(shè)時(shí)間閾值內(nèi)從預(yù)設(shè)網(wǎng)址獲取披露信息,所述披露信息包括公司公告的掛牌公司、公司公告的兩網(wǎng)及退市公司、業(yè)務(wù)周知的掛牌公司、業(yè)務(wù)周知的兩網(wǎng)及退市公司、全部新增公告的代碼、標(biāo)題、日期以及公告正式文件;獲取公告網(wǎng)站標(biāo)題以及公告文件內(nèi)的正文標(biāo)題,根據(jù)預(yù)設(shè)的業(yè)務(wù)提取規(guī)則判斷公告所屬的業(yè)務(wù)類型;針對網(wǎng)站披露的所有掛牌公司公告數(shù)據(jù)進(jìn)行關(guān)鍵詞檢索,檢索的關(guān)鍵詞支持單個(gè)關(guān)鍵詞和多個(gè)關(guān)鍵詞的組合查詢;針對不同業(yè)務(wù)類型公告內(nèi)容按照設(shè)定的規(guī)則進(jìn)行內(nèi)容抽取,抽取結(jié)果生成通知單。本系統(tǒng)可以面向所有企事業(yè)單位,針對單位文件整體的識別分析,進(jìn)行簡單的業(yè)務(wù)配置并根據(jù)標(biāo)準(zhǔn)化功能,實(shí)現(xiàn)智能化識別。通過本項(xiàng)目的實(shí)施,將顯著提升企事業(yè)單位的辦公效率;大幅縮減了對于手動填單、人為關(guān)聯(lián)的工作量。將多個(gè)工具類系統(tǒng)進(jìn)行集成,完善了整個(gè)系統(tǒng)的多樣性和規(guī)范性。
參考圖2,圖2是本發(fā)明實(shí)施例提供的另一種信息處理的方法的流程示意圖。
如圖2所示,所述信息處理的方法包括:
步驟201,在預(yù)設(shè)時(shí)間閾值內(nèi)從預(yù)設(shè)網(wǎng)址獲取披露信息,所述披露信息包括公司公告的掛牌公司、公司公告的兩網(wǎng)及退市公司、業(yè)務(wù)周知的掛牌公司、業(yè)務(wù)周知的兩網(wǎng)及退市公司、全部新增公告的代碼、標(biāo)題、日期以及公告正式文件;
步驟202,獲取公告網(wǎng)站標(biāo)題以及公告文件內(nèi)的正文標(biāo)題,根據(jù)預(yù)設(shè)的業(yè)務(wù)提取規(guī)則判斷公告所屬的業(yè)務(wù)類型;
步驟203,對識別不屬于業(yè)務(wù)類型的公告加入到問題公告列表,以使得對應(yīng)管理員及業(yè)務(wù)管理員進(jìn)行驗(yàn)證和處理;
步驟204,針對網(wǎng)站披露的所有掛牌公司公告數(shù)據(jù)進(jìn)行關(guān)鍵詞檢索,檢索的關(guān)鍵詞支持單個(gè)關(guān)鍵詞和多個(gè)關(guān)鍵詞的組合查詢;
步驟205,針對不同業(yè)務(wù)類型公告內(nèi)容按照設(shè)定的規(guī)則進(jìn)行內(nèi)容抽取,抽取結(jié)果生成通知單。
參考圖3,圖3是本發(fā)明實(shí)施例提供的另一種信息處理的方法的流程示意圖。
如圖3所示,所述信息處理的方法包括:
步驟301,在預(yù)設(shè)時(shí)間閾值內(nèi)從預(yù)設(shè)網(wǎng)址獲取披露信息,所述披露信息包括公司公告的掛牌公司、公司公告的兩網(wǎng)及退市公司、業(yè)務(wù)周知的掛牌公司、業(yè)務(wù)周知的兩網(wǎng)及退市公司、全部新增公告的代碼、標(biāo)題、日期以及公告正式文件;
步驟302,獲取公告網(wǎng)站標(biāo)題以及公告文件內(nèi)的正文標(biāo)題,根據(jù)預(yù)設(shè)的業(yè)務(wù)提取規(guī)則判斷公告所屬的業(yè)務(wù)類型;
步驟303,使用分頁列表形式對抽取結(jié)果整體情況進(jìn)行展示,公告列表用于提供日期時(shí)間范圍和業(yè)務(wù)類型的篩選功能,并實(shí)現(xiàn)對數(shù)據(jù)項(xiàng)的選擇、反選和全選功能;所述公告列表的上方包括公告日期時(shí)間范圍、業(yè)務(wù)類型的篩選選項(xiàng),所述篩選選項(xiàng)用于接收變更篩選條件后即時(shí)刷新公告列表內(nèi)容;所述公告列表的每頁顯示條數(shù)依照系統(tǒng)全局配置和用戶首選項(xiàng)決定的,超過每頁顯示條數(shù)的公告通過分頁進(jìn)行顯示;所述公告列表的審核狀態(tài)包括:未審核、已審核、駁回和已完成;
步驟304,針對網(wǎng)站披露的所有掛牌公司公告數(shù)據(jù)進(jìn)行關(guān)鍵詞檢索,檢索的關(guān)鍵詞支持單個(gè)關(guān)鍵詞和多個(gè)關(guān)鍵詞的組合查詢;
步驟305,針對不同業(yè)務(wù)類型公告內(nèi)容按照設(shè)定的規(guī)則進(jìn)行內(nèi)容抽取,抽取結(jié)果生成通知單。
參考圖4,圖4是本發(fā)明實(shí)施例提供的另一種信息處理的方法的流程示意圖。
如圖4所示,所述信息處理的方法包括:
步驟401,在預(yù)設(shè)時(shí)間閾值內(nèi)從預(yù)設(shè)網(wǎng)址獲取披露信息,所述披露信息包括公司公告的掛牌公司、公司公告的兩網(wǎng)及退市公司、業(yè)務(wù)周知的掛牌公司、業(yè)務(wù)周知的兩網(wǎng)及退市公司、全部新增公告的代碼、標(biāo)題、日期以及公告正式文件;
步驟402,獲取公告網(wǎng)站標(biāo)題以及公告文件內(nèi)的正文標(biāo)題,根據(jù)預(yù)設(shè)的業(yè)務(wù)提取規(guī)則判斷公告所屬的業(yè)務(wù)類型;
步驟403,根據(jù)當(dāng)前選定的時(shí)間范圍和業(yè)務(wù)類型,統(tǒng)計(jì)符合條件公告數(shù)量并在公告表的最上方進(jìn)行提示;
步驟404,針對網(wǎng)站披露的所有掛牌公司公告數(shù)據(jù)進(jìn)行關(guān)鍵詞檢索,檢索的關(guān)鍵詞支持單個(gè)關(guān)鍵詞和多個(gè)關(guān)鍵詞的組合查詢;
步驟405,針對不同業(yè)務(wù)類型公告內(nèi)容按照設(shè)定的規(guī)則進(jìn)行內(nèi)容抽取,抽取結(jié)果生成通知單。
參考圖5,圖5是本發(fā)明實(shí)施例提供的另一種信息處理的方法的流程示意圖。
如圖5所示,所述信息處理的方法包括:
步驟501,在預(yù)設(shè)時(shí)間閾值內(nèi)從預(yù)設(shè)網(wǎng)址獲取披露信息,所述披露信息包括公司公告的掛牌公司、公司公告的兩網(wǎng)及退市公司、業(yè)務(wù)周知的掛牌公司、業(yè)務(wù)周知的兩網(wǎng)及退市公司、全部新增公告的代碼、標(biāo)題、日期以及公告正式文件;
步驟502,獲取公告網(wǎng)站標(biāo)題以及公告文件內(nèi)的正文標(biāo)題,根據(jù)預(yù)設(shè)的業(yè)務(wù)提取規(guī)則判斷公告所屬的業(yè)務(wù)類型;
步驟503,根據(jù)當(dāng)前選定的時(shí)間范圍和業(yè)務(wù)類型,統(tǒng)計(jì)符合條件公告數(shù)量并在公告表的最上方進(jìn)行提示;
步驟504,通過所述公告列表頁面中的審核按鈕接收用戶觸發(fā)的進(jìn)入數(shù)據(jù)審核頁面的請求,以使得所述用戶根據(jù)數(shù)據(jù)記錄對應(yīng)的原始公告對抽取結(jié)果進(jìn)行人工校對;進(jìn)入審核頁面后,所述公告列表頁面頂部顯示從某種業(yè)務(wù)類型的公告抽取出來的數(shù)據(jù)指標(biāo)及其值,并顯示對應(yīng)的原始預(yù)設(shè)類型的公告;接收所述用戶點(diǎn)擊的指標(biāo)項(xiàng)的按鍵后,在當(dāng)前頁面中提供給所述用戶進(jìn)行數(shù)據(jù)準(zhǔn)確性確認(rèn)的界面;若所述用戶對抽取有誤的指標(biāo)項(xiàng)進(jìn)行修改,則對原始數(shù)據(jù)進(jìn)行更新,所述公告列表中相應(yīng)的數(shù)據(jù)記錄由未審核變?yōu)橐褜徍耍唤邮账鲇脩酎c(diǎn)擊的返回按鈕,并返回到公告列表頁面;
具體的,通過公告列表頁面中的審核按鈕,進(jìn)入數(shù)據(jù)審核頁面,根據(jù)該條數(shù)據(jù)記錄對應(yīng)的原始公告對抽取結(jié)果進(jìn)行人工校對。
進(jìn)入審核頁面后,頂部顯示從某種業(yè)務(wù)類型的公告抽取出來的數(shù)據(jù)指標(biāo)及其值,接著顯示相應(yīng)的原始PDF/WORD/EXCEL類型的公告(可以滾動、全屏顯示完整的公告)。點(diǎn)擊某個(gè)指標(biāo)項(xiàng),可以快速在公告中DXXW到對其進(jìn)行信息抽取的位置,并在當(dāng)前頁面中框中,供審核人員進(jìn)行數(shù)據(jù)準(zhǔn)確性確認(rèn)。審核人員可以根據(jù)原始公告的實(shí)際情況,對抽取有誤的指標(biāo)項(xiàng)進(jìn)行修改,點(diǎn)擊確認(rèn)按鈕,可以對數(shù)據(jù)庫中的原始數(shù)據(jù)進(jìn)行更新,同時(shí)公告列表中相應(yīng)的數(shù)據(jù)記錄也由未審核變?yōu)橐褜徍?。點(diǎn)擊返回按鈕,回到公告列表頁面。
具體的,采用自主研發(fā)的提取信息追溯技術(shù),可以追溯現(xiàn)有信息出處并進(jìn)行高亮展示、精準(zhǔn)DXXW。同時(shí)提供手動編輯功能,支持對特殊文件的人為GXXK(主要針對一些涵蓋圖片及掃描件信息的處理)。
系統(tǒng)基于掛牌公司上傳的年報(bào)、業(yè)務(wù)通知單信息,在上報(bào)的過程中,用戶可通過本功能進(jìn)行反復(fù)糾錯(cuò),提高業(yè)務(wù)數(shù)據(jù)的準(zhǔn)確性、一致性。
步驟505,針對網(wǎng)站披露的所有掛牌公司公告數(shù)據(jù)進(jìn)行關(guān)鍵詞檢索,檢索的關(guān)鍵詞支持單個(gè)關(guān)鍵詞和多個(gè)關(guān)鍵詞的組合查詢;
步驟506,針對不同業(yè)務(wù)類型公告內(nèi)容按照設(shè)定的規(guī)則進(jìn)行內(nèi)容抽取,抽取結(jié)果生成通知單。
參考圖6,圖6是本發(fā)明實(shí)施例提供的另一種信息處理的方法的流程示意圖。
在圖1至圖5的基礎(chǔ)上,以在圖1的基礎(chǔ)上為例,如圖6所示,所述信息處理的方法包括:
步驟601,在預(yù)設(shè)時(shí)間閾值內(nèi)從預(yù)設(shè)網(wǎng)址獲取披露信息,所述披露信息包括公司公告的掛牌公司、公司公告的兩網(wǎng)及退市公司、業(yè)務(wù)周知的掛牌公司、業(yè)務(wù)周知的兩網(wǎng)及退市公司、全部新增公告的代碼、標(biāo)題、日期以及公告正式文件;
步驟602,獲取公告網(wǎng)站標(biāo)題以及公告文件內(nèi)的正文標(biāo)題,根據(jù)預(yù)設(shè)的業(yè)務(wù)提取規(guī)則判斷公告所屬的業(yè)務(wù)類型;
步驟603,針對網(wǎng)站披露的所有掛牌公司公告數(shù)據(jù)進(jìn)行關(guān)鍵詞檢索,檢索的關(guān)鍵詞支持單個(gè)關(guān)鍵詞和多個(gè)關(guān)鍵詞的組合查詢;
步驟604,針對不同業(yè)務(wù)類型公告內(nèi)容按照設(shè)定的規(guī)則進(jìn)行內(nèi)容抽取,抽取結(jié)果生成通知單;
步驟605,通過監(jiān)管責(zé)任列表接收用戶向管理員分配的管理員權(quán)限,所述監(jiān)管責(zé)任列表是公司管理員對監(jiān)管員及掛牌公司和券商進(jìn)行授權(quán)的入口;若當(dāng)前情況屬于預(yù)設(shè)特殊情況時(shí),接收所述管理員根據(jù)所述管理員權(quán)限進(jìn)行操作,所述管理員權(quán)限包括負(fù)責(zé)查看和處理本管理員管轄范圍的掛牌公司公告;根據(jù)所述操作反饋問題公告并生成通知單完成掛牌公司相應(yīng)的業(yè)務(wù)處理。
參考圖7,圖7是本發(fā)明實(shí)施例通過的一種信息處理的裝置的功能模塊示意圖。
如圖7所示,所述裝置包括:
第一獲取模塊701,用于在預(yù)設(shè)時(shí)間閾值內(nèi)從預(yù)設(shè)網(wǎng)址獲取披露信息,所述披露信息包括公司公告的掛牌公司、公司公告的兩網(wǎng)及退市公司、業(yè)務(wù)周知的掛牌公司、業(yè)務(wù)周知的兩網(wǎng)及退市公司、全部新增公告的代碼、標(biāo)題、日期以及公告正式文件;
第二獲取模塊702,用于獲取公告網(wǎng)站標(biāo)題以及公告文件內(nèi)的正文標(biāo)題,根據(jù)預(yù)設(shè)的業(yè)務(wù)提取規(guī)則判斷公告所屬的業(yè)務(wù)類型;
查詢模塊703,用于針對網(wǎng)站披露的所有掛牌公司公告數(shù)據(jù)進(jìn)行關(guān)鍵詞檢索,檢索的關(guān)鍵詞支持單個(gè)關(guān)鍵詞和多個(gè)關(guān)鍵詞的組合查詢;
生成模塊704,用于針對不同業(yè)務(wù)類型公告內(nèi)容按照設(shè)定的規(guī)則進(jìn)行內(nèi)容抽取,抽取結(jié)果生成通知單。
優(yōu)選地,所述裝置還包括:
加入模塊,用于在根據(jù)預(yù)設(shè)的業(yè)務(wù)提取規(guī)則判斷公告所屬的業(yè)務(wù)類型之后,對識別不屬于業(yè)務(wù)類型的公告加入到問題公告列表,以使得對應(yīng)管理員及業(yè)務(wù)管理員進(jìn)行驗(yàn)證和處理;
展示模塊,用于在根據(jù)預(yù)設(shè)的業(yè)務(wù)提取規(guī)則判斷公告所屬的業(yè)務(wù)類型之后,使用分頁列表形式對抽取結(jié)果整體情況進(jìn)行展示,公告列表用于提供日期時(shí)間范圍和業(yè)務(wù)類型的篩選功能,并實(shí)現(xiàn)對數(shù)據(jù)項(xiàng)的選擇、反選和全選功能;所述公告列表的上方包括公告日期時(shí)間范圍、業(yè)務(wù)類型的篩選選項(xiàng),所述篩選選項(xiàng)用于接收變更篩選條件后即時(shí)刷新公告列表內(nèi)容;所述公告列表的每頁顯示條數(shù)依照系統(tǒng)全局配置和用戶首選項(xiàng)決定的,超過每頁顯示條數(shù)的公告通過分頁進(jìn)行顯示;所述公告列表的審核狀態(tài)包括:未審核、已審核、駁回和已完成;
統(tǒng)計(jì)模塊,用于在根據(jù)預(yù)設(shè)的業(yè)務(wù)提取規(guī)則判斷公告所屬的業(yè)務(wù)類型之后,根據(jù)當(dāng)前選定的時(shí)間范圍和業(yè)務(wù)類型,統(tǒng)計(jì)符合條件公告數(shù)量并在公告表的最上方進(jìn)行提示。
優(yōu)選地,所述裝置還包括:
第一處理模塊,用于通過所述公告列表頁面中的審核按鈕接收用戶觸發(fā)的進(jìn)入數(shù)據(jù)審核頁面的請求,以使得所述用戶根據(jù)數(shù)據(jù)記錄對應(yīng)的原始公告對抽取結(jié)果進(jìn)行人工校對;進(jìn)入審核頁面后,所述公告列表頁面頂部顯示從某種業(yè)務(wù)類型的公告抽取出來的數(shù)據(jù)指標(biāo)及其值,并顯示對應(yīng)的原始預(yù)設(shè)類型的公告;接收所述用戶點(diǎn)擊的指標(biāo)項(xiàng)的按鍵后,在當(dāng)前頁面中提供給所述用戶進(jìn)行數(shù)據(jù)準(zhǔn)確性確認(rèn)的界面;若所述用戶對抽取有誤的指標(biāo)項(xiàng)進(jìn)行修改,則對原始數(shù)據(jù)進(jìn)行更新,所述公告列表中相應(yīng)的數(shù)據(jù)記錄由未審核變?yōu)橐褜徍?;接收所述用戶點(diǎn)擊的返回按鈕,并返回到公告列表頁面。
優(yōu)選地,所述裝置還包括:
第二處理模塊,用于通過監(jiān)管責(zé)任列表接收用戶向管理員分配的管理員權(quán)限,所述監(jiān)管責(zé)任列表是公司管理員對監(jiān)管員及掛牌公司和券商進(jìn)行授權(quán)的入口;若當(dāng)前情況屬于預(yù)設(shè)特殊情況時(shí),接收所述管理員根據(jù)所述管理員權(quán)限進(jìn)行操作,所述管理員權(quán)限包括負(fù)責(zé)查看和處理本管理員管轄范圍的掛牌公司公告;根據(jù)所述操作反饋問題公告并生成通知單完成掛牌公司相應(yīng)的業(yè)務(wù)處理。
本發(fā)明實(shí)施例提供的一種信息處理的裝置,在預(yù)設(shè)時(shí)間閾值內(nèi)從預(yù)設(shè)網(wǎng)址獲取披露信息,所述披露信息包括公司公告的掛牌公司、公司公告的兩網(wǎng)及退市公司、業(yè)務(wù)周知的掛牌公司、業(yè)務(wù)周知的兩網(wǎng)及退市公司、全部新增公告的代碼、標(biāo)題、日期以及公告正式文件;獲取公告網(wǎng)站標(biāo)題以及公告文件內(nèi)的正文標(biāo)題,根據(jù)預(yù)設(shè)的業(yè)務(wù)提取規(guī)則判斷公告所屬的業(yè)務(wù)類型;針對網(wǎng)站披露的所有掛牌公司公告數(shù)據(jù)進(jìn)行關(guān)鍵詞檢索,檢索的關(guān)鍵詞支持單個(gè)關(guān)鍵詞和多個(gè)關(guān)鍵詞的組合查詢;針對不同業(yè)務(wù)類型公告內(nèi)容按照設(shè)定的規(guī)則進(jìn)行內(nèi)容抽取,抽取結(jié)果生成通知單。本系統(tǒng)可以面向所有企事業(yè)單位,針對單位文件整體的識別分析,進(jìn)行簡單的業(yè)務(wù)配置并根據(jù)標(biāo)準(zhǔn)化功能,實(shí)現(xiàn)智能化識別。通過本項(xiàng)目的實(shí)施,將顯著提升企事業(yè)單位的辦公效率;大幅縮減了對于手動填單、人為關(guān)聯(lián)的工作量。將多個(gè)工具類系統(tǒng)進(jìn)行集成,完善了整個(gè)系統(tǒng)的多樣性和規(guī)范性。
以上結(jié)合具體實(shí)施例描述了本發(fā)明實(shí)施例的技術(shù)原理。這些描述只是為了解釋本發(fā)明實(shí)施例的原理,而不能以任何方式解釋為對本發(fā)明實(shí)施例保護(hù)范圍的限制?;诖颂幍慕忉?,本領(lǐng)域的技術(shù)人員不需要付出創(chuàng)造性的勞動即可聯(lián)想到本發(fā)明實(shí)施例的其它具體實(shí)施方式,這些方式都將落入本發(fā)明實(shí)施例的保護(hù)范圍之內(nèi)。