一種信息發(fā)布的方法及系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及移動(dòng)互聯(lián)網(wǎng)的信息平臺技術(shù)領(lǐng)域,尤其涉及一種信息發(fā)布的方法及系統(tǒng)。
【背景技術(shù)】
[0002]現(xiàn)代社會(huì)中,各種信息無處不在,信息發(fā)布系統(tǒng)中的信息一般包括文字、聲音、圖形、圖像、動(dòng)畫、視頻等等。其中,能夠同時(shí)獲取、處理、編輯、存儲和展示兩個(gè)以上不同類型信息媒體的技術(shù),也稱多媒體信息發(fā)布系統(tǒng)。因此認(rèn)為多媒體是計(jì)算機(jī)綜合處理文本、圖形、圖像、音頻、視頻等多媒體信息,使多種信息建立邏輯連接,集成為一個(gè)系統(tǒng)并具有交互性。它是一種迅速發(fā)展的綜合性電子信息技術(shù),給人們的工作、生活、和娛樂帶來了深刻的革命。
[0003]不但局限于多媒體信息,很多信息充斥于當(dāng)今社會(huì),如何更好,更準(zhǔn)確的將有價(jià)值的信息發(fā)布到用戶終端是一個(gè)重要的問題。
【發(fā)明內(nèi)容】
[0004]為了克服現(xiàn)有技術(shù)的不足,本發(fā)明的目的是實(shí)現(xiàn)信息發(fā)布、展現(xiàn)行業(yè)相關(guān)信息的移動(dòng)終端門戶的方法及系統(tǒng)。
[0005]本發(fā)明為實(shí)現(xiàn)上述目的,采用以下技術(shù)方案:
[0006]本發(fā)明一方面提供了一種發(fā)布信息的方法,所述方法包括:
[0007]獲取互聯(lián)網(wǎng)數(shù)據(jù);
[0008]對獲取的所述互聯(lián)網(wǎng)數(shù)據(jù)進(jìn)行處理,所述處理至少包括:抽取、整合、過濾;
[0009]將處理后的數(shù)據(jù)進(jìn)行存儲與版本控制;
[0010]將存儲的數(shù)據(jù)發(fā)布到請求端。
[0011]作為優(yōu)選的,所述獲取互聯(lián)網(wǎng)數(shù)據(jù),具體包括以下步驟:
[0012]模仿登陸目標(biāo)系統(tǒng);
[0013]從所述目標(biāo)系統(tǒng)的入口點(diǎn)開始,遍歷頁面上所有的鏈接地址;
[0014]對獲取的鏈接進(jìn)行分類整理,去除重復(fù)選項(xiàng),篩選出與設(shè)定的文件類型相匹配的頁面地址;
[0015]訪問篩選出的頁面地址,獲取頁面內(nèi)容,將頁面內(nèi)容與設(shè)定的關(guān)鍵字進(jìn)行匹配;
[0016]利用指紋技術(shù)分析頁面結(jié)構(gòu),從頁面中解析出設(shè)定的數(shù)據(jù);
[0017]將解析出的數(shù)據(jù)與預(yù)先設(shè)定的顯示模板進(jìn)行整合,將信息顯示出來。
[0018]作為優(yōu)選的,所述訪問篩選出的頁面地址,獲取頁面內(nèi)容,將頁面內(nèi)容與設(shè)定的關(guān)鍵字進(jìn)行匹配之后,還包括:
[0019]將匹配一致的頁面進(jìn)行解析,并重復(fù)從所述目標(biāo)系統(tǒng)的入口點(diǎn)開始,遍歷頁面上所有的鏈接地址。
[0020]作為優(yōu)選的,所述從所述目標(biāo)系統(tǒng)的入口點(diǎn)開始,遍歷頁面上所有的鏈接地址,具體包括:
[0021]周期性的遍歷頁面上所有的鏈接地址。
[0022]作為優(yōu)選的,所述設(shè)定文件類型根據(jù)用戶的興趣選擇進(jìn)行設(shè)定,所述文件類型包括文本、指定圖片格式、腳本任意一種或組合。
[0023]本發(fā)明的另一方面提供了一種發(fā)布信息的系統(tǒng),所述系統(tǒng)包括:
[0024]獲取單元,用于獲取互聯(lián)網(wǎng)數(shù)據(jù);
[0025]處理單元,用于對獲取的所述互聯(lián)網(wǎng)數(shù)據(jù)進(jìn)行處理,所述處理至少包括:抽取、整合、過濾;
[0026]數(shù)據(jù)庫,用于將處理后的數(shù)據(jù)進(jìn)行存儲與版本控制;
[0027]發(fā)布單元,用于根據(jù)接收到的請求信息的指令,將存儲的數(shù)據(jù)發(fā)布到請求端。
[0028]作為優(yōu)選的,所述系統(tǒng)中獲取單元具體包括:
[0029]設(shè)定模擬模塊:用于模仿登陸目標(biāo)系統(tǒng);
[0030]遍歷模塊,用于從所述目標(biāo)系統(tǒng)的入口點(diǎn)開始,遍歷頁面上所有的鏈接地址:
[0031]分類模塊,用于對獲取的鏈接進(jìn)行分類整理,去除重復(fù)選項(xiàng),篩選出與設(shè)定的文件類型相匹配的頁面地址;
[0032]匹配模塊,用于訪問篩選出的頁面地址,獲取頁面內(nèi)容,將頁面內(nèi)容與設(shè)定的關(guān)鍵字進(jìn)行匹配;
[0033]解析模塊,用于利用指紋技術(shù)分析頁面結(jié)構(gòu),從頁面中解析出設(shè)定的數(shù)據(jù);
[0034]顯示模塊,用于將解析出的數(shù)據(jù)與預(yù)先設(shè)定的顯示模板進(jìn)行整合,將信息顯示出來。
[0035]作為優(yōu)選的,所述遍歷模塊,還用于將匹配一致的頁面進(jìn)行解析,并重復(fù)從所述目標(biāo)系統(tǒng)的入口點(diǎn)開始,遍歷頁面上所有的鏈接地址。
[0036]作為優(yōu)選的,所述遍歷模塊,還用于周期性的遍歷頁面上所有的鏈接地址。
[0037]本發(fā)明的第三方面還提供了一種移動(dòng)終端,所述終端包括:接收單元,用于接收任意一所述的發(fā)布信息的系統(tǒng)發(fā)布的信息。
[0038]本發(fā)明的有益效果包括以下幾點(diǎn):
[0039]首先聚信息:云引擎技術(shù)可實(shí)時(shí)針對政企客戶指定的信息源匯聚信息內(nèi)容
[0040]其次,多門戶:應(yīng)用軟件APP (applicat1n)、手機(jī)無線應(yīng)用協(xié)議WAP (WirelessApplicat1n Protocol)網(wǎng)站、微信公共賬戶同步呈現(xiàn),實(shí)時(shí)同步
[0041]最后,智能化:基于智能后臺的信息自動(dòng)化發(fā)布和APP或者微信賬號動(dòng)態(tài)生成技術(shù),智能后臺實(shí)時(shí)與前端APP、微信賬號等對接,實(shí)現(xiàn)人工編輯操作所不能夠比擬的強(qiáng)大并便捷的智能化功能,為政企單位提供與客戶屬性匹配的自動(dòng)化專屬化APP/微信賬號(如:信息自動(dòng)更新發(fā)布、會(huì)員動(dòng)態(tài)交互、機(jī)器人、APP按鈕/微信菜單動(dòng)態(tài)生成)
[0042]下面結(jié)合附圖和實(shí)施例對本發(fā)明作進(jìn)一步說明。
【附圖說明】
[0043]圖1是本發(fā)明方法的實(shí)施例一的流程示意圖;
[0044]圖2是本發(fā)明獲取互聯(lián)網(wǎng)數(shù)據(jù)方法的流程示意圖;
[0045]圖3是本發(fā)明系統(tǒng)的實(shí)施例一的結(jié)構(gòu)示意圖;
[0046]圖4是本發(fā)明系統(tǒng)的獲取單元的結(jié)構(gòu)示意圖;
[0047]圖5是本發(fā)明的移動(dòng)終端的結(jié)構(gòu)框圖;
[0048]圖6是本發(fā)明系統(tǒng)運(yùn)行的結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0049]本發(fā)明的目的是可以為不同行業(yè),不同屬性的政企客戶單位帶來宣傳、溝通、營銷、交互等多方位價(jià)值。
[0050]下面結(jié)合具體實(shí)施例及附圖對本發(fā)明進(jìn)行詳細(xì)說明:
[0051]如圖1所示,為本發(fā)明實(shí)施例一提供的一種發(fā)布信息的方法流程圖,所述方法包括:
[0052]步驟101:獲取互聯(lián)網(wǎng)數(shù)據(jù);
[0053]步驟102:對獲取的所述互聯(lián)網(wǎng)數(shù)據(jù)進(jìn)行處理,所述處理至少包括:抽取、整合、過濾;
[0054]步驟103:將處理后的數(shù)據(jù)進(jìn)行存儲與版本控制;
[0055]步驟104:將存儲的數(shù)據(jù)發(fā)布到請求端。
[0056]本發(fā)明提供的方法中還可以提供對數(shù)據(jù)的檢索、統(tǒng)計(jì)、讀取服務(wù)以及全方位支持各類終端設(shè)備,例如:電腦、平板、手機(jī)、電視機(jī)或者電子書等。
[0057]如圖2所示,為獲取互聯(lián)網(wǎng)數(shù)據(jù)方法的流程示意圖,所述方法具體包括以下步驟:
[0058]步驟201:模仿登陸目標(biāo)系統(tǒng);
[0059]步驟202:從所述目標(biāo)系統(tǒng)的入口點(diǎn)開始,遍歷頁面上所有的鏈接地址;
[0060]步驟203:對獲取的鏈接進(jìn)行分類整理,去除重復(fù)選項(xiàng),篩選出與設(shè)定的文件類型相匹配的頁面地址;
[0061]步驟204:訪問篩選出的頁面地址,獲取頁面內(nèi)容,將頁面內(nèi)容與設(shè)定的關(guān)鍵字進(jìn)行匹配;
[0062]步驟205:利用指紋技術(shù)分析頁面結(jié)構(gòu),從頁面中解析出設(shè)定的數(shù)據(jù);
[0063]步驟206:將解析出的數(shù)據(jù)與預(yù)先設(shè)定的顯示模板進(jìn)行整合,將信息顯示出來。
[0064]另外還可以將解析出的數(shù)據(jù)與用戶預(yù)先定制的顯示模板進(jìn)行整合,依照用戶的喜好把數(shù)據(jù)抓取結(jié)果呈現(xiàn)給最終用戶。
[0065]步驟204:所述訪問篩選出的頁面地址,獲取頁面內(nèi)容,將頁面內(nèi)容與設(shè)定的關(guān)鍵字進(jìn)行匹配之后,還包括:
[0066]將匹配一致的頁面進(jìn)行解析,并重復(fù)步驟202從所述目標(biāo)系統(tǒng)的入口點(diǎn)開始,遍歷頁面上所有的鏈接地址。
[0067]用戶還可以也可對爬蟲的爬行深度進(jìn)行定制。
[0068]步驟202具體還可以包括:周期性的遍歷頁面上所有的鏈接地址。還可以
[0069]具體的在上述的各步驟所述設(shè)定文件類型根據(jù)用戶的興趣選擇進(jìn)行設(shè)定,所述文件類型包括文本、指定圖片格式、腳本任意一種或組合。
[0070]云引擎是一種基于云平臺的海量數(shù)據(jù)檢索程序,它利用云計(jì)算架構(gòu)為用戶提供一種高度可定制,易維護(hù),智能化的數(shù)據(jù)獲取方式。云引擎程序可模仿瀏覽器的行為,由用戶根據(jù)特定目標(biāo)站點(diǎn)的特點(diǎn)制定用戶認(rèn)證邏輯,實(shí)現(xiàn)無用戶自動(dòng)登陸(即:模擬用戶登錄),獲取該用戶權(quán)限下允許獲取的所有的信息。