技術(shù)編號:8381057
提示:您尚未登錄,請點 登 陸 后下載,如果您還沒有賬戶請點 注 冊 ,登陸完成后,請刷新本頁查看技術(shù)詳細信息。 本發(fā)明涉及計算機應用,特別涉及一種網(wǎng)頁數(shù)據(jù)結(jié)構(gòu)化解析方法和裝 置。背景技術(shù) 隨著大數(shù)據(jù)時代的來臨,全球企業(yè)都對于大數(shù)據(jù)充滿了積極的熱情,大數(shù)據(jù)分析 處理也應運而生。大數(shù)據(jù)處理流程包括數(shù)據(jù)采集、數(shù)據(jù)存儲整合、數(shù)據(jù)預處理、數(shù)據(jù)挖掘分 析、數(shù)據(jù)展現(xiàn)應用。傳統(tǒng)行業(yè)企業(yè)在開展大數(shù)據(jù)時,首先面對的就是如何打通內(nèi)部數(shù)據(jù)與外 部數(shù)據(jù),也就是如何獲得基于企業(yè)內(nèi)部數(shù)據(jù)之外的互聯(lián)網(wǎng)數(shù)據(jù)。然而互聯(lián)網(wǎng)采集的數(shù)據(jù)一 般都是無結(jié)構(gòu)或半結(jié)構(gòu)化的文本、圖片、音頻以及視頻等等。如何將這些數(shù)...
注意:該技術(shù)已申請專利,請尊重研發(fā)人員的辛勤研發(fā)付出,在未取得專利權(quán)人授權(quán)前,僅供技術(shù)研究參考不得用于商業(yè)用途。
該專利適合技術(shù)人員進行技術(shù)研發(fā)參考以及查看自身技術(shù)是否侵權(quán),增加技術(shù)思路,做技術(shù)知識儲備,不適合論文引用。
請注意,此類技術(shù)沒有源代碼,用于學習研究技術(shù)思路。