国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種互聯(lián)網(wǎng)交通輿情信息采集和處理的方法與流程

      文檔序號(hào):11276572閱讀:1035來源:國知局
      一種互聯(lián)網(wǎng)交通輿情信息采集和處理的方法與流程

      本發(fā)明涉及信息采集領(lǐng)域,特別是涉及一種互聯(lián)網(wǎng)交通輿情信息采集和處理的方法。



      背景技術(shù):

      隨著經(jīng)濟(jì)的快速發(fā)展,城市交通發(fā)展增速,交通新聞信息量越來越大,交通管理部門對(duì)掌控當(dāng)前交通信息和輿情的需求日益強(qiáng)烈?,F(xiàn)有技術(shù)中是通過以下兩個(gè)技術(shù)對(duì)網(wǎng)站、微博、微信等互聯(lián)網(wǎng)新聞進(jìn)行收集。

      網(wǎng)絡(luò)爬蟲是一種按照一定的規(guī)則,自動(dòng)地抓取互聯(lián)網(wǎng)信息的程序或者腳本,它們被廣泛用于互聯(lián)網(wǎng)搜索引擎或其他類似網(wǎng)站,可以自動(dòng)采集所有其能夠訪問到的頁面內(nèi)容,以獲取或更新這些網(wǎng)站的內(nèi)容和檢索方式。從功能上來講,爬蟲一般分為數(shù)據(jù)采集,處理,儲(chǔ)存三個(gè)部分。

      傳統(tǒng)爬蟲從一個(gè)或若干初始網(wǎng)頁的url開始,獲得初始網(wǎng)頁上的url,在抓取網(wǎng)頁的過程中,不斷從當(dāng)前頁面上抽取新的url放入隊(duì)列,直到滿足系統(tǒng)的一定停止條件。聚焦爬蟲的工作流程較為復(fù)雜,需要根據(jù)一定的網(wǎng)頁分析算法過濾與主題無關(guān)的鏈接,保留有用的鏈接并將其放入等待抓取的url隊(duì)列。然后,它將根據(jù)一定的搜索策略從隊(duì)列中選擇下一步要抓取的網(wǎng)頁url,并重復(fù)上述過程,直到達(dá)到系統(tǒng)的某一條件時(shí)停止。另外,所有被爬蟲抓取的網(wǎng)頁將會(huì)被系統(tǒng)存貯,進(jìn)行一定的分析、過濾,并建立索引,以便之后的查詢和檢索;對(duì)于聚焦爬蟲來說,這一過程所得到的分析結(jié)果還可能對(duì)以后的抓取過程給出反饋和指導(dǎo)。

      用戶從互聯(lián)網(wǎng)上可獲得的信息包含了從技術(shù)資料、商業(yè)信息到新聞報(bào)道、娛樂資訊等多種類別和形式的文檔,構(gòu)成了一個(gè)異常龐大的具有異構(gòu)性、開放性特點(diǎn)的分布式數(shù)據(jù)庫,而這個(gè)數(shù)據(jù)庫中存放的是非結(jié)構(gòu)化的文本數(shù)據(jù)。結(jié)合人工智能研究領(lǐng)域中的自然語言理解和計(jì)算機(jī)語言學(xué),數(shù)據(jù)挖掘需要兩個(gè)關(guān)鍵技術(shù):網(wǎng)絡(luò)挖掘和文本挖掘。

      網(wǎng)絡(luò)挖掘側(cè)重于分析和挖掘網(wǎng)頁相關(guān)的數(shù)據(jù),包括文本、鏈接結(jié)構(gòu)和訪問統(tǒng)計(jì)(最終形成用戶網(wǎng)絡(luò)導(dǎo)航)。一個(gè)網(wǎng)頁中包含了多種不同的數(shù)據(jù)類型,因此網(wǎng)絡(luò)挖掘就包含了文本挖掘、數(shù)據(jù)庫中數(shù)據(jù)挖掘、圖像挖掘等。

      文本挖掘是抽取有效、新穎、有用、可理解的、散布在文本文件中的有價(jià)值知識(shí),并且利用這些知識(shí)更好地組織信息的過程。文本挖掘包含文本收集、文本分析、特征修剪、文檔聚類、文檔分類等關(guān)鍵技術(shù)。

      但是現(xiàn)有技術(shù)中的網(wǎng)絡(luò)爬蟲技術(shù),針對(duì)性不強(qiáng),缺少準(zhǔn)確的行業(yè)熱點(diǎn)專題詞庫支撐,獲取內(nèi)容繁多,不能針對(duì)交通類信息進(jìn)行有效采集。網(wǎng)絡(luò)和文本數(shù)據(jù)挖掘作為新興技術(shù),缺少基于交通業(yè)務(wù)的定制化模型,不能及時(shí)、有效處理和分析出有效的交通類信息。

      現(xiàn)有技術(shù)中對(duì)互聯(lián)網(wǎng)中的交通輿情信息采集和處理的方法是通過網(wǎng)站、微博、微信等互聯(lián)網(wǎng)新聞渠道,去獲取具體公安交通管理部門相關(guān)的輿情新聞內(nèi)容并對(duì)新聞輿情類內(nèi)容的監(jiān)控和管理,主要從信息監(jiān)控、數(shù)據(jù)采集、內(nèi)容分析到業(yè)務(wù)處理、統(tǒng)計(jì)研判的過程采取的還是半人工、半系統(tǒng)處理的方式,不能全面實(shí)現(xiàn)自動(dòng)化。

      因此,如何對(duì)快速全方位掌握、監(jiān)控和管理交通新聞輿情,提供更好的現(xiàn)代化支持,就成為本領(lǐng)域技術(shù)人員亟需解決的問題。



      技術(shù)實(shí)現(xiàn)要素:

      本發(fā)明的目的在于提供一種互聯(lián)網(wǎng)交通輿情信息采集和處理的方法,以克服現(xiàn)有技術(shù)中存在的上述缺陷。

      一種互聯(lián)網(wǎng)交通輿情信息采集和處理的方法,就是要解決從信息監(jiān)控、數(shù)據(jù)采集、內(nèi)容分析到業(yè)務(wù)處理、統(tǒng)計(jì)研判的全自動(dòng)化過程。通過建設(shè)輿情監(jiān)控和管理平臺(tái),來實(shí)現(xiàn)輿情信息的自動(dòng)化處理過程,為交通管理者提供最及時(shí)、最有效的交通輿情內(nèi)容和分析結(jié)果。通過及時(shí)發(fā)現(xiàn)、獲取相關(guān)的輿情信息,并快速指派人員處理,為公安交通管理層全面掌握社情民意,輿情動(dòng)態(tài),做出正確輿論引導(dǎo)。通過對(duì)大量數(shù)據(jù)分析,發(fā)現(xiàn)薄弱環(huán)節(jié),為決策層提供針對(duì)性幫助。

      為實(shí)現(xiàn)上述目的,本發(fā)明提供一種互聯(lián)網(wǎng)交通輿情信息采集和處理的方法,其包括數(shù)據(jù)采集平臺(tái),數(shù)據(jù)處理平臺(tái),業(yè)務(wù)處理和數(shù)據(jù)研判平臺(tái),監(jiān)控、預(yù)警和報(bào)告模塊,業(yè)務(wù)辦理模塊和輿情信息庫模塊;所述數(shù)據(jù)采集平臺(tái)、數(shù)據(jù)處理平臺(tái)、業(yè)務(wù)處理和數(shù)據(jù)研判平臺(tái)依次電連接,且上述三個(gè)平臺(tái)均與所述輿情信息庫電連接,所述業(yè)務(wù)處理和數(shù)據(jù)研判平臺(tái)電連接監(jiān)控、預(yù)警和報(bào)告模塊以及業(yè)務(wù)辦理模塊;所述互聯(lián)網(wǎng)交通輿情信息采集和處理的方法包括通過數(shù)據(jù)采集平臺(tái)按照預(yù)設(shè)的熱點(diǎn)詞庫對(duì)互聯(lián)網(wǎng)媒體上交通輿情信息進(jìn)行搜索、監(jiān)控和下載,將其儲(chǔ)存在所述輿情信息庫并傳遞到數(shù)據(jù)處理平臺(tái);所述數(shù)據(jù)處理平臺(tái)通過對(duì)下載的所述交通輿情信息按照預(yù)定要求進(jìn)行過濾、分析和處理形成滿足管理者業(yè)務(wù)需要的交通輿情內(nèi)容,將其儲(chǔ)存在所述輿情信息庫并傳遞到業(yè)務(wù)處理和數(shù)據(jù)研判平臺(tái);所述業(yè)務(wù)處理和數(shù)據(jù)研判平臺(tái)根據(jù)管理者的需要對(duì)滿足管理者業(yè)務(wù)需要的所述交通輿情內(nèi)容進(jìn)行處理和研判,并將結(jié)果儲(chǔ)存在所述輿情信息庫并傳遞到業(yè)務(wù)辦理模塊以及監(jiān)控、預(yù)警和報(bào)告模塊,最終實(shí)現(xiàn)輿情審核、輿情派警、輿情處理和大數(shù)據(jù)分析功能。

      優(yōu)選地,所述數(shù)據(jù)采集平臺(tái)包括網(wǎng)絡(luò)搜索模塊、信息監(jiān)控模塊和數(shù)據(jù)下載模塊;所述數(shù)據(jù)處理平臺(tái)包括數(shù)據(jù)過濾模塊、語義分析模塊和數(shù)據(jù)處理模塊;所述業(yè)務(wù)處理和數(shù)據(jù)研判平臺(tái)包括業(yè)務(wù)辦理模塊、終端決策模塊、數(shù)據(jù)統(tǒng)計(jì)模塊和研判分析模塊。

      優(yōu)選地,所述數(shù)據(jù)采集平臺(tái)基于網(wǎng)絡(luò)爬蟲技術(shù)按照預(yù)設(shè)的熱點(diǎn)詞庫對(duì)互聯(lián)網(wǎng)媒體上指定的交通輿情信息數(shù)據(jù)源進(jìn)行網(wǎng)絡(luò)搜索,分析實(shí)時(shí)搜索的交通輿情信息,判斷是否符合交通管理者的交通輿情信息采集業(yè)務(wù)的需要,將符合交通管理者采集業(yè)務(wù)需要的交通輿情信息的相關(guān)網(wǎng)頁信息資源進(jìn)行下載,將下載的交通輿情信息存儲(chǔ)到輿情信息庫同時(shí)傳遞到數(shù)據(jù)處理平臺(tái);所述數(shù)據(jù)處理平臺(tái)基于數(shù)據(jù)挖掘技術(shù)按照預(yù)定要求通過數(shù)據(jù)的網(wǎng)絡(luò)挖掘、文本挖掘和語義分析實(shí)現(xiàn)將下載的交通輿情信息進(jìn)行定制化處理,對(duì)交通輿情信息進(jìn)行基礎(chǔ)過濾工作,去除下載重復(fù)、下載資源不完整、時(shí)間過期的信息,進(jìn)行語義分析后,形成滿足交通管理者業(yè)務(wù)需要的交通輿情內(nèi)容,將交通輿情內(nèi)容按照規(guī)定的編碼格式和儲(chǔ)存規(guī)則存儲(chǔ)到輿情信息庫同時(shí)傳遞到業(yè)務(wù)處理和數(shù)據(jù)研判平臺(tái);所述業(yè)務(wù)處理和數(shù)據(jù)研判平臺(tái)通過人機(jī)交互設(shè)備面向公安交通管理人員開放,根據(jù)公安交通管理人員的需要實(shí)現(xiàn)對(duì)所述交通輿情內(nèi)容的業(yè)務(wù)處理和數(shù)據(jù)研判功能,將其存儲(chǔ)到輿情信息庫同時(shí)傳遞到業(yè)務(wù)辦理模塊以及監(jiān)控、預(yù)警和報(bào)告模塊,最終實(shí)現(xiàn)輿情審核、輿情派警、輿情處理和大數(shù)據(jù)分析功能。

      優(yōu)選地,所述熱點(diǎn)詞庫包括7個(gè)交通管理專題和每個(gè)交通管理專題對(duì)應(yīng)的若干關(guān)鍵詞。

      優(yōu)選地,所述7個(gè)交通管理專題包括交通事件、熱點(diǎn)話題、交通執(zhí)法、交通組織和管控、惡意言論、交通建議和問題舉報(bào)以及政策法規(guī)。

      優(yōu)選地,所述交通事件對(duì)應(yīng)的關(guān)鍵詞包括車輛失控、擁堵、交通事故、施工、占道、相撞、剮蹭、女司機(jī)、交通肇事、逃逸、車禍、翻車、追尾、高速、高速公路、爆胎、自燃、路況和大貨車;熱點(diǎn)話題對(duì)應(yīng)的關(guān)鍵詞包括網(wǎng)約車、共享單車、拼車、租車、綠色出行和電動(dòng)汽車;交通執(zhí)法對(duì)應(yīng)的關(guān)鍵詞包括違章、違規(guī)上路、違法亂紀(jì)、罰單、超載、逆行、超速、違法停車、套牌、電子警察、抓拍、闖紅燈、搶黃燈、酒駕、無照駕駛、酒后駕駛、違章停車、假號(hào)牌、偽造車牌、假車牌、套牌、逃逸車輛、襲警、飆車和闖卡;交通組織和管控對(duì)應(yīng)的關(guān)鍵詞包括重大活動(dòng)、安保、交警、交通警察、交警總隊(duì)、交警支隊(duì)、交警大隊(duì)、交警中隊(duì)、車管所、協(xié)警、單雙號(hào)、限行、限速、禁行、緝查布控、封路、駕照、駕校、車流、收費(fèi)站和繞行;惡意言論對(duì)應(yīng)的關(guān)鍵詞包括受賄、貪污、腐敗、打人、罵人和送禮;交通建議和問題舉報(bào)對(duì)應(yīng)的關(guān)鍵詞包括亂收費(fèi)、收黑錢、黑車、有法不依、秉公執(zhí)法、紅綠燈、違規(guī)收費(fèi)和釣魚執(zhí)法;政策法規(guī)對(duì)應(yīng)的關(guān)鍵詞包括鼓勵(lì)拼車、共享出行、交通標(biāo)線、限速標(biāo)志、交通標(biāo)志、交通宣傳和交通安全。

      優(yōu)選地,所述網(wǎng)絡(luò)挖掘的重要內(nèi)容共有18個(gè)方面,所述18個(gè)方面包括輿情新聞標(biāo)題、輿情新聞內(nèi)容、作者、發(fā)布時(shí)間、數(shù)據(jù)來源、首發(fā)來源、數(shù)據(jù)采集時(shí)間、輿情性質(zhì)、原文鏈接地址、關(guān)鍵字、摘要內(nèi)容、專題類型、話題信息、訪問量、轉(zhuǎn)發(fā)量、評(píng)論數(shù)、跟帖量和所屬區(qū)域。

      優(yōu)選地,所述語義分析包括7個(gè)功能,包括基本處理功能、句法分析功能、文本挖掘功能、文本聚類功能、情感分析功能、知識(shí)提取功能和熱度分析功能。

      優(yōu)選地,所述業(yè)務(wù)處理功能,包括輿情審核、輿情派警和輿情處理;所述輿情審核是交通管理者對(duì)采集和處理的交通輿情信息是否屬于有效、屬實(shí)的新聞內(nèi)容和基礎(chǔ)分類是否合理的審核;所述輿情派警是根據(jù)經(jīng)審核后的有效交通輿情信息所屬的轄區(qū),系統(tǒng)默認(rèn)指派給負(fù)責(zé)轄區(qū)業(yè)務(wù)的交警人員;所述輿情處理是交通管理人員對(duì)某一具體的交通輿情信息進(jìn)行處結(jié)和辦理操作。

      優(yōu)選地,所述數(shù)據(jù)研判功能是對(duì)交通輿情信息的處理結(jié)果,進(jìn)行大數(shù)據(jù)分析,進(jìn)行直觀且數(shù)字化的顯示。

      本發(fā)明的有益效果:

      本發(fā)明提出的互聯(lián)網(wǎng)交通輿情信息采集和處理的方法,使得交通管理者可以及時(shí)發(fā)現(xiàn)與自己管轄區(qū)域,業(yè)務(wù)相關(guān)的交通輿情信息;發(fā)現(xiàn)有效輿情信息后,可以及時(shí)派警處理,避免輿情進(jìn)一步發(fā)酵,造成不好的社會(huì)影響;通過大量的交通輿情歷史數(shù)據(jù)分析,可以總結(jié)、歸納出有利于交通管理政策的內(nèi)容依據(jù)。

      附圖說明

      圖1為本發(fā)明的架構(gòu)圖;

      圖2為本發(fā)明的輿情審核示意圖;

      圖3為本發(fā)明的輿情派警示意圖;

      圖4為本發(fā)明的輿情派警的警員值班情況示意圖;

      圖5為本發(fā)明的輿情處理示意圖;

      圖6為本發(fā)明的數(shù)據(jù)研判示意圖。

      具體實(shí)施方式

      為使本發(fā)明實(shí)施的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行更加詳細(xì)的描述。在附圖中,自始至終相同或類似的標(biāo)號(hào)表示相同或類似的元件或具有相同或類似功能的元件。所描述的實(shí)施例是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例。下面通過參考附圖描述的實(shí)施例是示例性的,旨在用于解釋本發(fā)明,而不能理解為對(duì)本發(fā)明的限制?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。下面結(jié)合附圖對(duì)本發(fā)明的實(shí)施例進(jìn)行詳細(xì)說明。

      在本發(fā)明一寬泛實(shí)施例中一種互聯(lián)網(wǎng)交通輿情信息采集和處理的方法,其包括數(shù)據(jù)采集平臺(tái),數(shù)據(jù)處理平臺(tái),業(yè)務(wù)處理和數(shù)據(jù)研判平臺(tái),監(jiān)控、預(yù)警和報(bào)告模塊,業(yè)務(wù)辦理模塊和輿情信息庫模塊;所述數(shù)據(jù)采集平臺(tái)、數(shù)據(jù)處理平臺(tái)、業(yè)務(wù)處理和數(shù)據(jù)研判平臺(tái)依次電連接,且上述三個(gè)平臺(tái)均與所述輿情信息庫電連接,所述業(yè)務(wù)處理和數(shù)據(jù)研判平臺(tái)電連接監(jiān)控、預(yù)警和報(bào)告模塊以及業(yè)務(wù)辦理模塊;所述互聯(lián)網(wǎng)交通輿情信息采集和處理的方法包括通過數(shù)據(jù)采集平臺(tái)按照預(yù)設(shè)的熱點(diǎn)詞庫對(duì)互聯(lián)網(wǎng)媒體上交通輿情信息進(jìn)行搜索、監(jiān)控和下載,將其儲(chǔ)存在所述輿情信息庫并傳遞到數(shù)據(jù)處理平臺(tái);所述數(shù)據(jù)處理平臺(tái)通過對(duì)下載的所述交通輿情信息按照預(yù)定要求進(jìn)行過濾、分析和處理形成滿足管理者業(yè)務(wù)需要的交通輿情內(nèi)容,將其儲(chǔ)存在所述輿情信息庫并傳遞到業(yè)務(wù)處理和數(shù)據(jù)研判平臺(tái);所述業(yè)務(wù)處理和數(shù)據(jù)研判平臺(tái)根據(jù)管理者的需要對(duì)滿足管理者業(yè)務(wù)需要的所述交通輿情內(nèi)容進(jìn)行處理和研判,并將結(jié)果儲(chǔ)存在所述輿情信息庫并傳遞到業(yè)務(wù)辦理模塊以及監(jiān)控、預(yù)警和報(bào)告模塊,最終實(shí)現(xiàn)輿情審核、輿情派警、輿情處理和大數(shù)據(jù)分析功能。

      本發(fā)明提供的一種互聯(lián)網(wǎng)交通輿情信息采集和處理的方法,與現(xiàn)有技術(shù)相比具有以下優(yōu)點(diǎn):

      使得交通管理者可以及時(shí)發(fā)現(xiàn)與自己管轄區(qū)域,業(yè)務(wù)相關(guān)的交通輿情信息;發(fā)現(xiàn)有效輿情信息后,可以及時(shí)派警處理,避免輿情進(jìn)一步發(fā)酵,造成不好的社會(huì)影響;通過大量的交通輿情歷史數(shù)據(jù)分析,可以總結(jié)、歸納出有利于交通管理政策的內(nèi)容依據(jù)。

      對(duì)本發(fā)明實(shí)施例進(jìn)行描述如下:

      一種互聯(lián)網(wǎng)交通輿情信息采集和處理的方法,其包括數(shù)據(jù)采集平臺(tái),數(shù)據(jù)處理平臺(tái),業(yè)務(wù)處理和數(shù)據(jù)研判平臺(tái),監(jiān)控、預(yù)警和報(bào)告模塊,業(yè)務(wù)辦理模塊和輿情信息庫模塊;所述數(shù)據(jù)采集平臺(tái)、數(shù)據(jù)處理平臺(tái)、業(yè)務(wù)處理和數(shù)據(jù)研判平臺(tái)依次電連接,且上述三個(gè)平臺(tái)均與所述輿情信息庫電連接,所述業(yè)務(wù)處理和數(shù)據(jù)研判平臺(tái)電連接監(jiān)控、預(yù)警和報(bào)告模塊以及業(yè)務(wù)辦理模塊;所述互聯(lián)網(wǎng)交通輿情信息采集和處理的方法包括通過數(shù)據(jù)采集平臺(tái)按照預(yù)設(shè)的熱點(diǎn)詞庫對(duì)互聯(lián)網(wǎng)媒體上交通輿情信息進(jìn)行搜索、監(jiān)控和下載,將其儲(chǔ)存在所述輿情信息庫并傳遞到數(shù)據(jù)處理平臺(tái);所述數(shù)據(jù)處理平臺(tái)通過對(duì)下載的所述交通輿情信息按照預(yù)定要求進(jìn)行過濾、分析和處理形成滿足管理者業(yè)務(wù)需要的交通輿情內(nèi)容,將其儲(chǔ)存在所述輿情信息庫并傳遞到業(yè)務(wù)處理和數(shù)據(jù)研判平臺(tái);所述業(yè)務(wù)處理和數(shù)據(jù)研判平臺(tái)根據(jù)管理者的需要對(duì)滿足管理者業(yè)務(wù)需要的所述交通輿情內(nèi)容進(jìn)行處理和研判,并將結(jié)果儲(chǔ)存在所述輿情信息庫并傳遞到業(yè)務(wù)辦理模塊以及監(jiān)控、預(yù)警和報(bào)告模塊,最終實(shí)現(xiàn)輿情審核、輿情派警、輿情處理和大數(shù)據(jù)分析功能。

      所述數(shù)據(jù)采集平臺(tái)包括網(wǎng)絡(luò)搜索模塊、信息監(jiān)控模塊和數(shù)據(jù)下載模塊;所述數(shù)據(jù)處理平臺(tái)包括數(shù)據(jù)過濾模塊、語義分析模塊和數(shù)據(jù)處理模塊;所述業(yè)務(wù)處理和數(shù)據(jù)研判平臺(tái)包括業(yè)務(wù)辦理模塊、終端決策模塊、數(shù)據(jù)統(tǒng)計(jì)模塊和研判分析模塊。

      所述數(shù)據(jù)采集平臺(tái)基于網(wǎng)絡(luò)爬蟲技術(shù)按照預(yù)設(shè)的熱點(diǎn)詞庫對(duì)互聯(lián)網(wǎng)媒體上指定的交通輿情信息數(shù)據(jù)源進(jìn)行網(wǎng)絡(luò)搜索,分析實(shí)時(shí)搜索的交通輿情信息,判斷是否符合交通管理者的交通輿情信息采集業(yè)務(wù)的需要,將符合交通管理者采集業(yè)務(wù)需要的交通輿情信息的相關(guān)網(wǎng)頁信息資源進(jìn)行下載,將下載的交通輿情信息存儲(chǔ)到輿情信息庫同時(shí)傳遞到數(shù)據(jù)處理平臺(tái);所述數(shù)據(jù)處理平臺(tái)基于數(shù)據(jù)挖掘技術(shù)按照預(yù)定要求通過數(shù)據(jù)的網(wǎng)絡(luò)挖掘、文本挖掘和語義分析實(shí)現(xiàn)將下載的交通輿情信息進(jìn)行定制化處理,對(duì)交通輿情信息進(jìn)行基礎(chǔ)過濾工作,去除下載重復(fù)、下載資源不完整、時(shí)間過期的信息,進(jìn)行語義分析后,形成滿足交通管理者業(yè)務(wù)需要的交通輿情內(nèi)容,將交通輿情內(nèi)容按照規(guī)定的編碼格式和儲(chǔ)存規(guī)則存儲(chǔ)到輿情信息庫同時(shí)傳遞到業(yè)務(wù)處理和數(shù)據(jù)研判平臺(tái);所述業(yè)務(wù)處理和數(shù)據(jù)研判平臺(tái)通過人機(jī)交互設(shè)備面向公安交通管理人員開放,根據(jù)公安交通管理人員的需要實(shí)現(xiàn)對(duì)所述交通輿情內(nèi)容的業(yè)務(wù)處理和數(shù)據(jù)研判功能,將其存儲(chǔ)到輿情信息庫同時(shí)傳遞到業(yè)務(wù)辦理模塊以及監(jiān)控、預(yù)警和報(bào)告模塊,最終實(shí)現(xiàn)輿情審核、輿情派警、輿情處理和大數(shù)據(jù)分析功能。

      所述熱點(diǎn)詞庫包括7個(gè)交通管理專題和每個(gè)交通管理專題對(duì)應(yīng)的若干關(guān)鍵詞。

      所述7個(gè)交通管理專題包括交通事件、熱點(diǎn)話題、交通執(zhí)法、交通組織和管控、惡意言論、交通建議和問題舉報(bào)以及政策法規(guī)。

      所述交通事件對(duì)應(yīng)的關(guān)鍵詞包括車輛失控、擁堵、交通事故、施工、占道、相撞、剮蹭、女司機(jī)、交通肇事、逃逸、車禍、翻車、追尾、高速、高速公路、爆胎、自燃、路況和大貨車;熱點(diǎn)話題對(duì)應(yīng)的關(guān)鍵詞包括網(wǎng)約車、共享單車、拼車、租車、綠色出行和電動(dòng)汽車;交通執(zhí)法對(duì)應(yīng)的關(guān)鍵詞包括違章、違規(guī)上路、違法亂紀(jì)、罰單、超載、逆行、超速、違法停車、套牌、電子警察、抓拍、闖紅燈、搶黃燈、酒駕、無照駕駛、酒后駕駛、違章停車、假號(hào)牌、偽造車牌、假車牌、套牌、逃逸車輛、襲警、飆車和闖卡;交通組織和管控對(duì)應(yīng)的關(guān)鍵詞包括重大活動(dòng)、安保、交警、交通警察、交警總隊(duì)、交警支隊(duì)、交警大隊(duì)、交警中隊(duì)、車管所、協(xié)警、單雙號(hào)、限行、限速、禁行、緝查布控、封路、駕照、駕校、車流、收費(fèi)站和繞行;惡意言論對(duì)應(yīng)的關(guān)鍵詞包括受賄、貪污、腐敗、打人、罵人和送禮;交通建議和問題舉報(bào)對(duì)應(yīng)的關(guān)鍵詞包括亂收費(fèi)、收黑錢、黑車、有法不依、秉公執(zhí)法、紅綠燈、違規(guī)收費(fèi)和釣魚執(zhí)法;政策法規(guī)對(duì)應(yīng)的關(guān)鍵詞包括鼓勵(lì)拼車、共享出行、交通標(biāo)線、限速標(biāo)志、交通標(biāo)志、交通宣傳和交通安全。

      所述網(wǎng)絡(luò)挖掘的重要內(nèi)容共有18個(gè)方面,所述18個(gè)方面包括輿情新聞標(biāo)題、輿情新聞內(nèi)容、作者、發(fā)布時(shí)間、數(shù)據(jù)來源、首發(fā)來源、數(shù)據(jù)采集時(shí)間、輿情性質(zhì)、原文鏈接地址、關(guān)鍵字、摘要內(nèi)容、專題類型、話題信息、訪問量、轉(zhuǎn)發(fā)量、評(píng)論數(shù)、跟帖量和所屬區(qū)域。

      所述語義分析包括7個(gè)功能,包括基本處理功能、句法分析功能、文本挖掘功能、文本聚類功能、情感分析功能、知識(shí)提取功能和熱度分析功能。

      所述業(yè)務(wù)處理功能,包括輿情審核、輿情派警和輿情處理;所述輿情審核是交通管理者對(duì)采集和處理的交通輿情信息是否屬于有效、屬實(shí)的新聞內(nèi)容和基礎(chǔ)分類是否合理的審核;所述輿情派警是根據(jù)經(jīng)審核后的有效交通輿情信息所屬的轄區(qū),系統(tǒng)默認(rèn)指派給負(fù)責(zé)轄區(qū)業(yè)務(wù)的交警人員;所述輿情處理是交通管理人員對(duì)某一具體的交通輿情信息進(jìn)行處結(jié)和辦理操作。

      所述數(shù)據(jù)研判功能是對(duì)交通輿情信息的處理結(jié)果,進(jìn)行大數(shù)據(jù)分析,進(jìn)行直觀且數(shù)字化的顯示。

      根據(jù)附圖1-6對(duì)本發(fā)明進(jìn)行詳細(xì)描述。

      一種互聯(lián)網(wǎng)交通輿情信息采集和處理的方法,就是要解決從信息監(jiān)控、數(shù)據(jù)采集、內(nèi)容分析到業(yè)務(wù)處理、統(tǒng)計(jì)研判的全自動(dòng)化過程。通過建設(shè)輿情監(jiān)控和管理平臺(tái),來實(shí)現(xiàn)輿情信息的自動(dòng)化處理過程,為交通管理者提供最及時(shí)、最有效的交通輿情內(nèi)容和分析結(jié)果。

      根據(jù)附圖1可知,

      1.數(shù)據(jù)采集平臺(tái)

      在一種互聯(lián)網(wǎng)交通輿情信息處理的方法中,基于網(wǎng)絡(luò)爬蟲技術(shù)實(shí)現(xiàn)數(shù)據(jù)采集功能。

      包括以下三部分:

      (1)網(wǎng)絡(luò)搜索,通過指定的交通信息數(shù)據(jù)源,實(shí)時(shí)搜索。

      (2)信息監(jiān)控,分析實(shí)時(shí)搜索的交通輿情信息,判斷是否符合交通管理者的信息采集業(yè)務(wù)需求。

      (3)數(shù)據(jù)下載,將交通新聞輿情相關(guān)的網(wǎng)頁信息資源進(jìn)行下載,存儲(chǔ)到輿情信息庫。

      數(shù)據(jù)采集平臺(tái)通過三部分實(shí)現(xiàn)數(shù)據(jù)采集功能。網(wǎng)絡(luò)爬蟲在采集數(shù)據(jù)時(shí),將依據(jù)交通管理熱點(diǎn)詞庫進(jìn)行全網(wǎng)搜索,在一種互聯(lián)網(wǎng)交通輿情信息處理方法中,定義的交通管理熱點(diǎn)詞庫如下:

      2.數(shù)據(jù)處理平臺(tái)

      在一種互聯(lián)網(wǎng)交通輿情信息處理的方法中,數(shù)據(jù)處理平臺(tái)是通過數(shù)據(jù)的網(wǎng)絡(luò)挖掘、文本挖掘、語義分析等,實(shí)現(xiàn)將下載的交通輿情信息進(jìn)行定制化處理,形成滿足交通管理業(yè)務(wù)需要的內(nèi)容。這些內(nèi)容包括:

      輿情新聞標(biāo)題

      輿情新聞內(nèi)容

      作者

      發(fā)布時(shí)間

      數(shù)據(jù)來源

      首發(fā)來源

      數(shù)據(jù)采集時(shí)間

      輿情性質(zhì)(正面、負(fù)面、中立)

      原文鏈接地址

      關(guān)鍵字

      摘要內(nèi)容

      專題類型

      話題信息

      訪問量

      轉(zhuǎn)發(fā)量

      評(píng)論數(shù)

      跟帖量

      所屬區(qū)域

      (1)數(shù)據(jù)過濾

      數(shù)據(jù)過濾,實(shí)現(xiàn)將下載的數(shù)據(jù)內(nèi)容做基礎(chǔ)的過濾工作,包括去除下載重復(fù)、下載資源不完整、時(shí)間過期的等新聞數(shù)據(jù)。

      (2)語義分析

      包括以下功能:

      基本處理

      語言識(shí)別、中文分詞、詞性標(biāo)注、命名實(shí)體識(shí)別

      句法分析

      文本斷句、句法分析、主謂賓提取

      文本挖掘

      關(guān)鍵詞提取、文本分類、文本摘要

      文本聚類

      文本相似度、詞向量、文本聚類

      情感分析

      正面、負(fù)面、中立

      知識(shí)提取

      實(shí)體提取、關(guān)系提取

      熱度分析

      點(diǎn)擊量、轉(zhuǎn)發(fā)量、跟帖量

      (3)數(shù)據(jù)處理

      數(shù)據(jù)處理功能,是將數(shù)據(jù)語義分析的結(jié)果,按照一定編碼格式和存儲(chǔ)規(guī)則,進(jìn)行數(shù)據(jù)存儲(chǔ),為業(yè)務(wù)平臺(tái)提供基礎(chǔ)數(shù)據(jù)。

      3.業(yè)務(wù)處理和數(shù)據(jù)研判平臺(tái)

      業(yè)務(wù)處理平臺(tái)和數(shù)據(jù)研判平臺(tái),是面向公安交通管理人員使用的業(yè)務(wù)系統(tǒng)。

      業(yè)務(wù)處理包括以下幾部分:

      (1)輿情審核

      對(duì)于采集和處理的交通輿情信息,交通管理者,需要確認(rèn)下是否屬于有效、屬實(shí)的新聞內(nèi)容,和該新聞的一些基礎(chǔ)分類是否合理。參見附圖2。

      (2)輿情派警

      經(jīng)審核后的有效輿情信息,將根據(jù)該輿情內(nèi)容所屬的轄區(qū),系統(tǒng)會(huì)默認(rèn)指派給負(fù)責(zé)轄區(qū)業(yè)務(wù)的交警人員,進(jìn)行處理。參見附圖3。

      每天進(jìn)行值班安排,來分配具體轄區(qū),機(jī)關(guān),在輿情處理環(huán)節(jié),所需指派的交警人員,參見附圖4。

      (3)輿情處理

      輿情處置是交通管理人員對(duì)某一具體的輿情信息進(jìn)行處結(jié)、辦理。參見附圖5。

      數(shù)據(jù)研判平臺(tái)

      是通過對(duì)交通輿情信息的處理結(jié)果,進(jìn)行大數(shù)據(jù)分析,形成直觀的、數(shù)字化的結(jié)果。參見附圖6。

      最后需要指出的是:以上實(shí)施例僅用以說明本發(fā)明的技術(shù)方案,而非對(duì)其限制。盡管參照前述實(shí)施例對(duì)本發(fā)明進(jìn)行了詳細(xì)的說明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解:其依然可以對(duì)前述各實(shí)施例所記載的技術(shù)方案進(jìn)行修改,或者對(duì)其中部分技術(shù)特征進(jìn)行等同替換;而這些修改或者替換,并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明各實(shí)施例技術(shù)方案的精神和范圍。

      當(dāng)前第1頁1 2 
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1