国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      異常信息確定裝置和方法以及電子設(shè)備的制造方法

      文檔序號(hào):8258520閱讀:568來源:國知局
      異常信息確定裝置和方法以及電子設(shè)備的制造方法
      【技術(shù)領(lǐng)域】
      [0001]本公開涉及文本信息處理領(lǐng)域,更具體地涉及一種異常信息確定裝置、異常信息確定方法以及電子設(shè)備。
      【背景技術(shù)】
      [0002]隨著網(wǎng)絡(luò)的普及,用戶越來越多地利用網(wǎng)絡(luò)獲取資訊。熱門新聞的線上評(píng)論、以及熱門專業(yè)論壇都是發(fā)言非?;钴S的地方;用戶對(duì)于消費(fèi)的商品、熱門事件等等的評(píng)價(jià)也會(huì)在網(wǎng)上發(fā)表,這些言論影響了后來者對(duì)于商品或者事情走向的判斷。由于背后的巨大商業(yè)利益,以操控輿論謀取商業(yè)利益的水軍就誕生了,他們會(huì)集體的發(fā)帖,討論,制造熱門事件,從而迷惑普通用戶,導(dǎo)致輿論走向朝他們希望的方向走。如果不加以甄別例如水軍信息的異常信息,將不能區(qū)別何為真假的網(wǎng)絡(luò)民意,從而不能更好地進(jìn)行輿情監(jiān)控。
      [0003]因此,當(dāng)前亟需一種能夠準(zhǔn)確、可靠地識(shí)別異常信息的異常信息確定裝置以及異常息確定方法。

      【發(fā)明內(nèi)容】

      [0004]在下文中給出了關(guān)于本公開的簡(jiǎn)要概述,以便提供關(guān)于本公開的某些方面的基本理解。應(yīng)當(dāng)理解,這個(gè)概述并不是關(guān)于本公開的窮舉性概述。它并不意圖確定本公開的關(guān)鍵或重要部分,也不意圖限定本公開的范圍。其目的僅僅是以簡(jiǎn)化的形式給出某些概念,以此作為稍后論述的更詳細(xì)描述的前序。
      [0005]鑒于現(xiàn)有技術(shù)的上述缺陷,本公開的目的之一是提供一種異常信息獲確定裝置、方法和電子設(shè)備,以至少克服現(xiàn)有技術(shù)中的上述問題。
      [0006]根據(jù)本公開的一個(gè)方面,提供了一種異常信息確定裝置,包括:搜索單元,用于在預(yù)定信息源中搜索與特定關(guān)鍵詞相關(guān)的信息;異常信息候選確定單元,用于根據(jù)異常信息的傳播規(guī)律,確定搜索單元搜索到的信息中的異常信息候選;以及異常信息確定單元,用于基于異常信息候選構(gòu)建異常信息分類器,并使用異常信息分類器在異常信息候選中確定異常信息。
      [0007]根據(jù)本公開的又一個(gè)方面,還提供一種異常信息確定方法,包括:搜索步驟,用于在預(yù)定信息源中搜索與特定關(guān)鍵詞相關(guān)的信息;異常信息候選確定步驟,用于根據(jù)異常信息的傳播規(guī)律,確定搜索步驟搜索到的信息中的異常信息候選;以及異常信息確定步驟,用于基于異常信息候選構(gòu)建異常信息分類器,并使用該異常信息分類器在異常信息候選中確定異常信息。
      [0008]根據(jù)本公開的另一個(gè)方面,還提供了一種電子設(shè)備,該電子設(shè)備包括如上所述的異常信息確定裝置。
      [0009]依據(jù)本公開的其它方面,還提供了一種使得計(jì)算機(jī)用作如上所述的異常信息確定裝置的程序。
      [0010]依據(jù)本公開的又一方面,還提供了相應(yīng)的計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),該計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)上存儲(chǔ)有能夠由計(jì)算設(shè)備執(zhí)行的計(jì)算機(jī)程序,該計(jì)算機(jī)程序在執(zhí)行時(shí)能夠使計(jì)算設(shè)備執(zhí)行上述異常信息確定方法。
      [0011]上述根據(jù)本公開實(shí)施例的異常信息確定裝置和方法以及電子設(shè)備,至少能夠獲得以下益處之一:能夠更準(zhǔn)確、可靠地確定諸如網(wǎng)絡(luò)等的信息源中的異常信息,有利于提高甄別異常用戶的準(zhǔn)確率,并且能夠大大提高異常信息監(jiān)控的效率。
      [0012]通過以下結(jié)合附圖對(duì)本公開的最佳實(shí)施例的詳細(xì)說明,本公開的這些以及其他優(yōu)點(diǎn)將更加明顯。
      【附圖說明】
      [0013]本公開可以通過參考下文中結(jié)合附圖所給出的描述而得到更好的理解,其中在所有附圖中使用了相同或相似的附圖標(biāo)記來表示相同或者相似的部件。所述附圖連同下面的詳細(xì)說明一起包含在本說明書中并且形成本說明書的一部分,而且用來進(jìn)一步舉例說明本公開的優(yōu)選實(shí)施例和解釋本公開的原理和優(yōu)點(diǎn)。其中:
      [0014]圖1是示意性地示出根據(jù)本公開實(shí)施例的異常信息確定裝置的一種示例結(jié)構(gòu)的框圖。
      [0015]圖2是示意性地示出圖1中的異常信息候選確定單元的一種可能的示例結(jié)構(gòu)的框圖。
      [0016]圖3是示意性地示出圖2中的異常帖子候選確定子單元的一種可能的示例結(jié)構(gòu)的框圖。
      [0017]圖4是示意性地示出圖1中的異常信息確定單元的一種可能的示例結(jié)構(gòu)的框圖。
      [0018]圖5是示意性示出根據(jù)本公開實(shí)施例的異常信息確定方法的流程圖。
      [0019]圖6示意性示出根據(jù)本公開實(shí)施例的異常信息確定方法的異常信息候選確定步驟的一種示例性處理。
      [0020]圖7是示出了可用來實(shí)現(xiàn)根據(jù)本公開實(shí)施例的異常信息確定裝置和方法的一種可能的信息處理設(shè)備的硬件配置的結(jié)構(gòu)簡(jiǎn)圖。
      [0021]本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解,附圖中的元件僅僅是為了簡(jiǎn)單和清楚起見而示出的,而且不一定是按比例繪制的。例如,附圖中某些元件的尺寸可能相對(duì)于其他元件放大了,以便有助于提高對(duì)本公開實(shí)施例的理解。
      【具體實(shí)施方式】
      [0022]在下文中將結(jié)合附圖對(duì)本公開的示例性實(shí)施例進(jìn)行描述。為了清楚和簡(jiǎn)明起見,在說明書中并未描述實(shí)際實(shí)施方式的所有特征。然而,應(yīng)該了解,在開發(fā)任何這種實(shí)際實(shí)施例的過程中必須做出很多特定于實(shí)施方式的決定,以便實(shí)現(xiàn)開發(fā)人員的具體目標(biāo),例如,符合與系統(tǒng)及業(yè)務(wù)相關(guān)的那些限制條件,并且這些限制條件可能會(huì)隨著實(shí)施方式的不同而有所改變。此外,還應(yīng)該了解,雖然開發(fā)工作有可能是非常復(fù)雜和費(fèi)時(shí)的,但對(duì)得益于本公開內(nèi)容的本領(lǐng)域技術(shù)人員來說,這種開發(fā)工作僅僅是例行的任務(wù)。
      [0023]在此,還需要說明的一點(diǎn)是,為了避免因不必要的細(xì)節(jié)而模糊了本公開,在附圖中僅僅示出了與根據(jù)本公開的方案密切相關(guān)的裝置結(jié)構(gòu)和/或處理步驟,而省略了與本公開關(guān)系不大的其他細(xì)節(jié)。
      [0024]圖1是示意性地示出根據(jù)本公開實(shí)施例的異常信息確定裝置的一種示例結(jié)構(gòu)的框圖。
      [0025]根據(jù)本公開實(shí)施例的異常信息確定裝置I包括:搜索單元10,用于在預(yù)定信息源中搜索與特定關(guān)鍵詞相關(guān)的信息;異常信息候選確定單元20,用于根據(jù)異常信息的傳播規(guī)律,確定搜索單元搜索到的信息中的異常信息候選;以及異常信息確定單元30,用于基于異常信息候選構(gòu)建異常信息分類器,并使用異常信息分類器在異常信息候選中確定異常信肩、O
      [0026]搜索單元10可以在例如網(wǎng)絡(luò)的預(yù)定信息源中搜索與特定關(guān)鍵詞相關(guān)的信息。預(yù)定信息源例如可以是各個(gè)網(wǎng)站中的一個(gè)或更多個(gè)門戶或者專業(yè)論壇等。根據(jù)本公開的實(shí)施例,特定關(guān)鍵詞可以由用戶指定,例如用戶可以指定某個(gè)或者某些論壇中重復(fù)出現(xiàn)的事件的例如名稱等作為特定關(guān)鍵詞。例如,用戶可以指定“A公司B公司”作為特定關(guān)鍵詞。
      [0027]根據(jù)特定關(guān)鍵詞,搜索單元10可以例如使用門戶或者專業(yè)的論壇搜索引擎搜索與特定關(guān)鍵詞相關(guān)的信息。在例如門戶或者專業(yè)論壇的預(yù)定信息源中搜索的與特定關(guān)鍵詞相關(guān)的信息例如是諸如水軍等異常用戶發(fā)布的帖子。例如,在以“A公司B公司”作為特定關(guān)鍵詞的上述示例中,根據(jù)該關(guān)鍵詞在諸如網(wǎng)址為“http: //www.qiho0.com”的專業(yè)論壇中搜索與該關(guān)鍵詞相關(guān)的信息,結(jié)果可以得到以“A公司B公司競(jìng)購C公司? ”、“【翻譯求助】B公司A公司網(wǎng)盤容量大戰(zhàn)傳到外國去了求翻譯”、以及“A公司B公司金山,回家看看用戶吧”為標(biāo)題的多個(gè)與特定關(guān)鍵詞“A公司B公司”相關(guān)的帖子。
      [0028]發(fā)明人發(fā)現(xiàn)網(wǎng)絡(luò)中的異常信息、尤其是水軍發(fā)布的帖子通常具有一定的傳播規(guī)律。因此,根據(jù)本公開的實(shí)施例,針對(duì)搜索單元10搜索到的與特定關(guān)鍵詞相關(guān)的信息,異常信息候選確定單元20可以利用異常信息的傳播規(guī)律來確定搜索單元搜索到的信息中潛在的異常信息作為異常信息候選。
      [0029]本領(lǐng)域技術(shù)人員可以理解,異常信息候選確定單元20確定異常信息候選的方式可以由本領(lǐng)域技術(shù)人員根據(jù)實(shí)際需要來設(shè)定。例如,可以將異常信息候選確定單元設(shè)置為將滿足異常信息的傳播規(guī)律的信息作為異常信息候選,也可以將異常信息候選確定單元設(shè)置為根據(jù)異常信息的傳播規(guī)律,排除正常信息,而將其余信息確定為異常信息候選。
      [0030]圖2是示意性地示出圖1中的異常信息候選確定單元的一種可能的示例結(jié)構(gòu)的框圖。如圖所示,異常信息候選確定單元20被配置為:針對(duì)水軍在各個(gè)論壇發(fā)布的企圖操控社會(huì)輿論的異常帖子的情況,根據(jù)異常帖子的傳播規(guī)律,確定搜索單元10搜索到的帖子中的異常帖子。
      [0031]如圖2所示,異長(zhǎng)信息候選確定單元20包括:標(biāo)題查詢子單元201,用于針對(duì)搜索單元10搜索到的每個(gè)帖子,查詢?cè)陬A(yù)定時(shí)間段內(nèi)、以該帖子的標(biāo)題為標(biāo)題的所有帖子,并確定該所有帖子的帖子數(shù)量是否大于第一閾值;回帖提取子單元202,用于在標(biāo)題查詢子單元201確定帖子數(shù)量大于第一閾值的情況下,確定所有帖子中主帖的作者,并提取每個(gè)作者的回帖;以及異常帖子候選確定子單元203,用于基于每個(gè)作者的主帖與回帖之間的關(guān)系,確定作為異常信息候選的異常帖子候選。
      [0032]由于為了影響事件走向以達(dá)到操控輿論謀取商業(yè)利益的目的,水軍等異常用戶通常會(huì)在特定的時(shí)間段內(nèi)發(fā)布大量的具有相同或類似標(biāo)題的帖子,形成突發(fā)熱點(diǎn),因此,根據(jù)本公開的實(shí)施例,標(biāo)題查詢子單元201利用帖子標(biāo)題判定搜索單元搜索到的信息是否為突發(fā)熱點(diǎn)。
      [0033]更具體地,標(biāo)題查詢子單元201針對(duì)搜索單元10搜索到的每個(gè)帖子,查詢?cè)陬A(yù)定時(shí)間段內(nèi)、以該帖子的標(biāo)題為標(biāo)題的所有帖子,并確定該所有帖子的帖子數(shù)量是否大于第一閾值。例如,如果在諸如24小時(shí)之內(nèi)的時(shí)間范圍內(nèi),以該帖子的標(biāo)題為標(biāo)題的所有帖子的數(shù)量大于第一閾值,則將該標(biāo)題表達(dá)的事件作為突發(fā)熱點(diǎn)。第一閾值可以根據(jù)例如水軍的異常用戶運(yùn)作熱點(diǎn)事件時(shí)通常發(fā)布帖子的數(shù)量來確定,例如可以將第一閾值取為1000, 10000等。仍以“A公司B公司”作為特定關(guān)鍵詞在諸如網(wǎng)址為“http://www.qiho0.com”的專業(yè)論壇中搜索為例,根據(jù)各個(gè)標(biāo)題下所有帖子的數(shù)量,標(biāo)題查詢子單元201可以確定標(biāo)題為“A公司B公司D公司,回家看看用戶吧”的帖子的數(shù)量大于第一閾值,為突發(fā)熱點(diǎn)。
      [0034]在標(biāo)題查詢子單元201確定帖子數(shù)量大于第一閾值的情況下,回帖提取子單元20
      當(dāng)前第1頁1 2 3 4 
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1