国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      使用短消息的媒體事件結(jié)構(gòu)和情境識別的制作方法

      文檔序號:7591407閱讀:162來源:國知局
      專利名稱:使用短消息的媒體事件結(jié)構(gòu)和情境識別的制作方法
      技術(shù)領(lǐng)域
      本公開涉及對例如實(shí)況媒體事件的媒體事件(media event)的結(jié)構(gòu)(structure) 和/或情境(context)的識別,更具體而言涉及利用短消息內(nèi)容來識別媒體事件的結(jié)構(gòu)和
      /或情境。
      背景技術(shù)
      內(nèi)容,例如多媒體、音頻、視頻、圖像、動畫、交互式等等內(nèi)容,已經(jīng)變得越來越可被用戶訪問。此外,可訪問的視頻的數(shù)量增加了。作為非限制性示例,用戶經(jīng)由互聯(lián)網(wǎng)或其他計(jì)算機(jī)網(wǎng)絡(luò)可訪問的視頻內(nèi)容的數(shù)量已經(jīng)增加了。其他類型的多媒體內(nèi)容是媒體事件,例如實(shí)況媒體事件。諸如紀(jì)念媒體事件的內(nèi)容之類的內(nèi)容可能是相當(dāng)冗長的。用戶可能只對該事件的一部分感興趣?;蛘?,用戶可能不知道其是否對該內(nèi)容感興趣。

      發(fā)明內(nèi)容
      本公開嘗試解決現(xiàn)有技術(shù)的缺點(diǎn)并且提供了使用短消息采樣的媒體事件片段識別和注釋的系統(tǒng)、方法和體系結(jié)構(gòu)。本公開的實(shí)施例利用通過短消息傳遞服務(wù)開展的實(shí)時(shí)討論來發(fā)現(xiàn)媒體事件(例如實(shí)況媒體事件)的結(jié)構(gòu)、內(nèi)容和情境。根據(jù)一個或多個實(shí)施例,提供了一種方法,其包括利用至少一個計(jì)算設(shè)備,獲得多個用戶的短消息的采樣,短消息的采樣對應(yīng)于媒體事件;利用該至少一個計(jì)算設(shè)備和短消息的采樣,識別媒體事件中的片段;以及利用該至少一個計(jì)算設(shè)備,識別從短消息的采樣中取得的至少一個詞語,該至少一個詞語指示出所識別的片段的情境。根據(jù)一個或多個實(shí)施例,提供了一種系統(tǒng),其包括至少一個計(jì)算設(shè)備,該至少一個計(jì)算設(shè)備被配置為獲得多個用戶的短消息的采樣,短消息的采樣對應(yīng)于媒體事件;利用短消息的采樣,識別媒體事件中的片段;以及識別從短消息的采樣中取得的至少一個詞語, 該至少一個詞語指示出所識別的片段的情境。根據(jù)一個或多個實(shí)施例,提供了一種存儲計(jì)算機(jī)可執(zhí)行過程步驟的計(jì)算機(jī)可讀存儲介質(zhì)。這些過程步驟包括獲得多個用戶的短消息的采樣,短消息的采樣對應(yīng)于媒體事件;利用短消息的采樣,識別媒體事件中的片段;以及識別從短消息的采樣中取得的至少一個詞語,該至少一個詞語指示出所識別的片段的情境。根據(jù)一個或多個實(shí)施例,提供了一種系統(tǒng),其包括被配置為提供根據(jù)這種實(shí)施例的功能的一個或多個計(jì)算設(shè)備。根據(jù)一個或多個實(shí)施例,功能被體現(xiàn)在由至少一個計(jì)算設(shè)備執(zhí)行的方法的步驟中。根據(jù)一個或多個實(shí)施例,用于實(shí)現(xiàn)根據(jù)一個或多個這種實(shí)施例的功能的程序代碼被體現(xiàn)在計(jì)算機(jī)可讀介質(zhì)中、由計(jì)算機(jī)可讀介質(zhì)體現(xiàn)和/或被體現(xiàn)在計(jì)算機(jī)可讀介質(zhì)上。


      參考以下結(jié)合附圖來理解的描述將更清楚本公開的上述特征和目的,附圖中相似的標(biāo)號表示相似的元件,其中圖1提供了根據(jù)本公開的一個或多個實(shí)施例的過程流程的概覽。圖2提供了包括根據(jù)本公開的一個或多個實(shí)施例使用的組件的概覽。圖3示出了根據(jù)本公開的一個或多個實(shí)施例從與巴拉克·奧巴馬(Barack Obama) 2009年總統(tǒng)就職典禮相關(guān)的短消息的子集確定的按分鐘的最大追隨者計(jì)數(shù)。圖4提供了根據(jù)本公開的一個或多個實(shí)施例與總統(tǒng)就職典禮程序相對應(yīng)的短消息中被識別為具有最高峰度得分的詞語(term)的隨著時(shí)間的流逝的正規(guī)化詞語頻率得分的示例。圖5提供了根據(jù)一個或多個利用總統(tǒng)就職典禮短消息確定的具有最高持續(xù)興趣水平的兩個詞語的示例“flubbed”和“messed”。圖6示出了可聯(lián)系本公開的一個或多個實(shí)施例使用的一些組件。圖7是示出根據(jù)本公開的一個或多個實(shí)施例的計(jì)算設(shè)備的內(nèi)部體系結(jié)構(gòu)的詳細(xì)框圖,所述計(jì)算設(shè)備例如是諸如服務(wù)器702或用戶計(jì)算機(jī)704之類的計(jì)算設(shè)備。
      具體實(shí)施例方式概括來說,本公開包括使用短消息采樣的媒體事件片段識別和注釋的系統(tǒng)、方法和體系結(jié)構(gòu)?,F(xiàn)在將參考上述附圖(其中相似的標(biāo)號指代相似的組件)來論述本公開的某些實(shí)施例。雖然是聯(lián)系利用Twitter 生成的短消息來描述本公開的實(shí)施例的,但是應(yīng)當(dāng)清楚,任何其他類型的短消息傳遞或微博客系統(tǒng)、應(yīng)用和/或短消息類型都是適用的。作為非限制性示例,短消息是簡短的,例如140個字符的文本和/或媒體內(nèi)容,從一用戶(例如個人或?qū)嶓w)發(fā)送到一個或多個其他用戶。利用Twitter ,用戶發(fā)布短消息,該短消息被顯示在用戶的個人資料頁面上并且被遞送到預(yù)訂該用戶的短消息的其他用戶或者說追隨者 (follower)。其他短消息傳遞應(yīng)用包括但不限于短消息傳遞服務(wù)應(yīng)用、文本消息傳遞應(yīng)用、 多媒體消息傳遞應(yīng)用、互聯(lián)網(wǎng)聊天應(yīng)用、博客和/或微博客應(yīng)用、電子郵件等等。根據(jù)一個或多個實(shí)施例,短消息的集合被采樣并且采樣的消息可用于識別媒體事件的一個或多個部分或片段,和/或提供關(guān)于該媒體事件或媒體事件的片段的注釋或描述。作為非限制性示例,媒體事件是實(shí)況媒體事件,并且短消息集合包括在實(shí)況媒體事件期間收集的短消息。短消息的集合被采樣,并且短消息的采樣被用于對媒體事件進(jìn)行分段和注釋。作為一些非限制性示例,分析短消息活動,例如Twitter上的短消息活動,以發(fā)現(xiàn)和注釋一個或多個部分或片段,例如興趣點(diǎn),并且可以從所分析的短消息內(nèi)容來識別與媒體事件的一個或多個部分或片段相關(guān)聯(lián)的主題。作為另一非限制性示例,實(shí)況媒體事件可被存儲,例如存儲為模擬、數(shù)字、視頻、音頻和/或多媒體數(shù)據(jù)或內(nèi)容,并且對短消息活動的分析的結(jié)果可注釋從該分析識別的媒體事件或媒體事件的一部分。圖1提供了根據(jù)本公開的一個或多個實(shí)施例的過程流程的概覽。在步驟102,使用至少一個標(biāo)準(zhǔn)從短消息的集合中采樣、選擇或識別短消息。根據(jù)一個或多個實(shí)施例,短消息的集合包括為諸如實(shí)況媒體事件之類的媒體事件收集的短消息活動。如這里所述,可以在媒體事件的廣播期間收集短消息。作為一些非限制性示例,根據(jù)一個或多個實(shí)施例,可以選擇來自被識別為具有至少閾值受眾水平的用戶的短消息,和/或可以選擇被識別為交談型消息的短消息。在步驟104,分析短消息的采樣,例如利用一個或多個標(biāo)準(zhǔn)從短消息的集合中選擇的短消息,以識別在媒體事件期間的某種轉(zhuǎn)變,例如新片段、興趣點(diǎn)等等。在步驟106,分析短消息采樣以識別要與媒體事件相關(guān)聯(lián)的主題內(nèi)容,或者媒體事件的片段或興趣點(diǎn)。根據(jù)一個或多個實(shí)施例,例如圖1所述的過程被體現(xiàn)在硬件、軟件或硬件和軟件的組合中。根據(jù)一個或多個實(shí)施例,一個或多個通用計(jì)算機(jī),例如個人計(jì)算機(jī)或服務(wù)器計(jì)算機(jī),可被配置為執(zhí)行這里所述的過程中的一個或多個。圖2提供了包括根據(jù)本公開的一個或多個實(shí)施例使用的組件的概覽。短消息的集合202被輸入到短消息采樣組件204中。短消息的集合202對應(yīng)于媒體事件。作為非限制性示例,集合202可包括具有與媒體事件相對應(yīng)的時(shí)間戳的短消息,該時(shí)間戳例如是消息的發(fā)布時(shí)間。時(shí)間戳可以在媒體事件的時(shí)間期間,例如在媒體事件的廣播期間。作為另一非限制性示例,時(shí)間戳可在包括媒體事件之前某段時(shí)間和/或之后某段時(shí)間的跨度內(nèi)。作為另一非限制性示例,可對短消息執(zhí)行預(yù)分析以識別短消息中使用的與媒體事件相關(guān)的詞語。應(yīng)當(dāng)清楚,這些和其他技術(shù)可用于識別短消息的集合202。短消息采樣204對短消息的集合202采樣以選擇短消息的采樣206。根據(jù)一個或多個實(shí)施例,短消息采樣組件204可使用一個或多個標(biāo)準(zhǔn)來從集合202中選擇短消息以生成采樣206。作為一些非限制性示例,短消息采樣組件204可以識別若干個被追隨者 (followcaster),或者說具有訂戶的用戶。被追隨者的數(shù)目可以基于閾值訂戶數(shù)目來確定, 以使得所選擇的被追隨者至少具有閾值數(shù)目的訂戶。可以基于集合202中的用戶、對每個用戶的訂戶數(shù)目的確定以及利用集合202確定的用戶的訂戶數(shù)目的統(tǒng)計(jì)分析來識別所使用的閾值。作為非限制性示例,可以根據(jù)用戶的訂戶數(shù)目的分布來確定該閾值,其中該數(shù)目對應(yīng)于前1/4,例如所選擇的(一個或多個)用戶具有至少處于前25%的訂戶數(shù)目。該分析可以跨集合202的整個跨度執(zhí)行,或者利用具有小于集合202的整個跨度的時(shí)間跨度的窗口執(zhí)行。根據(jù)一個或多個實(shí)施例,短消息采樣204可分析短消息的集合202以識別交談型消息,這些交談型消息被選擇用于采樣206。通常,交談型消息是長度較長的那種,和/或是針對特定的一個或多個用戶的。在Twitter 中,短消息可包含(iusername,其使短消息指向用戶名,并且在用戶之間提供鏈接,例如在消息發(fā)送者和一個或多個 username之間提供鏈接。應(yīng)當(dāng)清楚,其他標(biāo)準(zhǔn)可用于識別交談型消息。短消息分析器208分析短消息的采樣206以識別媒體事件中的斷點(diǎn),這些斷點(diǎn)被用于識別媒體事件的片段。此外,分析器208使用在短消息的采樣206中使用的詞語以識別整個媒體事件和/或媒體事件的所識別片段的主題和/或情境。根據(jù)一個或多個實(shí)施例,分段信息210和212可用于總結(jié)或以其他方式描述媒體事件或者媒體事件的片段;對媒體事件或片段進(jìn)行索引、排名和檢索以便搜索;為媒體事件編目錄,等等。再次參考圖1,根據(jù)一個或多個實(shí)施例,可利用發(fā)送短消息的用戶的所確定的受眾水平,例如發(fā)送集合中包括的短消息的用戶的所確定的受眾水平,來對短消息集合采樣。根據(jù)一個或多個這種實(shí)施例,識別具有被認(rèn)為重大的用戶受眾的用戶,例如相對于集合中的其他用戶的受眾水平而言具有被認(rèn)為重大的用戶受眾的用戶,并且選擇所識別的用戶的短消息活動來包括在圖1的步驟104和106中使用的短消息的采樣中,其中所識別的用戶在這里被稱為被追隨者。本公開的實(shí)施例對通過短消息的集合識別的用戶或被追隨者進(jìn)行評估以基于被追隨者的追隨者的數(shù)目來識別一個或多個被追隨者,并且通過選擇所識別的 (一個或多個)被追隨者發(fā)送的消息來對短消息集合采樣。根據(jù)一個或多個實(shí)施例,來自被識別為被追隨者的用戶的短消息活動被用于識別媒體事件中的新片段或感興趣的重要事件的開始。根據(jù)一個或多個實(shí)施例,媒體事件的新片段的開始和/或感興趣的重要事件的開始是根據(jù)被識別為具有重大受眾的(一個或多個)用戶的活動來識別的。作為非限制性示例,Twitter 用戶可以選擇預(yù)訂或“追隨”被追隨者的消息,例如被追隨者的追隨者預(yù)訂或請求來自被追隨者的消息被發(fā)送到追隨者。每個用戶具有表示明確收聽該用戶的饋送的用戶的數(shù)目的追隨者計(jì)數(shù)。最初,例如,當(dāng)新用戶注冊或登記時(shí),該新用戶的追隨者計(jì)數(shù)為零個。為集合中的每個用戶確定預(yù)訂被追隨者的用戶的數(shù)目。作為非限制性示例,可通過識別接收來自給定用戶的短消息的用戶的數(shù)目來確定該給定用戶的追隨者的數(shù)目。用戶具有的追隨者的數(shù)目可描述用戶的角色,例如短消息活動中的個人、組織或其他實(shí)體,例如記者或通訊社、網(wǎng)絡(luò)名人、評論員等等。追隨者計(jì)數(shù)或者追隨給定用戶的用戶的數(shù)目可以是發(fā)貼的數(shù)據(jù)集的一部分,或者該計(jì)數(shù)可以根據(jù)短消息的集合來確定。為每個用戶或用戶的子集確定的追隨者計(jì)數(shù)可用于識別平均追隨者計(jì)數(shù)和中值追隨者計(jì)數(shù)。通過單獨(dú)或結(jié)合分析和/或中值追隨者計(jì)數(shù)來分析所確定的追隨者計(jì)數(shù),至少具有閾值數(shù)目的追隨者的一個或多個用戶可被識別為具有重大受眾。根據(jù)一個或多個實(shí)施例,可通過考查給定時(shí)間間隔的追隨者計(jì)數(shù)來估計(jì)追隨者計(jì)數(shù)。作為非限制性示例,該時(shí)間間隔是一分鐘;然而,可以使用任何時(shí)間間隔。為每個時(shí)間間隔,例如每分鐘,確定短消息的匯總數(shù)目,例如Twitter用戶的微博(tweet)的匯總數(shù)目。 根據(jù)一個或多個實(shí)施例,所匯總的短消息可以是短消息的集合的子集,例如與給定媒體事件相關(guān)的短消息的子集,從而使得一短消息基于為該短消息中的媒體事件識別的一個或多個關(guān)鍵詞語的存在而被識別為該子集的一部分。為每個時(shí)間間隔的用戶確定追隨者的總和、均值、中值和最大數(shù)目??梢苑治霭磿r(shí)間間隔的最大追隨者計(jì)數(shù)以識別主導(dǎo)被追隨者, 例如被認(rèn)為宣告媒體事件中的片段或興趣點(diǎn)的開始的被追隨者。在一個或多個實(shí)施例中,例如當(dāng)追隨者計(jì)數(shù)總體上很不穩(wěn)定時(shí),可以在局部化的窗口中,例如包括一個或多個時(shí)間間隔的窗口中,分析追隨者計(jì)數(shù)。圖3示出了根據(jù)本公開的一個或多個實(shí)施例從與巴拉克·奧巴馬2009年總統(tǒng)就職典禮相關(guān)的短消息的子集確定的按分鐘的最大追隨者計(jì)數(shù)。在該示例中,追隨者計(jì)數(shù)整體上是不穩(wěn)定的;可以在局部化窗口中測量不穩(wěn)定的追隨者計(jì)數(shù)。在前1/4部分中有13個用戶;在90分鐘采樣窗口內(nèi),一個用戶的追隨者計(jì)數(shù)下降了一個但又增加了兩個追隨者。在前1/4部分中,19條微博來自13 個用戶。在這些用戶之中,只有兩個用戶是整體分布的前1/4部分(例如大于3/4,或者( ) 中的離群者一個用戶是擁有49,485個追隨者的舊金山灣區(qū)的著名博客主,另一個是擁有 86,631個追隨者的CNN Breaking News0兩者都具有至少一個傳遞來自另一來源的引述的發(fā)貼,例如引述新聞總監(jiān)或巴拉克·奧巴馬。用戶具有的追隨者的數(shù)目可以描述該用戶的角色,例如短消息活動中的個人、組織或其他實(shí)體,例如記者或通訊社、網(wǎng)絡(luò)名人、評論員等等。按追隨者計(jì)數(shù)的前10個用戶是主流媒體公司和受歡迎的博客主。根據(jù)一個或多個實(shí)施例,交談型短消息活動的水平,例如提及另一用戶的短消息的數(shù)目,可用于對媒體事件分段。此分析可以取代或附加于對被追隨者的短消息采樣,來作為用于識別媒體事件的片段的機(jī)制??梢詮慕徽勑投滔⒌乃酱_定的交談的水平的變動,可以反映對媒體事件本身的興趣的水平,這可以用于識別媒體事件中的斷點(diǎn)。作為非限制性示例,交談型短消息包括提及另一用戶的消息,例如在Twitter 中,交談型短消息或微博被識別為包括另一用戶的“@menti0n”(@式提及)的那種。作為另一非限制性示例,交談型消息包含對于該消息針對一個或多個其他用戶的指示。根據(jù)一個或多個實(shí)施例,在媒體事件的過程期間交談型消息的波動可用于識別媒體事件中的斷點(diǎn),這些斷點(diǎn)可用于識別媒體事件的片段。在假定用戶在媒體事件中的重要點(diǎn)或者片段中發(fā)布較少的交談短消息內(nèi)容,而在片段結(jié)束時(shí)則發(fā)布更多交談內(nèi)容的情況下,數(shù)量的周期性增大可被識別并用于識別事件的邏輯斷點(diǎn)。所識別的斷點(diǎn)可以是候選分段點(diǎn)。根據(jù)一個或多個實(shí)施例,少交談消息活動的時(shí)刻被映射到媒體事件期間的片段開始, 例如事件開始點(diǎn),而多交談的時(shí)刻則被映射到片段的結(jié)束。由于線性速率數(shù)據(jù)饋送中的每分鐘消息數(shù)目可能幾乎是恒定而非周期性的,所以查看每分鐘的短消息的總量可能不起作用。針對性交談的量,例如微博中的“Omention”的量,可隨時(shí)間而變化。此外,在每分鐘鍵入字符數(shù)目和每分鐘的Omention數(shù)目之間存在強(qiáng)相關(guān)??紤]到這種相關(guān),Omention的數(shù)目可用作給定時(shí)間的交談水平的指標(biāo),從而使得@ mention的數(shù)目的波動被認(rèn)為是短消息的交談水平的波動。根據(jù)一個或多個實(shí)施例,通過對每時(shí)間間隔(例如每分鐘)的Omention消息的數(shù)目計(jì)數(shù)來識別交談波動。與Omention消息的數(shù)目的下降相對應(yīng)的交談消息的下降表示片段的開始,例如媒體事件的開始,媒體事件期間的重要點(diǎn),等等。與Omention消息的數(shù)目的上升相對應(yīng)的交談消息的上升表示片段的結(jié)束,例如媒體事件的結(jié)束、媒體事件中的重要點(diǎn)的結(jié)束,等等。根據(jù)一個或多個實(shí)施例,短消息活動中使用的詞語可被識別并用于識別媒體事件或媒體事件的片段的主題、情境和/或描述。詞語使用情況隨著時(shí)間的流逝的發(fā)展可反映興趣時(shí)刻附近的媒體事件的內(nèi)容。根據(jù)一個或多個實(shí)施例,短消息的文本內(nèi)容可指示出媒體事件的結(jié)構(gòu)和內(nèi)容,和/或媒體事件中的各個時(shí)刻生成的相對興趣水平。作為非限制性示例,短消息的文本內(nèi)容的按時(shí)間發(fā)展可指向和語義地注釋重要時(shí)刻并且預(yù)測正在發(fā)生的討論和興趣的主題。根據(jù)一個或多個實(shí)施例,隨著時(shí)間的流逝考查詞語的頻率。使用基于詞語頻率和反轉(zhuǎn)文檔頻率tf-idf的記分度量。詞語i根據(jù)其窗口詞語頻率tft,i或者說時(shí)間t附近的給定時(shí)間窗口內(nèi)包含詞語i的短消息的數(shù)目被記分。窗口詞語頻率tfu可以被全集詞語頻率Cfi所正規(guī)化,全集詞語頻率是在短消息的集合或者采樣中包含詞語i的短消息的總數(shù)。作為非限制性示例,時(shí)間t附近詞語i的正規(guī)化詞語頻率得分可被表達(dá)為
      權(quán)利要求
      1.一種方法,包括利用至少一個計(jì)算設(shè)備,獲得多個用戶的短消息的采樣,所述短消息的采樣對應(yīng)于媒體事件;利用所述至少一個計(jì)算設(shè)備和所述短消息的采樣,識別所述媒體事件中的片段;以及利用所述至少一個計(jì)算設(shè)備,識別從所述短消息的采樣中取得的至少一個詞語,所述至少一個詞語指示出所識別的片段的情境。
      2.如權(quán)利要求1所述的方法,還包括利用所述至少一個計(jì)算設(shè)備,從短消息的集合中選擇所述短消息的采樣,所述選擇包括選擇來自所述多個用戶中的至少一個用戶的短消息,所述至少一個用戶是至少具有閾值數(shù)目的訂戶的被追隨者。
      3.如權(quán)利要求2所述的方法,所述識別所述媒體事件中的片段的步驟還包括利用所述至少一個計(jì)算設(shè)備,利用被識別為至少具有閾值數(shù)目的訂戶的被追隨者的至少一個用戶的短消息活動來識別所述媒體事件中的片段。
      4.如權(quán)利要求1所述的方法,還包括利用所述至少一個計(jì)算設(shè)備,從短消息的集合中選擇所述短消息的采樣,所述選擇包括選擇交談型的短消息。
      5.如權(quán)利要求4所述的方法,其中,交談型消息包含關(guān)于該消息針對一個或多個用戶的指示。
      6.如權(quán)利要求5所述的方法,其中,所述指示包括鏈接消息發(fā)送者和所述一個或多個用戶的指示符。
      7.如權(quán)利要求1所述的方法,所述識別所述媒體事件中的片段的步驟還包括利用所述至少一個計(jì)算設(shè)備,利用被識別為交談型消息的短消息來識別所述媒體事件中的片段。
      8.如權(quán)利要求1所述的方法,所述識別所述媒體事件中的片段的步驟還包括利用所述至少一個計(jì)算設(shè)備和所述短消息的采樣,確定在所述短消息的采樣中使用的一詞語的多個詞語頻率得分,所述多個詞語頻率得分中的每一個對應(yīng)于所述媒體事件的一時(shí)間窗口并且指示出在相應(yīng)的時(shí)間窗口中包含該詞語的短消息的數(shù)目;利用所述至少一個計(jì)算設(shè)備和所述短消息的采樣,確定與所述多個詞語頻率得分相對應(yīng)的多個正規(guī)化頻率得分,對于每個詞語頻率得分,相應(yīng)的正規(guī)化頻率得分包括該詞語頻率得分與全集詞語頻率之比,全集詞語頻率指示出所述采樣中包含該詞語的短消息的數(shù)目;利用所述至少一個計(jì)算設(shè)備和為該詞語識別的多個正規(guī)化詞語頻率得分,確定最大正規(guī)化詞語頻率得分;以及利用所述至少一個計(jì)算設(shè)備,從與為該詞語確定的最大正規(guī)化頻率得分相對應(yīng)的時(shí)間窗口識別所述片段。
      9.如權(quán)利要求1所述的方法,識別從所述短消息的采樣取得的至少一個詞語的步驟還包括利用所述至少一個計(jì)算設(shè)備和所述短消息的采樣,確定在所述短消息的采樣中使用的一詞語的多個詞語頻率得分,所述多個詞語頻率得分中的每一個對應(yīng)于所述媒體事件的一時(shí)間窗口并且指示出在相應(yīng)的時(shí)間窗口中包含該詞語的短消息的數(shù)目;利用所述至少一個計(jì)算設(shè)備和為該詞語識別的所述多個詞語頻率得分,確定該詞語的使用頻率在與所識別的片段相對應(yīng)的時(shí)間是否相對較高;以及利用所述至少一個計(jì)算設(shè)備,在該詞語的使用頻率在與所識別的片段相對應(yīng)的時(shí)間相對較高的情況下,將該詞語識別為指示出所識別的片段的情境的詞語。
      10.如權(quán)利要求9所述的方法,其中,每個所述詞語頻率得分包括正規(guī)化頻率得分,該正規(guī)化頻率得分包括指示出在該時(shí)間窗口中包含該詞語的短消息的數(shù)目的詞語頻率與指示出在所述采樣中包含該詞語的短消息的數(shù)目的全集詞語頻率之比。
      11.一種系統(tǒng),包括至少一個計(jì)算設(shè)備,被配置為獲得多個用戶的短消息的采樣,所述短消息的采樣對應(yīng)于媒體事件;利用所述短消息的采樣,識別所述媒體事件中的片段;以及識別從所述短消息的采樣中取得的至少一個詞語,所述至少一個詞語指示出所識別的片段的情境。
      12.如權(quán)利要求11所述的系統(tǒng),所述至少一個計(jì)算設(shè)備還被配置為從短消息的集合中選擇所述短消息的采樣,所述選擇包括選擇來自所述多個用戶中的至少一個用戶的短消息,所述至少一個用戶是至少具有閾值數(shù)目的訂戶的被追隨者。
      13.如權(quán)利要求12所述的系統(tǒng),被配置為識別所述媒體事件中的片段的所述至少一個計(jì)算設(shè)備還被配置為利用被識別為至少具有閾值數(shù)目的訂戶的被追隨者的至少一個用戶的短消息活動來識別所述媒體事件中的片段。
      14.如權(quán)利要求11所述的系統(tǒng),所述至少一個計(jì)算設(shè)備還被配置為從短消息的集合中選擇所述短消息的采樣,所述選擇包括選擇交談型的短消息。
      15.如權(quán)利要求14所述的系統(tǒng),其中,交談型消息包含關(guān)于該消息針對一個或多個用戶的指示。
      16.如權(quán)利要求15所述的系統(tǒng),其中,所述指示包括鏈接消息發(fā)送者和所述一個或多個用戶的指示符。
      17.如權(quán)利要求11所述的系統(tǒng),被配置為識別所述媒體事件中的片段的所述至少一個計(jì)算設(shè)備還被配置為利用被識別為交談型消息的短消息來識別所述媒體事件中的片段。
      18.如權(quán)利要求11所述的系統(tǒng),被配置為識別所述媒體事件中的片段的所述至少一個計(jì)算設(shè)備還被配置為利用所述短消息的采樣,確定在所述短消息的采樣中使用的一詞語的多個詞語頻率得分,所述多個詞語頻率得分中的每一個對應(yīng)于所述媒體事件的一時(shí)間窗口并且指示出在相應(yīng)的時(shí)間窗口中包含該詞語的短消息的數(shù)目;利用所述短消息的采樣,確定與所述多個詞語頻率得分相對應(yīng)的多個正規(guī)化頻率得分,對于每個詞語頻率得分,相應(yīng)的正規(guī)化頻率得分包括該詞語頻率得分與全集詞語頻率之比,全集詞語頻率指示出所述采樣中包含該詞語的短消息的數(shù)目;利用為該詞語識別的多個正規(guī)化詞語頻率得分,確定最大正規(guī)化詞語頻率得分;以及從與為該詞語確定的最大正規(guī)化頻率得分相對應(yīng)的時(shí)間窗口識別所述片段。
      19.如權(quán)利要求11所述的系統(tǒng),被配置為識別從所述短消息的采樣取得的至少一個詞語的所述至少一個計(jì)算設(shè)備還被配置為利用所述短消息的采樣,確定在所述短消息的采樣中使用的一詞語的多個詞語頻率得分,所述多個詞語頻率得分中的每一個對應(yīng)于所述媒體事件的一時(shí)間窗口并且指示出在相應(yīng)的時(shí)間窗口中包含該詞語的短消息的數(shù)目;利用為該詞語識別的所述多個詞語頻率得分,確定該詞語的使用頻率在與所識別的片段相對應(yīng)的時(shí)間是否相對較高;以及在該詞語的使用頻率在與所識別的片段相對應(yīng)的時(shí)間相對較高的情況下,將該詞語識別為指示出所識別的片段的情境的詞語。
      20.如權(quán)利要求19所述的系統(tǒng),其中,每個所述詞語頻率得分包括正規(guī)化頻率得分,該正規(guī)化頻率得分包括指示出在該時(shí)間窗口中包含該詞語的短消息的數(shù)目的詞語頻率與指示出在所述采樣中包含該詞語的短消息的數(shù)目的全集詞語頻率之比。
      21.一種計(jì)算機(jī)可讀存儲介質(zhì),有形地存儲著計(jì)算機(jī)可讀指令,所述指令包括獲得多個用戶的短消息的采樣,所述短消息的采樣對應(yīng)于媒體事件;利用所述短消息的采樣,識別所述媒體事件中的片段;以及識別從所述短消息的采樣中取得的至少一個詞語,所述至少一個詞語指示出所識別的片段的情境。
      22.如權(quán)利要求21所述的介質(zhì),所述指令還包括從短消息的集合中選擇所述短消息的采樣,所述選擇包括選擇來自所述多個用戶中的至少一個用戶的短消息,所述至少一個用戶是至少具有閾值數(shù)目的訂戶的被追隨者。
      23.如權(quán)利要求22所述的介質(zhì),所述識別所述媒體事件中的片段還包括利用被識別為至少具有閾值數(shù)目的訂戶的被追隨者的至少一個用戶的短消息活動來識別所述媒體事件中的片段。
      24.如權(quán)利要求21所述的介質(zhì),所述指令還包括從短消息的集合中選擇所述短消息的采樣,所述選擇包括選擇交談型的短消息。
      25.如權(quán)利要求M所述的介質(zhì),其中,交談型消息包含關(guān)于該消息針對一個或多個用戶的指示。
      26.如權(quán)利要求25所述的介質(zhì),其中,所述指示包括鏈接消息發(fā)送者和所述一個或多個用戶的指示符。
      27.如權(quán)利要求21所述的介質(zhì),所述識別所述媒體事件中的片段還包括利用被識別為交談型消息的短消息來識別所述媒體事件中的片段。
      28.如權(quán)利要求21所述的介質(zhì),所述識別所述媒體事件中的片段還包括利用所述短消息的采樣,確定在所述短消息的采樣中使用的一詞語的多個詞語頻率得分,所述多個詞語頻率得分中的每一個對應(yīng)于所述媒體事件的一時(shí)間窗口并且指示出在相應(yīng)的時(shí)間窗口中包含該詞語的短消息的數(shù)目;利用所述短消息的采樣,確定與所述多個詞語頻率得分相對應(yīng)的多個正規(guī)化頻率得分,對于每個詞語頻率得分,相應(yīng)的正規(guī)化頻率得分包括該詞語頻率得分與全集詞語頻率之比,全集詞語頻率指示出所述采樣中包含該詞語的短消息的數(shù)目;利用為該詞語識別的多個正規(guī)化詞語頻率得分,確定最大正規(guī)化詞語頻率得分;以及從與為該詞語確定的最大正規(guī)化頻率得分相對應(yīng)的時(shí)間窗口識別所述片段。
      29.如權(quán)利要求21所述的介質(zhì),識別從所述短消息的采樣取得的至少一個詞語還包括利用所述短消息的采樣,確定在所述短消息的采樣中使用的一詞語的多個詞語頻率得分,所述多個詞語頻率得分中的每一個對應(yīng)于所述媒體事件的一時(shí)間窗口并且指示出在相應(yīng)的時(shí)間窗口中包含該詞語的短消息的數(shù)目;利用為該詞語識別的所述多個詞語頻率得分,確定該詞語的使用頻率在與所識別的片段相對應(yīng)的時(shí)間是否相對較高;以及在該詞語的使用頻率在與所識別的片段相對應(yīng)的時(shí)間相對較高的情況下,將該詞語識別為指示出所識別的片段的情境的詞語。
      30.如權(quán)利要求四所述的介質(zhì),其中,每個所述詞語頻率得分包括正規(guī)化頻率得分,該正規(guī)化頻率得分包括指示出在該時(shí)間窗口中包含該詞語的短消息的數(shù)目的詞語頻率與指示出在所述采樣中包含該詞語的短消息的數(shù)目的全集詞語頻率之比。
      全文摘要
      本發(fā)明提供了使用短消息的媒體事件結(jié)構(gòu)和情境識別。本公開描述了利用通過短消息傳遞服務(wù)開展的實(shí)時(shí)討論來發(fā)現(xiàn)媒體事件(例如實(shí)況媒體事件)的結(jié)構(gòu)、內(nèi)容和情境。概括來說,獲得多個用戶的短消息的采樣。短消息的采樣對應(yīng)于媒體事件。利用短消息的采樣,識別媒體事件中的片段,并且識別從短消息的采樣中取得的至少一個詞語。該至少一個詞語指示出所識別的片段的情境。
      文檔編號H04W4/14GK102164355SQ20111004364
      公開日2011年8月24日 申請日期2011年2月22日 優(yōu)先權(quán)日2010年2月22日
      發(fā)明者伊麗莎白·F·丘吉爾, 大衛(wèi)·艾曼·沙瑪, 林登·肯尼迪 申請人:雅虎公司
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
      1