一種確定流媒體中內(nèi)容爆點(diǎn)的方法及裝置的制造方法
【專利摘要】本發(fā)明實(shí)施例公開了一種確定流媒體中內(nèi)容爆點(diǎn)的方法和裝置,包括:按照預(yù)設(shè)的規(guī)則將流媒體劃分多個(gè)時(shí)間段;針對(duì)每個(gè)時(shí)間段,對(duì)該時(shí)間段內(nèi)的彈幕進(jìn)行分詞;統(tǒng)計(jì)每個(gè)分詞的詞頻,確定該時(shí)間段對(duì)應(yīng)的彈幕主題詞;并確定該時(shí)間段對(duì)應(yīng)的彈幕主題詞的出現(xiàn)頻率;根據(jù)每個(gè)時(shí)間段對(duì)應(yīng)的彈幕主題詞的出現(xiàn)頻率,及保存的頻率均值,識(shí)別出現(xiàn)頻率大于所述頻率均值的時(shí)間段;在識(shí)別出的時(shí)間段中,根據(jù)對(duì)應(yīng)的彈幕主題詞在該時(shí)間段內(nèi)每個(gè)時(shí)間點(diǎn)出現(xiàn)的頻率,將出現(xiàn)頻率最大值對(duì)應(yīng)的時(shí)間點(diǎn)確定為內(nèi)容爆點(diǎn)。使用本發(fā)明實(shí)施例,能夠提高確定流媒體中內(nèi)容爆點(diǎn)的效率和準(zhǔn)確性。
【專利說(shuō)明】
一種確定流媒體中內(nèi)容爆點(diǎn)的方法及裝置
技術(shù)領(lǐng)域
[0001] 本發(fā)明涉及流媒體技術(shù)領(lǐng)域,尤其涉及一種確定流媒體中內(nèi)容爆點(diǎn)的方法及裝 置。
【背景技術(shù)】
[0002] 現(xiàn)有的流媒體中內(nèi)容爆點(diǎn)的確定如視頻看點(diǎn)等主要依賴人工來(lái)編輯打點(diǎn)確定,由 于編輯者對(duì)內(nèi)容的敏感度不同,設(shè)置的看點(diǎn)與大多數(shù)用戶的關(guān)注點(diǎn)可能存在誤差,不能正 確反映出用戶真實(shí)感興趣的話題;且單個(gè)流媒體的爆點(diǎn)一經(jīng)設(shè)定一般不會(huì)再持續(xù)進(jìn)行更 新,當(dāng)某些時(shí)效性的熱點(diǎn)話題發(fā)生變化時(shí)相應(yīng)的爆點(diǎn)內(nèi)容不能有效的展示出來(lái)。
[0003] 可見,在現(xiàn)有技術(shù)中,這種依賴人工來(lái)編輯打點(diǎn)確定流媒體中內(nèi)容爆點(diǎn)的方法,效 率低,誤差大且更新不及時(shí)。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明實(shí)施例公開了 一種確定流媒體中內(nèi)容爆點(diǎn)的方法及裝置,以提高確定流媒 體中內(nèi)容爆點(diǎn)的效率,提高確定流媒體中內(nèi)容爆點(diǎn)的準(zhǔn)確性。
[0005] 為達(dá)到上述目的,本發(fā)明實(shí)施例公開了一種確定流媒體中內(nèi)容爆點(diǎn)的方法,應(yīng)用 于服務(wù)器,所述方法包括:
[0006] 按照預(yù)設(shè)的規(guī)則將流媒體劃分多個(gè)時(shí)間段;
[0007] 針對(duì)每個(gè)時(shí)間段,對(duì)該時(shí)間段內(nèi)的彈幕進(jìn)行分詞;統(tǒng)計(jì)該時(shí)間段內(nèi)每個(gè)分詞的詞 頻,確定該時(shí)間段對(duì)應(yīng)的彈幕主題詞;并確定該時(shí)間段對(duì)應(yīng)的彈幕主題詞的出現(xiàn)次數(shù);
[0008] 根據(jù)每個(gè)時(shí)間段對(duì)應(yīng)的彈幕主題詞的出現(xiàn)次數(shù),及保存的頻率均值,識(shí)別彈幕主 題詞出現(xiàn)次數(shù)大于所述頻率均值的時(shí)間段;
[0009] 在識(shí)別出的時(shí)間段中,根據(jù)對(duì)應(yīng)的彈幕主題詞在該時(shí)間段內(nèi)每個(gè)時(shí)間點(diǎn)出現(xiàn)的次 數(shù),將出現(xiàn)次數(shù)最大值對(duì)應(yīng)的時(shí)間點(diǎn)確定為內(nèi)容爆點(diǎn)。
[0010] 較佳地,所述按照預(yù)設(shè)的規(guī)則將流媒體劃分多個(gè)時(shí)間段之前,所述方法還包括:
[0011] 判斷用戶針對(duì)流媒體發(fā)送的彈幕數(shù)量是否大于預(yù)設(shè)的數(shù)量額定值,當(dāng)所述彈幕數(shù) 量大于預(yù)設(shè)的數(shù)量額定值時(shí),進(jìn)行所述按照預(yù)設(shè)的規(guī)則將流媒體劃分多個(gè)時(shí)間段的步驟。
[0012] 較佳地,所述對(duì)該時(shí)間段內(nèi)的彈幕進(jìn)行分詞之前,所述方法還包括:
[0013] 對(duì)該時(shí)間段內(nèi)的彈幕進(jìn)行過(guò)濾。
[0014] 較佳地,所述對(duì)該時(shí)間段內(nèi)的彈幕進(jìn)行過(guò)濾包括:
[0015] 判斷該時(shí)間段內(nèi)的每個(gè)彈幕與保存的無(wú)意義語(yǔ)句詞表中的內(nèi)容是否相同;
[0016] 如果相同,則過(guò)濾該彈幕。
[0017] 較佳地,所述對(duì)該時(shí)間段內(nèi)的彈幕進(jìn)行分詞之前,所述方法還包括:
[0018] 針對(duì)每個(gè)時(shí)間段,判斷該時(shí)間段內(nèi)的彈幕數(shù)量是否大于設(shè)定的數(shù)量閾值,如果是, 則進(jìn)行所述對(duì)該時(shí)間段內(nèi)的彈幕進(jìn)行分詞的步驟。
[0019] 較佳地,所述將出現(xiàn)次數(shù)最大值對(duì)應(yīng)的時(shí)間點(diǎn)確定為內(nèi)容爆點(diǎn)之后,所述方法還 包括:
[0020]將確定的每個(gè)內(nèi)容爆點(diǎn)保存在所述流媒體中,并針對(duì)每個(gè)內(nèi)容爆點(diǎn)保存該內(nèi)容爆 點(diǎn)對(duì)應(yīng)的彈幕。
[0021 ]較佳地,所述方法還包括:
[0022] 將識(shí)別出的時(shí)間段對(duì)應(yīng)的彈幕主題詞確定為該內(nèi)容爆點(diǎn)的爆點(diǎn)主題詞。
[0023] 為達(dá)到上述目的,本發(fā)明實(shí)施例還公開了一種確定流媒體中內(nèi)容爆點(diǎn)的裝置,應(yīng) 用于服務(wù)器,所述裝置包括:
[0024] 劃分模塊,用于按照預(yù)設(shè)的規(guī)則將流媒體劃分多個(gè)時(shí)間段;
[0025] 處理模塊,用于針對(duì)每個(gè)時(shí)間段,對(duì)該時(shí)間段內(nèi)的彈幕進(jìn)行分詞;統(tǒng)計(jì)每個(gè)時(shí)間段 內(nèi)每個(gè)分詞的詞頻,確定該時(shí)間段對(duì)應(yīng)的彈幕主題詞;并確定該時(shí)間段對(duì)應(yīng)的彈幕主題詞 的出現(xiàn)次數(shù);
[0026] 識(shí)別模塊,用于根據(jù)每個(gè)時(shí)間段對(duì)應(yīng)的彈幕主題詞的出現(xiàn)次數(shù),及保存的頻率均 值,識(shí)別彈幕主題詞出現(xiàn)次數(shù)大于所述頻率均值的時(shí)間段;
[0027] 第一確定模塊,用于根據(jù)對(duì)應(yīng)的彈幕主題詞在該時(shí)間段內(nèi)每個(gè)時(shí)間點(diǎn)出現(xiàn)的次 數(shù),將出現(xiàn)次數(shù)最大值對(duì)應(yīng)的時(shí)間點(diǎn)確定為內(nèi)容爆點(diǎn)。
[0028]較佳地,所述裝置還包括:
[0029] 第一判斷模塊,用于判斷用戶針對(duì)流媒體發(fā)送的彈幕數(shù)量是否大于預(yù)設(shè)的數(shù)量額 定值,當(dāng)所述彈幕數(shù)量大于預(yù)設(shè)的數(shù)量額定值時(shí),進(jìn)行所述按照預(yù)設(shè)的規(guī)則將流媒體劃分 多個(gè)時(shí)間段的步驟。
[0030] 過(guò)濾模塊,用于在對(duì)每個(gè)時(shí)間段內(nèi)的彈幕進(jìn)行分詞之前對(duì)該時(shí)間段內(nèi)的彈幕進(jìn)行 過(guò)濾。
[0031] 較佳地,所述過(guò)濾模塊具體用于:
[0032] 判斷該時(shí)間段內(nèi)的每個(gè)彈幕與保存的無(wú)意義語(yǔ)句詞表中的內(nèi)容是否相同;
[0033]如果相同,則過(guò)濾該彈幕。
[0034]較佳地,所述裝置還包括:
[0035]第二判斷模塊,用于針對(duì)每個(gè)時(shí)間段,判斷該時(shí)間段內(nèi)的彈幕數(shù)量是否大于設(shè)定 的數(shù)量閾值,如果是,則進(jìn)行所述對(duì)該時(shí)間段內(nèi)的彈幕進(jìn)行分詞的步驟。
[0036] 保存模塊,用于將出現(xiàn)次數(shù)最大值對(duì)應(yīng)的時(shí)間點(diǎn)確定為內(nèi)容爆點(diǎn)之后,將確定的 每個(gè)內(nèi)容爆點(diǎn)保存在所述流媒體中,并針對(duì)每個(gè)內(nèi)容爆點(diǎn)保存該內(nèi)容爆點(diǎn)對(duì)應(yīng)的彈幕。
[0037] 第二確定模塊,用于將識(shí)別出的時(shí)間段對(duì)應(yīng)的彈幕主題詞確定為該內(nèi)容爆點(diǎn)的爆 點(diǎn)主題詞。
[0038] 本發(fā)明實(shí)施例提供了一種確定流媒體中內(nèi)容爆點(diǎn)的方法和裝置,該方法中按照預(yù) 設(shè)的規(guī)則將流媒體劃分多個(gè)時(shí)間段;針對(duì)每個(gè)時(shí)間段,對(duì)該時(shí)間段內(nèi)的彈幕進(jìn)行分詞;統(tǒng)計(jì) 每個(gè)時(shí)間段內(nèi)每個(gè)分詞的詞頻,確定該時(shí)間段對(duì)應(yīng)的彈幕主題詞;并確定該時(shí)間段對(duì)應(yīng)的 彈幕主題詞的出現(xiàn)次數(shù);根據(jù)每個(gè)時(shí)間段對(duì)應(yīng)的彈幕主題詞的出現(xiàn)次數(shù),及保存的頻率均 值,識(shí)別彈幕主題詞出現(xiàn)次數(shù)大于所述頻率均值的時(shí)間段;在識(shí)別出的時(shí)間段中,根據(jù)對(duì)應(yīng) 的彈幕主題詞在該時(shí)間段內(nèi)每個(gè)時(shí)間點(diǎn)出現(xiàn)的次數(shù),將出現(xiàn)次數(shù)最大值對(duì)應(yīng)的時(shí)間點(diǎn)確定 為內(nèi)容爆點(diǎn)。本發(fā)明實(shí)施例是基于用戶彈幕內(nèi)容確定內(nèi)容爆點(diǎn),這是因?yàn)橛脩魧?duì)感興趣的 內(nèi)容輸入的彈幕也會(huì)比較多,因此根據(jù)流媒體中每個(gè)時(shí)間段內(nèi)彈幕主題詞的出現(xiàn)次數(shù),可 以準(zhǔn)確的確定出用戶感興趣的內(nèi)容爆點(diǎn),從而使確定出的內(nèi)容爆點(diǎn)更加準(zhǔn)確,另外,由于本 發(fā)明實(shí)施例中該內(nèi)容爆點(diǎn)可以按照上述方式靈活確定,如果彈幕內(nèi)容發(fā)生了變化,也能夠 及時(shí)、準(zhǔn)確的確定出變化后的內(nèi)容爆點(diǎn)。當(dāng)然,實(shí)施本發(fā)明的任一產(chǎn)品或方法必不一定需要 同時(shí)達(dá)到以上所述的所有優(yōu)點(diǎn)。
【附圖說(shuō)明】
[0039] 為了更清楚地說(shuō)明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn) 有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見地,下面描述中的附圖僅僅是本 發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以 根據(jù)這些附圖獲得其他的附圖。
[0040] 圖1為本發(fā)明實(shí)施例提供的一種確定流媒體中內(nèi)容爆點(diǎn)的方法流程示意圖;
[0041] 圖2為本發(fā)明實(shí)施例提供的另一種確定流媒體中內(nèi)容爆點(diǎn)的方法流程示意圖;
[0042] 圖3為本發(fā)明實(shí)施例提供的一種確定流媒體中內(nèi)容爆點(diǎn)的裝置結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0043]下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完 整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;?本發(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他 實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
[0044] 本發(fā)明實(shí)施例公開了一種確定流媒體中內(nèi)容爆點(diǎn)的方法及裝置,下面進(jìn)行詳細(xì)說(shuō) 明。
[0045] 圖1為本發(fā)明實(shí)施例的確定流媒體中內(nèi)容爆點(diǎn)的方法流程示意圖,應(yīng)用于服務(wù)器, 包括以下步驟:
[0046] 步驟S101:按照預(yù)設(shè)的規(guī)則將流媒體劃分多個(gè)時(shí)間段。
[0047] 劃分規(guī)則可以預(yù)先自行設(shè)定,可以是將流媒體均勻的劃分為多個(gè)時(shí)間段,或是將 流媒體不均勻的劃分為多個(gè)時(shí)間段,具體預(yù)設(shè)劃分規(guī)則如何設(shè)定,本發(fā)明實(shí)施例不作限定。 [0048]步驟S102:針對(duì)每個(gè)時(shí)間段,對(duì)該時(shí)間段內(nèi)的彈幕進(jìn)行分詞;統(tǒng)計(jì)該時(shí)間段內(nèi)每個(gè) 分詞的詞頻,確定該時(shí)間段對(duì)應(yīng)的彈幕主題詞;并確定該時(shí)間段對(duì)應(yīng)的彈幕主題詞的出現(xiàn) 次數(shù)。
[0049] 彈幕為用戶在觀看流媒體內(nèi)容時(shí)針對(duì)流媒體發(fā)送的評(píng)論內(nèi)容,其能夠正確反映出 用戶真實(shí)感興趣的話題。
[0050] 不同的彈幕發(fā)送的時(shí)間可能會(huì)有所區(qū)別,但是每個(gè)彈幕都只會(huì)在流媒體上特定的 一個(gè)時(shí)間點(diǎn)出現(xiàn),因此在流媒體上相同時(shí)間點(diǎn)會(huì)出現(xiàn)一定數(shù)量的彈幕且出現(xiàn)的彈幕基本上 具有相同的主題。
[0051] 由于用戶發(fā)送的彈幕與流媒體是同步實(shí)時(shí)更新的,因此彈幕與流媒體有著時(shí)間上 的對(duì)應(yīng)關(guān)系,即在流媒體上每個(gè)時(shí)間段內(nèi)會(huì)對(duì)應(yīng)積累有一定數(shù)量的用戶針對(duì)流媒體發(fā)送的 彈蒂。
[0052]對(duì)流媒體上每個(gè)時(shí)間段內(nèi)的彈幕進(jìn)行分詞,分詞技術(shù)屬于現(xiàn)有技術(shù),本發(fā)明實(shí)施 例不贅述。
[0053]對(duì)彈幕進(jìn)行分詞之后,統(tǒng)計(jì)每個(gè)時(shí)間段內(nèi)每個(gè)分詞的詞頻,每個(gè)分詞的詞頻即為 每個(gè)分詞出現(xiàn)的次數(shù),并將出現(xiàn)次數(shù)最多的分詞,即詞頻最大的分詞確定為該時(shí)間段對(duì)應(yīng) 的彈幕主題詞,并將所述詞頻最大的分詞的次數(shù)確定為所述彈幕主題詞的次數(shù)。
[0054]步驟S103:根據(jù)每個(gè)時(shí)間段對(duì)應(yīng)的彈幕主題詞的出現(xiàn)次數(shù),及保存的頻率均值,識(shí) 別彈幕主題詞的出現(xiàn)次數(shù)大于所述頻率均值的時(shí)間段。
[0055] 具體地,保存的頻率均值可以為預(yù)先設(shè)定的值,或是通過(guò)預(yù)設(shè)的計(jì)算方法計(jì)算得 出來(lái)的數(shù)值。
[0056] 計(jì)算頻率均值的預(yù)設(shè)的計(jì)算方法可以為,根據(jù)統(tǒng)計(jì)的每個(gè)時(shí)間段對(duì)應(yīng)的彈幕主題 詞的出現(xiàn)次數(shù),求出該流媒體上各彈幕主題詞的頻率中值,具體如下式所示。
[0057]頻率均值=(第一個(gè)時(shí)間段內(nèi)彈幕主題詞的出現(xiàn)次數(shù)+第二個(gè)時(shí)間段內(nèi)彈幕主題 詞的出現(xiàn)次數(shù)+……+第N個(gè)時(shí)間段內(nèi)彈幕主題詞的出現(xiàn)次數(shù))/(時(shí)間段的數(shù)量N)。
[0058] 當(dāng)然,也可以采用其他計(jì)算方法計(jì)算頻率均值,具體采用何種計(jì)算方法計(jì)算頻率 均值,本發(fā)明實(shí)施例不作限定。
[0059] 根據(jù)預(yù)先設(shè)定的頻率中值或計(jì)算得出的頻率均值,判斷每個(gè)時(shí)間段內(nèi)的彈幕主題 詞的出現(xiàn)次數(shù)是否大于該頻率均值,若大于,則識(shí)別彈幕主題詞的出現(xiàn)次數(shù)大于所述頻率 均值的時(shí)間段。
[0060] 步驟S104:在識(shí)別出的時(shí)間段中,根據(jù)對(duì)應(yīng)的彈幕主題詞在該時(shí)間段內(nèi)每個(gè)時(shí)間 點(diǎn)出現(xiàn)的次數(shù),將出現(xiàn)次數(shù)最大值對(duì)應(yīng)的時(shí)間點(diǎn)確定為內(nèi)容爆點(diǎn)。
[0061 ]具體地,識(shí)別出的時(shí)間段為彈幕主題詞的出現(xiàn)次數(shù)大于保存的頻率均值的時(shí)間 段,針對(duì)識(shí)別出的時(shí)間段,確定該時(shí)間段內(nèi)的彈幕主題詞在每個(gè)時(shí)間點(diǎn)出現(xiàn)的次數(shù),并將該 時(shí)間段內(nèi)彈幕主題詞出現(xiàn)次數(shù)最大值對(duì)應(yīng)的時(shí)間點(diǎn)確定為內(nèi)容爆點(diǎn)。
[0062] 為了便于用戶清楚的了解內(nèi)容爆點(diǎn)對(duì)應(yīng)的主題內(nèi)容,將識(shí)別出的時(shí)間段對(duì)應(yīng)的彈 幕主題詞確定為內(nèi)容爆點(diǎn)的爆點(diǎn)主題詞,這樣用戶就可以通過(guò)查看爆點(diǎn)主題詞清楚的了解 該內(nèi)容爆點(diǎn)對(duì)應(yīng)的爆點(diǎn)話題是什么。
[0063] 本發(fā)明實(shí)施例是基于用戶主動(dòng)生成的彈幕內(nèi)容確定內(nèi)容爆點(diǎn),由于用戶對(duì)感興趣 的內(nèi)容輸入的彈幕也會(huì)比較多,因此根據(jù)流媒體中每個(gè)時(shí)間段內(nèi)彈幕主題詞的出現(xiàn)次數(shù), 可以準(zhǔn)確的確定出用戶感興趣的內(nèi)容爆點(diǎn),從而使確定出的內(nèi)容爆點(diǎn)更加準(zhǔn)確,另外,由于 本發(fā)明實(shí)施例中該內(nèi)容爆點(diǎn)可以按照上述方式靈活確定,如果彈幕內(nèi)容發(fā)生了變化,也能 夠及時(shí)、準(zhǔn)確的確定出變化后的內(nèi)容爆點(diǎn)。
[0064] 為了提高確定流媒體內(nèi)容爆點(diǎn)的效率,在上述實(shí)施例的基礎(chǔ)上,在本發(fā)明的一個(gè) 實(shí)施例中,在對(duì)流媒體劃分多個(gè)時(shí)間段之前,該方法還包括:
[0065] 判斷用戶針對(duì)流媒體發(fā)送的彈幕數(shù)量是否大于預(yù)設(shè)的數(shù)量額定值,當(dāng)所述彈幕數(shù) 量大于預(yù)設(shè)的數(shù)量額定值時(shí),按照預(yù)設(shè)的規(guī)則將流媒體劃分多個(gè)時(shí)間段。
[0066] 具體地,預(yù)設(shè)的數(shù)量額定值為用戶根據(jù)實(shí)際情況自行設(shè)定的,其可以是很大的數(shù), 具體數(shù)值范圍本發(fā)明實(shí)施例不作限定,當(dāng)用戶針對(duì)流媒體發(fā)送的彈幕數(shù)量小于預(yù)設(shè)的數(shù)量 額定值時(shí),可以認(rèn)為根據(jù)此時(shí)的彈幕數(shù)量確定出的內(nèi)容爆點(diǎn)可能不夠準(zhǔn)確,因此在本發(fā)明 實(shí)施例中可以暫時(shí)不對(duì)其進(jìn)行確定流媒體內(nèi)容爆點(diǎn)的工作。
[0067]應(yīng)用本實(shí)施例,在確定流媒體的內(nèi)容爆點(diǎn)之前,根據(jù)用戶針對(duì)該流媒體發(fā)送的彈 幕數(shù)量先進(jìn)行判斷,其彈幕數(shù)量是否達(dá)到預(yù)設(shè)的數(shù)量額定值,在不可能出現(xiàn)內(nèi)容爆點(diǎn)時(shí),不 進(jìn)行確定流媒體內(nèi)容爆點(diǎn)的計(jì)算工作,減少了計(jì)算工作量,提高了確定流媒體內(nèi)容爆點(diǎn)的 效率。
[0068]為了進(jìn)一步提高確定流媒體內(nèi)容爆點(diǎn)的效率,在上述實(shí)施例的基礎(chǔ)上,在本發(fā)明 的另一個(gè)實(shí)施例中,在對(duì)每個(gè)時(shí)間段內(nèi)的彈幕進(jìn)行分詞之前,該方法還包括:
[0069]針對(duì)每個(gè)時(shí)間段,獲取流媒體在該時(shí)間段內(nèi)對(duì)應(yīng)的彈幕數(shù)量,判斷所述彈幕數(shù)量 是否大于預(yù)設(shè)的數(shù)量閾值,如果是,則對(duì)該時(shí)間段內(nèi)的彈幕進(jìn)行分詞。
[0070] 具體地,流媒體在每個(gè)時(shí)間段內(nèi)的彈幕數(shù)量可能會(huì)起伏變化,例如在某電視劇結(jié) 尾時(shí)刻可能只有很少的彈幕,這種情況下可以認(rèn)為不會(huì)出現(xiàn)內(nèi)容爆點(diǎn),則可以不對(duì)該時(shí)間 段進(jìn)行確定內(nèi)容爆點(diǎn)的工作,從而提高流媒體內(nèi)容爆點(diǎn)的確定效率。
[0071] 所述預(yù)設(shè)的數(shù)量閾值為用戶根據(jù)實(shí)際應(yīng)用情況自行設(shè)定的,當(dāng)該時(shí)間段內(nèi)的彈幕 數(shù)量大于預(yù)設(shè)的數(shù)量閾值時(shí),對(duì)該時(shí)間段內(nèi)的彈幕進(jìn)行分詞,當(dāng)該時(shí)間段內(nèi)的彈幕數(shù)量小 于預(yù)設(shè)的數(shù)量閾值時(shí),認(rèn)為不會(huì)有內(nèi)容爆點(diǎn),不進(jìn)行分詞處理。
[0072]應(yīng)用本實(shí)施例,只對(duì)彈幕數(shù)量大于預(yù)設(shè)的數(shù)量閾值的時(shí)間段內(nèi)的彈幕進(jìn)行分詞處 理,對(duì)彈幕數(shù)量小于預(yù)設(shè)的數(shù)量閾值的時(shí)間段不予考慮,這樣就避免了對(duì)不可能出現(xiàn)內(nèi)容 爆點(diǎn)的時(shí)間段做分詞處理工作,減小了分詞工作量,進(jìn)一步提高了確定流媒體內(nèi)容爆點(diǎn)的 效率。
[0073] 為了提高確定流媒體內(nèi)容爆點(diǎn)的準(zhǔn)確性,在上述實(shí)施例的基礎(chǔ)上,在本發(fā)明的又 一個(gè)實(shí)施例中,在對(duì)每個(gè)時(shí)間段內(nèi)的彈幕進(jìn)行分詞之前,該方法還包括:
[0074] 對(duì)每個(gè)時(shí)間段內(nèi)的彈幕進(jìn)行過(guò)濾。
[0075] 具體地,對(duì)每個(gè)時(shí)間段內(nèi)的彈幕進(jìn)行過(guò)濾包括:判斷該時(shí)間段內(nèi)的每個(gè)彈幕與保 存的無(wú)意義語(yǔ)句詞表中的內(nèi)容是否相同;如果相同,則過(guò)濾該彈幕。
[0076] 所述無(wú)意義語(yǔ)句詞表為保存在本地的表,無(wú)意義語(yǔ)句包括無(wú)意義的字、詞、短語(yǔ)以 及詆毀他人等低質(zhì)量語(yǔ)句等。無(wú)意義語(yǔ)句詞表如表1所示,其內(nèi)容可以根據(jù)實(shí)際情況進(jìn)行更 新。
[0077] 表 1
[0079] 應(yīng)用本實(shí)施例,分析彈幕內(nèi)容時(shí),過(guò)濾掉了無(wú)意義的不能準(zhǔn)確反映用戶真實(shí)感興 趣的話題的彈幕,只對(duì)有效反映用戶真實(shí)感興趣的話題的彈幕進(jìn)行分析,進(jìn)一步提高了確 定流媒體內(nèi)容爆點(diǎn)的準(zhǔn)確性。
[0080] 具體地,對(duì)彈幕的過(guò)濾工作可以在判斷每個(gè)時(shí)間段內(nèi)彈幕數(shù)量是否大于預(yù)設(shè)的數(shù) 量閾值之前,也可以在判斷每個(gè)時(shí)間段內(nèi)彈幕數(shù)量是否大于預(yù)設(shè)的數(shù)量閾值之后。
[0081] 為便于用戶查看與內(nèi)容爆點(diǎn)有關(guān)的彈幕內(nèi)容,在上述實(shí)施例的基礎(chǔ)上,在本發(fā)明 的再一個(gè)實(shí)施例中,該方法還包括:
[0082] 在確定內(nèi)容爆點(diǎn)后,將確定的每個(gè)內(nèi)容爆點(diǎn)保存在所述流媒體中,并針對(duì)每個(gè)內(nèi) 容爆點(diǎn)保存該內(nèi)容爆點(diǎn)對(duì)應(yīng)的彈幕。
[0083] 應(yīng)用本實(shí)施例,當(dāng)用戶播放該流媒體時(shí),可以點(diǎn)選內(nèi)容爆點(diǎn),查看對(duì)應(yīng)的彈幕,并 可以選擇是否播放該時(shí)間點(diǎn)對(duì)于的彈幕內(nèi)容,便于用戶更清楚的了解該內(nèi)容爆點(diǎn)對(duì)應(yīng)的話 題內(nèi)容。
[0084] 下面以一個(gè)具體的實(shí)施例對(duì)本發(fā)明進(jìn)行詳細(xì)描述,圖2為本發(fā)明實(shí)施例提供的另 一種確定流媒體中內(nèi)容爆點(diǎn)的方法流程示意圖,應(yīng)用于服務(wù)器,包括以下步驟:
[0085] 步驟S201:判斷用戶針對(duì)流媒體發(fā)送的彈幕數(shù)量是否大于預(yù)設(shè)的數(shù)量額定值,當(dāng) 所述彈幕數(shù)量大于預(yù)設(shè)的數(shù)量額定值時(shí),則按照預(yù)設(shè)的規(guī)則將流媒體劃分多個(gè)時(shí)間段。 [0086]假設(shè)流媒體時(shí)長(zhǎng)20秒,在這20秒內(nèi)的彈幕數(shù)量為800條,預(yù)設(shè)的數(shù)量額定值為500 條,用戶針對(duì)該流媒體發(fā)送的彈幕數(shù)量大于預(yù)設(shè)的數(shù)量額定值,則按照預(yù)設(shè)的規(guī)則將該流 媒體劃分多個(gè)時(shí)間段。
[0087]步驟S202:按照預(yù)設(shè)的規(guī)則將流媒體劃分多個(gè)時(shí)間段。
[0088] 假設(shè)預(yù)設(shè)規(guī)則為每5秒一個(gè)時(shí)間段,則可將流媒體劃分為4個(gè)時(shí)間段,1到5秒劃分 為第一時(shí)間段,5到10秒劃分為第二時(shí)間段,10到15秒劃分為第三時(shí)間段,15到20秒劃分為 第四時(shí)間段。
[0089] 步驟S203:針對(duì)每個(gè)時(shí)間段,對(duì)該時(shí)間段內(nèi)的彈幕進(jìn)行過(guò)濾。
[0090] 劃分時(shí)間段之后,判斷這四個(gè)時(shí)間段內(nèi)的每個(gè)彈幕與保存的無(wú)意義語(yǔ)句詞表中的 內(nèi)容是否相同;如果相同,則過(guò)濾該彈幕。
[0091] 步驟S204:針對(duì)每個(gè)時(shí)間段,獲取該時(shí)間段內(nèi)對(duì)彈幕進(jìn)行過(guò)濾后的彈幕數(shù)量,判斷 所述彈幕數(shù)量是否大于預(yù)設(shè)的數(shù)量閾值,若大于,則對(duì)該時(shí)間段內(nèi)的彈幕進(jìn)行分詞。
[0092] 假設(shè)第一時(shí)間段內(nèi)過(guò)濾后的彈幕數(shù)量為50條,第二時(shí)間段內(nèi)過(guò)濾后的彈幕數(shù)量為 250條,第三時(shí)間段內(nèi)過(guò)濾后的彈幕數(shù)量為400條,第四時(shí)間段內(nèi)過(guò)濾后的彈幕數(shù)量為100 條,假設(shè)預(yù)設(shè)的數(shù)量閾值為200,則可以得出,第二時(shí)間段和第三時(shí)間段內(nèi)過(guò)濾后的彈幕數(shù) 量大于預(yù)設(shè)的數(shù)量閾值,對(duì)第二時(shí)間段和第三時(shí)間段內(nèi)的過(guò)濾后的彈幕進(jìn)行分詞處理,而 第一時(shí)間段和第四時(shí)間段包含的彈幕數(shù)量較少,此時(shí)認(rèn)為其不會(huì)出現(xiàn)內(nèi)容爆點(diǎn),不進(jìn)行分 詞處理。
[0093] 采用現(xiàn)有的分詞技術(shù)對(duì)彈幕進(jìn)行分詞,本實(shí)施例不贅述分詞過(guò)程。
[0094] 步驟S205:統(tǒng)計(jì)每個(gè)時(shí)間段內(nèi)每個(gè)分詞的詞頻,確定該時(shí)間段對(duì)應(yīng)的彈幕主題詞; 并確定該時(shí)間段對(duì)應(yīng)的彈幕主題詞的出現(xiàn)次數(shù)。
[0095] 對(duì)第二時(shí)間段和第三時(shí)間段的彈幕進(jìn)行分詞之后,統(tǒng)計(jì)這兩個(gè)時(shí)間段內(nèi)每個(gè)分詞 出現(xiàn)的詞頻,即統(tǒng)計(jì)這兩個(gè)時(shí)間段內(nèi)每個(gè)分詞出現(xiàn)的次數(shù),并確定出這兩個(gè)時(shí)間段內(nèi)出現(xiàn) 次數(shù)最多的分詞。
[0096] 假設(shè)第二時(shí)間段內(nèi)出現(xiàn)次數(shù)最多的分詞是第一分詞,出現(xiàn)次數(shù)為250次,第三時(shí)間 段內(nèi)出現(xiàn)次數(shù)最多分詞的是第二分詞,出現(xiàn)次數(shù)為500次,則確定第一分詞為其所對(duì)應(yīng)的第 二時(shí)間段內(nèi)的彈幕主題詞,第二分詞為其所對(duì)應(yīng)的第三時(shí)間段內(nèi)的彈幕主題詞,且第二時(shí) 間段內(nèi)的彈幕主題詞的出現(xiàn)次數(shù)為250次,第三時(shí)間段內(nèi)的主題詞的出現(xiàn)次數(shù)為500次。
[0097] 步驟S206:根據(jù)每個(gè)時(shí)間段對(duì)應(yīng)的彈幕主題詞的出現(xiàn)次數(shù),及保存的頻率均值,識(shí) 別彈幕主題詞的出現(xiàn)次數(shù)大于所述頻率均值的時(shí)間段。
[0098] 判斷第二時(shí)間段和第三時(shí)間段內(nèi)的彈幕主題詞的出現(xiàn)次數(shù)是否大于保存的頻率 均值,本實(shí)施例中保存的頻率均值為根據(jù)下式計(jì)算出的頻率中值:
[0099] 頻率均值=(第一個(gè)時(shí)間段內(nèi)彈幕主題詞的出現(xiàn)次數(shù)+第二個(gè)時(shí)間段內(nèi)彈幕主題 詞的出現(xiàn)次數(shù)+……+第N個(gè)時(shí)間段內(nèi)彈幕主題詞的出現(xiàn)次數(shù))/(時(shí)間段的數(shù)量N) = (250+ 500)/2 = 375
[0100] 則得出第三時(shí)間段內(nèi)的主題詞的出現(xiàn)次數(shù)大于頻率均值,則識(shí)別第三時(shí)間段,并 將第三時(shí)間段對(duì)應(yīng)的彈幕主題詞確定為內(nèi)容爆點(diǎn)的爆點(diǎn)主題詞,即將第二分詞確定為爆點(diǎn) 主題詞。
[0101] 步驟S207:在識(shí)別出的時(shí)間段中,根據(jù)對(duì)應(yīng)的彈幕主題詞在該時(shí)間段內(nèi)每個(gè)時(shí)間 點(diǎn)出現(xiàn)的次數(shù),將出現(xiàn)次數(shù)最大值對(duì)應(yīng)的時(shí)間點(diǎn)確定為內(nèi)容爆點(diǎn)。
[0102] 在第三時(shí)間段內(nèi),統(tǒng)計(jì)彈幕主題詞在每個(gè)時(shí)間點(diǎn)的出現(xiàn)次數(shù),假設(shè)在第11秒處彈 幕主題詞出現(xiàn)40次,在第12秒處彈幕主題詞出現(xiàn)60次,在第13秒處彈幕主題詞出現(xiàn)300次, 在第14秒處彈幕主題詞出現(xiàn)70次,在第15秒處彈幕主題詞出現(xiàn)30次,在第13秒處彈幕主題 詞出現(xiàn)次數(shù)最多,則最后確定第三時(shí)間段內(nèi)的第13秒處為內(nèi)容爆點(diǎn)。
[0103] 步驟S208:將確定的內(nèi)容爆點(diǎn)保存在所述流媒體中。
[0104] 為便于用戶查詢內(nèi)容爆點(diǎn)的話題內(nèi)容,在將第三時(shí)間段內(nèi)的第13秒處確定為內(nèi)容 爆點(diǎn)后,將該時(shí)間點(diǎn)保存在所述流媒體中,并保存該時(shí)間點(diǎn)對(duì)應(yīng)的300條彈幕主題詞,當(dāng)用 戶使用應(yīng)用該實(shí)施例的服務(wù)器時(shí),可以點(diǎn)選內(nèi)容爆點(diǎn)查看爆點(diǎn)話題相關(guān)的彈幕,并尋找到 對(duì)應(yīng)的時(shí)間點(diǎn)播放。
[0105] 應(yīng)用本實(shí)施例,在對(duì)流媒體劃分多個(gè)時(shí)間段之前以及在對(duì)每個(gè)時(shí)間段內(nèi)的彈幕進(jìn) 行分詞之前,添加了對(duì)彈幕數(shù)量進(jìn)行判斷的步驟,減少了計(jì)算工作量,提高了確定流媒體內(nèi) 容爆點(diǎn)的效率;在對(duì)每個(gè)時(shí)間段內(nèi)的彈幕進(jìn)行分詞之前,還對(duì)每個(gè)時(shí)間段內(nèi)的彈幕進(jìn)行了 過(guò)濾,進(jìn)一步提高了確定流媒體內(nèi)容爆點(diǎn)的準(zhǔn)確性。
[0106] 本發(fā)明實(shí)施例還公開了一種確定流媒體中內(nèi)容爆點(diǎn)的裝置,圖3為本發(fā)明實(shí)施例 的一種確定流媒體中內(nèi)容爆點(diǎn)的裝置結(jié)構(gòu)示意圖,應(yīng)用于服務(wù)器,包括:
[0107] 劃分模塊301,用于按照預(yù)設(shè)的規(guī)則將流媒體劃分多個(gè)時(shí)間段。
[0108] 具體地,劃分規(guī)則可以預(yù)先自行設(shè)定,可以是將流媒體均勻的劃分為多個(gè)時(shí)間段, 或是將流媒體不均勻的劃分為多個(gè)時(shí)間段,具體預(yù)設(shè)劃分規(guī)則如何設(shè)定,本發(fā)明實(shí)施例不 作限定。
[0109] 處理模塊302,用于針對(duì)每個(gè)時(shí)間段,對(duì)該時(shí)間段內(nèi)的彈幕進(jìn)行分詞;統(tǒng)計(jì)該時(shí)間 段內(nèi)每個(gè)分詞的詞頻,確定該時(shí)間段對(duì)應(yīng)的彈幕主題詞;并確定該時(shí)間段對(duì)應(yīng)的彈幕主題 詞的出現(xiàn)次數(shù)。
[0110] 彈幕為用戶在觀看流媒體內(nèi)容時(shí)針對(duì)流媒體發(fā)送的評(píng)論內(nèi)容,其能夠正確反映出 用戶真實(shí)感興趣的話題。
[0111] 不同的彈幕發(fā)送的時(shí)間可能會(huì)有所區(qū)別,但是每個(gè)彈幕都只會(huì)在流媒體上特定的 一個(gè)時(shí)間點(diǎn)出現(xiàn),因此在流媒體上相同時(shí)間點(diǎn)會(huì)出現(xiàn)一定數(shù)量的彈幕且出現(xiàn)的彈幕基本上 具有相同的主題。
[0112]由于用戶發(fā)送的彈幕與流媒體是同步實(shí)時(shí)更新的,因此彈幕與流媒體有著時(shí)間上 的對(duì)應(yīng)關(guān)系,即在流媒體上每個(gè)時(shí)間段內(nèi)會(huì)對(duì)應(yīng)積累有一定數(shù)量的用戶針對(duì)流媒體發(fā)送的 彈蒂。
[0113] 具體地,對(duì)流媒體上每個(gè)時(shí)間段內(nèi)的彈幕進(jìn)行分詞,分詞技術(shù)屬于現(xiàn)有技術(shù),本發(fā) 明實(shí)施例不贅述。
[0114] 對(duì)彈幕進(jìn)行分詞之后,統(tǒng)計(jì)每個(gè)時(shí)間段內(nèi)每個(gè)分詞的詞頻,每個(gè)分詞的詞頻即為 每個(gè)分詞出現(xiàn)的次數(shù),并將出現(xiàn)次數(shù)最多的分詞,即詞頻最大的分詞確定為該時(shí)間段對(duì)應(yīng) 的彈幕主題詞,并將所述分詞的次數(shù)確定為所述彈幕主題詞的次數(shù)。
[0115] 識(shí)別模塊303,用于根據(jù)每個(gè)時(shí)間段對(duì)應(yīng)的彈幕主題詞的出現(xiàn)次數(shù),及保存的頻率 均值,識(shí)別彈幕主題詞的出現(xiàn)次數(shù)大于所述頻率均值的時(shí)間段。
[0116] 具體地,保存的頻率均值可以為預(yù)先設(shè)定的值,或是通過(guò)預(yù)設(shè)的計(jì)算方法計(jì)算得 出來(lái)的數(shù)值。
[0117] 計(jì)算頻率均值的預(yù)設(shè)的計(jì)算方法可以為,根據(jù)統(tǒng)計(jì)的每個(gè)時(shí)間段對(duì)應(yīng)的彈幕主題 詞的出現(xiàn)次數(shù),求出該流媒體上各彈幕主題詞的頻率中值,具體如下式所示。
[0118] 頻率均值=(第一個(gè)時(shí)間段內(nèi)彈幕主題詞的出現(xiàn)次數(shù)+第二個(gè)時(shí)間段內(nèi)彈幕主題 詞的出現(xiàn)次數(shù)+……+第N個(gè)時(shí)間段內(nèi)彈幕主題詞的出現(xiàn)次數(shù))/(時(shí)間段的數(shù)量N)。
[0119] 當(dāng)然,也可以采用其他計(jì)算方法計(jì)算頻率均值,具體采用何種計(jì)算方法計(jì)算頻率 均值,本發(fā)明實(shí)施例不作限定。
[0120] 根據(jù)預(yù)先設(shè)定的頻率中值或計(jì)算得出的頻率均值,判斷每個(gè)時(shí)間段內(nèi)的彈幕主題 詞的出現(xiàn)次數(shù)是否大于該頻率均值,若大于,則識(shí)別彈幕主題詞的出現(xiàn)次數(shù)大于所述頻率 均值的時(shí)間段。
[0121] 第一確定模塊304,用于在識(shí)別出的時(shí)間段中,根據(jù)對(duì)應(yīng)的彈幕主題詞在該時(shí)間段 內(nèi)每個(gè)時(shí)間點(diǎn)出現(xiàn)的次數(shù),將出現(xiàn)次數(shù)最大值對(duì)應(yīng)的時(shí)間點(diǎn)確定為內(nèi)容爆點(diǎn)。
[0122] 具體地,識(shí)別出的時(shí)間段為彈幕主題詞的出現(xiàn)次數(shù)大于保存的頻率均值的時(shí)間 段,針對(duì)識(shí)別出的時(shí)間段,確定該時(shí)間段內(nèi)的彈幕主題詞在每個(gè)時(shí)間點(diǎn)出現(xiàn)的次數(shù),并將該 時(shí)間段內(nèi)彈幕主題詞出現(xiàn)次數(shù)最大值對(duì)應(yīng)的時(shí)間點(diǎn)確定為內(nèi)容爆點(diǎn)。
[0123] 為了便于用戶清楚的了解內(nèi)容爆點(diǎn)對(duì)應(yīng)的主題內(nèi)容,該裝置還包括第二確定模塊 (圖3中未示出),用于將識(shí)別出的時(shí)間段對(duì)應(yīng)的彈幕主題詞確定為內(nèi)容爆點(diǎn)的爆點(diǎn)主題詞, 這樣用戶就可以通過(guò)查看爆點(diǎn)主題詞清楚的了解該內(nèi)容爆點(diǎn)對(duì)應(yīng)的爆點(diǎn)話題是什么。
[0124] 本發(fā)明實(shí)施例是基于用戶主動(dòng)生成的彈幕內(nèi)容確定內(nèi)容爆點(diǎn),由于用戶對(duì)感興趣 的內(nèi)容輸入的彈幕也會(huì)比較多,因此根據(jù)流媒體中每個(gè)時(shí)間段內(nèi)彈幕主題詞的出現(xiàn)次數(shù), 可以準(zhǔn)確的確定出用戶感興趣的內(nèi)容爆點(diǎn),從而使確定出的內(nèi)容爆點(diǎn)更加準(zhǔn)確,另外,由于 本發(fā)明實(shí)施例中該內(nèi)容爆點(diǎn)可以按照上述方式靈活確定,如果彈幕內(nèi)容發(fā)生了變化,也能 夠及時(shí)、準(zhǔn)確的確定出變化后的內(nèi)容爆點(diǎn)。
[0125] 為了提高確定流媒體內(nèi)容爆點(diǎn)的效率,在上述實(shí)施例的基礎(chǔ)上,在本發(fā)明的一個(gè) 實(shí)施例中,在對(duì)流媒體劃分多個(gè)時(shí)間段之前,該裝置還包括:
[0126] 第一判斷模塊,用于判斷用戶針對(duì)流媒體發(fā)送的彈幕數(shù)量是否大于預(yù)設(shè)的數(shù)量額 定值,當(dāng)所述彈幕數(shù)量大于預(yù)設(shè)的數(shù)量額定值時(shí),按照預(yù)設(shè)的規(guī)則將流媒體劃分多個(gè)時(shí)間 段。
[0127] 具體地,預(yù)設(shè)的數(shù)量額定值為用戶根據(jù)實(shí)際情況自行設(shè)定的,其可以是很大的數(shù), 具體數(shù)值范圍本發(fā)明實(shí)施例不作限定,
[0128] 當(dāng)用戶針對(duì)流媒體發(fā)送的彈幕數(shù)量小于預(yù)設(shè)的數(shù)量額定值時(shí),可以認(rèn)為根據(jù)此時(shí) 的彈幕數(shù)量確定出的內(nèi)容爆點(diǎn)可能不夠準(zhǔn)確,因此在本發(fā)明實(shí)施例中可以暫時(shí)不對(duì)其進(jìn)行 確定流媒體內(nèi)容爆點(diǎn)的工作。
[0129] 應(yīng)用本實(shí)施例,在確定流媒體的內(nèi)容爆點(diǎn)之前,根據(jù)用戶針對(duì)該流媒體發(fā)送的彈 幕數(shù)量先進(jìn)行判斷,其彈幕數(shù)量是否達(dá)到預(yù)設(shè)的數(shù)量額定值,在不可能出現(xiàn)內(nèi)容爆點(diǎn)時(shí),不 進(jìn)行確定流媒體內(nèi)容爆點(diǎn)的計(jì)算工作,減少了計(jì)算工作量,提高了確定流媒體內(nèi)容爆點(diǎn)的 效率。
[0130] 為了進(jìn)一步提高確定流媒體內(nèi)容爆點(diǎn)的效率,在上述實(shí)施例的基礎(chǔ)上,在本發(fā)明 的另一個(gè)實(shí)施例中,在對(duì)每個(gè)時(shí)間段內(nèi)的彈幕進(jìn)行分詞之前,該裝置還包括:
[0131] 第二判斷模塊,用于針對(duì)每個(gè)時(shí)間段,獲取流媒體在該時(shí)間段內(nèi)對(duì)應(yīng)的彈幕數(shù)量, 判斷所述彈幕數(shù)量是否大于預(yù)設(shè)的數(shù)量閾值,如果是,則對(duì)該時(shí)間段內(nèi)的彈幕進(jìn)行分詞。
[0132] 具體地,流媒體在每個(gè)時(shí)間段內(nèi)的彈幕數(shù)量可能會(huì)起伏變化,例如在某電視劇結(jié) 尾時(shí)刻可能只有很少的彈幕,這種情況下可以認(rèn)為不會(huì)出現(xiàn)內(nèi)容爆點(diǎn),則可以不對(duì)該時(shí)間 段進(jìn)行確定內(nèi)容爆點(diǎn)的工作,從而提高流媒體內(nèi)容爆點(diǎn)的確定效率。
[0133] 所述預(yù)設(shè)的數(shù)量閾值為用戶根據(jù)實(shí)際應(yīng)用情況自行設(shè)定的,當(dāng)該時(shí)間段內(nèi)的彈幕 數(shù)量大于預(yù)設(shè)的數(shù)量閾值時(shí),對(duì)該時(shí)間段內(nèi)的彈幕進(jìn)行分詞,當(dāng)該時(shí)間段內(nèi)的彈幕數(shù)量小 于預(yù)設(shè)的數(shù)量閾值時(shí),認(rèn)為不會(huì)有內(nèi)容爆點(diǎn),不進(jìn)行分詞處理。
[0134] 應(yīng)用本實(shí)施例,只對(duì)彈幕數(shù)量大于預(yù)設(shè)的數(shù)量閾值的時(shí)間段內(nèi)的彈幕進(jìn)行分詞處 理,對(duì)彈幕數(shù)量小于預(yù)設(shè)的數(shù)量閾值的時(shí)間段不予考慮,這樣就避免了對(duì)不可能出現(xiàn)內(nèi)容 爆點(diǎn)的時(shí)間段做分詞處理工作,減小了分詞工作量,進(jìn)一步提高了確定流媒體內(nèi)容爆點(diǎn)的 效率。
[0135] 為了提高確定流媒體內(nèi)容爆點(diǎn)的準(zhǔn)確性,在上述實(shí)施例的基礎(chǔ)上,在本發(fā)明的又 一個(gè)實(shí)施例中,在對(duì)每個(gè)時(shí)間段內(nèi)的彈幕進(jìn)行分詞之前,該裝置還包括:
[0136] 過(guò)濾模塊,用于對(duì)每個(gè)時(shí)間段內(nèi)的彈幕進(jìn)行過(guò)濾。
[0137] 具體地,對(duì)每個(gè)時(shí)間段內(nèi)的彈幕進(jìn)行過(guò)濾包括:判斷該時(shí)間段內(nèi)的每個(gè)彈幕與保 存的無(wú)意義語(yǔ)句詞表中的內(nèi)容是否相同;如果相同,則過(guò)濾該彈幕。
[0138] 所述無(wú)意義語(yǔ)句詞表為保存在本地的表,無(wú)意義語(yǔ)句包括無(wú)意義的字、詞、短語(yǔ)以 及詆毀他人等低質(zhì)量語(yǔ)句等。無(wú)意義語(yǔ)句詞表如表1所示,其內(nèi)容可以根據(jù)實(shí)際情況進(jìn)行更 新。
[0139] 表1
[0141] 應(yīng)用本實(shí)施例,分析彈幕內(nèi)容時(shí),過(guò)濾掉了無(wú)意義的不能準(zhǔn)確反映用戶真實(shí)感興 趣的話題的彈幕,只對(duì)有效反映用戶真實(shí)感興趣的話題的彈幕進(jìn)行分析,進(jìn)一步提高了確 定流媒體內(nèi)容爆點(diǎn)的準(zhǔn)確性。
[0142] 具體地,對(duì)彈幕的過(guò)濾工作可以在判斷每個(gè)時(shí)間段內(nèi)彈幕數(shù)量是否大于預(yù)設(shè)的數(shù) 量閾值之前,也可以在判斷每個(gè)時(shí)間段內(nèi)彈幕數(shù)量是否大于預(yù)設(shè)的數(shù)量閾值之后。
[0143] 為便于用戶查看與內(nèi)容爆點(diǎn)有關(guān)的彈幕內(nèi)容,在上述實(shí)施例的基礎(chǔ)上,在本發(fā)明 的再一個(gè)實(shí)施例中,該裝置還包括:
[0144] 保存模塊,用于在確定內(nèi)容爆點(diǎn)后,將確定的每個(gè)內(nèi)容爆點(diǎn)保存在所述流媒體中, 并針對(duì)每個(gè)內(nèi)容爆點(diǎn)保存該內(nèi)容爆點(diǎn)對(duì)應(yīng)的彈幕。
[0145] 應(yīng)用本實(shí)施例,當(dāng)用戶播放該流媒體時(shí),可以點(diǎn)選內(nèi)容爆點(diǎn),查看對(duì)應(yīng)的彈幕,并 可以選擇是否播放該時(shí)間點(diǎn)對(duì)于的彈幕內(nèi)容,便于用戶更清楚的了解該內(nèi)容爆點(diǎn)對(duì)應(yīng)的話 題內(nèi)容。
[0146] 對(duì)于裝置實(shí)施例而言,由于其基本相似于方法實(shí)施例,所以描述的比較簡(jiǎn)單,相關(guān) 之處參見方法實(shí)施例的部分說(shuō)明即可。
[0147] 需要說(shuō)明的是,在本文中,諸如第一和第二等之類的關(guān)系術(shù)語(yǔ)僅僅用來(lái)將一個(gè)實(shí) 體或者操作與另一個(gè)實(shí)體或操作區(qū)分開來(lái),而不一定要求或者暗示這些實(shí)體或操作之間存 在任何這種實(shí)際的關(guān)系或者順序。而且,術(shù)語(yǔ)"包括"、"包含"或者其任何其他變體意在涵蓋 非排他性的包含,從而使得包括一系列要素的過(guò)程、方法、物品或者設(shè)備不僅包括那些要 素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過(guò)程、方法、物品或者設(shè)備 所固有的要素。在沒有更多限制的情況下,由語(yǔ)句"包括一個(gè)……"限定的要素,并不排除在 包括所述要素的過(guò)程、方法、物品或者設(shè)備中還存在另外的相同要素。
[0148] 本領(lǐng)域普通技術(shù)人員可以理解實(shí)現(xiàn)上述方法實(shí)施方式中的全部或部分步驟是可 以通過(guò)程序來(lái)指令相關(guān)的硬件來(lái)完成,所述的程序可以存儲(chǔ)于計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中, 這里所稱得的存儲(chǔ)介質(zhì),如:R0M/RAM、磁碟、光盤等。
[0149] 以上所述僅為本發(fā)明的較佳實(shí)施例而已,并非用于限定本發(fā)明的保護(hù)范圍。凡在 本發(fā)明的精神和原則之內(nèi)所作的任何修改、等同替換、改進(jìn)等,均包含在本發(fā)明的保護(hù)范圍 內(nèi)。
【主權(quán)項(xiàng)】
1. 一種確定流媒體中內(nèi)容爆點(diǎn)的方法,其特征在于,應(yīng)用于服務(wù)器,所述方法包括: 按照預(yù)設(shè)的規(guī)則將流媒體劃分多個(gè)時(shí)間段; 針對(duì)每個(gè)時(shí)間段,對(duì)該時(shí)間段內(nèi)的彈幕進(jìn)行分詞;統(tǒng)計(jì)該時(shí)間段內(nèi)每個(gè)分詞的詞頻,確 定該時(shí)間段對(duì)應(yīng)的彈幕主題詞;并確定該時(shí)間段對(duì)應(yīng)的彈幕主題詞的出現(xiàn)次數(shù); 根據(jù)每個(gè)時(shí)間段對(duì)應(yīng)的彈幕主題詞的出現(xiàn)次數(shù),及保存的頻率均值,識(shí)別彈幕主題詞 出現(xiàn)次數(shù)大于所述頻率均值的時(shí)間段; 在識(shí)別出的時(shí)間段中,根據(jù)對(duì)應(yīng)的彈幕主題詞在該時(shí)間段內(nèi)每個(gè)時(shí)間點(diǎn)出現(xiàn)的次數(shù), 將出現(xiàn)次數(shù)最大值對(duì)應(yīng)的時(shí)間點(diǎn)確定為內(nèi)容爆點(diǎn)。2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述按照預(yù)設(shè)的規(guī)則將流媒體劃分多個(gè)時(shí) 間段之前,所述方法還包括: 判斷用戶針對(duì)流媒體發(fā)送的彈幕數(shù)量是否大于預(yù)設(shè)的數(shù)量額定值,當(dāng)所述彈幕數(shù)量大 于預(yù)設(shè)的數(shù)量額定值時(shí),進(jìn)行所述按照預(yù)設(shè)的規(guī)則將流媒體劃分多個(gè)時(shí)間段的步驟。3. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對(duì)該時(shí)間段內(nèi)的彈幕進(jìn)行分詞之前, 所述方法還包括: 對(duì)該時(shí)間段內(nèi)的彈幕進(jìn)行過(guò)濾。4. 根據(jù)權(quán)利要求3所述的方法,其特征在于,所述對(duì)該時(shí)間段內(nèi)的彈幕進(jìn)行過(guò)濾包括: 判斷該時(shí)間段內(nèi)的每個(gè)彈幕與保存的無(wú)意義語(yǔ)句詞表中的內(nèi)容是否相同; 如果相同,則過(guò)濾該彈幕。5. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對(duì)該時(shí)間段內(nèi)的彈幕進(jìn)行分詞之前, 所述方法還包括: 針對(duì)每個(gè)時(shí)間段,判斷該時(shí)間段內(nèi)的彈幕數(shù)量是否大于設(shè)定的數(shù)量閾值,如果是,則進(jìn) 行所述對(duì)該時(shí)間段內(nèi)的彈幕進(jìn)行分詞的步驟。6. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述將出現(xiàn)次數(shù)最大值對(duì)應(yīng)的時(shí)間點(diǎn)確定 為內(nèi)容爆點(diǎn)之后,所述方法還包括: 將確定的每個(gè)內(nèi)容爆點(diǎn)保存在所述流媒體中,并針對(duì)每個(gè)內(nèi)容爆點(diǎn)保存該內(nèi)容爆點(diǎn)對(duì) 應(yīng)的彈蒂。7. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括: 將識(shí)別出的時(shí)間段對(duì)應(yīng)的彈幕主題詞確定為該內(nèi)容爆點(diǎn)的爆點(diǎn)主題詞。8. -種確定流媒體中內(nèi)容爆點(diǎn)的裝置,其特征在于,應(yīng)用于服務(wù)器,所述裝置包括: 劃分模塊,用于按照預(yù)設(shè)的規(guī)則將流媒體劃分多個(gè)時(shí)間段; 處理模塊,用于針對(duì)每個(gè)時(shí)間段,對(duì)該時(shí)間段內(nèi)的彈幕進(jìn)行分詞;統(tǒng)計(jì)每個(gè)時(shí)間段內(nèi)每 個(gè)分詞的詞頻,確定該時(shí)間段對(duì)應(yīng)的彈幕主題詞;并確定該時(shí)間段對(duì)應(yīng)的彈幕主題詞的出 現(xiàn)次數(shù); 識(shí)別模塊,用于根據(jù)每個(gè)時(shí)間段對(duì)應(yīng)的彈幕主題詞的出現(xiàn)次數(shù),及保存的頻率均值,識(shí) 別彈幕主題詞出現(xiàn)次數(shù)大于所述頻率均值的時(shí)間段; 第一確定模塊,用于根據(jù)對(duì)應(yīng)的彈幕主題詞在該時(shí)間段內(nèi)每個(gè)時(shí)間點(diǎn)出現(xiàn)的次數(shù),將 出現(xiàn)次數(shù)最大值對(duì)應(yīng)的時(shí)間點(diǎn)確定為內(nèi)容爆點(diǎn)。9. 根據(jù)權(quán)利要求8所述的裝置,其特征在于,所述裝置還包括: 第一判斷模塊,用于判斷用戶針對(duì)流媒體發(fā)送的彈幕數(shù)量是否大于預(yù)設(shè)的數(shù)量額定 值,當(dāng)所述彈幕數(shù)量大于預(yù)設(shè)的數(shù)量額定值時(shí),進(jìn)行所述按照預(yù)設(shè)的規(guī)則將流媒體劃分多 個(gè)時(shí)間段的步驟。10. 根據(jù)權(quán)利要求8所述的裝置,其特征在于,所述裝置還包括: 過(guò)濾模塊,用于在對(duì)每個(gè)時(shí)間段內(nèi)的彈幕進(jìn)行分詞之前對(duì)該時(shí)間段內(nèi)的彈幕進(jìn)行過(guò) 濾。11. 根據(jù)權(quán)利要求10所述的裝置,其特征在于,所述過(guò)濾模塊具體用于: 判斷該時(shí)間段內(nèi)的每個(gè)彈幕與保存的無(wú)意義語(yǔ)句詞表中的內(nèi)容是否相同; 如果相同,則過(guò)濾該彈幕。12. 根據(jù)權(quán)利要求8所述的裝置,其特征在于,所述裝置還包括: 第二判斷模塊,用于針對(duì)每個(gè)時(shí)間段,判斷該時(shí)間段內(nèi)的彈幕數(shù)量是否大于設(shè)定的數(shù) 量閾值,如果是,則進(jìn)行所述對(duì)該時(shí)間段內(nèi)的彈幕進(jìn)行分詞的步驟。13. 根據(jù)權(quán)利要求8所述的裝置,其特征在于,所述裝置還包括: 保存模塊,用于將出現(xiàn)次數(shù)最大值對(duì)應(yīng)的時(shí)間點(diǎn)確定為內(nèi)容爆點(diǎn)之后,將確定的每個(gè) 內(nèi)容爆點(diǎn)保存在所述流媒體中,并針對(duì)每個(gè)內(nèi)容爆點(diǎn)保存該內(nèi)容爆點(diǎn)對(duì)應(yīng)的彈幕。14. 根據(jù)權(quán)利要求8所述的裝置,其特征在于,所述裝置還包括: 第二確定模塊,用于將識(shí)別出的時(shí)間段對(duì)應(yīng)的彈幕主題詞確定為該內(nèi)容爆點(diǎn)的爆點(diǎn)主 題詞。
【文檔編號(hào)】H04N21/845GK106028176SQ201610373489
【公開日】2016年10月12日
【申請(qǐng)日】2016年5月31日
【發(fā)明人】王晨曦, 汪強(qiáng), 楊琛
【申請(qǐng)人】北京奇藝世紀(jì)科技有限公司