本技術(shù)涉及電數(shù)字數(shù)據(jù)處理領(lǐng)域,特別涉及一種彈幕處理方法。
背景技術(shù):
1、在直播應用中,觀看直播的用戶可以通過彈幕與主播交互。但是,由于直播間的顯示界面有限,如果直播熱度較高,過多的彈幕可能無法及時顯示,也可能造成直播間觀感下降,影響用戶體驗。
技術(shù)實現(xiàn)思路
1、本技術(shù)實施例提供了一種彈幕處理方法,能夠?qū)χ辈ラg的彈幕進行智能化的規(guī)劃處理,對不同類型的彈幕采用不同的處理方式,優(yōu)化直播間的彈幕顯示效果,提升直播間的彈幕中的有效信息含量,并且促進基于彈幕的直播間交互。
2、根據(jù)本技術(shù)實施例的一個方面,提供了一種彈幕處理方法,所述方法包括:
3、獲取目標直播間在預設(shè)時段對應的交互信息,所述交互信息包括實時觀看人數(shù)、實時彈幕數(shù)量和實時彈幕字數(shù);
4、基于第一計算模型對所述交互信息進行數(shù)據(jù)處理,確定交互熱度;
5、在所述交互熱度達到預設(shè)熱度閾值的情況下,啟動第二計算模型,觸發(fā)所述第二計算模型在第一彈幕序列中的前預設(shè)數(shù)量個候選彈幕中篩選滿足預設(shè)彈幕要求的目標彈幕,所述第一彈幕序列用于儲存實時獲取但尚未被展示在所述目標直播間的彈幕,所述候選彈幕為未被所述第二計算模型篩選過的彈幕;
6、使用所述前預設(shè)數(shù)量個候選彈幕形成第二彈幕序列,基于所述目標彈幕對所述第二彈幕序列進行修正,得到修正結(jié)果;
7、以所述修正結(jié)果替代所述第二彈幕序列,在所述目標直播間進行顯示。
8、在一示例性的實施方式中,所述預設(shè)彈幕要求包括:相似彈幕要求、關(guān)鍵彈幕要求和特定彈幕要求,所述第二計算模型包括第一嵌入模型、第二嵌入模型和特殊彈幕過濾模型,所述第二嵌入模型具備所述目標直播間對應的專業(yè)領(lǐng)域的專業(yè)知識,所述第二計算模型執(zhí)行下述操作:
9、所述第一嵌入模型對各所述候選彈幕進行通用特征提取,得到通用特征池,基于所述通用特征池篩選出由符合所述相似彈幕要求的彈幕所構(gòu)成的第一彈幕組;
10、所述第二嵌入模型對各所述候選彈幕進行特征提取,得到專業(yè)特征池,基于所述專業(yè)特征池篩選出由符合所述關(guān)鍵彈幕要求的彈幕所構(gòu)成的第二彈幕組;
11、所述特殊彈幕過濾模型對各所述候選彈幕進行特殊詞提取,篩選出由符合所述特定彈幕要求的彈幕所構(gòu)成的第三彈幕組;
12、所述第一彈幕組、所述第二彈幕組和所述第三彈幕組中任一彈幕都屬于所述目標彈幕。
13、在一示例性的實施方式中,所述基于所述通用特征池篩選出由符合所述相似彈幕要求的彈幕所構(gòu)成的第一彈幕組,包括:
14、對所述通用特征池中各所述通用特征進行聚類,得到多個特征簇;
15、對于任一特征簇,若所述特征簇中任意兩個通用特征之間的特征距離均小于第一距離閾值,并且所述特征簇中的通用特征數(shù)量達到第一數(shù)量,則基于所述特征簇中各所述通用特征分別對應的彈幕構(gòu)成對應的第一彈幕組;
16、相應的,所述基于所述目標彈幕對所述第二彈幕序列進行修正,包括:
17、對任一所述第一彈幕組,確定所述第一彈幕組對應的特征簇中與簇心的特征距離最短的第一彈幕;生成融合彈幕,所述融合彈幕的彈幕內(nèi)容為所述第一彈幕的內(nèi)容,所述融合彈幕的發(fā)布賬號包括所述第一彈幕組各彈幕的發(fā)布賬號;在所述第二彈幕序列中刪除所述第一彈幕組的各彈幕,將所述融合彈幕插入所述第二彈幕組的頭部。
18、在一示例性的實施方式中,所述關(guān)鍵彈幕要求包括多個源文本,所述方法還包括:將每一所述源文本輸入所述第二嵌入模型得到對應的源文本專業(yè)特征,所述基于所述專業(yè)特征池篩選出由符合所述關(guān)鍵彈幕要求的彈幕所構(gòu)成的第二彈幕組,包括:
19、對所述專業(yè)特征池中的每一專業(yè)特征執(zhí)行下述操作:計算所述專業(yè)特征與各所述源文本專業(yè)特征間的特征距離;若最小的特征距離小于第二距離閾值,則判定所述專業(yè)特征對應的彈幕符合所述關(guān)鍵彈幕要求;將所述最小的特征距離對應的源文本專業(yè)特征所對應的源文本,確定為所述專業(yè)特征對應的彈幕的關(guān)聯(lián)源文本;
20、相應的,所述基于所述目標彈幕對所述第二彈幕序列進行修正,包括:
21、針對所述第二彈幕序列中被所述第二彈幕組命中的任一彈幕,為所述彈幕加上特殊標記。
22、在一示例性的實施方式中,所述關(guān)鍵彈幕要求還包括每一所述源文本對應的回復文本,所述方法還包括針對所述第二彈幕組中的任一彈幕執(zhí)行下述操作:
23、基于所述關(guān)鍵彈幕要求,確定所述彈幕對應的關(guān)聯(lián)源文本對應的關(guān)聯(lián)回復文本;
24、在目標客戶端顯示第一提示信息和第一控件,所述目標客戶端為所述彈幕的發(fā)布賬戶對應的客戶端,所述第一提示信息用于指示所述目標直播間的主播與所述發(fā)布賬戶進行了彈幕交互;
25、在所述第一控件被觸發(fā)的情況下,在所述目標客戶端展示對應的關(guān)聯(lián)回復文本。
26、在一示例性的實施方式中,所述方法還包括:
27、在所述目標客戶端顯示第二控件;
28、在所述第二控件被觸發(fā)的情況下,在所述目標客戶端播放回復語音,所述回復語音是由語音生成模型基于所述關(guān)聯(lián)回復文本自動生成的,并且符合所述主播的音色的語音。
29、在一示例性的實施方式中,所述基于所述目標彈幕對所述第二彈幕序列進行修正,包括:
30、對所述第二彈幕序列中被所述第三彈幕組命中的任一彈幕,進行刪除處理。
31、在一示例性的實施方式中,所述語音生成模型通過下述方法訓練得到:
32、獲取預訓練的語音解碼器,所述語音解碼器基于通用的文本-語音對訓練得到,所述語音解碼器包括語音編碼器和語音解碼器;
33、獲取所述主播錄制的訓練樣本,所述訓練樣本包括樣本文本和對應的樣本語音,所述樣本文本和所述樣本語音都具備所述主播對應的專業(yè)知識;
34、將所述樣本文本輸入所述第二嵌入模型,得到樣本文本特征;
35、將所述樣本語音輸入所述語音編碼器,得到樣本語音特征;
36、基于所述樣本文本特征和所述樣本語音特征訓練連接器;該步驟包括:將所述樣本文本特征輸入所述連接器,得到預測語音特征;基于所述預測語音特征與對應的樣本語音特征的差異調(diào)整所述連接器的參數(shù),以使得所述連接器輸出的語音信息符合主播音色;
37、由所述第二嵌入模型、訓練后的連接器和所述語音解碼器,構(gòu)成所述語音生成模型。
38、在一示例性的實施方式中,所述方法還包括基于所述語音生成模型執(zhí)行下述操作:
39、復用所述第二嵌入模型輸出所述關(guān)聯(lián)回復文本對應的文本特征;
40、將所述文本特征輸入所述語音生成模型中的連接器,得到對應的語音特征;
41、將所述語音特征輸入所述語音生成模型中的語音解碼器,得到所述回復語音。
42、根據(jù)本技術(shù)實施例的一個方面,提供了一種計算機可讀存儲介質(zhì),所述存儲介質(zhì)中存儲有至少一條指令、至少一段程序、代碼集或指令集,所述至少一條指令、所述至少一段程序、所述代碼集或指令集由處理器加載并執(zhí)行以實現(xiàn)上述彈幕處理方法。
43、本技術(shù)實施例提供的技術(shù)方案可以帶來如下有益效果:
44、本請實施例提出彈幕處理方法,該彈幕處理方法可以全自動地在目標直播間熱度較高的情況下,對即將播出的彈幕進行處理,對相似彈幕進行聚合,刪除不合規(guī)的彈幕,以減少彈幕的數(shù)量,通過識別重點彈幕,可以突出彈幕的重點內(nèi)容,達到全面優(yōu)化彈幕顯示效果,提升用戶基于彈幕的交互體驗的目的。