技術(shù)編號:40282270
提示:您尚未登錄,請點 登 陸 后下載,如果您還沒有賬戶請點 注 冊 ,登陸完成后,請刷新本頁查看技術(shù)詳細(xì)信息。本發(fā)明屬于智慧教育和人工智能,具體一種涉及基于大模型的教學(xué)視頻理解的方法。背景技術(shù)、目前有基于d卷積的視頻理解方法,通過使用多個d卷積層,逐層提取并組合更復(fù)雜的時空特征,最后整合卷積層產(chǎn)生的特征,映射到視頻內(nèi)容的語義空間。另外有基于動態(tài)時空圖的視頻理解方法,將視頻數(shù)據(jù)輸送到已訓(xùn)練好的網(wǎng)絡(luò)模型中,以輸出視頻理解結(jié)果等。這些方法對于視頻中的場景、時序等有較好的識別效果,但針對教學(xué)視頻無法理解詳細(xì)的語言或文字內(nèi)容。、同時,現(xiàn)階段不存在將視頻作為直接輸入的多模態(tài)大模型,均需要經(jīng)過人為提取視頻幀圖...
注意:該技術(shù)已申請專利,請尊重研發(fā)人員的辛勤研發(fā)付出,在未取得專利權(quán)人授權(quán)前,僅供技術(shù)研究參考不得用于商業(yè)用途。
該專利適合技術(shù)人員進(jìn)行技術(shù)研發(fā)參考以及查看自身技術(shù)是否侵權(quán),增加技術(shù)思路,做技術(shù)知識儲備,不適合論文引用。