基于人工智能的封面生成方法、裝置、計(jì)算機(jī)設(shè)備及介質(zhì)與流程

文檔序號(hào)：40449974發(fā)布日期：2024-12-27 09:14閱讀：5來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專(zhuān)利>電子通信裝置的制造及其應(yīng)用技術(shù)

基于人工智能的封面生成方法、裝置、計(jì)算機(jī)設(shè)備及介質(zhì)與流程

本技術(shù)涉及人工智能開(kāi)發(fā)與金融科技領(lǐng)域，尤其涉及基于人工智能的封面生成方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)。

背景技術(shù)：

1、隨著人工智能生成內(nèi)容技術(shù)的飛速發(fā)展，數(shù)字創(chuàng)意產(chǎn)業(yè)迎來(lái)了前所未有的變革。在這一浪潮中，文本、圖像乃至視頻內(nèi)容的自動(dòng)化生成已成為現(xiàn)實(shí)，極大地豐富了互聯(lián)網(wǎng)上的多媒體資源。尤其值得注意的是，短視頻作為當(dāng)前最為流行的內(nèi)容形式之一，其創(chuàng)作與消費(fèi)均呈現(xiàn)出爆炸式增長(zhǎng)的趨勢(shì)。為了適應(yīng)快節(jié)奏的生活方式和碎片化的信息獲取習(xí)慣，大量長(zhǎng)視頻內(nèi)容被重新剪輯成短視頻，以滿足用戶在有限時(shí)間內(nèi)高效獲取信息的需求。

2、然而，在視頻內(nèi)容的制作與傳播過(guò)程中，視頻封面作為吸引觀眾點(diǎn)擊觀看的第一印象，其重要性不言而喻。傳統(tǒng)的視頻封面生成方式高度依賴(lài)于人工挑選。具體而言，人工挑選封面需要視頻制作者反復(fù)瀏覽視頻內(nèi)容，從中挑選出最具代表性或吸引力的畫(huà)面作為封面，這一過(guò)程需要不僅耗時(shí)耗力，效率低下，還容易因個(gè)人審美差異而導(dǎo)致封面選擇的不一致性，難以保證封面選擇的準(zhǔn)確性。

技術(shù)實(shí)現(xiàn)思路

1、本技術(shù)實(shí)施例的目的在于提出一種基于人工智能的封面生成方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)，以解決現(xiàn)有的視頻封面生成方式高度依賴(lài)于人工挑選，不僅耗時(shí)耗力，效率低下，還容易因個(gè)人審美差異而導(dǎo)致封面選擇的不一致性，難以保證封面選擇的準(zhǔn)確性的技術(shù)問(wèn)題。

2、為了解決上述技術(shù)問(wèn)題，本技術(shù)實(shí)施例提供一種基于人工智能的封面生成方法，采用了如下所述的技術(shù)方案：

3、獲取待處理的目標(biāo)視頻，并對(duì)所述目標(biāo)視頻進(jìn)行抽幀處理得到對(duì)應(yīng)的圖像幀；其中，所述圖像幀的數(shù)量包括多個(gè)；

4、基于預(yù)設(shè)的圖文理解模型中的圖像編碼器對(duì)所述圖像幀進(jìn)行處理，得到對(duì)應(yīng)的目標(biāo)圖像特征；

5、基于所述圖文理解模型中的全連接層對(duì)所述目標(biāo)圖像特征進(jìn)行處理，得到對(duì)應(yīng)的圖像質(zhì)量評(píng)分；

6、獲取與所述目標(biāo)視頻對(duì)應(yīng)的文本信息，并基于所述文本信息構(gòu)建查詢(xún)文本；

7、基于所述圖文理解模型中的文本編碼器對(duì)所述查詢(xún)文本進(jìn)行處理，得到對(duì)應(yīng)的目標(biāo)文本特征；

8、計(jì)算所述目標(biāo)圖像特征與所述目標(biāo)文本特征之間的語(yǔ)義匹配度；

9、基于所述圖像質(zhì)量評(píng)分與所述語(yǔ)義匹配度生成所述圖像幀的封面得分；

10、從所有所述圖像幀中篩選出封面得分最高的目標(biāo)圖像幀，并將所述目標(biāo)圖像幀作為所述目標(biāo)視頻的封面。

11、進(jìn)一步的，所述基于所述圖文理解模型中的全連接層對(duì)所述目標(biāo)圖像特征進(jìn)行處理，得到對(duì)應(yīng)的圖像質(zhì)量評(píng)分的步驟，具體包括：

12、基于所述全連接層對(duì)所述目標(biāo)圖像特征進(jìn)行預(yù)測(cè)處理，得到對(duì)應(yīng)的清晰度預(yù)測(cè)值與壓縮比預(yù)測(cè)值；

13、對(duì)所述清晰度預(yù)測(cè)值與所述壓縮比預(yù)測(cè)值進(jìn)行歸一化處理，得到對(duì)應(yīng)的指定清晰度預(yù)測(cè)值與指定壓縮比預(yù)測(cè)值；

14、調(diào)用預(yù)設(shè)的轉(zhuǎn)換公式；

15、基于所述轉(zhuǎn)換公式對(duì)所述指定清晰度預(yù)測(cè)值與所述指定壓縮比預(yù)測(cè)值進(jìn)行計(jì)算處理，得到對(duì)應(yīng)的計(jì)算結(jié)果；

16、將所述計(jì)算結(jié)果作為所述圖像質(zhì)量評(píng)分。

17、進(jìn)一步的，所述計(jì)算所述目標(biāo)圖像特征與所述目標(biāo)文本特征之間的語(yǔ)義匹配度的步驟，具體包括：

18、調(diào)用預(yù)設(shè)的相似度算法；

19、基于所述相似度算法計(jì)算所述目標(biāo)圖像特征與所述目標(biāo)文本特征之間的相似度；

20、將所述相似度作為所述語(yǔ)義匹配度。

21、進(jìn)一步的，所述基于所述圖像質(zhì)量評(píng)分與所述語(yǔ)義匹配度生成所述圖像幀的封面得分的步驟，具體包括：

22、獲取預(yù)設(shè)的權(quán)重確定算法；

23、基于所述權(quán)重確定算法生成與圖像質(zhì)量因素對(duì)應(yīng)的第一權(quán)重，以及生成與語(yǔ)義匹配度因素對(duì)應(yīng)的第二權(quán)重；

24、調(diào)用預(yù)設(shè)的得分計(jì)算公式；

25、基于所述得分計(jì)算公式對(duì)所述圖像質(zhì)量評(píng)分、所述語(yǔ)義匹配度、所述第一權(quán)重以及所述第二權(quán)重進(jìn)行處理，得到所述圖像幀的封面得分。

26、進(jìn)一步的，在所述基于預(yù)設(shè)的圖文理解模型中的圖像編碼器對(duì)所述圖像幀進(jìn)行處理，得到對(duì)應(yīng)的目標(biāo)圖像特征的步驟之前，還包括：

27、獲取預(yù)先構(gòu)建的預(yù)訓(xùn)練數(shù)據(jù)集，以及獲取預(yù)先構(gòu)建的微調(diào)數(shù)據(jù)集；

28、將所述預(yù)訓(xùn)練數(shù)據(jù)集劃分為多個(gè)批次的圖文對(duì)數(shù)據(jù)；

29、調(diào)用預(yù)設(shè)的多模態(tài)學(xué)習(xí)模型，并將所述圖文對(duì)數(shù)據(jù)輸入至所述多模態(tài)學(xué)習(xí)模型內(nèi)得到對(duì)應(yīng)的特征數(shù)據(jù)；其中，所述多模態(tài)學(xué)習(xí)模型至少包括圖像編碼器、文本編碼器以及全連接層；

30、基于所述特征數(shù)據(jù)計(jì)算回歸損失，以及基于所述特征數(shù)據(jù)計(jì)算對(duì)比損失；

31、基于所述回歸損失與所述對(duì)比損失構(gòu)建綜合損失；

32、基于所述綜合損失對(duì)所述多模態(tài)學(xué)習(xí)模型進(jìn)行訓(xùn)練處理，直至符合預(yù)設(shè)的訓(xùn)練批次，得到對(duì)應(yīng)的第一學(xué)習(xí)模型；

33、基于預(yù)設(shè)的訓(xùn)練策略，使用所述微調(diào)數(shù)據(jù)集對(duì)所述第一學(xué)習(xí)模型進(jìn)行微調(diào)處理，得到滿足預(yù)期構(gòu)建條件的第二學(xué)習(xí)模型；

34、將所述第二學(xué)習(xí)模型作為所述圖文理解模型。

35、進(jìn)一步的，所述獲取預(yù)先構(gòu)建的預(yù)訓(xùn)練數(shù)據(jù)集的步驟，具體包括：

36、從目標(biāo)網(wǎng)站上獲取指定數(shù)量的圖像數(shù)據(jù)；

37、基于預(yù)設(shè)的圖像降質(zhì)算法對(duì)所述圖像數(shù)據(jù)進(jìn)行預(yù)處理，得到對(duì)應(yīng)的指定圖像數(shù)據(jù)；

38、生成與所述指定圖像數(shù)據(jù)對(duì)應(yīng)的文本標(biāo)簽；

39、基于所述指定圖像數(shù)據(jù)與所述文本標(biāo)簽生成所述預(yù)訓(xùn)練數(shù)據(jù)集。

40、進(jìn)一步的，所述基于所述特征數(shù)據(jù)計(jì)算回歸損失的步驟，具體包括：

41、從所述特征數(shù)據(jù)中獲取圖像特征；

42、基于所述全連接層生成與所述圖像特征對(duì)應(yīng)的預(yù)測(cè)值；

43、獲取與所述圖像特征對(duì)應(yīng)的真實(shí)值；

44、計(jì)算所述真實(shí)值與所述預(yù)測(cè)值之間的歐幾里得距離；

45、將所述歐幾里得距離作為所述回歸損失。

46、為了解決上述技術(shù)問(wèn)題，本技術(shù)實(shí)施例還提供一種基于人工智能的封面生成裝置，采用了如下所述的技術(shù)方案：

47、第一處理模塊，用于獲取待處理的目標(biāo)視頻，并對(duì)所述目標(biāo)視頻進(jìn)行抽幀處理得到對(duì)應(yīng)的圖像幀；其中，所述圖像幀的數(shù)量包括多個(gè)；

48、第二處理模塊，用于基于預(yù)設(shè)的圖文理解模型中的圖像編碼器對(duì)所述圖像幀進(jìn)行處理，得到對(duì)應(yīng)的目標(biāo)圖像特征；

49、第三處理模塊，用于基于所述圖文理解模型中的全連接層對(duì)所述目標(biāo)圖像特征進(jìn)行處理，得到對(duì)應(yīng)的圖像質(zhì)量評(píng)分；

50、第一構(gòu)建模塊，用于獲取與所述目標(biāo)視頻對(duì)應(yīng)的文本信息，并基于所述文本信息構(gòu)建查詢(xún)文本；

51、第四處理模塊，用于基于所述圖文理解模型中的文本編碼器對(duì)所述查詢(xún)文本進(jìn)行處理，得到對(duì)應(yīng)的目標(biāo)文本特征；

52、第一計(jì)算模塊，用于計(jì)算所述目標(biāo)圖像特征與所述目標(biāo)文本特征之間的語(yǔ)義匹配度；

53、生成模塊，用于基于所述圖像質(zhì)量評(píng)分與所述語(yǔ)義匹配度生成所述圖像幀的封面得分；

54、第一確定模塊，用于從所有所述圖像幀中篩選出封面得分最高的目標(biāo)圖像幀，并將所述目標(biāo)圖像幀作為所述目標(biāo)視頻的封面。

55、為了解決上述技術(shù)問(wèn)題，本技術(shù)實(shí)施例還提供一種計(jì)算機(jī)設(shè)備，采用了如下所述的技術(shù)方案：

56、獲取待處理的目標(biāo)視頻，并對(duì)所述目標(biāo)視頻進(jìn)行抽幀處理得到對(duì)應(yīng)的圖像幀；其中，所述圖像幀的數(shù)量包括多個(gè)；

57、基于預(yù)設(shè)的圖文理解模型中的圖像編碼器對(duì)所述圖像幀進(jìn)行處理，得到對(duì)應(yīng)的目標(biāo)圖像特征；

58、基于所述圖文理解模型中的全連接層對(duì)所述目標(biāo)圖像特征進(jìn)行處理，得到對(duì)應(yīng)的圖像質(zhì)量評(píng)分；

59、獲取與所述目標(biāo)視頻對(duì)應(yīng)的文本信息，并基于所述文本信息構(gòu)建查詢(xún)文本；

60、基于所述圖文理解模型中的文本編碼器對(duì)所述查詢(xún)文本進(jìn)行處理，得到對(duì)應(yīng)的目標(biāo)文本特征；

61、計(jì)算所述目標(biāo)圖像特征與所述目標(biāo)文本特征之間的語(yǔ)義匹配度；

62、基于所述圖像質(zhì)量評(píng)分與所述語(yǔ)義匹配度生成所述圖像幀的封面得分；

63、從所有所述圖像幀中篩選出封面得分最高的目標(biāo)圖像幀，并將所述目標(biāo)圖像幀作為所述目標(biāo)視頻的封面。

64、為了解決上述技術(shù)問(wèn)題，本技術(shù)實(shí)施例還提供一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)，采用了如下所述的技術(shù)方案：

65、獲取待處理的目標(biāo)視頻，并對(duì)所述目標(biāo)視頻進(jìn)行抽幀處理得到對(duì)應(yīng)的圖像幀；其中，所述圖像幀的數(shù)量包括多個(gè)；

66、基于預(yù)設(shè)的圖文理解模型中的圖像編碼器對(duì)所述圖像幀進(jìn)行處理，得到對(duì)應(yīng)的目標(biāo)圖像特征；

67、基于所述圖文理解模型中的全連接層對(duì)所述目標(biāo)圖像特征進(jìn)行處理，得到對(duì)應(yīng)的圖像質(zhì)量評(píng)分；

68、獲取與所述目標(biāo)視頻對(duì)應(yīng)的文本信息，并基于所述文本信息構(gòu)建查詢(xún)文本；

69、基于所述圖文理解模型中的文本編碼器對(duì)所述查詢(xún)文本進(jìn)行處理，得到對(duì)應(yīng)的目標(biāo)文本特征；

70、計(jì)算所述目標(biāo)圖像特征與所述目標(biāo)文本特征之間的語(yǔ)義匹配度；

71、基于所述圖像質(zhì)量評(píng)分與所述語(yǔ)義匹配度生成所述圖像幀的封面得分；

72、從所有所述圖像幀中篩選出封面得分最高的目標(biāo)圖像幀，并將所述目標(biāo)圖像幀作為所述目標(biāo)視頻的封面。

73、與現(xiàn)有技術(shù)相比，本技術(shù)實(shí)施例主要有以下有益效果：

74、本技術(shù)首先獲取待處理的目標(biāo)視頻，并對(duì)所述目標(biāo)視頻進(jìn)行抽幀處理得到對(duì)應(yīng)的圖像幀；其中，所述圖像幀的數(shù)量包括多個(gè)；然后基于預(yù)設(shè)的圖文理解模型中的圖像編碼器對(duì)所述圖像幀進(jìn)行處理，得到對(duì)應(yīng)的目標(biāo)圖像特征；并基于所述圖文理解模型中的全連接層對(duì)所述目標(biāo)圖像特征進(jìn)行處理，得到對(duì)應(yīng)的圖像質(zhì)量評(píng)分；之后獲取與所述目標(biāo)視頻對(duì)應(yīng)的文本信息，并基于所述文本信息構(gòu)建查詢(xún)文本；后續(xù)基于所述圖文理解模型中的文本編碼器對(duì)所述查詢(xún)文本進(jìn)行處理，得到對(duì)應(yīng)的目標(biāo)文本特征；進(jìn)一步計(jì)算所述目標(biāo)圖像特征與所述目標(biāo)文本特征之間的語(yǔ)義匹配度；最后基于所述圖像質(zhì)量評(píng)分與所述語(yǔ)義匹配度生成所述圖像幀的封面得分，并從所有所述圖像幀中篩選出封面得分最高的目標(biāo)圖像幀，進(jìn)而將所述目標(biāo)圖像幀作為所述視頻的封面。本技術(shù)通過(guò)獲取待處理的目標(biāo)視頻，并對(duì)所述目標(biāo)視頻進(jìn)行抽幀處理得到對(duì)應(yīng)的圖像幀，然后基于圖文理解模型的使用對(duì)圖像幀進(jìn)行圖像質(zhì)量分析以得到相應(yīng)的圖像質(zhì)量評(píng)分，并會(huì)同時(shí)獲取與所述目標(biāo)視頻對(duì)應(yīng)的文本信息，并基于所述文本信息構(gòu)建查詢(xún)文本，之后基于圖文理解模型的使用對(duì)查詢(xún)文本與圖像幀進(jìn)行語(yǔ)義匹配處理以得到相應(yīng)的語(yǔ)義匹配度，后續(xù)基于所述圖像質(zhì)量評(píng)分與所述語(yǔ)義匹配度生成所述圖像幀的封面得分，最后從所有所述圖像幀中篩選出封面得分最高的目標(biāo)圖像幀，并將所述目標(biāo)圖像幀作為所述目標(biāo)視頻的封面，以實(shí)現(xiàn)自動(dòng)快速且準(zhǔn)確地生成目標(biāo)視頻的封面，避免了人工挑選封面的操作，有效地提高了封面生成的效率，保證了封面生成的準(zhǔn)確性。

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁(yè)1 2

該技術(shù)已申請(qǐng)專(zhuān)利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：唐小初,舒暢,陳又新
技術(shù)所有人：平安科技（深圳）有限公司
我是此專(zhuān)利的發(fā)明人

上一篇：一種園林綠化蓄水裝置的制作方法
上一篇：一種防泄漏UV燈凈化裝置的制作方法

該領(lǐng)域下的技術(shù)專(zhuān)家
如您需求助技術(shù)專(zhuān)家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢(xún)。
1、王老師：1.數(shù)字信號(hào)處理 2.傳感器技術(shù)及應(yīng)用 3.機(jī)電一體化產(chǎn)品開(kāi)發(fā) 4.機(jī)械工程測(cè)試技術(shù) 5.逆向工程技術(shù)研究
2、王老師：1.機(jī)器人 2.嵌入式控制系統(tǒng)開(kāi)發(fā)
3、孫老師：1.振動(dòng)信號(hào)時(shí)頻分析理論與測(cè)試系統(tǒng)設(shè)計(jì) 2.汽車(chē)檢測(cè)系統(tǒng)設(shè)計(jì) 3.汽車(chē)電子控制系統(tǒng)設(shè)計(jì)
4、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
5、袁老師：1.計(jì)算機(jī)視覺(jué) 2.無(wú)線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專(zhuān)家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢(xún)問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

基于人工智能的封面生成方法、裝置、計(jì)算機(jī)設(shè)備及介質(zhì)與流程

基于人工智能的封面生成方法、裝置、計(jì)算機(jī)設(shè)備及介質(zhì)與流程