本公開涉及人工智能,尤其涉及一種基于計算機(jī)視覺的體育運動實時評測方法、裝置、設(shè)備及存儲介質(zhì)。
背景技術(shù):
1、在體育運動評測領(lǐng)域,傳統(tǒng)方法主要依賴人工觀測或紅外測量技術(shù)來捕捉人體在運動過程中的位置變化,以獲取評估數(shù)據(jù)。這些方法雖然在一定程度上能夠提供評測結(jié)果,但受限于儀器設(shè)備和人力資源,往往成本較高且效率較低,難以滿足大規(guī)模或?qū)崟r性評測的需求。
2、隨著技術(shù)的發(fā)展,特別是計算機(jī)視覺和人工智能技術(shù)的進(jìn)步,為體育運動評測帶來了新的可能性。通過計算機(jī)視覺技術(shù),可以從視頻幀中提取人體關(guān)鍵點信息,實現(xiàn)對人體動作的自動識別和分析。然而,相關(guān)技術(shù)在處理周期性運動的計數(shù)和分析時,仍存在一定的局限性,例如對動作細(xì)節(jié)的捕捉不夠精準(zhǔn),或是在復(fù)雜場景下的魯棒性不足。
技術(shù)實現(xiàn)思路
1、有鑒于此,本公開提出了一種基于計算機(jī)視覺的體育運動實時評測方法、裝置、設(shè)備及存儲介質(zhì)。
2、根據(jù)本公開的一方面,提供了一種基于計算機(jī)視覺的體育運動實時評測方法,所述方法包括:
3、獲取目標(biāo)視頻幀,所述目標(biāo)視頻幀包括在體育運動過程中的測試者;
4、對所述目標(biāo)視頻幀進(jìn)行人體姿態(tài)估計,得到姿態(tài)估計信息,所述姿態(tài)估計信息包括所述測試者的多個人體關(guān)鍵點的位置信息和所述多個人體關(guān)鍵點之間的夾角信息;
5、根據(jù)所述姿態(tài)估計信息,調(diào)用訓(xùn)練完成的運動分析模型進(jìn)行運動分析,輸出得到所述測試者的運動分析結(jié)果,所述運動分析結(jié)果用于指示所述測試者當(dāng)前動作所處的階段。
6、在一種可能的實現(xiàn)方式中,所述對所述目標(biāo)視頻幀進(jìn)行人體姿態(tài)估計,得到姿態(tài)估計信息,包括:
7、根據(jù)所述目標(biāo)視頻幀,調(diào)用訓(xùn)練完成的姿態(tài)估計模型進(jìn)行人體姿態(tài)估計,輸出得到所述測試者的所述多個人體關(guān)鍵點的位置信息;
8、根據(jù)所述多個人體關(guān)鍵點的位置信息,確定所述多個人體關(guān)鍵點之間的夾角信息,所述夾角信息包括多組所述人體關(guān)鍵點各自對應(yīng)的夾角,每組所述人體關(guān)鍵點包括至少三個所述人體關(guān)鍵點。
9、在另一種可能的實現(xiàn)方式中,所述運動分析模型為與所述測試者的體育運動類型對應(yīng)的運動分析模型,所述根據(jù)所述姿態(tài)估計信息,調(diào)用訓(xùn)練完成的運動分析模型進(jìn)行運動分析,輸出得到所述測試者的運動分析結(jié)果之前,還包括:
10、獲取多個體育運動類型各自對應(yīng)的訓(xùn)練樣本集,所述訓(xùn)練樣本集包括多組樣本數(shù)據(jù),每組所述樣本數(shù)據(jù)包括樣本姿態(tài)估計信息和對應(yīng)的預(yù)先標(biāo)注的正確評測結(jié)果;
11、對于每個所述體育運動類型,根據(jù)對應(yīng)的所述訓(xùn)練樣本集對原始神經(jīng)網(wǎng)絡(luò)模型進(jìn)行單獨訓(xùn)練,得到所述體育運動類型對應(yīng)的運動分析模型。
12、在另一種可能的實現(xiàn)方式中,所述運動分析結(jié)果包括預(yù)測值,所述測試者當(dāng)前動作所處的階段包括運動開始、運動進(jìn)行中和運動結(jié)束中的一種,當(dāng)所述預(yù)測值小于或等于第一預(yù)設(shè)閾值時用于指示運動開始,當(dāng)所述預(yù)測值大于所述第一預(yù)設(shè)閾值且小于第二預(yù)設(shè)閾值時用于指示運動進(jìn)行中,當(dāng)所述預(yù)測值大于或等于所述第二預(yù)設(shè)閾值時用于指示運動結(jié)束,所述第二預(yù)設(shè)閾值大于所述第一預(yù)設(shè)閾值。
13、在另一種可能的實現(xiàn)方式中,所述方法還包括:
14、獲取多個運動項目區(qū)域各自對應(yīng)的第一視頻幀,所述第一視頻幀包括一個或多個測試者的所述目標(biāo)視頻幀,每個所述運動項目區(qū)域配置有對應(yīng)的緩存隊列和調(diào)度器;
15、對于每個所述運動項目區(qū)域的第一視頻幀,通過對應(yīng)的所述緩存隊列緩存所述第一視頻幀;
16、通過對應(yīng)的所述調(diào)度器對緩存的所述第一視頻幀進(jìn)行處理,得到所述第一視頻幀對應(yīng)的運動分析結(jié)果。
17、在另一種可能的實現(xiàn)方式中,所述緩存隊列用于從接收端持續(xù)接收所述第一視頻幀,從發(fā)送端每隔預(yù)設(shè)時間間隔將緩存的所述第一視頻幀進(jìn)行分發(fā)。
18、在另一種可能的實現(xiàn)方式中,所述第一視頻幀包括多個測試者的所述目標(biāo)視頻幀,所述通過對應(yīng)的所述調(diào)度器對緩存的所述第一視頻幀進(jìn)行處理,得到所述第一視頻幀對應(yīng)的運動分析結(jié)果,包括:
19、將所述第一視頻幀進(jìn)行裁剪,得到所述多個測試者各自對應(yīng)的所述目標(biāo)視頻幀,所述目標(biāo)視頻幀為僅包括單個測試者的圖像;
20、調(diào)用對應(yīng)的所述調(diào)度器的多個線程并行處理多個所述目標(biāo)視頻幀,得到多個所述測試者各自對應(yīng)的所述運動分析結(jié)果。
21、根據(jù)本公開的另一方面,提供了一種基于計算機(jī)視覺的體育運動實時評測裝置,所述裝置包括:
22、獲取模塊,用于獲取目標(biāo)視頻幀,所述目標(biāo)視頻幀包括在體育運動過程中的測試者;
23、估計模塊,用于對所述目標(biāo)視頻幀進(jìn)行人體姿態(tài)估計,得到姿態(tài)估計信息,所述姿態(tài)估計信息包括所述測試者的多個人體關(guān)鍵點的位置信息和所述多個人體關(guān)鍵點之間的夾角信息;
24、分析模塊,用于根據(jù)所述姿態(tài)估計信息,調(diào)用訓(xùn)練完成的運動分析模型進(jìn)行運動分析,輸出得到所述測試者的運動分析結(jié)果,所述運動分析結(jié)果用于指示所述測試者當(dāng)前動作所處的階段。
25、在一種可能的實現(xiàn)方式中,所述分析模塊,還用于:
26、根據(jù)所述目標(biāo)視頻幀,調(diào)用訓(xùn)練完成的姿態(tài)估計模型進(jìn)行人體姿態(tài)估計,輸出得到所述測試者的所述多個人體關(guān)鍵點的位置信息;
27、根據(jù)所述多個人體關(guān)鍵點的位置信息,確定所述多個人體關(guān)鍵點之間的夾角信息,所述夾角信息包括多組所述人體關(guān)鍵點各自對應(yīng)的夾角,每組所述人體關(guān)鍵點包括至少三個所述人體關(guān)鍵點。
28、在另一種可能的實現(xiàn)方式中,所述運動分析模型為與所述測試者的體育運動類型對應(yīng)的運動分析模型,所述裝置還包括:訓(xùn)練模塊,用于:
29、獲取多個體育運動類型各自對應(yīng)的訓(xùn)練樣本集,所述訓(xùn)練樣本集包括多組樣本數(shù)據(jù),每組所述樣本數(shù)據(jù)包括樣本姿態(tài)估計信息和對應(yīng)的預(yù)先標(biāo)注的正確評測結(jié)果;
30、對于每個所述體育運動類型,根據(jù)對應(yīng)的所述訓(xùn)練樣本集對原始神經(jīng)網(wǎng)絡(luò)模型進(jìn)行單獨訓(xùn)練,得到所述體育運動類型對應(yīng)的運動分析模型。
31、在另一種可能的實現(xiàn)方式中,所述運動分析結(jié)果包括預(yù)測值,所述測試者當(dāng)前動作所處的階段包括運動開始、運動進(jìn)行中和運動結(jié)束中的一種,當(dāng)所述預(yù)測值小于或等于第一預(yù)設(shè)閾值時用于指示運動開始,當(dāng)所述預(yù)測值大于所述第一預(yù)設(shè)閾值且小于第二預(yù)設(shè)閾值時用于指示運動進(jìn)行中,當(dāng)所述預(yù)測值大于或等于所述第二預(yù)設(shè)閾值時用于指示運動結(jié)束,所述第二預(yù)設(shè)閾值大于所述第一預(yù)設(shè)閾值。
32、在另一種可能的實現(xiàn)方式中,所述裝置還包括:處理模塊,用于:
33、獲取多個運動項目區(qū)域各自對應(yīng)的第一視頻幀,所述第一視頻幀包括一個或多個測試者的所述目標(biāo)視頻幀,每個所述運動項目區(qū)域配置有對應(yīng)的緩存隊列和調(diào)度器;
34、對于每個所述運動項目區(qū)域的第一視頻幀,通過對應(yīng)的所述緩存隊列緩存所述第一視頻幀;
35、通過對應(yīng)的所述調(diào)度器對緩存的所述第一視頻幀進(jìn)行處理,得到所述第一視頻幀對應(yīng)的運動分析結(jié)果。
36、在另一種可能的實現(xiàn)方式中,所述緩存隊列用于從接收端持續(xù)接收所述第一視頻幀,從發(fā)送端每隔預(yù)設(shè)時間間隔將緩存的所述第一視頻幀進(jìn)行分發(fā)。
37、在另一種可能的實現(xiàn)方式中,所述第一視頻幀包括多個測試者的所述目標(biāo)視頻幀,所述處理模塊,還用于:
38、將所述第一視頻幀進(jìn)行裁剪,得到所述多個測試者各自對應(yīng)的所述目標(biāo)視頻幀,所述目標(biāo)視頻幀為僅包括單個測試者的圖像;
39、調(diào)用對應(yīng)的所述調(diào)度器的多個線程并行處理多個所述目標(biāo)視頻幀,得到多個所述測試者各自對應(yīng)的所述運動分析結(jié)果。
40、根據(jù)本公開的另一方面,提供了一種計算設(shè)備,所述設(shè)備包括:
41、處理器;
42、用于存儲處理器可執(zhí)行指令的存儲器;
43、其中,所述處理器被配置為在執(zhí)行所述存儲器存儲的指令時,實現(xiàn)上述的方法。
44、根據(jù)本公開的另一方面,提供了一種非易失性計算機(jī)可讀存儲介質(zhì),其上存儲有計算機(jī)程序指令,所述計算機(jī)程序指令被處理器執(zhí)行時實現(xiàn)上述的方法。
45、根據(jù)本公開的另一方面,提供了一種計算機(jī)程序產(chǎn)品,包括計算機(jī)可讀代碼,或者承載有計算機(jī)可讀代碼的非易失性計算機(jī)可讀存儲介質(zhì),當(dāng)所述計算機(jī)可讀代碼在計算設(shè)備的處理器中運行時,所述計算設(shè)備中的處理器執(zhí)行上述方法。
46、本公開實施例通過獲取測試者在體育運動過程中的目標(biāo)視頻幀,運用人體姿態(tài)估計技術(shù)提取多個人體關(guān)鍵點的位置信息和多個人體關(guān)鍵點之間的夾角信息,進(jìn)一步利用訓(xùn)練完成的運動分析模型,對測試者的動作進(jìn)行深入分析,并輸出運動分析結(jié)果,從而指示測試者當(dāng)前動作所處的階段。特別是在周期往復(fù)型運動的計數(shù)中,該方法通過引入人體關(guān)鍵點的位置信息和夾角信息作為模型輸入,運動分析模型可以更加精確地捕捉到動作的細(xì)節(jié),從而提供更為準(zhǔn)確的動作分析結(jié)果,有效提升了運動分析的準(zhǔn)確度。
47、根據(jù)下面參考附圖對示例性實施例的詳細(xì)說明,本公開的其它特征及方面將變得清楚。