實施例總體涉及數(shù)據(jù)處理,并且更具體地涉及經(jīng)由通用圖形處理單元的數(shù)據(jù)處理。
背景技術(shù):
1、當(dāng)前的并行圖形數(shù)據(jù)處理包括開發(fā)用于對圖形數(shù)據(jù)執(zhí)行諸如線性插值、曲面細分、柵格化、紋理映射、深度測試等特定操作的系統(tǒng)和方法。傳統(tǒng)上,圖形處理器使用固定功能計算單元來處理圖形數(shù)據(jù)。然而,最近,已使圖形處理器的各部分變成可編程的,使得這些處理器能夠支持更廣泛的操作來處理頂點和片段數(shù)據(jù)。
2、為了進一步提高性能,圖形處理器通常實現(xiàn)諸如流水線操作的處理技術(shù),這些處理技術(shù)嘗試貫穿圖形流水線的不同部分并行地處理盡可能多的圖形數(shù)據(jù)。具有單指令多線程(simt)架構(gòu)的并行圖形處理器被設(shè)計為使圖形流水線中的并行處理量最大化。在simt架構(gòu)中,并行線程組嘗試盡可能經(jīng)常地同步執(zhí)行程序指令以提高處理效率。有關(guān)simt架構(gòu)的軟件和硬件的一般概述可見于謝恩·庫克的《cuda編程》第3章第37-51頁(2013年)(shanecook,cuda?programming,chapter?3,pages?37-51(2013))和/或尼古拉斯·威爾特的cuda手冊《對gpu編程的全面指導(dǎo)》,章節(jié)2.6.2到3.1.2(2013年6月)(nicholas?wilt,cudahandbook,a?comprehensive?guide?to?gpu?programming,sections?2.6.2to?3.1.2(june2013))。
技術(shù)實現(xiàn)思路
1.一種裝置,包括:
2.如權(quán)利要求1所述的裝置,其中,所述計算單元進一步用于請求所述線程分派器分派要被執(zhí)行的所述附加線程。
3.如權(quán)利要求1所述的裝置,其中,所述計算單元用于存儲針對所述犧牲線程的阻塞狀況。
4.如權(quán)利要求3所述的裝置,其中,所述存儲器用于存儲多個掛起線程的線程狀態(tài)。
5.如權(quán)利要求4所述的裝置,其中,所述計算單元用于將所述犧牲線程的線程狀態(tài)存儲到所述存儲器內(nèi)的偏移。
6.如權(quán)利要求5所述的裝置,其中,所述計算單元用于從具有被存儲在所述存儲器中的狀態(tài)的掛起線程選擇要被執(zhí)行的所述附加線程。
7.如權(quán)利要求6所述的裝置,所述計算單元用于基于與掛起線程相關(guān)聯(lián)的阻塞狀況來選擇所述存儲器中的掛起線程。
8.如權(quán)利要求1所述的裝置,其中,所述裝置是圖形處理器。
9.如權(quán)利要求1所述的裝置,其中,所述存儲器與所述計算單元處于同一集成電路上。
10.一種方法,包括:
11.如權(quán)利要求10所述的方法,附加地包括:由所述計算單元請求線程分派器分派要被執(zhí)行的所述附加線程。
12.如權(quán)利要求10所述的方法,附加地包括:存儲針對所述犧牲線程的阻塞狀況。
13.如權(quán)利要求12所述的方法,附加地包括:
14.如權(quán)利要求13所述的方法,附加地包括:基于與所述附加線程相關(guān)聯(lián)的所存儲的阻塞狀況來選擇要被執(zhí)行的所述附加線程。
15.如權(quán)利要求10所述的方法,其中,所述處理裝置是圖形處理器。
16.一種芯片上系統(tǒng)集成電路,包括:
17.如權(quán)利要求16所述的芯片上系統(tǒng)集成電路,其中,所述計算單元進一步用于請求所述線程分派器分派要被執(zhí)行的所述附加線程。
18.如權(quán)利要求16所述的芯片上系統(tǒng)集成電路,其中,所述計算單元用于存儲針對所述犧牲線程的阻塞狀況。
19.如權(quán)利要求18所述的芯片上系統(tǒng)集成電路,其中,所述存儲器用于存儲多個掛起線程的線程狀態(tài),并且所述計算單元用于從具有被存儲到所述存儲器的狀態(tài)的多個線程中的一個線程選擇要被執(zhí)行的所述附加線程。
20.如權(quán)利要求19所述的芯片上系統(tǒng)集成電路,其中,所述計算單元用于基于與掛起線程相關(guān)聯(lián)的被存儲的阻塞狀況來選擇所述存儲器中的掛起線程。