本公開涉及光子計算,特別涉及一種集成平衡光子通用高維矩陣運算系統(tǒng)。
背景技術(shù):
1、人工智能(artificial?intelligence,ai)應(yīng)用、物聯(lián)網(wǎng)、云服務(wù)等對高效處理海量數(shù)據(jù)的需求日益迫切。一項研究發(fā)現(xiàn),運行頂級深度神經(jīng)網(wǎng)絡(luò)(deep?ne)所需的計算量增長速度是硬件效率提升速度的兩倍。目前,ai在醫(yī)療成像和診斷、材料發(fā)現(xiàn)、自主導(dǎo)航、自然語言處理等多個學(xué)科多個領(lǐng)域的能力和應(yīng)用范圍的不斷擴大,例如,現(xiàn)有技術(shù)中已經(jīng)出現(xiàn)了自然語言處理工具chatgpt、ai繪畫工具midjourney?ai、圖像生成系統(tǒng)dall.e等。因此,隨著全球?qū)τ嬎隳芰π枨蟮牟粩嘣鲩L,提高計算吞吐量和效率成為了一個重要挑戰(zhàn)。
2、傳統(tǒng)計算硬件的有限效率促使人們增加對硬件并行性的投資,但是深度神經(jīng)網(wǎng)絡(luò)(deep?neural?networks,?dnns)的普遍性和準確性是與訓(xùn)練數(shù)據(jù)的數(shù)量和可用計算量成比例的,這也是它們的致命弱點。雖然圖形處理器(graphics?processing?units,gpus)在歷史上促進了深度學(xué)習(xí)的持續(xù)進步,但這是由于它們適合在大量獨立節(jié)點的集群上分布式訓(xùn)練dnns,而不是顯著提高了單個節(jié)點的計算吞吐量。這種分布式深度學(xué)習(xí)方法可能需要幾個月的時間,花費數(shù)百萬美元的計算服務(wù)費用,并排放數(shù)百噸二氧化碳。按照這些趨勢,使用傳統(tǒng)計算硬件在dnns領(lǐng)域繼續(xù)取得進展在經(jīng)濟上和環(huán)境上都是不可持續(xù)的。
3、在模擬域中,光計算顯示出為ai應(yīng)用提升效率和吞吐量的潛力,并且在過去幾年中已經(jīng)顯示出顯著的實驗進展。各種光子架構(gòu),如級聯(lián)mach-zehnder干涉儀、存內(nèi)計算、可重構(gòu)超表面、頻率梳整形和神經(jīng)形態(tài)計算都已經(jīng)證明了在光子域進行模擬計算的可行性。然而,這些方法大多依賴于固定的光子權(quán)重和高速光電探測器和模數(shù)轉(zhuǎn)換器(analog?todigital?converter,adc),以將光矩陣-向量乘法(matrix-vector?multiplication,mvm)的結(jié)果轉(zhuǎn)換回數(shù)字域從而進行進一步處理。因此,光電讀出電路必須以與輸入的電光調(diào)制器相同的速度運行,這限制了光子加速器的整體吞吐量和能效的上限。此外,與可以非常高效的數(shù)模轉(zhuǎn)換不同,從模擬到數(shù)字域的轉(zhuǎn)換并不簡單,能耗隨著adc的運行頻率的增加而增加。因此,讀出電路的整體能耗占據(jù)了許多模擬計算系統(tǒng)的大部分功耗,其與矩陣規(guī)模成正比。另外,光子和電子組件在物理尺寸上的顯著差異對權(quán)重固定架構(gòu)提出了挑戰(zhàn),通常需要在計算過程中不斷重新配置權(quán)重矩陣,這可能導(dǎo)致計算效率比傳統(tǒng)數(shù)字硬件的計算效率還要低。為了應(yīng)對這一挑戰(zhàn),hamerly等人提出了一種新的方法,該方法通過同相檢測在光域?qū)崿F(xiàn)大規(guī)模的乘累加運算。但是,這些自由空間架構(gòu)需要對系統(tǒng)中的多個光學(xué)路徑長度進行精確且穩(wěn)定的控制以確保時間相干性,并需要定制的衍射光學(xué)元件以確??臻g相干性。同時,其使用的空間光調(diào)制器的調(diào)制速度在目前僅約為1?khz或更低,這會導(dǎo)致計算效率大大降低。
技術(shù)實現(xiàn)思路
1、本公開旨在至少解決現(xiàn)有技術(shù)中存在的問題之一,提供一種集成平衡光子通用高維矩陣運算系統(tǒng)。
2、本公開提供了一種集成平衡光子通用高維矩陣運算系統(tǒng),所述系統(tǒng)包括:
3、硅光芯片,用于將不同射頻信號數(shù)據(jù)以及數(shù)字電子信號編碼至光模擬域,基于編碼后的光模擬信號,通過平衡光子交叉陣列進行矩陣運算,得到對應(yīng)的矩陣運算結(jié)果;
4、驅(qū)動控制電路芯片,用于產(chǎn)生所述不同射頻信號數(shù)據(jù),驅(qū)動所述硅光芯片將所述不同射頻信號數(shù)據(jù)以及所述數(shù)字電子信號編碼至所述光模擬域;以及,對所述矩陣運算結(jié)果進行電學(xué)讀出處理,得到矩陣運算最終結(jié)果。
5、可選地,所述硅光芯片包括硅基激光器、硅光分束器、行輸入調(diào)制器陣列、列輸入調(diào)制器陣列、行硅光dac陣列、列硅光dac陣列、硅基平衡光子交叉陣列;其中,
6、所述硅基激光器,用于產(chǎn)生輸入光;
7、所述硅光分束器,用于將所述硅基激光器產(chǎn)生的輸入光分成m個行輸入光和n個列輸入光;
8、所述行輸入調(diào)制器陣列、所述列輸入調(diào)制器陣列,分別用于將不同射頻信號數(shù)據(jù)分別加載至對應(yīng)的各所述行輸入光、各所述列輸入光,以分別得到各行調(diào)制光、各列調(diào)制光;
9、所述行硅光dac陣列,用于分別對各所述行調(diào)制光進行復(fù)數(shù)域數(shù)字編碼,得到各行輸入光信號;
10、所述列硅光dac陣列,用于分別對各所述列調(diào)制光進行復(fù)數(shù)域數(shù)字編碼,得到各列輸入光信號;
11、所述硅基平衡光子交叉陣列,用于基于各所述行輸入光信號和各所述列輸入光信號進行矩陣運算,得到所述矩陣運算結(jié)果。
12、可選地,所述硅基平衡光子交叉陣列包括m×n個陣元,每個所述陣元均包括一個波導(dǎo)交叉、兩個1×2定向耦合器、一個2×2波導(dǎo)耦合器、一個波導(dǎo)平衡探測器;其中,
13、所述波導(dǎo)交叉的輸入端分別用于接收對應(yīng)的所述行輸入光信號和所述列輸入光信號,所述波導(dǎo)交叉的輸出端分別與各所述1×2定向耦合器的輸入端連接,以使所述行輸入光信號和所述列輸入光信號分別進入對應(yīng)的所述1×2定向耦合器;
14、每個所述陣元中,各所述1×2定向耦合器的一路輸出光經(jīng)所述2×2波導(dǎo)耦合器干涉后進入所述波導(dǎo)平衡探測器,以通過所述波導(dǎo)平衡探測器進行平衡探測及時間積分,實現(xiàn)對應(yīng)的所述行輸入光信號與所述列輸入光信號之間的矩陣運算;各所述1×2定向耦合器的另一路輸出光用于將對應(yīng)的所述行輸入光信號或所述列輸入光信號傳輸至下一個所述陣元。
15、可選地,所述硅基平衡光子交叉陣列中,同一行或同一列相鄰兩個所述1×2定向耦合器的耦合系數(shù)滿足kn=kn+1/(1/η+?kn+1);其中,kn表示第n個1×2定向耦合器的耦合系數(shù),kn+1表示與第n個1×2定向耦合器同一行或同一列相鄰的下一個1×2定向耦合器的耦合系數(shù),η表示所述陣元的插入損耗。
16、可選地,所述驅(qū)動控制電路芯片包括:
17、濾波器陣列,用于對所述矩陣運算結(jié)果中的各個矩陣元素分別進行輸入均衡處理;
18、跨阻放大器陣列,用于對輸入均衡處理后的各個所述矩陣元素分別進行光電轉(zhuǎn)換及放大處理,得到所述矩陣運算最終結(jié)果。
19、可選地,所述驅(qū)動控制電路芯片還包括:
20、硅光dac驅(qū)動器陣列,用于產(chǎn)生多個可調(diào)電壓,以通過各所述可調(diào)電壓驅(qū)動所述行硅光dac陣列和所述列硅光dac陣列。
21、可選地,所述硅光dac驅(qū)動器陣列,包括微控制單元、多通道電學(xué)dac陣列以及調(diào)整輸出級;其中,
22、所述微控制單元,用于在線動態(tài)配置所述多通道電學(xué)dac陣列輸出多個可調(diào)電壓;
23、所述調(diào)整輸出級,用于進行功率推動,輸出各所述可調(diào)電壓至對應(yīng)的所述行硅光dac陣列和所述列硅光dac陣列,以驅(qū)動所述行硅光dac陣列和所述列硅光dac陣列。
24、可選地,所述驅(qū)動控制電路芯片還包括:
25、射頻發(fā)生器陣列,用于產(chǎn)生多個不同頻率的射頻信號;
26、混頻器陣列,用于將數(shù)據(jù)分別加載到各不同頻率的射頻信號中,得到各不同射頻信號數(shù)據(jù);
27、電子合束器陣列,用于分別將對應(yīng)所述行輸入調(diào)制器陣列或所述列輸入調(diào)制器陣列中的同一對象的各不同射頻信號數(shù)據(jù)合成一路作為對應(yīng)的射頻輸入信號,并將各所述射頻輸入信號分別輸出至所述行輸入調(diào)制器陣列或所述列輸入調(diào)制器陣列中的對應(yīng)對象。
28、可選地,所述射頻發(fā)生器陣列包括現(xiàn)場可編程門陣列和運算放大器棧;其中,
29、所述現(xiàn)場可編程門陣列,用于分別設(shè)定各射頻信號的頻率;
30、所述運算放大器棧,用于根據(jù)所述現(xiàn)場可編程門陣列設(shè)定的各射頻信號的頻率,分別生成對應(yīng)的各頻率的射頻信號。
31、可選地,所述硅光芯片與所述驅(qū)動控制電路芯片采用光電混合集成方法進行集成,所述光電混合集成方法包括單片光電混合集成方法、倒裝焊方法、硅通孔三維堆疊方法中的任意一者。
32、本公開相對于現(xiàn)有技術(shù)而言,具有以下有益效果:
33、1.利用硅基光子交叉陣列和平衡檢測來執(zhí)行矩陣運算,將光輸入的調(diào)制頻率與讀出電路的速度解耦,且不需要頻繁地重新編程光子權(quán)重,在大矩陣的極限下顯著降低了能耗和延遲。
34、2.利用平衡檢測的差分特性,允許通過控制輸入光的相位和幅度來實現(xiàn)整個復(fù)數(shù)域的通用矩陣運算,且平衡檢測可以消除共模噪聲,允許使用極低的光功率,大大提高了信噪比。
35、3.通過增加時間和射頻自由度為數(shù)據(jù)添加了額外的維度,從而可獲得高維矩陣運算,提高了系統(tǒng)并行度和吞吐量。同時,時間和射頻編碼使得光子硬件物理尺寸不再限制矩陣運算的最大維度,大大提高了系統(tǒng)的靈活性、可擴展性和運算效率。
36、4.采用光電混合集成技術(shù)對硅基器件構(gòu)成的硅光芯片與驅(qū)動控制電路芯片進行集成封裝,并基于cmos(complementary?metal?oxide?semiconductor,互補金屬氧化物半導(dǎo)體)工藝流片,可大幅提高系統(tǒng)的集成度,大幅降低制作成本,實現(xiàn)批量化生產(chǎn)。