節(jié)的字節(jié)。許多短包極其地短,且由確認(rèn)包、消息、控制、請(qǐng)求、以及剩余的數(shù)據(jù)構(gòu)成。對(duì)于500字節(jié)的包大小,存在0.42的⑶F,且對(duì)于1000字節(jié)的包大小,存在0.48的⑶F。因此,僅6%的包在500字節(jié)與1000字節(jié)之間。實(shí)際上,35%的包小于200字節(jié),50%的包大于1400字節(jié),且僅15%的包在200與1400字節(jié)之間,所述在200與1400字節(jié)之間是包大小范圍的80%。
[0029]圖3圖示曲線圖210,所述曲線圖通過繪制小于包大小的流量包的百分比的流量帶寬的百分比對(duì)包大小而從曲線圖200導(dǎo)出。因?yàn)檩^大的流量包每包包含更多的流量,所以盡管存在相當(dāng)大數(shù)目的小包,但大部分流量由大包構(gòu)成。曲線圖210具有與曲線圖200相同的包分布。在曲線圖210中,1.04%的流量來自50字節(jié)或更短的包,2.99%的流量來自220字節(jié)或更短的包,4.49%的流量來自360字節(jié)或更短的包,7.28%的流量來自760字節(jié)或更短的包,14.40%的流量來自1380字節(jié)或更短的包,20.20%的流量來自1460字節(jié)或更短的包,74.05%的流量來自1480字節(jié)或更短的包,且100.00%的流量來自1500字節(jié)或更短的包。
[0030]盡管短包與長(zhǎng)包之間的大小閾值通??梢栽?00字節(jié)與1400字節(jié)之間,但是可以使用更高和更低的大小閾值。例如,如果巨型包以多達(dá)9,000字節(jié)的包大小來使用,那么大小閾值可以在500到8400的范圍內(nèi)。此大小閾值可以是靜態(tài)的,或它可以是動(dòng)態(tài)的,通過反饋回路基于舉例來說來自通過統(tǒng)計(jì)數(shù)據(jù)收集模塊144收集的數(shù)據(jù)的實(shí)時(shí)流量測(cè)量值來控制。對(duì)于其中界限是800字節(jié)的實(shí)例,電包交換結(jié)構(gòu)交換約8%的帶寬,而光子交換結(jié)構(gòu)交換約92%的帶寬。如果將大小閾值設(shè)定在1380字節(jié)處,那么將14.4%的帶寬路由到電包交換結(jié)構(gòu),而將85.6%的包帶寬路由到光子交換結(jié)構(gòu),且與具有僅電交換結(jié)構(gòu)的系統(tǒng)相比在吞吐量上存在6.94 = (85.6+14.4)/14.4的增益。并且,如果將大小閾值設(shè)定在360字節(jié)每包處,那么電包交換結(jié)構(gòu)處理4.49%的包帶寬且光子交換機(jī)處理95.51 %的帶寬,其中在帶寬上的增益為22.27 = (95.51+4.49)/4.49。在一實(shí)例中,80%到95%的包帶寬通過光子交換結(jié)構(gòu)交換,所述光子交換結(jié)構(gòu)與流動(dòng)通過電包交換機(jī)的剩余短包流一起將總的包交換節(jié)點(diǎn)的容量增加了約五到二十倍。如果85%的帶寬經(jīng)過光子交換結(jié)構(gòu),那么在總的交換節(jié)點(diǎn)容量上存在六倍的增加。如果95%的帶寬經(jīng)過光子交換機(jī),那么存在二十倍的增益。在一實(shí)例中,短包的包大小比長(zhǎng)包的包大小變化得更多,因?yàn)榇蠖鄶?shù)長(zhǎng)包為最大包大小或接近最大包大小。為了能夠?qū)崿F(xiàn)此益處,有必要能夠基于在每個(gè)流的每個(gè)流動(dòng)中的包的包長(zhǎng)度將包流分路成兩個(gè)流,且隨后在交換之后能夠?qū)⑺霭髟谛掳髦兄亟ǔ赏暾陌?jí)流。
[0031]在另一個(gè)實(shí)例中,使用巨型包。巨型包是長(zhǎng)于近似1500字節(jié)的標(biāo)準(zhǔn)長(zhǎng)度的包。例如,巨型幀可以在1500字節(jié)與9000字節(jié)之間,但它們也可以更大。在此情況下,包大小閾值可以設(shè)定成高得多,例如從約7500到約8500,但也可能更高。
[0032]電包交換機(jī)遭受嚴(yán)重的帶寬擁塞。將承載大部分帶寬的長(zhǎng)包轉(zhuǎn)移到光子包交換機(jī)中使得電包交換機(jī)僅處理短包,所述短包根據(jù)用于分路包的包大小閾值表示在正常數(shù)據(jù)中心中的總帶寬的5%與20%之間帶寬。這將電包交換機(jī)的帶寬吞吐量卸載了 80%到95%,從而改善其帶寬問題。并且,光子包交換機(jī)被簡(jiǎn)化,因?yàn)樗鼈冋诮粨Q的所有包大致長(zhǎng)度相同,或可以經(jīng)填補(bǔ)變成相同的長(zhǎng)度而不會(huì)遭受太多效率損失,從而允許在緩沖區(qū)點(diǎn)之間更簡(jiǎn)單的單級(jí)(或有效的單級(jí))交換,所述單級(jí)交換可以保留在電子域中。因此,光子包交換機(jī)變成經(jīng)電緩沖的快速光子電路交換結(jié)構(gòu)或光子突發(fā)交換結(jié)構(gòu)。由于分派給電包交換機(jī)以進(jìn)行交換的所需帶寬的急劇減少,卸載電包交換機(jī)提供了所述交換機(jī)上的備用容量的大量增加。所述容量可以經(jīng)分配以交換大小閾值以下的包的包流的其它源,而含有在大小閾值以上的包的包流在經(jīng)電子緩沖的光子包交換層中進(jìn)行交換。
[0033]圖4圖示數(shù)據(jù)中心260。類似于數(shù)據(jù)中心230,數(shù)據(jù)中心260包含服務(wù)器240、存儲(chǔ)單元242、I/O接口 244、流量監(jiān)視器250、TOR交換機(jī)245和中央處理控制232。然而,數(shù)據(jù)中心260包含中心包交換機(jī)264,所述中心包交換機(jī)包含電包交換結(jié)構(gòu)266和光子交換結(jié)構(gòu)270。電包交換結(jié)構(gòu)266包含集中式或分布式處理函數(shù),且光子交換結(jié)構(gòu)270包含集中式或分布式處理函數(shù)。這些集中式或分布式處理函數(shù)提供通過交換結(jié)構(gòu)的包流的實(shí)時(shí)逐包路由。中心包交換機(jī)264可以包含一或多個(gè)并行的電包交換機(jī)和一或多個(gè)并行的光子包交換機(jī)。在一個(gè)實(shí)例中,電包結(jié)構(gòu)266交換10%的流量帶寬,或約5百萬兆字節(jié)每秒、但遠(yuǎn)超過10%的包,因?yàn)槠渌邪驾^小,而光子交換結(jié)構(gòu)270交換90%的流量帶寬,或45百萬兆字節(jié)每秒、但遠(yuǎn)少于90%的包,因?yàn)槠渌邪驾^大。在此實(shí)例中,通過應(yīng)用光子交換機(jī)與包流分路器和合路器,總節(jié)點(diǎn)容量已經(jīng)從5TB/s增加到50TB/S。
[0034]TOR交換機(jī)245耦合到經(jīng)增強(qiáng)流量分路器280和經(jīng)增強(qiáng)流量合路器282。將通向和來自TOR交換機(jī)245的多個(gè)鏈路連接到中心包交換機(jī)264。在一實(shí)例中,按長(zhǎng)度分離包,其中長(zhǎng)包去往光子交換機(jī)且短包去往電交換機(jī)。一般來講,如果電交換結(jié)構(gòu)的帶寬處理容量是限制因素且如果90%的流量帶寬被路由到光子交換機(jī),那么在總交換節(jié)點(diǎn)的帶寬容量上存在十倍的增加。經(jīng)增強(qiáng)流量分路器280經(jīng)由若干鏈路將出局話務(wù)映射到中心包交換機(jī)264,且按長(zhǎng)度分離所述包,因此使短包流動(dòng)到電包交換結(jié)構(gòu)266且使長(zhǎng)包流動(dòng)到光子交換結(jié)構(gòu)270。在短包與長(zhǎng)包之間的大小閾值越低,性能的改進(jìn)就越大,因?yàn)楦嗟牧髁勘宦酚傻焦庾咏粨Q結(jié)構(gòu)270而非電包交換結(jié)構(gòu)266。然而,對(duì)于較低的大小閾值,光子交換結(jié)構(gòu)270必須能夠更快地建立連接,因?yàn)楣庾咏粨Q結(jié)構(gòu)處理包含更短的包的更寬范圍的包大小,且緩慢的建立時(shí)間將減少交換吞吐量。
[0035]經(jīng)增強(qiáng)流量合路器282使短接收包和長(zhǎng)接收包交錯(cuò)以恢復(fù)包序列完整性。因?yàn)殚L(zhǎng)包和短包將已經(jīng)在不同路徑上行進(jìn)通過具有不同緩沖策略的不同交換機(jī),且將具有不同的時(shí)延,所以它們可能不按時(shí)間順序到達(dá)。經(jīng)增強(qiáng)流量合路器282以正確的次序放置包,例如使用包序列號(hào)或時(shí)間戳。
[0036]在一實(shí)例中,存在2500個(gè)架頂交換機(jī)以及10,000個(gè)連接。如果例如每個(gè)架頂交換機(jī)都具有400Gb/s或50GByte/s的容量,那么核心交換機(jī)資源具有l(wèi)Pb/s或125TBytes/秒的交換容量。在一實(shí)例中,大于閾值的950Tb/s或118.75PBytes/s的包流經(jīng)光子交換結(jié)構(gòu)270,而小于閾值的50Tb/s或6.25TBytes/s的包流經(jīng)電包交換結(jié)構(gòu)266。950:50的值與約400字節(jié)的包分路閾值相對(duì)應(yīng)。
[0037]圖5圖示用于包流路由的系統(tǒng)100。一些包路由通過電包交換機(jī),而其它包路由通過光子交換機(jī)。例如,短包可以通過電包交換機(jī)交換,而長(zhǎng)包通過光子交換機(jī)交換。通過交換長(zhǎng)包,光子包交換速度相對(duì)寬松,因?yàn)榘掷m(xù)時(shí)間較長(zhǎng)。在一實(shí)例中,長(zhǎng)包可以具有可變長(zhǎng)度,且光子交換機(jī)使用異步交換。替代地,通過將長(zhǎng)包填補(bǔ)到固定長(zhǎng)度,例如1500字節(jié),可以將長(zhǎng)包作為固定長(zhǎng)度的包來傳輸。這比異步方法僅略微低效,因?yàn)榇蟛糠珠L(zhǎng)包或者在固定最大長(zhǎng)度處或者非常接近最大長(zhǎng)度。隨后,光子交換機(jī)可以使用異步交換,但也可以替代地通過使用快速設(shè)置光子電路交換機(jī)或突發(fā)交換機(jī)來使用同步交換。
[0038]分路器106可以容納在TOR交換機(jī)104中、容納在機(jī)架102中。替代地,分路器106可以是單獨(dú)的單元??梢源嬖跀?shù)千機(jī)架和TOR交換機(jī)。分路器106包含:流量分路器108,所述流量分路器將包流分路成兩個(gè)流量流;以及流量監(jiān)視器110,所述流量監(jiān)視器監(jiān)視流量。分路器106可以基于包在包流的每個(gè)包級(jí)流內(nèi)的排序向所述包添加標(biāo)識(shí),以便于維持在每個(gè)包級(jí)流中的包的排序,所述包在重組時(shí)可能采取不同的路徑。替代地,每個(gè)包級(jí)流內(nèi)的包在到達(dá)分路器106之前可以經(jīng)編號(hào)或以另外方式個(gè)別地標(biāo)識(shí),例如使用包序列號(hào)或傳輸控制協(xié)議(TCP)時(shí)間戳。一個(gè)包流被路由到光子交換結(jié)構(gòu)112,而另一個(gè)包流被路由到電包交換結(jié)構(gòu)116。在一實(shí)例中,長(zhǎng)包被路由到光子交換結(jié)構(gòu)112,而短包被路由到電包交換結(jié)構(gòu)116。光子交換結(jié)構(gòu)112可以具有約二到二十納秒的設(shè)置時(shí)間。比長(zhǎng)包的包持續(xù)時(shí)間(在100Gb/s處的1500字節(jié)是120ns)快得多的所述設(shè)置時(shí)間并不嚴(yán)重地影響交換效率。然而,以此交換設(shè)置時(shí)間交換短包將是有問題的。舉例來說,在100Gb/s處的50字節(jié)控制包具有約4ns的持續(xù)時(shí)間,所述持續(xù)時(shí)間小于中等光子交換機(jī)設(shè)置時(shí)間。光子交換結(jié)構(gòu)112可以包含固態(tài)光子交換機(jī)的陣列,所述陣列可以組裝成結(jié)構(gòu)架構(gòu),例如Baxter-Banyan、Benes或 CLOS0
[0039]并且,光子交換結(jié)構(gòu)112包含處理單元114,且電包交換結(jié)構(gòu)116包含集中式或分布式處理函數(shù)。所述處理函數(shù)基于信令/路由信息通過所述結(jié)構(gòu)提供逐包路由,所述逐包路由或者作為共路信令路徑或者作為標(biāo)準(zhǔn)包頭部或封套被承載。
[0040]將光子交換結(jié)構(gòu)112和電包交換結(jié)構(gòu)116的