一種攝像系統(tǒng)以及圖像識別系統(tǒng)的制作方法
【技術領域】
[0001]本發(fā)明涉及計算機及計算機應用技術領域,特別涉及一種攝像系統(tǒng)以及圖像識別系統(tǒng)。
【背景技術】
[0002]通常來說,一臺計算機主要包括三個核心部分:中央處理器(CPU,CentralProcessing Unit)、內(nèi)存和存儲。
[0003]經(jīng)過一些世界頂級公司的不懈努力,CPU已經(jīng)演變成極度復雜的半導體芯片。頂級的CPU內(nèi)核內(nèi)部的MOS管數(shù)目可以超過一億個。目前的產(chǎn)業(yè)趨勢是受制于功耗,CPU的運行頻率已經(jīng)很難再提高。已經(jīng)極度復雜的現(xiàn)代CPU,運行效率同樣很難再提高。新的CPU產(chǎn)品,越來越多地朝多核方向演進。
[0004]在內(nèi)存方面,目前居于統(tǒng)治地位的是動態(tài)隨機存取存儲器(DRAM,Dynamic RandomAccess Memory)技術。DRAM可以快速隨機讀寫,但卻不能在斷電的情況下保持內(nèi)容。實際上,即使在通電的情況下,它也會由于內(nèi)部用于儲存信息的電容器的漏電而丟失信息,必須周期性地自刷新。
[0005]在存儲方面,NAND閃存技術正在逐步取代傳統(tǒng)硬盤。閃存所依賴的浮置柵極(floating gate)技術,雖然能夠在斷電的情況下保持內(nèi)容,但寫入(將‘I’改寫為‘0’ )的速度很慢,擦除(將‘0’改寫為‘I’)的速度更慢,無法像DRAM那樣用于對計算的直接支持。它被制作成塊設備(block device),必須整塊一起擦除,一個塊(block)包含很多頁(page),擦除后每頁可以進行寫入操作。NAND的另外一個問題是具有有限的壽命。
[0006]DRAM和NAND閃存,以及CPU的邏輯電路,雖然都是基于CMOS半導體工藝生產(chǎn)的,但這三者的工藝彼此并不兼容。于是,計算機的三個核心部分無法在一個芯片上共存,這深刻地影響了現(xiàn)代計算機的架構。
[0007]現(xiàn)有技術中的計算機架構如圖1所示,圖1中示出多個CPU內(nèi)核,分別為CPU1、CPU2、CPU3、……、CPUn,每個CPU內(nèi)核一般具有相應的一級緩存(LI Cache),根據(jù)需要還可以進一步為每個CPU內(nèi)核配備相應的二級緩存(L2 Cache)、三級緩存(L3Cache)。DRAM與各個CPU內(nèi)核之間通過雙倍速率(DDR,Double Data Rate)接口進行通信,硬盤(HD,HardDisk)或固態(tài)硬盤(SSD,Solid State Drives)與各個CPU內(nèi)核之間則通過外圍設備接口進行通信。
[0008]—方面,CPU在向多核的方向發(fā)展,另一方面內(nèi)存和存儲都在另外的芯片里。多核CPU吞吐信息量成比例增加,與內(nèi)存、存儲的通信就越來越成為系統(tǒng)性能的瓶頸。為了緩解通信瓶頸,CPU不得不采用越來越大的多級緩存。緩存是把內(nèi)存中的內(nèi)容復制,通常是用成本比DRAM高得多但速度更快的靜態(tài)隨機存取存儲器(SRAM,Static Random AccessMemory)設計的。這樣的架構,費效比非常的差。半導體芯片的成本由其硅片的面積決定,而傳統(tǒng)計算機架構帶來的性能提升與其硅片面積的增加遠遠不成比例。
[0009]高端的圖像傳感器是可以在極短的時間內(nèi)(微秒級)取得圖像數(shù)據(jù)的,但一幀高清圖像的數(shù)據(jù)量很大,在目前的攝像系統(tǒng)中,考慮到現(xiàn)有計算機架構因CPU與內(nèi)存、存儲之間存在的通信瓶頸對于計算機整體性能的影響,把圖像數(shù)據(jù)讀出來通常就需要1/30秒-1/60秒的時間,因此在絕大部分的攝像系統(tǒng)中,對視頻的處理能力遠遠跟不上取得圖像數(shù)據(jù)的速度。
【發(fā)明內(nèi)容】
[0010]本發(fā)明要解決的問題是目前的攝像系統(tǒng)由于現(xiàn)有計算機架構中CPU與內(nèi)存、存儲之間存在的通信瓶頸對于計算機整體性能的影響,使攝像系統(tǒng)的圖像處理能力較為有限,難以滿足高速攝像的更高要求。
[0011]為解決上述問題,本發(fā)明技術方案提供一種攝像系統(tǒng),包括:細胞陣列計算系統(tǒng)和圖像傳感器;所述細胞陣列計算系統(tǒng)包括主控CPU、細胞陣列和細胞陣列總線;所述細胞陣列是由一個以上兼具計算和存儲功能的細胞組成的二維陣列,其中每一個細胞包括微處理器(MPU, Micro Processing Unit)和非易失(NV,Not Volatile)隨機存儲器;所述非易失隨機存儲器用于所述微處理器計算時所涉及數(shù)據(jù)的隨機存取,還用于存儲軟件的指令代碼和需要永久保存的數(shù)據(jù);所述圖像傳感器是由一個以上圖像采集單元組成的二維陣列,所述細胞陣列與所述圖像傳感器疊合形成三維結構,所述圖像傳感器中的圖像采集單元與所述細胞陣列中的細胞一一對應地相連;所述圖像采集單元用于采集圖像數(shù)據(jù)以供所述細胞陣列中的細胞進行處理;每一個細胞儲存各自在所述細胞陣列中的位置作為身份識別號(ID,identificat1n)以供細胞中的軟件或硬件讀?。凰鲋骺谻PU通過所述細胞陣列總線與所述細胞陣列中的每一個細胞進行通信;所述細胞陣列中的相鄰細胞之間有通信接口,能相互發(fā)送數(shù)據(jù)。
[0012]可選的,所述細胞陣列中的細胞還包括圖像處理器,用于對與本細胞相連的圖像采集單元所采集的圖像數(shù)據(jù)進行處理。
[0013]可選的,所述細胞陣列中的細胞還包括總線控制器和細胞內(nèi)部總線,所述總線控制器與所述細胞陣列總線、微處理器以及細胞內(nèi)部總線相連,所述總線控制器用于識別所述主控CPU與本細胞之間進行的通信,連接所述微處理器以傳遞所述主控CPU發(fā)送的指令或數(shù)據(jù)、狀態(tài)讀取,或者通過所述細胞內(nèi)部總線連接所述非易失隨機存儲器進行數(shù)據(jù)的讀寫操作。
[0014]可選的,所述細胞陣列中的任意兩個細胞之間能進行通信,參與細胞間通信的細胞包含起點細胞、終點細胞和中轉細胞,所述起點細胞為向所述終點細胞發(fā)出數(shù)據(jù)的細胞,所述終點細胞為最終接收所述起點細胞所發(fā)數(shù)據(jù)的細胞,所述中轉細胞為沿細胞間通信路徑依次相鄰且通過所述通信接口中轉所述起點細胞所發(fā)數(shù)據(jù)的細胞,所述細胞間通信路徑是由所述起點細胞、中轉細胞和終點細胞所構成的數(shù)據(jù)收發(fā)路徑。
[0015]可選的,所述細胞陣列中的任一細胞還能作為所述起點細胞向目標區(qū)域內(nèi)的所有細胞進行群發(fā)通信,參與所述群發(fā)通信且位于目標區(qū)域內(nèi)的細胞作為所述起點細胞、或作為所述終點細胞、或同時作為所述中轉細胞和終點細胞,參與所述群發(fā)通信且位于目標區(qū)域外的細胞作為所述起點細胞或中轉細胞。
[0016]可選的,所述細胞陣列中的細胞還包括與所述微處理器相連的網(wǎng)絡控制器,所述網(wǎng)絡控制器用于在進行細胞間通信時,對發(fā)出的數(shù)據(jù)、中轉的數(shù)據(jù)或者最終接收的數(shù)據(jù)進行收發(fā)控制,還用于向所述微處理器發(fā)送中斷信號。
[0017]可選的,所述細胞陣列中的細胞還包括與所述網(wǎng)絡控制器相連的一組或一組以上先入先出隊列(FIFO,F(xiàn)irst Input First Output),各組先入先出隊列分別對應一個與本細胞相鄰的細胞,每一組先入先出隊列包括輸入先入先出隊列和輸出先入先出隊列,所述輸入先入先出隊列用于存儲輸入本細胞進行中轉的數(shù)據(jù)或最終接收的數(shù)據(jù),所述輸出先入先出隊列用于存儲從本細胞輸出的需進行中轉的數(shù)據(jù)或本細胞向其他細胞發(fā)出的數(shù)據(jù)。
[0018]可選的,所述細胞陣列中還設有至少一個專職輸出細胞,所述專職輸出細胞作為所述終點細胞接收并存儲其他細胞給所述主控CPU的輸出數(shù)據(jù),并以中斷信號通知所述主控CPU讀取所述輸出數(shù)據(jù)。
[0019]可選的,所述圖像采集單元與所述細胞陣列中相對應的細胞之間通過過硅通孔(TSV,Through Silicon Vias)建立通信聯(lián)系。
[0020]可選的,所述主控CPU與所述細胞陣列和所述細胞陣列總線集成于一個芯片中。
[0021]可選的,所述主控CPU作為獨立的芯片,通過標準的內(nèi)存接口與由所述細胞陣列和所述細胞陣列總線組成的芯片進行通信。
[0022]可選的,所述非易失隨機存儲器為磁性隨機存儲器(MRAM,Magnetic RandomAccess Memory),所述圖像傳感器為互補金屬氧化物半導體(CMOS,Complementary MetalOxide Semiconductor)圖像傳感器,所述細胞陣列在一個娃片上。
[0023]為解決上述問題,本發(fā)明技術方案還提供一種圖像識別系統(tǒng),包括識別單元以及上述攝像系統(tǒng);所述識別單元用于對所述攝像系統(tǒng)處理后得到的圖像進行識別。
[0024]與現(xiàn)有技術相比,本發(fā)明的技術方案至少具有以下優(yōu)點:
[0025]通過將一個以上兼具獨立計算和存儲功能的單元(稱為“細胞”)組成二維陣列(稱為“細胞陣列”),其中每一個細胞包括微處理器和非易失隨機存儲器,所述非易失隨機存儲器既能支持所述微處理器進行計算時所涉及數(shù)據(jù)的隨機存取,也能支持存儲軟件的指令代碼和需要永久保存的數(shù)據(jù),使內(nèi)存、存儲、計算三個功能集成到每個細胞中,并使各細胞之間形成密集的通訊網(wǎng)絡,一方面,主控CPU能通過細胞陣列總線與細胞陣列中的每一個細胞進行通信,另一方面,細胞陣列中的相鄰細胞之間也能相互發(fā)送數(shù)據(jù),由此能通過數(shù)據(jù)群發(fā)和內(nèi)部網(wǎng)絡,克服現(xiàn)有計算機架構因CPU與內(nèi)存、存儲之間存在的通信瓶頸,從而提升計算系統(tǒng)的整體性能,并能使費效比較佳;在將上述具有細胞陣列的計算系統(tǒng)應用于攝像系統(tǒng)的情況下,每一幀圖像可以通過大量的通道讀出并同時被處理,能夠使攝像系統(tǒng)的圖像處理能力得以大幅提升,從而滿足對于高速攝像的更高要求。
[0026]進一步地,通過將包含細胞陣列計算系統(tǒng)的攝像系統(tǒng)應用于圖像識別系統(tǒng)中,由于每一幀圖像的處理速度得到大幅提升,因此能夠在更短的時間內(nèi)實現(xiàn)對于每一幀圖像的識別,使該圖像識別系統(tǒng)具有更快的圖像識別能力,從而滿足對于高速圖像識別的要求。
[0027]通過細胞陣列中相鄰細胞之間的通信接口,實現(xiàn)相鄰細胞之間對于數(shù)據(jù)的多次中轉,使細胞陣列中的任意兩個細胞之間不依靠主控CPU便能進行通信,提高了細胞間通信的效率,也降低了主控CPU的處理負擔,從而能進一步提升計算系統(tǒng)的整體性能。
[0028]通過將細胞間的點對點通信功能擴展到區(qū)域群發(fā),可以支持更高的平行度,獲得高得多的總帶寬,從而進一步提升計算系統(tǒng)的整體性能。
[0029]通過在細胞陣列中設置專職輸出細胞,以所述專職輸出細胞作為所述終點細胞接收并存儲其他細胞給主控CPU的輸出數(shù)據(jù),并以中斷信號的方式通知所述主控CPU讀取所述輸出數(shù)據(jù),如此能夠在只有少數(shù)幾個細胞需要向主控CPU輸出數(shù)據(jù)時提高主控CPU讀取輸出數(shù)據(jù)的效率。
[0030]本發(fā)明技術方案提供的細胞陣列計算系統(tǒng)解決了 CPU和內(nèi)存之間的通信瓶頸問題。這樣,在相同的硅片面積下,大量微型MPU的處理能力,在很多問題上遠超少數(shù)幾個頂級CPU的處理能力,而耗電則低得多。
[0031]本發(fā)明技術方案提供的細胞陣列計算系統(tǒng)使得計算機的架構更接近人腦,為未來的人工智能算法提供了強有力的引擎。
【附圖說明】
[0032]圖1是現(xiàn)有技術中計算機架構的示意圖;
[0033]圖2是本發(fā)明實施例提供的細胞陣列計算系統(tǒng)的一種結構示意圖;
[0034]圖3是本發(fā)明實施例的一種相鄰細胞之間通信方式的示意圖;
[0035]圖4是本發(fā)明實施例的另一種相鄰細胞之間通信方式的示意圖;
[0036]圖5是本發(fā)明實施例的細胞的結構示意圖;
[0037]圖6是應用細胞陣列計算系統(tǒng)以流水線的方式計算Monte Carlo積分的示意圖;
[0038]圖7是本發(fā)明實施例的細胞陣列中進行細胞間通信的細胞的結構示意圖;
[0039]圖8是本發(fā)明實施例的細胞陣列中細胞間通信的路徑選擇的示意圖;
[0040]圖9是本發(fā)明實施例的專職輸出細胞的實施過程示意圖;
[0041]圖10是本發(fā)明實施例的細胞陣列中起點細胞在目標區(qū)域角上的細胞群發(fā)示意圖;
[0042]圖11是本發(fā)明實施例的細胞陣列中起點細胞在目標區(qū)域邊上的細胞群發(fā)示意圖;
[0043]圖12是本發(fā)明實施例的細胞陣列中起點細胞在目標區(qū)域內(nèi)部的細胞群發(fā)示意圖;
[0044]圖13是本發(fā)明實施例的細胞陣列中起點細胞在目標區(qū)域外的細胞群發(fā)示意圖;
[0045]圖14是本發(fā)明實施例提供的細胞陣列計算系統(tǒng)的另一種結構示意圖;
[0046]圖15是本發(fā)明實施例提供的細胞陣列計算系統(tǒng)的又一種結構示意圖;
[0047]圖16是本發(fā)明實施例提供的細胞陣列計算系統(tǒng)的再一種結構示意圖;
[0048]圖17是本發(fā)明實施例提供的攝像系統(tǒng)的結構示意圖。
【具體實施方式】
[0049]現(xiàn)有技術的計算機架構由于CPU與內(nèi)存、存儲之間存在通信瓶頸,從而影響計算機整體性能的提升,并使費效比較差。
[0050]本申請發(fā)明人經(jīng)過研究后考慮,若是把內(nèi)存、存儲、計算