廣告?zhèn)髅酵斗沤K端中基于細胞神經(jīng)網(wǎng)絡(luò)或卷積神經(jīng)網(wǎng)絡(luò)的用戶識別系統(tǒng)的制作方法
【專利摘要】本實用新型提出了廣告?zhèn)髅酵斗沤K端中基于細胞神經(jīng)網(wǎng)絡(luò)或卷積神經(jīng)網(wǎng)絡(luò)的用戶識別系統(tǒng),屬于人工智能技術(shù)領(lǐng)域。本實用新型以細胞神經(jīng)網(wǎng)絡(luò)或卷積神經(jīng)網(wǎng)絡(luò)為核心,利用廣告播放終端已有的攝像頭、存儲介質(zhì)、微處理器、音頻輸出設(shè)備和供電設(shè)備等以及外置攝像頭等,構(gòu)成基于CNN技術(shù)的具有廣告接收用戶群體特征識別的多媒體廣告精確推送終端。所述的終端像人類視覺系統(tǒng)一樣,具有“看懂”世界的能力,基于識別到的人群的特征,依靠識別的圖像/視頻內(nèi)容,可以更為精確的針對用戶的行為和喜好給播放對象最可能感興趣的圖像或者視頻廣告信息,提高廣告投放精準(zhǔn)度及廣告投放效率,優(yōu)化廣告投放資源。
【專利說明】
廣告?zhèn)髅酵斗沤K端中基于細胞神經(jīng)網(wǎng)絡(luò)或卷積神經(jīng)網(wǎng)絡(luò)的用 戶識別系統(tǒng)
技術(shù)領(lǐng)域
[0001] 本實用新型屬于人工智能技術(shù)領(lǐng)域,具體地說,涉及用于廣告?zhèn)髅酵斗沤K端中基 于細胞神經(jīng)網(wǎng)絡(luò)或卷積神經(jīng)網(wǎng)絡(luò)(Cellular or Convolutional Neural Networks,CNN)的 用戶識別系統(tǒng)。
【背景技術(shù)】
[0002] 現(xiàn)如今,新興傳媒逐漸開始走進消費者視線搶奪有限的注意力資源,傳媒廣告投 放也已經(jīng)滲透到了各個投放場景,除傳統(tǒng)的電視廣告外,包括但不限于如樓宇視頻(電視) 廣告、移動車載廣告、飛機機載廣告、會展電視廣告等廣告投放場景越來越多被廣告商所應(yīng) 用,隨著廣告投放市場的競爭逐漸激烈化,廣告主對于廣告商的選擇要求更加苛刻,如何提 高廣告信息的投放精準(zhǔn)度,如何優(yōu)化廣告信息資源,提高廣告信息投放效率,是眾多廣告商 面臨的競爭難題。
[0003] 盡管隨著互聯(lián)網(wǎng)技術(shù)應(yīng)用及大數(shù)據(jù)的興起,GPS、基于移動終端的LBS服務(wù)等技術(shù) 的出現(xiàn),消費者的消費行為可以被記錄,消費者即時位置和時間數(shù)據(jù)變得易于獲取,廣告商 可以通過大數(shù)據(jù)分析進行廣告效果評估,優(yōu)化廣告投放資源,例如,根據(jù)某一個廣告投放場 景中用戶在接收廣告后的消費行為進行分析,從而判斷在該場景投放相應(yīng)廣告的有效性。 但對于現(xiàn)有的廣告?zhèn)髅酵斗沤K端而言,仍然無法完成點對點的針對廣告投放實時接收群體 的特征識別進行精準(zhǔn)投放,原因在于廣告商所采用的廣告?zhèn)髅酵斗沤K端,包括但不限于社 區(qū)廣告宣傳欄、居民樓電梯、酒店大堂、機場、車站、商場、寫字樓等場景應(yīng)用的廣告投放終 端,無法辨別實際廣告接收用戶的身份特征信息,如性別、年齡、裝扮等。
[0004] 在傳統(tǒng)的數(shù)字圖像技術(shù)中,用戶的特征信息識別的準(zhǔn)確率、速度和成本等受到很 大限制,無法得到廣泛應(yīng)用。隨著人工智能中深度學(xué)習(xí)技術(shù)的興起,用戶特征信息的識別變 得越來越可行,識別準(zhǔn)確度有了質(zhì)的提高,已經(jīng)能夠滿足人們的實際需求。
[0005] 人工智能早在計算機學(xué)伊始時就已經(jīng)產(chǎn)生,它最早是在1956年被作為一門學(xué)術(shù)學(xué) 科建立起來。機器學(xué)習(xí)屬于人工智能的一個分支,而神經(jīng)網(wǎng)絡(luò)是機器學(xué)習(xí)的一個分支,是最 實用、最有效的一個人工智能的分支。
[0006] 深度學(xué)習(xí) (Deep Learning)的概念由Hinton等人于2006年提出。深度學(xué)習(xí)領(lǐng)域中 的突破引發(fā)了人工智能革命。近年來,微軟、臉書、谷歌、IBM、百度等公司推出了各自的深度 學(xué)習(xí)系統(tǒng),運用"深度學(xué)習(xí)"技術(shù)提出了許多語音和圖像的識別、合成算法。這些算法是一種 計算機模擬人腦神經(jīng)網(wǎng)絡(luò)的算法。簡單來說,就是用計算機搭建一個人工神經(jīng)網(wǎng)絡(luò),然后通 過已有的大量數(shù)據(jù)不斷對其訓(xùn)練優(yōu)化。
[0007]人工神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方式是通過向它展示大量的訓(xùn)練范例,然后逐漸對網(wǎng)絡(luò)參數(shù) 進行調(diào)整,直至它能夠反饋出令人滿意的分類。一個典型的網(wǎng)絡(luò)是由10-30層(目前最深的 達到了 150多層)人工神經(jīng)元堆積架構(gòu)而成的。舉例說明,當(dāng)將一個圖片信息發(fā)送給一個神 經(jīng)網(wǎng)絡(luò)時,輸入層接收信息并且進行低層次的處理后將結(jié)果輸出給下一個層級,周而復(fù)始, 直到到達最后一個層級,來決定該圖像的分析結(jié)果。
[0008] 為了獲得更好的學(xué)習(xí)結(jié)果,神經(jīng)網(wǎng)絡(luò)的規(guī)模越來越大,層數(shù)越來越多,就成為了深 度神經(jīng)網(wǎng)絡(luò),深度神經(jīng)網(wǎng)絡(luò)是深度學(xué)習(xí)的一個重要分支。最早Google的深度神經(jīng)網(wǎng)絡(luò) Distblief用了1000臺機器、16000核處理,網(wǎng)絡(luò)規(guī)模大概是10億個神經(jīng)元,而后Andrew Ng 在Stanford大學(xué)用16臺服務(wù)器,總共64個GPU,并且用了一個超級性能的交換機 InfiniBand,可訓(xùn)練的網(wǎng)絡(luò)規(guī)模達到了 112億個神經(jīng)元。最近,百度深度學(xué)習(xí)的網(wǎng)絡(luò)規(guī)模已 經(jīng)達到了200億的節(jié)點。估計不遠的將來,深度神經(jīng)網(wǎng)絡(luò)的規(guī)模將達到1000億個神經(jīng)元,規(guī) 模越大,對并行架構(gòu)、優(yōu)化算法提出前所未有的挑戰(zhàn),但超大規(guī)模后可能會獲得更多新的認(rèn) 知。
[0009] 基于上述深度學(xué)習(xí)的新算法和技術(shù)的部分性能已超過了人類大腦。人工智能在深 度學(xué)習(xí)領(lǐng)域算法方面獲得了一定突破的同時,國內(nèi)外一些公司就將商業(yè)機會瞄準(zhǔn)了如何用 芯片實現(xiàn)這些已優(yōu)化參數(shù)的深度神經(jīng)網(wǎng)絡(luò)算法,獲得人工智能行為。例如,近期麻省理工 (MIT)、高通(Qualcomm)、英特爾(Intel)、Nvidia、Movidius等都在研發(fā)深度學(xué)習(xí)芯片。
[0010] 但從上面所述看,不管是谷歌、百度等的大規(guī)模深度神經(jīng)網(wǎng)絡(luò),還是MIT等單位的 深度學(xué)習(xí)芯片,由于規(guī)模、功耗、體積、成本或計算效率等問題,現(xiàn)階段用于廣告?zhèn)髅酵斗沤K 端還存在一定的難度,目前階段在社區(qū)廣告宣傳欄、居民樓電梯、酒店大堂、機場、車站、商 場、寫字樓等廣告投放終端中,還無法利用深度學(xué)習(xí)技術(shù)實時識別用戶的性別、年齡、裝束 等身份特征信息,達不到廣告精準(zhǔn)投放的效果。
【發(fā)明內(nèi)容】
[0011] 針對現(xiàn)有廣告?zhèn)髅酵斗沤K端,包括但不限于社區(qū)廣告宣傳欄、居民樓電梯,酒店大 堂、機場、車站、商場、寫字樓等場景應(yīng)用的廣告投放終端,無法完成點對點的針對廣告投放 實時接收群體的特征識別進行精準(zhǔn)投放的問題,本實用新型專利提出了一種用于具有自主 推送功能廣告投放終端的細胞神經(jīng)網(wǎng)絡(luò)或卷積神經(jīng)網(wǎng)絡(luò)用戶識別系統(tǒng),以細胞神經(jīng)網(wǎng)絡(luò)或 卷積神經(jīng)網(wǎng)絡(luò)(Cellular/Convolutional Neural Networks,CNN)為核心,利用廣告?zhèn)髅酵?放終端前置加裝的攝像頭(圖像獲?。?、自帶的顯示屏、喇叭/耳機、內(nèi)存、微處理器MCU和電 池等廣告?zhèn)髅浇K端本身的硬件資源,構(gòu)造具有深度學(xué)習(xí)功能的神經(jīng)網(wǎng)絡(luò)用戶群體識別系 統(tǒng),其外設(shè)示意圖如圖5所示。本實用新型專利能夠?qū)崟r精準(zhǔn)地完成廣告投放對象的身份特 征識別,并且配置靈活,通過軟件配置即可完成不同的圖像特征、身份特征識別功能,通過 本實用新型專利完成廣告投放終端對用戶身份、特征識別后,廣告?zhèn)髅酵斗沤K端可根據(jù)識 別結(jié)果精確推送相適應(yīng)的個性化廣告信息。
[0012] 本實用新型專利提出的廣告?zhèn)髅酵斗沤K端中基于細胞神經(jīng)網(wǎng)絡(luò)或/卷積神經(jīng)網(wǎng)絡(luò) 的用戶識別系統(tǒng),其特征在于,包括如下組件:細胞卷積神經(jīng)網(wǎng)絡(luò)芯片、攝像頭、微處理器、 存儲介質(zhì)、音頻輸出設(shè)備、顯示屏和供電設(shè)備,其中:
[0013] 所述攝像頭獲取目標(biāo)圖像,其輸出連接到所述細胞卷積神經(jīng)網(wǎng)絡(luò)芯片的輸入;所 述細胞卷積神經(jīng)網(wǎng)絡(luò)芯片對接收的圖像信號進行處理得到圖像特征值,其與所述微處理器 雙向連接;所述存儲介質(zhì)與所述微處理器雙向連接;所述聲音輸出設(shè)備的輸入與所述微處 理器輸出單向連接;所述顯示屏的輸入與所述微處理器輸出單向連接;所述供電裝置的輸 出與所述微處理器輸入單向連接。
[0014] 優(yōu)選地,所述的廣告?zhèn)髅酵斗沤K端中基于細胞神經(jīng)網(wǎng)絡(luò)或卷積神經(jīng)網(wǎng)絡(luò)的用戶識 別系統(tǒng)可以內(nèi)置于廣告播放終端內(nèi),這種播放終端可以是公共場所任意具有視頻或圖片播 放功能的廣告終端,包括但不限于社區(qū)宣傳欄、居民樓電梯、酒店大堂、機場、車站、商場、寫 字樓,還包括公交設(shè)施,包括但不限于地鐵、鐵路列車、飛機的廣告播放終端。
[0015] 優(yōu)選地,所述的廣告?zhèn)髅酵斗沤K端中基于細胞神經(jīng)網(wǎng)絡(luò)或卷積神經(jīng)網(wǎng)絡(luò)的用戶識 別系統(tǒng)可以做成計算機板卡形式,以外接的形式插入廣告投放終端,構(gòu)建用于廣告接收群 體特征識別的大規(guī)模深度神經(jīng)網(wǎng)絡(luò)。
[0016] 優(yōu)選地,所述的廣告?zhèn)髅酵斗沤K端中基于細胞神經(jīng)網(wǎng)絡(luò)或卷積神經(jīng)網(wǎng)絡(luò)的用戶識 別系統(tǒng)工作參數(shù)可事先設(shè)置,并可在使用過程中通過軟件更改優(yōu)化設(shè)置。
[0017]優(yōu)選地,所述的輸入圖像既可以來自細胞神經(jīng)網(wǎng)絡(luò)或卷積神經(jīng)網(wǎng)絡(luò)內(nèi)置圖像獲取 模塊,也可來自播放終端的外置攝像頭。
[0018] 本實用新型專利提出的廣告?zhèn)髅酵斗沤K端中基于細胞神經(jīng)網(wǎng)絡(luò)或卷積神經(jīng)網(wǎng)絡(luò) 的用戶識別系統(tǒng),其特征在于,包括如下廣告播放終端所具有的組件以及其他必要的外設(shè) 裝置;外置攝像頭、細胞卷積神經(jīng)網(wǎng)絡(luò)芯片、微處理器、存儲介質(zhì)、音頻輸出設(shè)備、顯示屏和 供電裝置,其中,
[0019] 所述外置攝像頭輸出連接到所述細胞卷積神經(jīng)網(wǎng)絡(luò)芯片的輸入;所述細胞卷積神 經(jīng)網(wǎng)絡(luò)芯片與所述微處理器雙向連接;所述存儲介質(zhì)與所述微處理器雙向連接;所述音頻 輸出設(shè)備的輸入與所述微處理器輸出單向連接;所述顯示屏的輸入與所述微處理器輸出單 向連接;所述供電裝置的輸出與所述微處理器輸入單向連接;
[0020] 所述細胞卷積神經(jīng)網(wǎng)絡(luò)芯片由系統(tǒng)時鐘模塊、內(nèi)置圖像獲取模塊、數(shù)模變換模塊、 圖像處理模塊、通訊控制模塊、存儲器和細胞卷積神經(jīng)網(wǎng)絡(luò)模塊組成,其中,
[0021] 所述系統(tǒng)時鐘模塊的輸入連接到外部時鐘源,為所述智能視覺芯片提供內(nèi)置或外 置的工作時鐘;所述內(nèi)置圖像獲取模塊的輸出連接到所述細胞卷積神經(jīng)網(wǎng)絡(luò)模塊;所述數(shù) 模變換模塊的輸入連接到外部數(shù)字圖像源、輸出連接到所述圖像處理模塊;所述圖像處理 模塊的輸入還連接到外部模擬圖像源、輸出連接到所述細胞卷積神經(jīng)網(wǎng)絡(luò)模塊;所述細胞 卷積神經(jīng)網(wǎng)絡(luò)模塊對其接收的圖像信號進行處理得到圖像特征的值;所述存儲器與所述細 胞卷積神經(jīng)網(wǎng)絡(luò)模塊連接;所述通訊控制模塊與所述細胞卷積神經(jīng)網(wǎng)絡(luò)模塊雙向連接。 [0022]由上述方案可以看出,本實用新型圍繞細胞神經(jīng)網(wǎng)絡(luò)或卷積神經(jīng)網(wǎng)絡(luò)CNN芯片,利 用終端外接/內(nèi)置攝像頭、內(nèi)存、微處理器、音頻輸出設(shè)備、顯示屏和電源等,構(gòu)成具有用戶 群體識別的多媒體廣告精確推送終端,具有集成度高、功耗小、計算速度快、配置靈活、可以 按需進行多媒體廣告投放等特點。具有用戶群體識別的多媒體廣告精確推送終端像人類視 覺系統(tǒng)一樣,具有"看懂"世界的能力,從而能自主根據(jù)所識別的廣告接受用戶群體特征,精 準(zhǔn)推送廣告信息,提高廣告的投放精準(zhǔn)度,優(yōu)化廣告資源,提升廣告投放效率。
【附圖說明】
[0023]圖1是本實用新型提出的基于CNN技術(shù)的廣告接受用戶識別系統(tǒng)的框圖。
[0024] 圖2是4 X 4兩維蜂窩神經(jīng)網(wǎng)絡(luò)示意圖。
[0025]圖3是單個細胞等效電路的舉例。
[0026] 圖4是CNN芯片原理框圖。
[0027] 圖5是本實用新型提出的基于CNN技術(shù)的具有廣告接受用戶群體識別的多媒體廣 告精確推送終端與外設(shè)示意圖。
【具體實施方式】
[0028] 下面將結(jié)合附圖對本實用新型的具體實施例進行詳細描述。
[0029]本實用新型以先進的細胞神經(jīng)網(wǎng)絡(luò)或卷積神經(jīng)網(wǎng)絡(luò)(CNN)芯片為核心,利用攝像 頭、微處理器以及廣告播放終端(主要是顯示屏)、供電模塊、音頻輸出設(shè)備、存儲介質(zhì)等一 般廣告?zhèn)髅酵斗沤K端本身的硬件資源,構(gòu)造一個基于CNN技術(shù)的具有廣告接收用戶群體識 別系統(tǒng),用于多媒體廣告精確推送終端,其原理框圖如圖1所示。
[0030] 細胞神經(jīng)網(wǎng)絡(luò)或卷積神經(jīng)網(wǎng)絡(luò)(CNN)芯片:用于圖像特征提取,提取出攝像頭送 來的圖像或視頻中的所關(guān)注的圖像主要特征。CNN芯片的核心是細胞神經(jīng)網(wǎng)絡(luò)或卷積神經(jīng) 網(wǎng)絡(luò)(CNN),CNN網(wǎng)絡(luò)的原理框圖如圖2所示,CNN網(wǎng)絡(luò)可以構(gòu)建現(xiàn)在正火熱的深度學(xué)習(xí)系統(tǒng)。 如同人類的神經(jīng)網(wǎng)絡(luò),CNN由大量非線性模擬電路組成,能夠?qū)崟r處理輸入的信號,當(dāng)然現(xiàn) 在這些非線性模擬電路的功能也可以采用數(shù)字電路來實現(xiàn)。這些非線性模擬電路構(gòu)成的單 元稱之為細胞(Cell),達數(shù)百萬個的細胞按一定的規(guī)則排列,只有最鄰近的細胞才直接互 相相連,交換信息。遠端的細胞通過耦合間接地發(fā)揮影響。每個細胞由線性電容、線性電阻、 非線性的壓控電流源、獨立的電壓源和獨立的電流源等組成,如圖3所示,也可以用數(shù)字電 路實現(xiàn)與圖3等效的功能。CNN利用了模擬和數(shù)字兩個世界的優(yōu)勢,它的連續(xù)時間特性可以 實時處理信號,本地互聯(lián)特性使得它便于大規(guī)模集成電路實現(xiàn),CNN特別適用于圖像、視頻 信號平行處理。
[0031] 圖2給出的是二維一層CNN網(wǎng)絡(luò)結(jié)構(gòu),可以進一步構(gòu)筑多層的CNN,增加學(xué)習(xí)的深 度,如同現(xiàn)在的深度學(xué)習(xí)網(wǎng)絡(luò)架構(gòu)。CNN細胞的參數(shù)是可以通過事先設(shè)置,并在后面使用過 程中通過程序再次設(shè)置。
[0032]不同的CNN細胞、不同的CNN層可以完成不同的圖像處理功能,比如不同細胞分別 完成圖像降噪、圖像紋理、邊緣檢測、圖像分割、凸凹角檢測、邊界提取、孔洞填充、骨架提 取、裁剪等,從而實時地得到圖像的各種特征,便于后續(xù)利用系統(tǒng)中微處理器MCU進一步實 現(xiàn)圖像識別、表示和描述。當(dāng)然,圖像的識別、表示和描述同樣可以由不同配置的CNN實現(xiàn)。 [0033] CNN獲得的圖像特征信號可以直接送給系統(tǒng)中的微處理器M⑶,兩者連接接口可以 是串行或并行數(shù)據(jù)接口。
[0034]關(guān)于CNN更詳細的原理,請參見1988年楊林博士發(fā)表的如下兩篇產(chǎn)生了廣泛影響 的"細胞神經(jīng)網(wǎng)絡(luò)"論文和相關(guān)發(fā)明專利:
[0035] Leon 0 , Chua ; Lin Yang,"Cel lular Neural Networks : Theory",IEEE Trans.Circuits and Systems,vol.35(10)0ct.1988,pp.1257-1272.
[0036] Leon 0,Chua;Lin Yang,"Cellular Neural Networks Applications,"IEEE Trans-Circuits and Systems,vol.35(10)0ct.1988,pp.1273-1290.
[0037] Leon 0,Chua;Lin Yang,"Cellular Neural Network",United States Patent, Patent Number:5,I40,670,Date of Patent:Aug.18,1992.
[0038] 在論文中,楊林博士提出了幾個關(guān)鍵的基礎(chǔ)性概念:并行處理、模擬電路、鄰域直 接連接、非鄰域間接作用、非線性器件、多層網(wǎng)絡(luò)、卷積算子、參數(shù)重新配置、應(yīng)用于圖像處 理等,為神經(jīng)網(wǎng)絡(luò)的發(fā)展奠定了良好的基礎(chǔ)。
[0039] 基于CNN原理,已完成集成電路-智能視覺芯片(Smart Vision Integrated Circuit,SViC)的設(shè)計和流片。
[0040] 外置攝像頭:用于拍攝我們所關(guān)注或要處理的播放目標(biāo)人群的圖像或視頻,把獲 得的圖像或者視頻送給CNN芯片。市場上攝像頭非常多,一般都能滿足本實施例的要求,本 實施例中采用了索尼頂X135,采用背照式成像傳感器,分辨率為4224X3176。
[0041 ] 微處理器MCU:微處理器MCU可以和CNN芯片通訊,設(shè)置和檢查CNN芯片的工作狀態(tài), 設(shè)置CNN芯片的初始工作模式。在系統(tǒng)運行期間,它可以讀取CNN芯片的工作狀態(tài),并重新設(shè) 置CNN中各個細胞的配置參數(shù),獲得不同的圖像特征。根據(jù)所選用微處理器的能力,讓微處 理器依據(jù)CNN獲得的圖像特征,參與部分圖像識別工作,例如本實施例中采用了三星公司的 S5PV210作為微處理器,內(nèi)核為ARM CortexTM-A8,它具有強大的運算和控制能力,可以運行 某些圖像識別算法,從而使微處理器和CNN芯片配合加速完成不同的圖像識別功能,提高識 別速度和識別性能,起到加速器的作用。依靠識別出的圖像內(nèi)容,可以幫助廣告播放終端, 識別廣告播放接收人群,比如,通過對用戶性別、年齡、穿著的圖片及視頻內(nèi)容判斷用戶的 行為和喜好;根據(jù)識別結(jié)果選擇播放目標(biāo)人群可能最感興趣的廣告或者宣傳視頻。另外,多 媒體廣告細胞神經(jīng)網(wǎng)絡(luò)或卷積神經(jīng)網(wǎng)絡(luò)精確推送終端像人類視覺系統(tǒng)一樣,具有"看懂"世 界的能力,從而能自主適應(yīng)更復(fù)雜的環(huán)境,而不是像現(xiàn)在只有光傳感器,只能感知外部光強 的變化,僅僅調(diào)節(jié)屏幕亮度。
[0042]存儲介質(zhì):用于保存CNN芯片和微處理器等涉及到的輸入的原始數(shù)據(jù)、中間計算結(jié) 果和最終的圖像特征數(shù)值等,以及保存預(yù)先制作的一些錄音、文字、圖片、視頻等內(nèi)容。CNN 芯片自身也有存儲器,也可以部分保存圖像特征過程中涉及到的數(shù)據(jù)。本實施例中內(nèi)存選 用了美光MT47H64M16HR,是DDR2SDRAM,容量1Gbit。微處理器的Flash擴展采用了三星 K9F1G08U0E,屬于NAND Flash,容量為IGb0
[0043]音頻輸出設(shè)備:用于播放語音信息。本實施例對揚聲器沒有特殊要求,一般市場上 的揚聲器都可滿足要求。
[0044]顯示屏LCD:用于展示相關(guān)圖片或視頻資料,組成廣告播放終端。根據(jù)需要,可以從 市場上選購不同尺寸的通用液晶顯示屏。
[0045]供電裝置:用于給CNN芯片和系統(tǒng)提供所需的穩(wěn)定供電。
[0046]本實用新型所采用的CNN芯片方案和現(xiàn)有的常見架構(gòu)方案的比較見表1,從中可以 看到本實用新型提出的CNN芯片架構(gòu)方案具有的優(yōu)點包括電子器件集成化程度高,芯片功 耗小,集成電路芯片功耗小于50毫瓦,具有顯著的低功耗、高性價比的功效。適合在小型智 能設(shè)備中使用,市場潛力巨大;采用CNN技術(shù),實時從所獲得的視覺圖像中提取圖像圖形特 征數(shù)據(jù),提取運算時間是目前世界公布的運算提取時間的十分之一左右;CNN芯片設(shè)計內(nèi)部 有數(shù)百萬個視覺神經(jīng)細胞單元,采用可設(shè)置(預(yù)置、網(wǎng)絡(luò)修改)神經(jīng)細胞網(wǎng)絡(luò)層數(shù),和每層 細胞的功能參數(shù),可以靈活改變該芯片的應(yīng)用范圍。
[0047]表1產(chǎn)品方案比較
[0049] 在本實施例中,除了用到上述實施例中所述的多媒體廣告推送終端和一些相關(guān)外 設(shè)之外,可能用到CNN芯片內(nèi)部的以下模塊,如圖4所示。
[0050] 內(nèi)置圖像獲取模塊:它由大量的光傳感器組成,每個CNN細胞有一個單獨的光傳感 器相連,每個光傳感器檢測圖像的一部分,得到相應(yīng)CNN細胞的輸入數(shù)據(jù)。CNN細胞能夠并行 高速接收輸入信號,每個CNN細胞專用于處理輸入圖像的單個像素,以便實時獲得圖像識別 結(jié)果??梢酝ㄟ^芯片封裝上的透明窗口,把要處理的圖像或數(shù)據(jù)直接投射到CNN芯上。
[0051] 外部圖像源和數(shù)模變換模塊:CNN芯片除了上述內(nèi)置的圖像獲取模塊外,也支持外 部圖像源的輸入。外部圖像源可能是攝像機、手機、計算機或視頻播放器等,物理接口支持 BNC、分離視頻信號接口 YUV/RGB、S-Video端子、復(fù)合視頻信號0^3、此4、1^8、^11等。外部 圖像源產(chǎn)生的圖像信號可能是模擬的或數(shù)字的,若是模擬的,則直接送給CNN單元,但若是 數(shù)字的,則送給數(shù)模變換模塊,完成數(shù)字圖像信號到模擬信號的轉(zhuǎn)換,得到相應(yīng)的模擬信 號,經(jīng)圖像處理模塊后再送給CNN單元。
[0052] 在本實施例中,作為廣告投放終端外置CNN用戶識別系統(tǒng),圖像源既可以選擇CNN 芯片內(nèi)置圖像獲取模塊,也可以通過廣告投放終端USB接口把廣告投放終端外置攝像頭作 為外部圖像源。
[0053]圖像處理模塊:對外部輸入的圖像信號進行一些技術(shù)處理,比如對輸入信號進行 幅度限幅處理,歸一化為[-1,1]之間,以便滿足CNN對輸入幅度的要求;伽馬校正,以獲得更 好的動態(tài)分布,等。
[0054]系統(tǒng)時鐘模塊:CNN芯片SVIC支持內(nèi)置時鐘和外部時鐘。在本實施例中,采用了CNN 芯片內(nèi)置時鐘。
[0055]存儲器:用于保存輸入的原始數(shù)據(jù)、中間計算結(jié)果和CNN最終的圖像特征數(shù)值等, 存儲器是內(nèi)置在CNN里面的。存儲器采用數(shù)字存儲器或模擬存儲器,采用模擬存儲器更能降 低功耗。
[0056]通訊/控制模塊:完成CNN芯片和外部的命令、數(shù)據(jù)交換,支持串行數(shù)據(jù)接口,包括 USB、I2C等;并行數(shù)據(jù)接口,RJ45接口的千兆以太網(wǎng),以及無線網(wǎng)絡(luò)接口,包括WiFi和藍牙。
[0057]上述【具體實施方式】以較佳實施案例對本實用新型進行了說明,但這只是為了便于 理解而舉的一個形象化的實例,不應(yīng)被視為是對本實用新型范圍的限制。同樣,根據(jù)本實用 新型的技術(shù)方案及其較佳實施案例的描述,可以做出各種可能的等同改變或替換,而所有 這些改變或替換都應(yīng)屬于本實用新型權(quán)利要求的保護范圍。
【主權(quán)項】
1. 廣告?zhèn)髅酵斗沤K端中基于細胞神經(jīng)網(wǎng)絡(luò)或卷積神經(jīng)網(wǎng)絡(luò)的用戶識別系統(tǒng),其特征在 于,包括如下組件:細胞卷積神經(jīng)網(wǎng)絡(luò)芯片、攝像頭、微處理器、存儲介質(zhì)、音頻輸出設(shè)備、顯 示屏和供電設(shè)備,其中: 所述攝像頭獲取目標(biāo)圖像,其輸出連接到所述細胞卷積神經(jīng)網(wǎng)絡(luò)芯片的輸入; 所述細胞卷積神經(jīng)網(wǎng)絡(luò)芯片對接收的圖像信號進行處理得到圖像特征值,其與所述微 處理器雙向連接; 所述存儲介質(zhì)與所述微處理器雙向連接; 所述聲音輸出設(shè)備的輸入與所述微處理器輸出單向連接; 所述顯示屏的輸入與所述微處理器輸出單向連接; 所述供電裝置的輸出與所述微處理器輸入單向連接。2. 根據(jù)權(quán)利要求1所述的廣告?zhèn)髅酵斗沤K端中基于細胞神經(jīng)網(wǎng)絡(luò)或卷積神經(jīng)網(wǎng)絡(luò)的用 戶識別系統(tǒng),其特征在于,所述的廣告?zhèn)髅酵斗沤K端中基于細胞神經(jīng)網(wǎng)絡(luò)或卷積神經(jīng)網(wǎng)絡(luò) 的用戶識別系統(tǒng)可以內(nèi)置于廣告播放終端內(nèi),這種播放終端可以是公共場所任意具有視頻 或圖片播放功能的廣告終端,包括但不限于社區(qū)宣傳欄、居民樓電梯、酒店大堂、機場、車 站、商場、寫字樓,還包括公交設(shè)施,包括但不限于地鐵、鐵路列車、飛機的廣告播放終端。3. 根據(jù)權(quán)利要求1所述的廣告?zhèn)髅酵斗沤K端中基于細胞神經(jīng)網(wǎng)絡(luò)或卷積神經(jīng)網(wǎng)絡(luò)的用 戶識別系統(tǒng),其特征在于,所述的廣告?zhèn)髅酵斗沤K端中基于細胞神經(jīng)網(wǎng)絡(luò)或卷積神經(jīng)網(wǎng)絡(luò) 的用戶識別系統(tǒng)可以做成計算機板卡形式,以外接的形式插入廣告投放終端,構(gòu)建用于廣 告接收群體特征識別的大規(guī)模深度神經(jīng)網(wǎng)絡(luò)。4. 根據(jù)權(quán)利要求1所述的廣告?zhèn)髅酵斗沤K端中基于細胞神經(jīng)網(wǎng)絡(luò)或卷積神經(jīng)網(wǎng)絡(luò)的用 戶識別系統(tǒng),其特征在于,所述的廣告?zhèn)髅酵斗沤K端中基于細胞神經(jīng)網(wǎng)絡(luò)或卷積神經(jīng)網(wǎng)絡(luò) 的用戶識別系統(tǒng)工作參數(shù)可事先設(shè)置,并可在使用過程中通過軟件更改優(yōu)化設(shè)置。5. 根據(jù)權(quán)利要求1所述的廣告?zhèn)髅酵斗沤K端中基于細胞神經(jīng)網(wǎng)絡(luò)或卷積神經(jīng)網(wǎng)絡(luò)的用 戶識別系統(tǒng),其特征在于,所述的輸入圖像既可以來自細胞神經(jīng)網(wǎng)絡(luò)或卷積神經(jīng)網(wǎng)絡(luò)內(nèi)置 圖像獲取模塊,也可來自播放終端的外置攝像頭。6. 廣告?zhèn)髅酵斗沤K端中基于細胞神經(jīng)網(wǎng)絡(luò)或卷積神經(jīng)網(wǎng)絡(luò)的用戶識別系統(tǒng),其特征在 于,包括如下廣告播放終端所具有的組件以及其他必要的外設(shè)裝置:外置攝像頭、細胞卷積 神經(jīng)網(wǎng)絡(luò)芯片、微處理器、存儲介質(zhì)、音頻輸出設(shè)備、顯示屏和供電裝置,其中, 所述外置攝像頭輸出連接到所述細胞卷積神經(jīng)網(wǎng)絡(luò)芯片的輸入; 所述細胞卷積神經(jīng)網(wǎng)絡(luò)芯片與所述微處理器雙向連接; 所述存儲介質(zhì)與所述微處理器雙向連接; 所述音頻輸出設(shè)備的輸入與所述微處理器輸出單向連接; 所述顯示屏的輸入與所述微處理器輸出單向連接; 所述供電裝置的輸出與所述微處理器輸入單向連接; 所述細胞卷積神經(jīng)網(wǎng)絡(luò)芯片由系統(tǒng)時鐘模塊、內(nèi)置圖像獲取模塊、數(shù)模變換模塊、圖像 處理模塊、通訊控制模塊、存儲器和細胞卷積神經(jīng)網(wǎng)絡(luò)模塊組成,其中, 所述系統(tǒng)時鐘模塊的輸入連接到外部時鐘源,為所述細胞卷積神經(jīng)網(wǎng)絡(luò)芯片提供內(nèi)置 或外置的工作時鐘; 所述內(nèi)置圖像獲取模塊的輸出連接到所述細胞卷積神經(jīng)網(wǎng)絡(luò)模塊; 所述數(shù)模變換模塊的輸入連接到外部數(shù)字圖像源、輸出連接到所述圖像處理模塊; 所述圖像處理模塊的輸入還連接到外部模擬圖像源、輸出連接到所述細胞卷積神經(jīng)網(wǎng) 絡(luò)豐吳塊; 所述細胞卷積神經(jīng)網(wǎng)絡(luò)模塊對其接收的圖像信號進行處理得到圖像特征的值; 所述存儲器與所述細胞卷積神經(jīng)網(wǎng)絡(luò)模塊連接; 所述通訊控制模塊與所述細胞卷積神經(jīng)網(wǎng)絡(luò)模塊雙向連接。
【文檔編號】G06K9/00GK205665733SQ201620270009
【公開日】2016年10月26日
【申請日】2016年4月5日
【發(fā)明人】李江, 陳進民
【申請人】陳進民