基于Hadoop的集成電路版圖轉(zhuǎn)換方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于計算機技術(shù)領(lǐng)域,更進一步涉及集成電路技術(shù)和計算機分布式數(shù)據(jù)處 理領(lǐng)域中的一種基于分布式處理軟件框架Hadoop的集成電路版圖轉(zhuǎn)換方法。本發(fā)明應(yīng)用 分布式文件系統(tǒng)(HadoopDistributedFileSystem,HDFS)對輸入文件進行分布式的存儲 及應(yīng)用映射-化簡(MapReduce)架構(gòu)中的映射(map)函數(shù)對集成電路版圖的加州理工中介 格式CIF(CaltechIntermediateForm)文檔進行分割、提取信息和轉(zhuǎn)換圖像等操作,可用 于高效率地把大規(guī)模的集成電路版圖的加州理工中介格式CIF文檔轉(zhuǎn)換為位圖(Bitmap, BMP)的圖像版圖。
【背景技術(shù)】
[0002] 隨著半導(dǎo)體產(chǎn)業(yè)的不斷發(fā)展,超大規(guī)模集成電路的發(fā)展應(yīng)運而生。在電路規(guī)模不 斷擴大、特征尺寸不斷縮小的情況下保持或提高集成電路的成品率已成為集成電路制造中 的關(guān)鍵問題。而關(guān)鍵面積是衡量集成電路成品率的一個重要指標。版圖中的線網(wǎng)和隨機缺 陷輪廓大多數(shù)是非規(guī)則形狀的,在平面版圖上可以更加直觀的計算線網(wǎng)的關(guān)鍵面積及優(yōu)化 隨機缺陷。為了精確計算版圖的關(guān)鍵面積以及能夠更加方便和高效地處理和優(yōu)化版圖圖 像,需要將版圖文件轉(zhuǎn)換為圖像文件。
[0003] JunpingWang,SuyangQi,DanXu發(fā)表的論文"AStudyonCIF-to-BMPFormat TransformationAlgorithm"(AdvancedMaterialsResearch,pp. 2510-2513, 2013)中提 出一種將版圖格式的文檔轉(zhuǎn)換為圖像格式文件的方法。該方法以集成電路版圖的加州理工 中介格式CIF文檔命令和位圖BMP為基礎(chǔ),能實現(xiàn)集成電路版圖的加州理工中介格式CIF 文檔的圖元轉(zhuǎn)換為位圖BMP的圖像。該方法的基本思想是讀入集成電路版圖的加州理工 中介格式CIF文檔名,通過文件的美國標準信息交換代碼(AmericanStandardCodefor InformationInterchange,ASCII)的文本形式,得出文件中的集成電路版圖中圖元以及各 層的信息;順序選擇層名,由層名得到對應(yīng)的圖元,同時,由層名確定圖元的顏色進而對其 進行顏色填充;然后,讀入圖元的數(shù)據(jù),算出各個圖元的信息,選擇圖元的類型,用二維數(shù)組 存儲轉(zhuǎn)換的圖形數(shù)據(jù);最后,輸出位圖BMP的圖像文件。該方法能夠完成從集成電路版圖的 加州理工中介格式CIF文檔轉(zhuǎn)換為位圖BMP的圖像文件。但是該方法仍然存在的不足是, 該方法只能轉(zhuǎn)換一幅圖像版圖,無法進行大規(guī)模的集成電路版圖的加州理工中介格式CIF 文檔的版圖轉(zhuǎn)換;該方法的版圖轉(zhuǎn)換過程很不穩(wěn)定,常常會產(chǎn)生空白圖像;該方法的轉(zhuǎn)換 效率很低,數(shù)據(jù)處理上也有待改進。
[0004] RongWei,JunpingWang,RunsenXing,XingeHong,RuipingFeng,PengLi,and SuyangQi發(fā)表的論文"ANewExtractionAlgorithmofImageLayoutBasedonSliding Window"(ASID2014,pp. 68-71,2014)提出了一種基于滑動窗口的圖像版圖轉(zhuǎn)換方法。該方 法的基本思想:首先讀入集成電路版圖的加州理工中介格式CIF格式文檔,得出整個集成 電路版圖的加州理工中介格式CIF文檔的版圖所在的矩形范圍,從而得到要轉(zhuǎn)換的圖像版 圖的精確范圍;其次逐條讀取集成電路版圖的加州理工中介格式CIF文檔命令,按設(shè)置好 的比例參數(shù)壓縮數(shù)據(jù),并轉(zhuǎn)化為統(tǒng)一的紅綠藍(RedGreenBlue,RGB)數(shù)據(jù)格式保存在畫圖 數(shù)組中;然后再次讀取畫圖數(shù)據(jù),確定圖形的位置和范圍,并填充相應(yīng)的顏色;最后從集成 電路版圖的加州理工中介格式CIF文檔版圖矩形范圍的左下角開始,逐個輸出輸出窗口內(nèi) 的圖像版圖,并滑動輸出窗口到下一個指定的輸出位置。該方法采用程序統(tǒng)計并計算出精 確的提取參數(shù),可以避免人為估值的不準確性。借助滑動窗口的滑動,可以將較大的集成電 路版圖的加州理工中介格式CIF文檔版圖分區(qū)域輸出為多幅連續(xù)的圖像版圖,實現(xiàn)了較大 的集成電路版圖的加州理工中介格式CIF文檔版圖的完整轉(zhuǎn)換。但是,該方法仍然存在的 不足是,該方法是基于單機串行處理數(shù)據(jù)的,對于大規(guī)模的版圖轉(zhuǎn)換,集成電路版圖的加州 理工中介格式CIF文檔中的命令行數(shù)越多,要轉(zhuǎn)換的圖像版圖范圍越大,轉(zhuǎn)換時間會很長, 效率會變低。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明的目的在于克服上述現(xiàn)有技術(shù)的不足,提出一種基于Hadoop的集成電路 版圖轉(zhuǎn)換方法,該方法可以提高集成電路版圖的加州理工中介格式CIF文檔版圖轉(zhuǎn)換為位 圖BMP的效率,解決在單機串行上轉(zhuǎn)換時效率低的問題。
[0006] 本發(fā)明的具體步驟如下:
[0007] (1)預(yù)處理文檔:
[0008] (la)將集成電路版圖的加州理工中介格式CIF文檔轉(zhuǎn)化成文本文件txt類型的文 檔;
[0009] (lb)刪除集成電路版圖的加州理工中介格式CIF文檔中說明集成電路版圖信息 的注釋語句,并刪除集成電路版圖的加州理工中介格式CIF文檔中除了文件結(jié)束標志語句 之外的語法命令語句;將刪除后保留基本圖元的圖形定義語句和文件結(jié)束標志語句的文檔 作為預(yù)處理后的文檔;
[0010] (2)上傳文檔:
[0011] 將預(yù)處理后的文檔,通過Eelipse插件上傳至分布式處理軟件框架Hadoop集群中 的分布式文件系統(tǒng)HDFS中;
[0012] (3)分塊存儲文檔數(shù)據(jù):
[0013] 分布式處理軟件框架Hadoop集群中的分布式文件系統(tǒng)HDFS,對上傳到該系統(tǒng)中 預(yù)處理后的文檔數(shù)據(jù)進行分塊存儲;
[0014] (4)設(shè)置映射map類:
[0015] (4a)將文檔數(shù)據(jù)塊中文本文件的一行由文本文件txt類型轉(zhuǎn)換為字符串string 類型,得到一個字符串;將該字符串在逗號和空格處進行分割,分割成子字符串,將分割后 的子字符串按其在分割前字符串中的先后順序依次存入字符串數(shù)組中;
[0016] (4b)將字符串數(shù)組中第一個元素的格式轉(zhuǎn)換為字符類型,將該字符類型的元素賦 值給字符變量wb;將字符串數(shù)組中其余元素的格式均轉(zhuǎn)換為整數(shù)類型,將整數(shù)類型的元素 保存到整數(shù)類型的一維數(shù)組中;
[0017] (4c)分析字符變量wb的內(nèi)容,如果字符變量wb中存儲的字符是字符"B、R、W、P" 中的一個時,執(zhí)行步驟(4d),如果字符變量wb中存儲的字符是字符"E"時,執(zhí)行步驟(4e);
[0018] (4d)根據(jù)集成電路版圖的加州理工中介格式CIF命令的語法格式,讀取整數(shù)類型 的一維數(shù)組中的數(shù)據(jù),采用像素畫圖方法,將集成電路版圖中的基本圖元轉(zhuǎn)換為像素矩陣 的形式,將基本圖元的像素矩陣保存到四維數(shù)組中;
[0019] (4e)將四維數(shù)組中基本圖元的像素矩陣用位圖BMP的形式分塊輸出;
[0020] (5)提交任務(wù):
[0021] 初始化任務(wù)Job,將任務(wù)Job提交到分布式處理軟件框架Hadoop集群中。
[0022] 本發(fā)明與現(xiàn)有的技術(shù)相比具有以下優(yōu)點:
[0023] 第1,由于本發(fā)明使用Hadoop集群轉(zhuǎn)換集成電路的版圖,克服了現(xiàn)有技術(shù)中對集 成電路的大規(guī)模版圖轉(zhuǎn)換效率低的缺點,使得本發(fā)明提高了集成電路的大規(guī)模版圖的轉(zhuǎn)換 效率。
[0024] 第2,由于本發(fā)明使用分布式文件系統(tǒng)HDFS對文檔數(shù)據(jù)進行處理,克服了現(xiàn)有技 術(shù)中對集成電路的版圖轉(zhuǎn)換過程不穩(wěn)定,出現(xiàn)空白圖像的缺點,使得本發(fā)明中的版圖轉(zhuǎn)換 效果更好,提高了集成電路的版圖轉(zhuǎn)換過程的穩(wěn)定性。
【附圖說明】
[0025] 圖1為本發(fā)明的的流程圖;
[0026] 圖2為本發(fā)明與現(xiàn)有方法的轉(zhuǎn)換時間比較圖。
【具體實施方式】
[0027] 下面結(jié)合附圖對本發(fā)明做進一步的描述。
[0028]參照圖1,本發(fā)明的具體實施步驟如下:
[0029]步驟1,預(yù)處理文檔。
[0030] 第一步,將集成電路版圖的加州理工中介格式CIF文檔轉(zhuǎn)化成文本文件txt類型 的文檔;
[0031] 第二步,刪除集成電路版圖的加州理工中介格式CIF文檔中說明集成電路版圖信 息的注釋語句,并刪除集成電路版圖的加州理工中介格式CIF文檔中除了文件結(jié)束標志語 句之外的語法命令語句。將刪除后保留基本圖元的圖形定義語句和文件結(jié)束標志語句的文 檔作為預(yù)處理后的文檔。集成電路版圖的加州理工中介格式CIF文檔中定義圖元命令的第 一個字符表示集成電路版圖中的基本圖元的形狀,字符"B"表示矩形,其后的數(shù)據(jù)依次表示 矩形的長、寬、橫坐標和豎坐標的值;字符"R"表示圓形,其后的數(shù)據(jù)依次表示圓形的直徑、 橫坐標和豎坐標的值;字符"W"表示有寬度的線條,其后的數(shù)據(jù)依次表示有寬度的線條的 寬度、折點的橫坐標和豎坐標的值;字符"P"表示多邊形,其后的數(shù)據(jù)依次表示多邊形的頂 點的橫坐標和豎坐標的值。集成電路版圖的加州理工中介格式CIF文檔的文件結(jié)束標志語 句中,字符"E"表示整個集成電路版圖的加州理工中介格式CIF文檔的結(jié)束。
[0032] 步驟2,上傳文檔。
[0033] 將預(yù)處理后的文檔通過Eclipse插件上傳至分布式處理軟件框架Hadoop集群中 的分布式文件系統(tǒng)HDFS中。上傳文檔的具體步驟如下:
[0034] 第一步,修改分布式處理軟件框架Hadoop集群中的插件Eclipse上本地haoop中 映射-化簡主節(jié)點的地址為主機節(jié)點的地址192. 168. 1. 219,映射-化簡主節(jié)點的端口號為 主機節(jié)點的端口 9001,本地haoop中分布式系統(tǒng)主節(jié)點的端口號為9000,用戶名為hadoop, 使插件Eclipse與分布式處理軟件框架Hadoop集群連接;
[0035] 第二步,在分布式處理軟件框架Hadoop集群中的分布式文件系統(tǒng)HDFS中建立一 個輸入文件夾Input,通過插件Eclipse將本地文件上傳到分布式文件系統(tǒng)HDFS中。
[0036] 步驟3,文檔數(shù)據(jù)分塊。
[0037] 第一步,將分布式處理軟件框架Hadoop集群中數(shù)據(jù)塊