本發(fā)明涉及圖像處理領域,且特別涉及一種應用于閱卷系統(tǒng)的圖像污染處理方法。
背景技術:
近年來,隨著信息技術的不斷升級發(fā)展,移動終端設備的使用已經越來越普及,更方便快捷、高效地工作、學習方式已越發(fā)受到人們的青睞。在傳統(tǒng)的教育領域,已逐漸開展新一代的教育信息化升級探索。在國內現有的基礎教育階段,學生學習狀況的主要考察形式仍然是各種類型的考試,大至高考、中考,小至基層教師日常家庭作業(yè)、單元考試,以及各類期中期末考試、會考、聯考、模考等。在此狀況下,教師背負著很大的批改作業(yè)和試卷的工作量壓力。
因而各類標準化輔助考試方法已逐漸在各類大型考試中使用,如光標閱讀機(Optical Mark Reader,OMR)進行答題卡自動閱卷處理的方式。光標閱讀機用光學掃描的方法來識別按一定格式印刷或書寫的標記,并將其轉換為計算機能接受的電信號,從而實現自動閱卷。光標閱讀機的優(yōu)點是對于高配合、符合要求的答題卡,其閱讀準確(即對涂點的識別有極高的精確度,誤碼率小于千萬分之一)、閱讀速度快,每秒鐘可以處理一千多個信息點(處理速度以A4幅面計,每小時五千張)。這種處理方式很大程度上減輕了教師批改試卷的工作量壓力,但其也存在很多缺點,例如整套硬件設備價格昂貴、答題卡質量要求苛刻等,所以,迄今為止,除在大型重要選拔類考試(高考、中考)中能夠被使用外,其它更多的常規(guī)考試閱卷工作無法使用該系統(tǒng)。
因此,隨之出現的網上閱卷系統(tǒng),特別針對客觀題,通過電子掃描、圖像識別技術實現自動評分,大大提高了閱卷效率。目前采用計算機網絡技術和掃描技術的網上評卷作為一種新的評卷方式,得到了廣泛地應用。其方法是,先將考生答題卡通過高速掃描儀,以圖像方式原原本本掃描到系統(tǒng)中,形成電子版答卷,該過程中對考生的原始圖像不作任何識別性修改,使掃描到系統(tǒng)中的電子版答卷與考生實際答卷完全一致,并通過計算機各類存儲設備加以存儲和管理。
圖像識別軟件首先識別答題卡周邊已經印好的定位標記塊(這些標記塊的尺寸標準、黑度標準,容易識別),據此建立圖像的坐標系。圖像識別軟件根據已經存儲在內存中的各個選項的印刷位置(相對于標記塊的位置),定位各道題的各個選項在圖像上的位置(坐標)。以這些位置為中心,選取一定區(qū)域的像素(通常比允許答題者涂的范圍小一些),計算每個區(qū)域內所有像素的灰度值的總和,與某個門限值進行比對,高于它就認為答題者涂上了(選擇了這個選項)。圖像識別軟件把識別出的選項集與標準答案進行比對,確定答題者涂中的每道題的答案是否正確。
在圖像識別中,由于圖像需要做預處理,將圖像的噪聲進行減少,使得后續(xù)的識別過程得以簡化和可行,且提高識別的準確度,因此前期的降噪顯得較為重要。
由于使用的答題卡是普通紙張,打印后分發(fā)給學生進行作答,因此會出現筆墨污染和摩擦。
轉換到圖像處理領域,這些摩擦和污染大致可劃分為:
1,圖像模糊
2,圖像噪聲
3,圖像破壞
對于當前的使用場景噪聲來說,由于絕大部分噪聲不是狄拉克沖擊,僅此噪聲點之間存在一定的關聯和關系。通過考察可以發(fā)現,在正常的墨跡污染中,噪聲是成團出現,且孤點或孤島并不是非常多;同時此類噪聲存在一定的一般特征,即滿足中心點區(qū)域墨跡最濃并向四周擴散而變淡。
由于答題卡在印制的過程中,印制自身的墨跡是相對較濃,學生填涂的墨跡相對印刷體會淡一些但比噪聲會更濃。轉換為數字圖像按照灰階排序的一般情況為:
印刷體<學生填涂<噪聲
由此可見,只需要找出一個給定的中間閾值,將圖像進行增強即可減少很大一部分的噪聲,在增強的過程中同時也要考慮將印刷體和學生填涂部分連同增強以便后續(xù)識別。
技術實現要素:
本發(fā)明提出一種應用于閱卷系統(tǒng)的圖像污染處理方法,能有效降低答題卡圖像的噪聲,提高答題卡圖像識別的正確率。
為了達到上述目的,本發(fā)明提出一種應用于閱卷系統(tǒng)的圖像污染處理方法,包括下列步驟:
步驟a,獲取答題卡圖像灰度直方圖;
步驟b,將所述圖像灰度直方圖進行拉伸處理;
步驟c,判斷處理后的圖像灰度直方圖中設定目標區(qū)間內是否有像素出現;
步驟d,當設定目標區(qū)間內沒有像素出現時,設定灰度拉伸中間值,將灰度值小于所述灰度拉伸中間值的全部像素的灰度值降低第一設定值,同時將灰度值大于所述灰度拉伸中間值的全部像素的灰度值增加第一設定值;
步驟e,判斷步驟d的處理次數是否達到第二設定值的次數,若已經達到第二設定值的次數時停止對所述圖像灰度進行處理;
步驟f,當設定目標區(qū)間內沒有像素出現,并且步驟d的處理次數尚未達到第二設定值時,返回步驟b對所述圖像灰度進行進一步處理;
步驟g,當設定目標區(qū)間內有像素出現時,停止對所述圖像灰度進行處理。
進一步的,所述灰度拉伸中間值為128。
進一步的,所述第一設定值為5~20。
進一步的,所述第一設定值為10。
進一步的,所述第二設定值為5~10。
進一步的,所述第二設定值為7。
進一步的,所述對圖像灰度直方圖進行拉伸處理為進行對數變換處理。
進一步的,所述步驟c中的設定目標區(qū)間為0~4。
本發(fā)明提出的應用于閱卷系統(tǒng)的圖像污染處理方法,通過設定灰度拉伸中間值作為灰度拉伸處理的閥值,將灰度值小于所述灰度拉伸中間值的全部像素的灰度值降低第一設定值,同時將灰度值大于所述灰度拉伸中間值的全部像素的灰度值增加第一設定值,直至圖像灰度直方圖經過對數變換拉伸處理后的設定目標區(qū)間出現像素或者達到處理次數設定值后停止處理,從而增強答題卡圖像的印刷體和學生填涂部分,同時降低污染部分的噪聲,達到提高答題卡圖像識別正確率的效果。
附圖說明
圖1所示為本發(fā)明較佳實施例的應用于閱卷系統(tǒng)的圖像污染處理方法流程圖。
具體實施方式
以下結合附圖給出本發(fā)明的具體實施方式,但本發(fā)明不限于以下的實施方式。根據下面說明和權利要求書,本發(fā)明的優(yōu)點和特征將更清楚。需說明的是,附圖均采用非常簡化的形式且均使用非精準的比率,僅用于方便、明晰地輔助說明本發(fā)明實施例的目的。
請參考圖1,圖1所示為本發(fā)明較佳實施例的應用于閱卷系統(tǒng)的圖像污染處理方法流程圖。本發(fā)明提出一種應用于閱卷系統(tǒng)的圖像污染處理方法,包括下列步驟:
步驟a,獲取答題卡圖像灰度直方圖;
步驟b,將所述圖像灰度直方圖進行拉伸處理;
步驟c,判斷處理后的圖像灰度直方圖中設定目標區(qū)間內是否有像素出現;
步驟d,當設定目標區(qū)間內沒有像素出現時,設定灰度拉伸中間值,將灰度值小于所述灰度拉伸中間值的全部像素的灰度值降低第一設定值,同時將灰度值大于所述灰度拉伸中間值的全部像素的灰度值增加第一設定值;
步驟e,判斷步驟d的處理次數是否達到第二設定值的次數,若已經達到第二設定值的次數時停止對所述圖像灰度進行處理;
步驟f,當設定目標區(qū)間內沒有像素出現,并且步驟d的處理次數尚未達到第二設定值時,返回步驟b對所述圖像灰度進行進一步處理;
步驟g,當設定目標區(qū)間內有像素出現時,停止對所述圖像灰度進行處理。
圖像是由像素構成,反映像素分布的直方圖往往可以作為圖像一個很重要的特征。在實際工程中,圖像直方圖在特征提取、圖像匹配等方面都有很好的應用。圖像灰度直方圖是反映一個圖像像素灰度分布的統(tǒng)計表,其橫坐標代表了圖像像素的灰度值,縱坐標代表了數值在0-255之間的每一灰度值在圖像中的像素總數。
直方圖拉伸的主要作用就是將灰度間隔小的圖像的灰度間隔擴大,以便于觀察圖像。直方圖拉伸是通過對比度拉伸對直方圖進行調整,從而“擴大”前景和背景灰度的差別,以達到增強對比度的目的。大部分像素分布在中間較窄的灰度范圍內,使得圖像整體對比度較低,利用灰度變換,將直方圖中間部分拉伸至整個灰度范圍[0,255]能夠增強對比度。
當用某些非線性函數作為圖像的映射函數時,可實現圖像灰度的非線性變換,如利用對數函數、指數函數等可實現對數變換和指數變換。對數變換主要用于將圖像的低灰度值部分擴展,將其高灰度值部分壓縮,以達到強調圖像低灰度部分的目的。
本發(fā)明將圖片灰度直方圖通過對數函數變換處理,將其進行拉伸使得觀察更加直觀,其縱坐標表示當前灰度值下圖片中出現的像素總數,由于紙質答題卡在存放過程中會出現一定程度的褪色情況,因此在圖片灰度直方圖中靠近灰度值為0的部分沒有像素出現,即純黑色的像素不存在。本發(fā)明通過對數變化處理灰度直方圖,將高灰度值部分壓縮,以達到強調圖像低灰度部分的目的,即加強答題卡圖像中印刷體部分和學生填涂部分的顯示效果。
本發(fā)明將圖片灰度直方圖通過對數函數變換處理,其中對數函數變換處理采用以下公式:
s=c*log(1+r)
其中c為尺度比例常數,用于調節(jié)動態(tài)范圍,r為原圖灰度值,s為變換后的目標灰度值。
所述步驟c中的設定目標區(qū)間為0~4,灰度區(qū)間0~4表示為答題卡印刷體接近原始印刷的黑體效果,說明答題卡圖像灰度直方圖的拉伸處理達到最佳增強效果,同時也說明答題卡污染降噪處理完成,使得印刷體及學生填涂部分和污染部分能夠明顯區(qū)分開來,從而提高答題卡圖像的識別正確率。
根據本發(fā)明較佳實施例,所述灰度拉伸中間值為128,本發(fā)明將灰度值128設定為灰度拉伸中間值的閥值,其拉伸處理為將灰度值小于128的全部像素的灰度值降低第一設定值,同時將灰度值大于128的全部像素的灰度值增加第一設定值,經過一次處理后的效果表現為增強答題卡印刷體和學生填涂部分等灰度值較低區(qū)域的灰度值,使其顏色表現的更加明顯,同時降低污染部分的灰色,使其表現的更加不明顯,從而達到降噪的效果。
所述第一設定值的范圍設定為5~20,較佳的,所述第一設定值設定為10,即在本發(fā)明較佳實施例中的拉伸處理為將灰度值小于128的全部像素的灰度值降低10點,同時將灰度值大于128的全部像素的灰度值增加10點。
所述第二設定值為5~10,較佳的,所述第二設定值為7,即在本發(fā)明較佳實施例的拉伸處理最多進行7次,當設定目標區(qū)間內還沒有像素出現,并且拉伸處理的次數還未達到7次時,繼續(xù)對答題卡圖像的灰度直方圖進行拉伸處理。當拉伸處理的次數達到7次之后,就算設定目標區(qū)間內還是沒有像素出現,也會停止對答題卡圖像灰度直方圖繼續(xù)進行拉伸處理。
綜上所述,本發(fā)明提出的應用于閱卷系統(tǒng)的圖像污染處理方法,通過設定灰度拉伸中間值作為灰度拉伸處理的閥值,將灰度值小于所述灰度拉伸中間值的全部像素的灰度值降低第一設定值,同時將灰度值大于所述灰度拉伸中間值的全部像素的灰度值增加第一設定值,直至設定目標區(qū)間出現像素或者達到處理次數設定值后停止處理,從而增強答題卡圖像的印刷體和學生填涂部分,同時降低污染部分的噪聲,達到提高答題卡圖像識別正確率的效果。
雖然本發(fā)明已以較佳實施例揭露如上,然其并非用以限定本發(fā)明。本發(fā)明所屬技術領域中具有通常知識者,在不脫離本發(fā)明的精神和范圍內,當可作各種的更動與潤飾。因此,本發(fā)明的保護范圍當視權利要求書所界定者為準。