- 相關(guān)推薦
淺談圖像仿射變換的應(yīng)用
摘 要:圖像的仿射變換是對(duì)圖像進(jìn)行校正和修補(bǔ)的一種重要方式。本文討論了仿射變換的原理和性質(zhì),介紹了仿射變換的一些實(shí)際應(yīng)用,并對(duì)仿射變換的未來研究方向作出了展望。
關(guān)鍵詞:計(jì)算機(jī)技術(shù)發(fā)表,發(fā)表計(jì)算機(jī)技術(shù),計(jì)算機(jī)技術(shù)投稿
隨著數(shù)碼照相機(jī)、手機(jī)的越來越普及,人們?cè)絹碓节呄蛴谑褂脭z像頭取代傳統(tǒng)的掃描儀拍攝圖像,并對(duì)圖像中的文字或圖像本身進(jìn)行識(shí)別。然而這種使用攝像頭拍到的圖像,一方面受拍攝角度的影響,存在透視扭曲,導(dǎo)致圖像發(fā)生形變;另一方面,由于圖像的實(shí)際場(chǎng)景本身存在形變,嚴(yán)重影響到圖像的識(shí)別。一種最常用的方法是通過采用仿射變換來對(duì)圖像進(jìn)行一定程度的校正以方便人眼或機(jī)器的識(shí)別和配準(zhǔn)。
1 .圖像的仿射變換
圖像可以看作是由成行列的像素點(diǎn)組成。因此可以通過建立坐標(biāo)系,給每個(gè)像素點(diǎn)定一個(gè)坐標(biāo)。仿射變換實(shí)際上就是坐標(biāo)變換,即根據(jù)圖像變換的原理,得到變換前后圖像坐標(biāo)間的映射關(guān)系。假設(shè)輸入圖像中,像素點(diǎn)的坐標(biāo)是(x,y);輸出圖像中,像素點(diǎn)的坐標(biāo)是( , )。為了表示仿射變換,需要引入齊次坐標(biāo),即用三維向量(x,y,1)表示二維向量(x,y),對(duì)于高維來說也是如此。按照這種方法,就可以用矩陣乘法表示變換。仿射變換可以統(tǒng)一表示為: 當(dāng)矩陣的行列增加時(shí),右下角的元素1不變其它部分用0填充,任何仿射變換都可以由上式變換而來。對(duì) - 的不同取值,對(duì)應(yīng)著不同的變換類型: (1)平移,將每一點(diǎn)移動(dòng)到(x+ax,y+by),變換矩陣為: (2)旋轉(zhuǎn)變換,將目標(biāo)圖像繞原點(diǎn)順時(shí)針旋轉(zhuǎn)角度,變換矩陣為: (3)剪切變換,又稱“錯(cuò)切變換”,相當(dāng)于一個(gè)橫向剪切與一個(gè)縱向剪切的復(fù)合,變換矩陣為: (4)縮放變換,將每一點(diǎn)的橫左邊放大(縮小)至a倍、縱坐標(biāo)放大(縮小)至b倍,變換矩陣為: 仿射變換可以看作是由平移、旋轉(zhuǎn)、剪切和縮放多個(gè)操作級(jí)聯(lián)而成。
2 仿射變換的應(yīng)用
仿射映射是實(shí)現(xiàn)識(shí)別的一個(gè)重要部分,以下是一些典型的應(yīng)用及其實(shí)現(xiàn)過程。
2.1 交通標(biāo)志檢測(cè)
基于計(jì)算機(jī)視覺的道路交通標(biāo)志識(shí)別系統(tǒng)(TSR)是智能交通系統(tǒng)(ITS)的重要組成部分。將仿射變換應(yīng)用于TSR,可以較好地解決場(chǎng)景圖中交通標(biāo)志的變形問題,并通過對(duì)其進(jìn)行形狀校正來提高交通標(biāo)志檢測(cè)和識(shí)別的準(zhǔn)確率。 以三角標(biāo)志牌識(shí)別過程為例,具體步驟如下:
(1) 對(duì)圖片進(jìn)行去噪和顏色分割的預(yù)處理;
(2) 利用顏色信息分割該交通標(biāo)志,確定感興趣區(qū)域;
(3) 對(duì)感興趣區(qū)域進(jìn)行二值化掃描,并找到感興趣區(qū)域的三個(gè)端點(diǎn)位置;
(4) 計(jì)算旋轉(zhuǎn)的角度,將感興趣區(qū)域圍繞最左邊的點(diǎn)(或者圖像邊緣的特征點(diǎn))做旋轉(zhuǎn);
(5) 根據(jù)仿射變換式確定仿射矩陣,將斜三角變換成為標(biāo)準(zhǔn)三角。與此類似的應(yīng)用有車牌識(shí)別等。
2.2 文本圖像糾正
在一副圖像中進(jìn)行文本檢測(cè)和定位,一般利用基于區(qū)域(利用文本區(qū)域獨(dú)特的梯度分布、紋理和顏色)的方法。 首先,假定文本和背景有強(qiáng)烈的對(duì)比,因此這些高梯度值被視為文本區(qū)域良好的候選域,通常以邊緣檢測(cè)或圖像梯度特征來定位文本域。然后,采用局域閥值處理方法二值化圖片。接著,進(jìn)行抽取工作,即對(duì)二值化圖片中的候選域進(jìn)行文本驗(yàn)證,輸出字符。接下來的工作就由仿射變換來實(shí)現(xiàn)。根據(jù)文字的實(shí)際情況,計(jì)算其旋轉(zhuǎn)角度并調(diào)整圖像的立體傾斜。此方法最大的應(yīng)用是OCR文字識(shí)別軟件等。
2.3 衛(wèi)星圖像的配準(zhǔn)
衛(wèi)星圖像由于距離和精確度的限制,很難對(duì)圖像的各個(gè)細(xì)節(jié)進(jìn)行細(xì)致的描述,所以對(duì)衛(wèi)星圖像的匹配一般都是基于圖像邊緣信息的。首先,通過網(wǎng)絡(luò)數(shù)據(jù)或?qū)嶋H測(cè)量,建立衛(wèi)星圖(邊緣信息)數(shù)據(jù)庫(kù)作為模板。然后,對(duì)所拍的衛(wèi)星圖像進(jìn)行快速多尺度小波變換來提取邊緣信息及關(guān)鍵點(diǎn)(如交點(diǎn)和拐點(diǎn))。接著,利用仿射變換對(duì)邊緣信息圖像進(jìn)行校正。最后,將衛(wèi)星圖像與數(shù)據(jù)庫(kù)中圖像進(jìn)行關(guān)鍵特征點(diǎn)的配準(zhǔn)。相關(guān)應(yīng)用有GPS定位、高空捕捉等。
2.4 醫(yī)學(xué)圖像配準(zhǔn)
對(duì)于人體的醫(yī)學(xué)圖像配準(zhǔn),主要針對(duì)剛體。所謂剛體指物體內(nèi)部任意兩點(diǎn)間的距離保持不變,如人的頭部。在配準(zhǔn)過程中,主要使用參數(shù)圖像配準(zhǔn)方法,即基于標(biāo)記點(diǎn)、主軸、灰度的配準(zhǔn)。以基于標(biāo)記點(diǎn)的配準(zhǔn)為例,對(duì)同一個(gè)病人在同一時(shí)期不同時(shí)間進(jìn)行2次大腦磁共振成像(MRI)檢測(cè),得到a圖和b圖。首先,對(duì)a圖,識(shí)別并定位兩個(gè)以上的標(biāo)記點(diǎn)(一般選輪廓上曲率的極值點(diǎn)、灰度的極值點(diǎn)或拐點(diǎn)等)。然后,對(duì)b圖進(jìn)行同樣的處理。接著,對(duì)b圖進(jìn)行仿射變換,調(diào)整其與a圖配準(zhǔn)。最后,根據(jù)配準(zhǔn)結(jié)果就可以看出來病人的病情發(fā)展情況。與此類似,對(duì)于人體骨骼的CT、MRI、X光圖都可以應(yīng)用仿射變換來實(shí)現(xiàn)圖像匹配。
2.5 人臉對(duì)齊 人臉識(shí)別技術(shù)是當(dāng)前生物特征識(shí)別的熱點(diǎn)之一,在信息安全、視頻監(jiān)控、視頻跟蹤等領(lǐng)域有著廣泛的應(yīng)用前景。要完成人臉識(shí)別,一個(gè)重要的步驟就
【淺談圖像仿射變換的應(yīng)用】相關(guān)文章:
常用函數(shù)圖像03-11
圖像記憶的原理03-06
[優(yōu)選]常用函數(shù)圖像03-12
后羿射日作文04-27
后羿射日作文(精華)05-06
《燕子》仿寫03-02
《荷花》仿寫02-27
常用函數(shù)圖像集合(15篇)03-12
圖像算法工程師的職責(zé)04-23