在科學(xué)技術(shù)日新月異的今天,人們對機(jī)器設(shè)備的智能性、自主性要求也越來越高,希望其完全替代人的角色,把人們從繁重、危險的工作任務(wù)中解脫出來,而能否像人一樣具有感知周圍環(huán)境的能力已成為設(shè)備實現(xiàn)智能化自主化的關(guān)鍵。
廣義的“圖像跟蹤”技術(shù),是指通過某種方式(如圖像識別、紅外、超聲波等)將攝像頭中拍攝到的物體進(jìn)行定位,并指揮攝像頭對該物體進(jìn)行跟蹤,讓該物體一直被保持在攝像頭視野范圍內(nèi)。狹義的“圖像跟蹤”技術(shù)就是我們?nèi)粘KU劦降?,通過“圖像識別”的方式來進(jìn)行跟蹤和拍攝。
因為紅外、超聲波等方式,都受環(huán)境的影響,而且要專門的識別輔助設(shè)備,在實際應(yīng)用中已經(jīng)逐步被“圖像識別”技術(shù)所替代?!皥D像識別”是直接利用了攝像頭拍攝到的圖像,進(jìn)行NCAST圖像差分及聚類運算,識別到目標(biāo)物體的位置,并指揮攝像頭對該物體進(jìn)行跟蹤。
圖像跟蹤系統(tǒng)采用特有的NCAST目標(biāo)外形特征檢測方法,被跟蹤者無需任何輔助設(shè)備,只要進(jìn)入跟蹤區(qū)域,系統(tǒng)便可對目標(biāo)進(jìn)行鎖定跟蹤,使攝像機(jī)畫面以鎖定的目標(biāo)為中心,并控制攝像機(jī)進(jìn)行相應(yīng)策略的縮放。系統(tǒng)支持多種自定義策略,支持多級特寫模式,適應(yīng)性強,不受強光、聲音、電磁等環(huán)境影響。
目標(biāo)物體的邊緣檢測物體的形狀特征在大多數(shù)情況下變化不多,基于目標(biāo)形狀輪廓的跟蹤方法與基于區(qū)域的匹配方法相比,可以更精確的分割目標(biāo)。
邊緣是運動目標(biāo)的最基本特征,表現(xiàn)在圖像中就是指目標(biāo)周圍圖像灰度有階躍變化或屋頂變化的那些像素集合,它是圖像中局部亮度變化最顯著的部分。
邊緣檢測就是采用某種算法來定位灰度不連續(xù)變化的位置,從而圖像中目標(biāo)與背景的交界線。圖像的灰度變化可以用灰度梯度來表示。
梯度算子梯度也即一階導(dǎo)數(shù),梯度算子對應(yīng)一階導(dǎo)數(shù)算子,一階導(dǎo)數(shù)也即梯度可以表示為:
圖像經(jīng)過邊緣檢測之后,還要經(jīng)過輪廓追蹤和輪廓表達(dá)。輪廓跟蹤的目的是得到邊緣像素的集合邊緣表。輪廓表達(dá)則是通過對邊緣表做一些處理,如擬合、統(tǒng)計及逼近等,得到目標(biāo)形狀特征的直觀表達(dá),為后續(xù)匹配提供模板信息。
輪廓跟蹤的思想是:1、根據(jù)提取的圖像邊緣,找出輪廓上的像素;
2、根據(jù)這些像素的特征用一定的“跟蹤準(zhǔn)則”找出物體上的其他像素;
3、其跟蹤效果的好壞主要取決于起始點和跟蹤準(zhǔn)則的選取兩個因素。
跟蹤準(zhǔn)則:按起始點選取準(zhǔn)則找到最左下方位的邊界點后,以其為起始點,定義左上方為初始搜索方向,若該方向的點為黑點(特征點),則判其為邊界點,否則沿順時針方向旋轉(zhuǎn)搜索方向45度,依此類推,直到搜索到第一個黑點(特征點)為止,然后再把該黑點(特征點)作為新的邊界點,逆時針方向旋轉(zhuǎn)當(dāng)前搜索方向90度,用相同的方法繼續(xù)搜索下一個黑點(特征點),直到找到初始邊界點為止。若用箭頭表示搜索方向,那么該輪廓跟蹤算法可以用圖表示。
通過上述算法得到物體的邊緣表后,可以用其作為輪廓表達(dá),也可以對其進(jìn)行處理,用處理后的信息形式來表達(dá)輪廓。目前常用的輪廓表達(dá)有以下三種:逼近擬合曲線法、內(nèi)插擬合曲線法、統(tǒng)計特征法。
目標(biāo)圖像顏色檢測為了對豐富多樣的色彩進(jìn)行表達(dá),人們用表示顏色的三個參數(shù)所構(gòu)成的三維空間來對圖像的顏色進(jìn)行描述,這個三維空間就是所謂的顏色空間。
如:RGB格式(紅、綠、藍(lán)三基色模型)、HSV格式(色度、飽和度、亮度模型)
RGB格式是工業(yè)界的一種顏色標(biāo)準(zhǔn),是通過對紅(R)、綠(G)、藍(lán)(B)三個顏色通道的變化以及它們相互之間的疊加來得到各式各樣的顏色的,RGB即是代表紅、綠、藍(lán)三個通道的顏色,這個標(biāo)準(zhǔn)幾乎包括了人類視力所能感知的所有顏色,是目前運用最廣的顏色系統(tǒng)之一。
HSV格式:H參數(shù)表示色彩信息,即所處的光譜顏色的位置。該參數(shù)用一個角度量來表示,紅、綠、藍(lán)分別相隔120度?;パa色分別相差180度。純度S為一比例值,范圍從0到1,它表示成所選顏色的純度和該顏色最大的純度之間的比率。S=0時,只有灰度。V表示色彩的明亮程度,范圍從0到1。有一點要注意:它和光強度之間并沒有直接的聯(lián)系。
例如:采用直方圖來表達(dá)圖像的顏色分布特征:1、對顏色進(jìn)行量化;2、計算顏色落在各個小區(qū)間內(nèi)的像素數(shù)量;3、對其進(jìn)行直方圖投影就可以得到圖像的顏色概率分布圖像。
圖像濾波及形態(tài)學(xué)處理算法運動目標(biāo)提取時,為了消除相機(jī)采集的圖像中的噪聲、改善圖像質(zhì)量,使圖像變得更清晰,需要對圖像進(jìn)行濾波。幾種常見噪聲:高斯噪聲、加性噪聲及椒鹽噪聲等。
為了消除噪聲影響和突出圖像的一些特征,目前常用的方法有:鄰域均值濾波、中值濾波法等。
運動目標(biāo)提取完成后,得到的二值化圖像可能含有許多空洞和孤立的噪聲點,為了更好地對目標(biāo)進(jìn)行定位和跟蹤,需要對得到的檢測結(jié)果進(jìn)行形態(tài)學(xué)處理。
形態(tài)學(xué)處理主要思想是:采用一個特定的結(jié)構(gòu)元素作為工具來度量和提取圖像特征(形狀、輪廓等),具體為看該結(jié)構(gòu)元素是否可以適當(dāng)有效地放入圖像內(nèi)部。目前常用的形態(tài)學(xué)運算有:膨脹、腐蝕、開啟和閉合操作。
圖像匹配圖像匹配是指在多幅圖像之間尋找對應(yīng)關(guān)系的過程,具體為在一幀圖像中尋找與給定目標(biāo)最相似的圖像區(qū)域或在一批圖像中尋找與目標(biāo)最相似的圖像。
利用圖像匹配技術(shù)不僅可以檢測出搜索圖像中是否有目標(biāo)圖像,還可以獲得目標(biāo)在圖像中的相對位置信息。
匹配算法概括起來可以分為兩類:基于區(qū)域的匹配方法和基于特征的匹配方法。
基于區(qū)域的匹配方法
根據(jù)整幅圖像的灰度值信息,建立目標(biāo)模板和待匹配目標(biāo)圖像之間的相似性度量,然后采用相應(yīng)的搜索算法,尋找待匹配目標(biāo)圖像中相似性度量值最大的地方。
基于特征的匹配方法提取圖像的特征,如特征點、邊緣、顏色、紋理等,對提取的特征進(jìn)行加工處理將其表達(dá)成特定的形式(向量、直方圖),對加工后的圖像特征采用一定的相似性度量準(zhǔn)則進(jìn)行匹配以建立目標(biāo)模板和待匹配圖像之間的對應(yīng)關(guān)系。
圖像跟蹤技術(shù)的應(yīng)用領(lǐng)域目前,目標(biāo)跟蹤技術(shù)主要應(yīng)用于以下領(lǐng)域:
1、智能視頻監(jiān)控:基于運動識別(基于步法的人類識別、自動物體檢測等),自動化監(jiān)測(監(jiān)視一個場景以檢測可疑行為);交通監(jiān)視(實時收集交通數(shù)據(jù)用來指揮交通流動);
2、人機(jī)交互:傳統(tǒng)人機(jī)交互是通過計算機(jī)鍵盤和鼠標(biāo)進(jìn)行的,為了使計算機(jī)具有識別和理解人的姿態(tài)、動作、手勢等能力,跟蹤技術(shù)是關(guān)鍵;
3、機(jī)器人視覺導(dǎo)航:在智能機(jī)器人中,跟蹤技術(shù)可用于計算拍攝物體的運動軌跡;
4、虛擬現(xiàn)實:虛擬環(huán)境中3D交互和虛擬角色動作模擬直接得益于視頻人體運動分析的研究成果,可給參與者更加豐富的交互形式,人體跟蹤分析是其關(guān)鍵技術(shù);
5、醫(yī)學(xué)診斷:跟蹤技術(shù)在超聲波和核磁序列圖像的自動分析中有廣泛應(yīng)用,由于超聲波圖像中的噪聲經(jīng)常會淹沒單幀圖像有用信息,使靜態(tài)分析十分困難,而通過跟蹤技術(shù)利用序列圖像中目標(biāo)在幾何上的連續(xù)性和時間上的相關(guān)性,可以得到更準(zhǔn)確的結(jié)果。
如涉及侵權(quán),請相關(guān)權(quán)利人與我司聯(lián)系刪除