時(shí)間:2022-05-02 05:19:48
序論:在您撰寫(xiě)計(jì)算機(jī)視覺(jué)論文時(shí),參考他人的優(yōu)秀作品可以開(kāi)闊視野,小編為您整理的1篇范文,希望這些建議能夠激發(fā)您的創(chuàng)作熱情,引導(dǎo)您走向新的創(chuàng)作高度。
現(xiàn)階段,我國(guó)的市面上有很多不同的方法來(lái)進(jìn)行機(jī)械零件尺寸的測(cè)量和研究,采取不同的測(cè)量辦法,得出的結(jié)果也有著精確度的差異。原始的測(cè)量方法是人們通過(guò)借助各種測(cè)量?jī)x器,如萬(wàn)能工具顯微鏡和三坐標(biāo)測(cè)量機(jī)等,進(jìn)行人工測(cè)量操作。這種方式存在著很多弊端,而計(jì)算機(jī)視覺(jué)檢測(cè)技術(shù)的應(yīng)用則可以很好地解決這一問(wèn)題。所謂視覺(jué)檢測(cè)就是檢測(cè)被測(cè)目標(biāo)時(shí),把圖像當(dāng)作檢測(cè)和傳遞信息的手段或載體加以利用的檢測(cè)方法,其目的是從圖像中提取有用的信號(hào),它是以現(xiàn)代光學(xué)為基礎(chǔ),融光電子學(xué)、計(jì)算機(jī)圖像學(xué)、信息處理、計(jì)算機(jī)視覺(jué)等科學(xué)技術(shù)為一體的現(xiàn)代檢測(cè)技術(shù)。由于計(jì)算機(jī)視覺(jué)系統(tǒng)可以快速獲取大量信息,而且易于與設(shè)計(jì)信息及加工控制信息集成,基于視覺(jué)檢測(cè)技術(shù)的儀器設(shè)備能夠?qū)崿F(xiàn)智能化、數(shù)字化、小型化、網(wǎng)絡(luò)化和多功能化,具備在線(xiàn)檢測(cè)、實(shí)時(shí)分析、實(shí)時(shí)控制的能力在軍事、工業(yè)、商業(yè)、醫(yī)學(xué)等領(lǐng)域得到廣泛關(guān)注和應(yīng)用。
一、計(jì)算機(jī)視覺(jué)檢測(cè)技術(shù)含義
計(jì)算機(jī)的視覺(jué)又叫做機(jī)器視覺(jué),通過(guò)利用計(jì)算機(jī)或者是其他的一些機(jī)械設(shè)備來(lái)幫助人們視線(xiàn)事物到圖片的過(guò)程,從而進(jìn)行三維世界的感知活動(dòng)。計(jì)算機(jī)的快速發(fā)展,離不開(kāi)神經(jīng)心理學(xué),心理學(xué)和認(rèn)知科學(xué)方面的研究和發(fā)展,計(jì)算機(jī)視覺(jué)檢測(cè)技術(shù)的發(fā)展方向就是對(duì)周?chē)娜S空間進(jìn)行感知和分析。一旦能夠擁有這種能力,計(jì)算機(jī)不僅能感知到周?chē)目傮w環(huán)境,而且,還能夠具有對(duì)物體進(jìn)行描述,識(shí)別理解和儲(chǔ)存的能力。
二、計(jì)算機(jī)視覺(jué)檢測(cè)的基本原理
要實(shí)現(xiàn)人工智能對(duì)視覺(jué)的計(jì)算機(jī)處理是很重要的方面在計(jì)算機(jī)視覺(jué)應(yīng)用領(lǐng)域中如果要讓我們的計(jì)算機(jī)明白圖像的信息就必須經(jīng)過(guò)一系列的處理過(guò)程―――數(shù)字圖像處理.數(shù)字圖像的處理包括5個(gè)步驟:圖像預(yù)處理(去除噪聲)、分割處理分割后區(qū)域、測(cè)量、圖像判讀、圖像技術(shù).根據(jù)抽象程度和處理方法的不同圖像技術(shù)可分為三個(gè)層次:圖像處理、圖像分析和圖像理解.這三個(gè)層次的有機(jī)結(jié)合也稱(chēng)為圖像工程.而計(jì)算機(jī)視覺(jué)(Computer vision)則是用計(jì)算機(jī)實(shí)現(xiàn)人的視覺(jué)功能對(duì)客觀(guān)世界三維場(chǎng)景的感知、識(shí)別和理解.視覺(jué)檢測(cè)按其所處理的數(shù)據(jù)類(lèi)型又大致可分為二值圖像、灰度圖像、彩色圖像和深度圖像的視覺(jué)檢測(cè).另外還有X射線(xiàn)檢測(cè)、超聲波檢測(cè)和紅外線(xiàn)檢測(cè)。
作為新興檢測(cè)技術(shù)計(jì)算機(jī)視覺(jué)檢測(cè)充分利用了計(jì)算機(jī)視覺(jué)研究成果采用像傳感器來(lái)實(shí)現(xiàn)對(duì)被測(cè)物體的尺寸及空間位置的三維測(cè)量能較好地滿(mǎn)足現(xiàn)代制造業(yè)的發(fā)展需求.與一般意義上的圖像處理相比計(jì)算機(jī)視覺(jué)檢測(cè)更強(qiáng)調(diào)精度、速度和無(wú)損性以及工業(yè)現(xiàn)場(chǎng)環(huán)境下的可靠性.例如基于三角法的主動(dòng)視覺(jué)測(cè)量理具有抗干擾能力強(qiáng)、效率高、精度合適等優(yōu)點(diǎn)非常適合制造業(yè)生產(chǎn)現(xiàn)場(chǎng)的在線(xiàn)、非接觸產(chǎn)品檢測(cè)及生產(chǎn)監(jiān)控.對(duì)人類(lèi)視覺(jué)感知能力的計(jì)算機(jī)模擬促進(jìn)了計(jì)算機(jī)視覺(jué)技術(shù)的產(chǎn)生和發(fā)展制造業(yè)上獲取這些信息的目的有:(1)計(jì)算出觀(guān)察點(diǎn)到目標(biāo)物體的距離;(2)得出觀(guān)察點(diǎn)到目標(biāo)物體的運(yùn)動(dòng)參數(shù);(3)甚至可以判斷出目標(biāo)物體的內(nèi)部特性;(4)推斷出目標(biāo)物體的表面特征有時(shí)要求形成立體視覺(jué)。
三、亞像素檢測(cè)技術(shù)
隨著工業(yè)檢測(cè)等應(yīng)用對(duì)精度要求的不斷提高,像素級(jí)精度已經(jīng)不能滿(mǎn)足實(shí)際檢測(cè)的要求,因此需要更高精度的邊緣提取算法,即亞像素算法。亞像素級(jí)精度的算法是在經(jīng)典算法的基礎(chǔ)上發(fā)展起來(lái)的,這些算法一般需要先用經(jīng)典算法找出邊緣像素的位置,然后使用周?chē)袼氐幕叶戎底鳛榕袛嗟难a(bǔ)充信息,利用插值、擬合等方法,使邊緣定位于更加精確的位置?,F(xiàn)在的亞像素提取算法很多,如重心法、概率論法、解調(diào)測(cè)量法、多項(xiàng)式插值法、濾波重建法、矩法等。由于這些算法的精度、抗噪聲能力和運(yùn)算量各不相同,他們的應(yīng)用場(chǎng)合也是各不相同的。
邊緣是圖像的基本特征,所謂邊緣是指圖像中灰度存在階躍或尖頂狀變化的像素的集合,邊緣廣泛存在于物體與物體、物體與背景之間。圖像測(cè)量是通過(guò)處理被測(cè)物體圖像中的邊緣而獲得物體的幾何參數(shù)的過(guò)程,邊緣的定位精度直接影響最終的測(cè)量結(jié)果。因此,圖像邊緣提取方法是檢測(cè)的基礎(chǔ)和關(guān)鍵之一。在視覺(jué)測(cè)量領(lǐng)域中,早期使用的都是像素級(jí)邊緣檢測(cè)方法,例如常用的梯度算子、Lapacian算子和門(mén)式算子等。以上的邊緣檢測(cè)方法的精度可以達(dá)到像素級(jí)精度,即可以判斷出邊緣位于某個(gè)像素內(nèi),但不能確定邊緣在該像素內(nèi)的更精確的位置。如果一個(gè)像素對(duì)應(yīng)的實(shí)際長(zhǎng)度較大,就會(huì)產(chǎn)生較大的誤差,傳統(tǒng)的整像素邊緣檢測(cè)方法就不再適用。
四、計(jì)算機(jī)視覺(jué)檢測(cè)技術(shù)在機(jī)加工零件檢測(cè)中的應(yīng)用要素與過(guò)程
(一)曲陣CCD相機(jī)
面陣CCD是本項(xiàng)目圖像采集系統(tǒng)中的主要設(shè)備之一,其主要功能是采集實(shí)驗(yàn)圖像。該CCD相機(jī)主要由CCD感光芯片、驅(qū)動(dòng)電路、信號(hào)處理路、電子接口電路和光學(xué)機(jī)械接口等構(gòu)成。
(二)工業(yè)定焦鏡頭
在圖像測(cè)量系統(tǒng)中,鏡頭的主要作用是將目標(biāo)聚焦在圖像傳感器的光敏面上。鏡頭的質(zhì)量直接影響到圖像測(cè)量系統(tǒng)的整體性能,合理選擇并安裝光學(xué)鏡頭是圖像測(cè)量系統(tǒng)設(shè)計(jì)的重要環(huán)節(jié)。
(三)數(shù)字圖像采集卡
隨著數(shù)字信號(hào)處理技術(shù)和嵌入式處理器技術(shù)在圖像采集卡中的應(yīng)用,使得圖像采集卡向高速度、多功能和模塊化方向不斷發(fā)展。這類(lèi)圖像采集卡不僅具有高速圖像采集功能,同時(shí)還具備部分圖像處理功能,因此又可以稱(chēng)之為圖像處理卡。
(四)標(biāo)定板
為提高測(cè)量精度,需要進(jìn)行攝像機(jī)標(biāo)定。標(biāo)定過(guò)程中,采用NANO公司的CBC75mm}.0型高精度標(biāo)定板,外形尺寸為75mmx75mmx3.0mm,圖形為棋盤(pán)格,其尺寸為2.0mmx2.0mm,精度為1級(jí),即圖形尺寸精度與圖形位置精度為。
(五)背光源
背光方式只顯示不透明物體的輪廓,所以這種方式用于被測(cè)物需要的信息可以從其輪廓得到的場(chǎng)合。因此,為精確提取軸的圖像中的邊緣特征,需采用背光源。為使圖像邊緣更銳利,光源顏色選擇紅色。
五、結(jié)語(yǔ)
隨著計(jì)算機(jī)技術(shù)和光電技術(shù)的發(fā)展,已經(jīng)出現(xiàn)了一種新的檢測(cè)技術(shù)―基于計(jì)算機(jī)視覺(jué)的檢測(cè)技術(shù),利用CCD攝像機(jī)作為圖像傳感器,綜合運(yùn)用圖像處理等技術(shù)進(jìn)行非接觸測(cè)量的方法,被廣泛地應(yīng)用于零件尺寸的精密測(cè)量中。本文以面陣CCD為傳感器,研究了零件在線(xiàn)測(cè)量的方法,實(shí)現(xiàn)了零件尺寸的圖像邊緣亞像素定位測(cè)量,對(duì)面陣CCD在高精度測(cè)量方面的應(yīng)用作了進(jìn)一步的探索和研究,為面陣CCD在復(fù)雜零件尺寸高精度測(cè)量的實(shí)現(xiàn)打下了基礎(chǔ)。
摘要:隨著商品種類(lèi)的不斷豐富和信息化管理手段的應(yīng)用普及,條形碼作為現(xiàn)代生產(chǎn)、物流和銷(xiāo)售各環(huán)節(jié)的重要信息化手段之一,它的應(yīng)用也日益廣泛,而且,隨著我國(guó)對(duì)食品和藥品安全問(wèn)題的重視,條碼作為追溯碼也開(kāi)始被用于食品藥品追溯領(lǐng)域。如何對(duì)條形碼中的信息進(jìn)行提取就變得非常重要了。本文在這樣的背景下針對(duì)乳品企業(yè)的產(chǎn)品可追溯問(wèn)題,設(shè)計(jì)了一套可用于乳品追溯的包裝條碼計(jì)算機(jī)視覺(jué)識(shí)別系統(tǒng)。
關(guān)鍵詞:條碼;乳品包裝;條碼識(shí)別;計(jì)算機(jī)視覺(jué)
本系統(tǒng)硬件部分采用面陣攝像機(jī)、工控機(jī)構(gòu)成,軟件部分采用C#語(yǔ)言和OpenCV軟件進(jìn)行開(kāi)發(fā),采用EF Model(實(shí)體框架)作為程序框架,通過(guò)搭建好的視頻采集系統(tǒng),利用外觸發(fā)啟動(dòng)攝像機(jī)采集圖像,經(jīng)過(guò)圖像預(yù)處理、識(shí)別區(qū)域的檢測(cè)和定位后,提取出待識(shí)別圖像,對(duì)于待識(shí)別圖像中的條碼和數(shù)字,分別采用相似邊距離方法進(jìn)行一維碼識(shí)別、采用逐行掃描法進(jìn)行二維碼識(shí)別,并利用模型匹配進(jìn)行數(shù)字識(shí)別。
本系統(tǒng)可綜合識(shí)別條碼以及數(shù)字識(shí)別,實(shí)驗(yàn)表明本系統(tǒng)具有較好的識(shí)別效率和識(shí)別精度,可以滿(mǎn)足一般條件下的包裝條碼計(jì)算機(jī)識(shí)別,并且已在乳品可追溯方面取得應(yīng)用。
1 概述
在數(shù)不勝數(shù)的新型計(jì)算機(jī)科學(xué)技術(shù)出現(xiàn)之后,條形碼技術(shù)儼然已經(jīng)成為了最為經(jīng)濟(jì)實(shí)用的一種自動(dòng)識(shí)別技術(shù)。隨著時(shí)代的不斷發(fā)展和用戶(hù)需求的不斷擴(kuò)展,各種各樣的商品出現(xiàn)在我們生活中[1]。雖然條形碼的技術(shù)發(fā)展的爐火純青,但是隨著條形碼的不斷變化和創(chuàng)新,識(shí)別包裝條形碼技術(shù)已然成為我們現(xiàn)在需要不斷研究的課題。
條形碼的出現(xiàn)無(wú)疑給我們的生活帶來(lái)了方便,但τ謖飧隹燜俜⒄溝氖貝,對(duì)其識(shí)別的技術(shù)的效率還需要我們進(jìn)行大量的研究和開(kāi)發(fā)。這也是開(kāi)發(fā)本系統(tǒng)的初衷。對(duì)于本系統(tǒng)來(lái)說(shuō),它既要滿(mǎn)足對(duì)條形碼的檢測(cè),圖像提取,校正等功能的實(shí)現(xiàn),又要實(shí)現(xiàn)所有程序自動(dòng)化的功能。該系統(tǒng)主要應(yīng)用于對(duì)海河食品包裝的識(shí)別。該系統(tǒng)利用外觸發(fā)器,實(shí)現(xiàn)將視頻轉(zhuǎn)化到靜態(tài)圖片的功能,同時(shí)通過(guò)后臺(tái)處理快速地找到該靜態(tài)圖片中條形碼的位置并對(duì)提取的條形碼以圖片的形式存儲(chǔ),然后對(duì)條形碼圖片進(jìn)行識(shí)別。
2 條形碼定位
2.1 圖像采集
采集方式是利用相機(jī)和觸發(fā)器采取圖像,DirectX以流的方式讀取播放視頻。
2.2 圖像預(yù)處理[2]
OpenCV現(xiàn)在利用Mat類(lèi)來(lái)表示圖像,在此基礎(chǔ)上進(jìn)行圖像的灰度化處理[3],在灰度處理基礎(chǔ)上,進(jìn)行圖像梯度化[4]。就是把圖像作為二維離散函數(shù)。梯度化過(guò)程就是對(duì)該函數(shù)求導(dǎo)的過(guò)程。圖像邊緣的確定大多都是通過(guò)圖像梯度化處理來(lái)實(shí)現(xiàn)的。梯度化方向[5],分水平方向梯度計(jì)算和垂直方向梯度計(jì)算,或者是振幅計(jì)算。在進(jìn)行檢測(cè)前,還要使用Scharr算子先確定邊緣像素[6]的位置。接下來(lái)進(jìn)行圖像二值化,所有的像素點(diǎn)的像素值設(shè)置為0或者255。最后,采用開(kāi)運(yùn)算算法進(jìn)行形態(tài)化處理。
2.3 條碼檢測(cè)
本系統(tǒng)使用Vecor容器用于存放面積;findContours函數(shù)對(duì)二值圖像中的輪廓進(jìn)行檢測(cè);Point用來(lái)表示坐標(biāo)為整數(shù)的二維點(diǎn);Rect方法:用于提取旋轉(zhuǎn)的矩形圖案;angle檢查這個(gè)矩形的偏斜角度;將提取的矩形輪廓標(biāo)記在圖片上并剪截下來(lái)進(jìn)行保存。
2.4 二維碼提取
相對(duì)應(yīng)一維碼,二維碼在譯碼之前需要先對(duì)二維碼進(jìn)行分割,再進(jìn)行邊緣檢測(cè)。采用區(qū)域增長(zhǎng)的方法修正邊界。二維碼是正方形形態(tài),我們也要對(duì)其進(jìn)行圖形區(qū)域的旋轉(zhuǎn)處理,利用Hough變換來(lái)進(jìn)行處理利用二維圖像的投影變換。然后對(duì)拍攝的圖像進(jìn)行Hough變換,根據(jù)4條邊界線(xiàn)進(jìn)行位置旋轉(zhuǎn)。也可以使用仿射變換。即先對(duì)一個(gè)向量空間進(jìn)行一次線(xiàn)性變換并根據(jù)該變化做出相對(duì)性的平移,使其變成另一個(gè)向量空間。該變化方法包括水平的平移、圖像的縮放、圖像的旋轉(zhuǎn)等功能。
2.5 數(shù)字定位方法
商品包裝上的條碼一般都是預(yù)印刷的,許多商品的生成日期和使用日期也需要入庫(kù)進(jìn)行保存,但是由于條碼印刷成本較高,所以廠(chǎng)家通常采用的方式是以數(shù)字形式將商品的生成日期和使用日期印刷在包裝袋上。因而,本系統(tǒng)添加了數(shù)字識(shí)別功能。數(shù)字技術(shù)識(shí)別的主要核心字符分割技術(shù):切割數(shù)字區(qū)域后,進(jìn)行字符的切割,由于該圖像還是灰度圖像,所以我們?cè)谇懈钋斑€要進(jìn)行一些圖像處理。具體過(guò)程:灰度拉伸、二值化、傾斜校正以及字符分割。圖像以海河牛奶的包裝袋為例。由于信息過(guò)多,一個(gè)條形碼無(wú)法將全部信息存儲(chǔ),所以會(huì)在包裝正面的空白位置加些數(shù)字,以此來(lái)完善條形碼內(nèi)容不足的地方。
具體分割算法如圖1所示。將截取后的整個(gè)圖片進(jìn)行自上而下的逐行對(duì)比,提取黑色的字符部分,直到整幅圖像完畢。已列為高度基準(zhǔn)進(jìn)行掃描,進(jìn)行從左到右依次排查,直到全部圖片掃面完畢。由于印刷問(wèn)題,數(shù)字區(qū)域可能有小圓點(diǎn),采用的是比例方法運(yùn)算將這些小點(diǎn)清除,把每個(gè)切割后的圖像的寬度均除以未切割前的圖像的寬度,設(shè)立一個(gè)最小的商值。如果小于該商值,將其以噪聲方式清除。最后對(duì)字符進(jìn)行了加框和歸一化處理。上述所切割的圖像大小是根據(jù)字符的最高和最低的值進(jìn)行的切割,所以我們得到的結(jié)果并不是很準(zhǔn)確,我們要將每個(gè)字符再進(jìn)行進(jìn)一步的確定,所以要多進(jìn)行幾次從第一個(gè)步驟到第三個(gè)步驟的運(yùn)算。這樣我們得到的才是該字符的準(zhǔn)確范圍。
3 條形碼識(shí)別
3.1 一維碼識(shí)別
一維碼儲(chǔ)存的信息是由條和空的寬度以及所在的位置來(lái)傳遞的。以EAN-13碼為例。一維條形碼的條和空的數(shù)量越多,它就越寬,儲(chǔ)存的數(shù)據(jù)量就越多,由于一維碼是由條和空組成的,將信息變化成二進(jìn)制或者十進(jìn)制的數(shù)字。
本系統(tǒng)對(duì)于一維碼識(shí)別采用的方法是相似邊距離方法,利用相似法識(shí)別一維碼[6]:根據(jù)算法進(jìn)行字符的掃描和識(shí)別,定義:C1和C3表示相鄰條的寬度,C2和C4表示空的寬度,T表示整個(gè)字符的寬度,T1和T2為相似邊的距離。用算法取得值JTj(j=1,2)來(lái)進(jìn)行T1與T2的歸一化處理。
3.2 二維碼識(shí)別
二維碼是按照一定的規(guī)律在平面上分布的黑色與白色相間的圖形記錄符號(hào)。識(shí)別二位碼[7]需先定位圖案,再是功能性數(shù)據(jù),識(shí)別由數(shù)據(jù)碼和糾錯(cuò)碼共同組成的數(shù)據(jù)信息。
定位圖案:我們通常定位二維碼是根據(jù)左上角、右上角以及左下角三個(gè)位置定位的。以其中一個(gè)圖形為例,我們可以將其看作分別為7*7、5*5和3*3三個(gè)模塊。三個(gè)之間比例為1:1:3:1:1。掃描:用一個(gè)直線(xiàn)逐行掃描二維碼,該線(xiàn)被截為1:1:3:1:1時(shí)截取。誤差在0.5之間在列方向,也用相同的方法進(jìn)行二維碼定位掃描。我們通常定位二維碼是根據(jù)圖上的三個(gè)位置定位的。
3.3 數(shù)字識(shí)別
數(shù)字識(shí)別[8]部分已經(jīng)超出了我們圖像處理的范圍依據(jù)了,屬于模式識(shí)別,由于我們已經(jīng)對(duì)圖片進(jìn)行了分割,所以我們只需通過(guò)其特征進(jìn)行分類(lèi)與識(shí)別。采用的是逐像素取法方法[9],具體操作就是對(duì)圖片M行每行每列的依次查找,遇到的黑點(diǎn)時(shí),將其像素值設(shè)為“1”,其他為“0”,全部掃描結(jié)束后,將提取的個(gè)數(shù)相同的像素,放在特征矩陣?yán)?。將特征信息,輸入到分?lèi)器中,進(jìn)行分類(lèi)處理,從而得出結(jié)果。再進(jìn)行采取模塊匹配,事先做好海河包裝上的圖像中字符的圖像采集,然后建立一個(gè)圖片模板識(shí)別庫(kù)。當(dāng)我們進(jìn)行字符識(shí)別時(shí),就將模板取出來(lái)依次對(duì)比,把與字符特征對(duì)比的結(jié)果的矢量求出加權(quán)距離。則最小的結(jié)果就是識(shí)別的結(jié)果。如圖2所示。
摘 要
近年來(lái),經(jīng)濟(jì)的發(fā)展和人們生活水平的提升也使得人們的出行更加便捷,越來(lái)越多的人都是自己駕車(chē)出行,這樣導(dǎo)致公路上的交通流量不斷增加,如何保障交通的順暢性和安全性成為人們關(guān)注的重點(diǎn)問(wèn)題。信息技術(shù)的發(fā)展推動(dòng)了計(jì)算機(jī)視覺(jué)技術(shù)的出現(xiàn),為交通安全性的提升提供了一定的保障。本文主要對(duì)計(jì)算機(jī)視覺(jué)技術(shù)進(jìn)行分析,進(jìn)一步探討計(jì)算機(jī)視覺(jué)技術(shù)在智能交通系統(tǒng)中的應(yīng)用。
【關(guān)鍵詞】計(jì)算機(jī) 視覺(jué)技術(shù) 智能交通 系統(tǒng) 應(yīng)用
智能交通系統(tǒng)簡(jiǎn)稱(chēng)ITS,這是一種新型的交通管理系統(tǒng)。該系統(tǒng)主要結(jié)合了信息化技術(shù)、計(jì)算機(jī)技術(shù)以及數(shù)據(jù)傳輸技術(shù)等多種技術(shù),用來(lái)對(duì)整個(gè)交通運(yùn)輸體系進(jìn)行管理,可以實(shí)現(xiàn)人、車(chē)、路的全面監(jiān)控和管理。計(jì)算機(jī)視覺(jué)藝術(shù)作為智能交通系統(tǒng)中的一個(gè)重要環(huán)節(jié),受到相關(guān)工作人員的高度重視。隨著計(jì)算機(jī)視覺(jué)技術(shù)的發(fā)展,不僅為交通行業(yè)的發(fā)展提供了更多的便捷,同時(shí)還能夠篩選道路交通的各種信息,進(jìn)一步增強(qiáng)了智能交通系統(tǒng)的靈活性和準(zhǔn)確性。
1 計(jì)算機(jī)視覺(jué)技術(shù)的概述
計(jì)算機(jī)視覺(jué)也被稱(chēng)為圖像分析和圖解理解,其包括的理論主要有攝影幾何學(xué)、概率論、圖像處理理論以及人工智能理論等部分。計(jì)算機(jī)視覺(jué)技術(shù)主要是用二維投影圖像實(shí)現(xiàn)三維物體重構(gòu)。這種技術(shù)的應(yīng)用范圍比較廣泛,不僅應(yīng)用于二維圖像識(shí)別方面,同時(shí)還用于三維物體的識(shí)別和重建上面。通過(guò)計(jì)算機(jī)視覺(jué)技術(shù)能夠獲取專(zhuān)業(yè)化的三維信息,對(duì)三維信息的獲取一般有兩種方法,其中一種是直接獲取法,還有一種是間接獲取法。直接獲取法主要是通過(guò)計(jì)算機(jī)視覺(jué)技術(shù)的效果來(lái)確定三維運(yùn)動(dòng)中產(chǎn)生的各種參數(shù),這一過(guò)程對(duì)攝像機(jī)運(yùn)動(dòng)問(wèn)題的關(guān)注程度較高;間接獲取的方式就是將單幅圖像和攝像機(jī)焦距相結(jié)合,來(lái)判斷被測(cè)量位置視覺(jué)上的信息。計(jì)算機(jī)視覺(jué)技術(shù)的關(guān)鍵就是實(shí)現(xiàn)特別匹配,在特殊情況下可以利用不同的攝像C同時(shí)收集運(yùn)動(dòng)信息,從而提高相關(guān)控制的精確度。
2 計(jì)算機(jī)視覺(jué)技術(shù)在智能交通系統(tǒng)中的應(yīng)用
計(jì)算機(jī)視覺(jué)技術(shù)在智能交通系統(tǒng)中的應(yīng)用可以實(shí)現(xiàn)道路交通的監(jiān)控,同時(shí)還能夠?qū)崿F(xiàn)自動(dòng)收費(fèi)、智能導(dǎo)航等功能,主要應(yīng)用有以下幾個(gè)方面的內(nèi)容。
2.1 交通監(jiān)控中對(duì)計(jì)算機(jī)視覺(jué)技術(shù)的應(yīng)用
基于計(jì)算機(jī)視覺(jué)技術(shù)的交通監(jiān)控系統(tǒng)主要分為三個(gè)步驟,首先是對(duì)車(chē)輛和行人進(jìn)行跟蹤和分割,其次是對(duì)車(chē)流量進(jìn)行分析和計(jì)算,并且計(jì)算車(chē)輛的平均速度和道路上車(chē)輛的隊(duì)列長(zhǎng)度,最后根據(jù)道路的交通狀況來(lái)規(guī)劃形式線(xiàn)路,從而有效緩解道路交通擁堵的現(xiàn)狀,方便人們減少出行時(shí)間。車(chē)輛和行人作為道路中運(yùn)動(dòng)的主要目標(biāo),在監(jiān)控場(chǎng)合下,需要對(duì)運(yùn)動(dòng)時(shí)間進(jìn)行有效分割,常用到的分割方式包括光流法和幀差法兩種,其中前一種分割方式主要是依據(jù)圖像中不同的運(yùn)動(dòng)用映射參數(shù)正確的表達(dá),這樣可以將具有同樣映射參數(shù)的光流量進(jìn)行分配,從而完成參數(shù)分割。計(jì)算機(jī)視覺(jué)在交通監(jiān)控中的應(yīng)用主要是對(duì)車(chē)輛速度、車(chē)輛數(shù)目、車(chē)輛分類(lèi)進(jìn)行檢測(cè)。隨著計(jì)算機(jī)通信技術(shù)的發(fā)展,計(jì)算機(jī)視覺(jué)技術(shù)也是日新月異,基于計(jì)算機(jī)視覺(jué)的交通監(jiān)控系統(tǒng)具有較強(qiáng)的實(shí)時(shí)工作性,能夠快速的適應(yīng)高度公路以及城市道路交通的監(jiān)控。
2.2 車(chē)輛導(dǎo)航中對(duì)計(jì)算機(jī)視覺(jué)技術(shù)的應(yīng)用
實(shí)現(xiàn)車(chē)輛的智能導(dǎo)航是計(jì)算機(jī)視覺(jué)技術(shù)在智能交通中應(yīng)用的典型案例。這種技術(shù)主要為駕駛?cè)藛T提供道路信息和車(chē)輛運(yùn)行狀況兩大信息。通過(guò)車(chē)輛智能導(dǎo)航系統(tǒng)的運(yùn)行能夠?qū)Φ缆穬蛇叺慕缦捱M(jìn)行有效的識(shí)別,將車(chē)輛引向規(guī)定的行駛車(chē)道,在車(chē)輛行駛過(guò)程中,該系統(tǒng)能夠自動(dòng)檢測(cè)車(chē)輛與前方其他車(chē)輛之間的距離,從而提醒駕駛?cè)藛T保持車(chē)輛的安全距離,最終實(shí)現(xiàn)安全導(dǎo)航駕駛。通過(guò)該系統(tǒng)的攝像機(jī)運(yùn)動(dòng)能夠識(shí)別其他車(chē)輛的行駛狀況,并且通過(guò)計(jì)算檢測(cè)點(diǎn)的方式計(jì)算車(chē)輛的模擬匹配點(diǎn)。車(chē)倆智能導(dǎo)航系統(tǒng)中就使用了計(jì)算機(jī)視覺(jué)技術(shù),可以從中提取相關(guān)信息,計(jì)算車(chē)輛行駛的安全距離和速度。
2.3 計(jì)算機(jī)視覺(jué)技術(shù)用于車(chē)輛輔助駕駛
計(jì)算機(jī)視覺(jué)技術(shù)在車(chē)輛輔助駕駛中的應(yīng)用主要是幫助駕駛?cè)藛T對(duì)外界的變化做出反應(yīng)。具體表現(xiàn)為車(chē)輛在市內(nèi)行駛時(shí),計(jì)算機(jī)視覺(jué)技術(shù)的應(yīng)用能夠識(shí)別周邊道路的標(biāo)記,并且對(duì)交通標(biāo)志、其他車(chē)輛和行人進(jìn)行識(shí)別,然后篩選相關(guān)信息進(jìn)行計(jì)算,讓駕駛?cè)饲宄饨绲木唧w狀況,從而避開(kāi)其他的車(chē)輛和行人,能夠從根本上減少交通事故的發(fā)生,增強(qiáng)車(chē)輛的安全運(yùn)行。輔助駕駛的形式轉(zhuǎn)變?yōu)槿藱C(jī)交互的方式,一定程度上能夠滿(mǎn)足駕駛?cè)藛T對(duì)信息的需求。
2.4 計(jì)算機(jī)視覺(jué)技術(shù)用于車(chē)輛智能收費(fèi)
車(chē)輛收費(fèi)是車(chē)輛在公共交通位置行駛中的一個(gè)關(guān)鍵環(huán)節(jié)。隨著科學(xué)技術(shù)的發(fā)展,車(chē)輛收費(fèi)系統(tǒng)逐漸向著計(jì)算機(jī)技術(shù)的應(yīng)用方向發(fā)展,計(jì)算機(jī)視覺(jué)技術(shù)在各地區(qū)交通發(fā)展中的應(yīng)用是現(xiàn)代化交通發(fā)展的一個(gè)重要突破口。很多地區(qū)的智能化收費(fèi)都是通過(guò)識(shí)別車(chē)牌的方式來(lái)實(shí)現(xiàn)收費(fèi),我國(guó)在車(chē)牌識(shí)別這方面僅僅限制于單目車(chē)牌和雙目車(chē)牌的識(shí)別,其中單目車(chē)牌識(shí)別的核心就是將車(chē)牌照位置作為核心部分,我國(guó)大部分地區(qū)都是將單目系統(tǒng)作為核心部分來(lái)使用。采用雙目系統(tǒng)對(duì)車(chē)牌進(jìn)行識(shí)別,也可以對(duì)車(chē)輛的型號(hào)進(jìn)行識(shí)別,通過(guò)大量的實(shí)踐發(fā)現(xiàn),雙目系統(tǒng)進(jìn)行車(chē)牌識(shí)別的實(shí)用性較強(qiáng)。但是這種識(shí)別方式在實(shí)際應(yīng)用過(guò)程中仍然存在著信息獲取難度大、車(chē)牌照定位難度大等多種問(wèn)題,尤其是車(chē)輛在高速路上行駛時(shí),對(duì)于車(chē)牌信息的獲取更為困難,因此,在這方面還需要加大研究和實(shí)踐。
3 結(jié)束語(yǔ)
隨著計(jì)算機(jī)視覺(jué)技術(shù)的智能化發(fā)展,其在智能交通系統(tǒng)中的應(yīng)用能夠解決多方面的問(wèn)題。該技術(shù)的應(yīng)用不僅能夠?qū)崿F(xiàn)車(chē)輛的實(shí)時(shí)監(jiān)控,同時(shí)還能夠?qū)崿F(xiàn)車(chē)輛導(dǎo)航以及車(chē)輛收費(fèi),幫助駕駛?cè)藛T識(shí)別車(chē)輛行駛中存在的障礙物,這樣一來(lái),可以增強(qiáng)車(chē)輛行駛的安全性,同時(shí)還能夠提高我國(guó)道路交通系統(tǒng)的整體管理水平。但是該技術(shù)應(yīng)用中也存在不足之處,未來(lái)發(fā)展中需要降低視覺(jué)系統(tǒng)的價(jià)格,減少系統(tǒng)的尺寸,從而增強(qiáng)系統(tǒng)對(duì)車(chē)輛信息的處理速度,最終實(shí)現(xiàn)對(duì)道路交通的全面監(jiān)測(cè)。
摘 要:在科技的帶動(dòng)下,計(jì)算機(jī)圖形學(xué)、計(jì)算機(jī)視覺(jué)與可視化技術(shù)得以快速發(fā)展,并被應(yīng)用到各個(gè)領(lǐng)域,隨著它們的應(yīng)用,極大的推動(dòng)了現(xiàn)代社會(huì)發(fā)展。為進(jìn)一步了解這些技術(shù),充分發(fā)揮其應(yīng)有作用,本文將對(duì)計(jì)算機(jī)圖形學(xué)、計(jì)算機(jī)視覺(jué)以及可視化技術(shù)展開(kāi)研究,希望能為相關(guān)人士帶來(lái)有效參考。
關(guān)鍵詞:計(jì)算機(jī)圖形學(xué);計(jì)算機(jī)視覺(jué);可視化技術(shù)
計(jì)算機(jī)圖形學(xué)、計(jì)算機(jī)視覺(jué)以及可視化技術(shù)三者均是計(jì)算機(jī)領(lǐng)域重要組成部分,要做好計(jì)算機(jī)知識(shí),就要先學(xué)好計(jì)算機(jī)圖形學(xué),但計(jì)算機(jī)圖形學(xué)學(xué)習(xí)相對(duì)枯燥,尤其是算法教學(xué)難以理解,為解決這一問(wèn)題,計(jì)算機(jī)視覺(jué)與可視化技術(shù)被應(yīng)用到計(jì)算機(jī)圖形學(xué)中??梢?jiàn),三者之間存在一定的聯(lián)系,因此,有必要對(duì)計(jì)算機(jī)圖形學(xué)、計(jì)算機(jī)視覺(jué)以及可視化技術(shù)展開(kāi)研究。
1 計(jì)算機(jī)圖形學(xué)概述
1.1 計(jì)算機(jī)圖形學(xué)目的
所謂的計(jì)算機(jī)圖形學(xué)實(shí)際上就是怎樣利用計(jì)算機(jī)表示圖形,并利用計(jì)算機(jī)完成圖形計(jì)算與處理,而這一過(guò)程的實(shí)現(xiàn)需要得到相關(guān)算法的支持。學(xué)習(xí)計(jì)算機(jī)圖形學(xué)的目的是利用計(jì)算機(jī)技術(shù)為人們呈現(xiàn)既帶有美感又不缺真實(shí)的圖形(如下圖1所示),為實(shí)現(xiàn)這一目標(biāo),就需要按照?qǐng)D形的要求創(chuàng)設(shè)合適的場(chǎng)景,并在一些光照模型的作用下,做好光照效果設(shè)計(jì),在這一過(guò)程中需要計(jì)算機(jī)圖形學(xué)能夠與其他計(jì)算機(jī)技術(shù)相配合。經(jīng)過(guò)計(jì)算機(jī)圖形學(xué)出來(lái)的圖像,多會(huì)以數(shù)字圖像的方式展示出來(lái),總的來(lái)說(shuō),計(jì)算機(jī)圖形學(xué)與圖像處理之間存在著一定的聯(lián)系[1]。計(jì)算機(jī)圖形學(xué)的涉及范圍相對(duì)寬泛,不僅有圖形硬件設(shè)計(jì),還包括動(dòng)畫(huà)制作,虛擬現(xiàn)實(shí)等多個(gè)部分。此外,計(jì)算機(jī)圖形學(xué)在動(dòng)畫(huà)制作中的應(yīng)用頻率也很高,如45分鐘一集的動(dòng)畫(huà)影片中,85%的畫(huà)面都需要用算機(jī)圖形學(xué)來(lái)完成,由此可見(jiàn),計(jì)算機(jī)圖形學(xué)的應(yīng)用頻率極高,并在動(dòng)畫(huà)制作中發(fā)揮著不可替代的作用。因此,應(yīng)重視計(jì)算機(jī)圖形學(xué)的應(yīng)用。
1.2 計(jì)算機(jī)圖形學(xué)應(yīng)用
隨著計(jì)算機(jī)圖形學(xué)的發(fā)展,它被應(yīng)用到各個(gè)領(lǐng)域中,并發(fā)揮著重要作用。首先,在計(jì)算機(jī)輔助設(shè)計(jì)與制造中的應(yīng)用,這是計(jì)算機(jī)圖形學(xué)應(yīng)用最多的領(lǐng)域,在計(jì)算機(jī)圖形學(xué)被應(yīng)用以后,不僅可以設(shè)計(jì)出更精準(zhǔn)的圖形,還能做好人機(jī)交互設(shè)計(jì),強(qiáng)化修改能力。計(jì)算機(jī)圖形學(xué)還被應(yīng)用到三維形體重建中,利用該技術(shù)可以將原理的二維信息轉(zhuǎn)化為三維信息,如在某次工程圖紙?jiān)O(shè)計(jì)中就應(yīng)用了計(jì)算機(jī)圖形學(xué),經(jīng)過(guò)一系列的處理以后,三維形體逐漸形成,最終實(shí)現(xiàn)了重建。其次,在醫(yī)學(xué)領(lǐng)域中的應(yīng)用。計(jì)算機(jī)圖形學(xué)在醫(yī)學(xué)領(lǐng)域中的應(yīng)用多以計(jì)算可視化的形式展示出來(lái),如在腦部手術(shù)中,醫(yī)生為看清患處真實(shí)情況,經(jīng)常需要利用在可視化技術(shù)的作用下將復(fù)雜的數(shù)據(jù)轉(zhuǎn)化為圖像,這時(shí)就體現(xiàn)了計(jì)算機(jī)圖形學(xué)在其中的應(yīng)用[2]。再者,在計(jì)算機(jī)動(dòng)畫(huà)中的應(yīng)用,人們看到的動(dòng)畫(huà)影片就是計(jì)算機(jī)圖形學(xué)作用的結(jié)果,以動(dòng)畫(huà)人物的行走為例,為保證動(dòng)畫(huà)人物的行走與自然人不存在過(guò)大差異,就需要應(yīng)用大量的計(jì)算機(jī)技術(shù),并在計(jì)算機(jī)圖形學(xué)的作用下完成設(shè)計(jì)。最后,在計(jì)算機(jī)藝術(shù)中的應(yīng)用。計(jì)算機(jī)圖形學(xué)在計(jì)算機(jī)藝術(shù)中也有廣泛應(yīng)用,它不僅可以用于藝術(shù)制作,很多場(chǎng)景都是通過(guò)計(jì)算機(jī)圖形學(xué)來(lái)完成的,現(xiàn)階段,一些人正在利用計(jì)算機(jī)圖形學(xué)創(chuàng)設(shè)人體模擬系統(tǒng),其目的是讓已故人士再次出現(xiàn)在熒屏上,這一目標(biāo)的實(shí)現(xiàn)就需要得到計(jì)算機(jī)圖形學(xué)的支持。
2 計(jì)算機(jī)視覺(jué)技術(shù)
2.1 計(jì)算機(jī)視覺(jué)技術(shù)含義
所謂的計(jì)算機(jī)視覺(jué)技術(shù),實(shí)際上就是用計(jì)算機(jī)取代人眼做識(shí)別、跟蹤以及測(cè)量等,同時(shí)也兼顧圖形處理,其目的是讓圖像在計(jì)算機(jī)被處理以后更適于識(shí)別。對(duì)于計(jì)算機(jī)視覺(jué)技術(shù)來(lái)說(shuō),意在實(shí)現(xiàn)人工智能,主要是從圖像與多維數(shù)據(jù)等方面實(shí)現(xiàn)人工智能系統(tǒng)設(shè)計(jì)[3]。計(jì)算機(jī)視覺(jué)是一種在相關(guān)理論與模型基礎(chǔ)上發(fā)展起來(lái)的視覺(jué)系統(tǒng),其主要構(gòu)成部分有以下幾種:
(1)程序控制,這一點(diǎn)主要體現(xiàn)在機(jī)器人設(shè)計(jì)上;(2)事件檢測(cè),多體現(xiàn)在圖像監(jiān)測(cè)上;(3)信息組織,主要體現(xiàn)在圖像數(shù)據(jù)庫(kù)等方面。計(jì)算機(jī)視覺(jué)三個(gè)階段如圖2所示,通過(guò)觀(guān)察圖1可以發(fā)現(xiàn),計(jì)算機(jī)視覺(jué)存在于圖像處理始終,從早期處理直到后期結(jié)束都存在,最終實(shí)現(xiàn)了3D描述,可見(jiàn),計(jì)算機(jī)視覺(jué)具有十分重要的作用[4]。
2.2 計(jì)算機(jī)視覺(jué)技術(shù)的應(yīng)用
現(xiàn)階段,現(xiàn)代社會(huì)已經(jīng)進(jìn)入信息化時(shí)代,計(jì)算機(jī)技術(shù)也被應(yīng)用到各個(gè)領(lǐng)域,并發(fā)揮著重要作用。計(jì)算機(jī)視覺(jué)的應(yīng)用促使計(jì)算機(jī)實(shí)現(xiàn)了智能化,在該技術(shù)的支持下,計(jì)算機(jī)可以像人一樣透過(guò)視覺(jué)看待世界萬(wàn)物,且具有良好的適應(yīng)能力,但這一目標(biāo)的實(shí)現(xiàn)還需要很長(zhǎng)時(shí)間,需要一系列的努力才能實(shí)現(xiàn)?,F(xiàn)階段,計(jì)算機(jī)視覺(jué)應(yīng)用最多的就是車(chē)輛視覺(jué)導(dǎo)航,然而,這種導(dǎo)航還沒(méi)有實(shí)現(xiàn)完全自主導(dǎo)航,這也是需要進(jìn)一步研究的地方。計(jì)算機(jī)視覺(jué)技術(shù)的適應(yīng)性較好,特別適合在工業(yè)領(lǐng)域應(yīng)用,即便是存在電子在干擾或溫度變化較大的地方都能很好的運(yùn)行,其整體效果也不會(huì)受到影響,再者,計(jì)算機(jī)視覺(jué)技術(shù)的嵌入性較好,成本相對(duì)較低,尤其適合在PC方案中使用,同時(shí),具有一定的非接觸能力,能夠獲取大量信息,且不受距離限制,總的來(lái)說(shuō),計(jì)算機(jī)視覺(jué)技術(shù)總體效果較好,適合利用在各種工業(yè)環(huán)境中應(yīng)用,因此,應(yīng)重視計(jì)算機(jī)視覺(jué)技術(shù)的應(yīng)用[5]。同時(shí)計(jì)算機(jī)視覺(jué)還被應(yīng)用到移動(dòng)機(jī)器人設(shè)計(jì)中,主要是利用小波模板展示人體形態(tài),然后做圖像掃描,這樣就可以順利完成小波變換,進(jìn)而了解到人的存在。同樣,將計(jì)算機(jī)視覺(jué)應(yīng)用到機(jī)器人設(shè)計(jì)上,可以自動(dòng)檢測(cè)出正在行動(dòng)的人或車(chē)輛,而無(wú)法檢測(cè)到靜止的人,之所以會(huì)出現(xiàn)這樣情況,主要是由于其中采用率步態(tài)分析法。
3 可視化技術(shù)
3.1 可視化技術(shù)含義
可視化技術(shù)是一種綜合了計(jì)算機(jī)圖形學(xué)與圖像處理于一體的技術(shù),它可以將復(fù)雜的數(shù)據(jù)轉(zhuǎn)化為圖像并在屏幕上展示出來(lái)。在可視化技術(shù)中,融合了以上兩種技術(shù)的特點(diǎn),并在多個(gè)領(lǐng)域都有應(yīng)用,隨著可視化技術(shù)的應(yīng)用,不僅有效實(shí)現(xiàn)了數(shù)據(jù)表示,還強(qiáng)化了數(shù)據(jù)處理能力,更對(duì)數(shù)據(jù)決策分析有一定作用[6]?,F(xiàn)階段,虛擬現(xiàn)實(shí)技術(shù)已經(jīng)成為可視化技術(shù)主要發(fā)展方向。
3.2 可視化技術(shù)的應(yīng)用
首先,在計(jì)算機(jī)圖形學(xué)教學(xué)中的應(yīng)用,計(jì)算機(jī)圖形學(xué)相對(duì)枯燥,相關(guān)知識(shí)也很抽象,不便于學(xué)生理解,在計(jì)算機(jī)圖形學(xué)中最重要的部分是曲線(xiàn)曲面,而這些曲線(xiàn)曲面多是與數(shù)學(xué)模型有關(guān),具有一定的抽象性,學(xué)生理解難度較大,以往教師只能通過(guò)一系列的公式演算幫助學(xué)生理解,盡管這樣依然難以讓學(xué)生掌握曲線(xiàn)變化情況,學(xué)生依舊無(wú)法正確理解。為減少這種情況的發(fā)生,可視化技術(shù)被應(yīng)用到計(jì)算機(jī)圖形學(xué)教學(xué)中,教師將抽象的知識(shí)用動(dòng)畫(huà)的形式展示出來(lái),學(xué)生只要觀(guān)看動(dòng)畫(huà),拖動(dòng)一定的控制點(diǎn)就可以了解到曲線(xiàn)變化情況,這樣一來(lái)不僅增加了教學(xué)趣味性,學(xué)生也可以隨意變動(dòng)曲線(xiàn),讓復(fù)雜的知識(shí)變得簡(jiǎn)單,深化學(xué)生對(duì)計(jì)算機(jī)圖形學(xué)知識(shí)的深度理解,同時(shí),利用可視化技術(shù)在一定條件下,還可以完成代碼編譯,如在Actoin ScriPt中做編譯,這樣也可以增強(qiáng)學(xué)生的理解能力[7]。
其次,在醫(yī)學(xué)領(lǐng)域中的應(yīng)用。醫(yī)學(xué)領(lǐng)域?qū)τ诳梢暬夹g(shù)的應(yīng)用主要體現(xiàn)在放射治療與矯正手術(shù)上。通過(guò)可視化技術(shù)可以屏幕上看到手術(shù)整個(gè)過(guò)程,并將原來(lái)細(xì)節(jié)部位放大,手術(shù)醫(yī)生觀(guān)察的更加細(xì)致,手術(shù)成功幾率也會(huì)大幅度提升,患者生命也能得到保證(如圖3所示)。如在對(duì)某名患者進(jìn)行身體檢查的過(guò)程中需要應(yīng)用到可視化技術(shù),由于通過(guò)檢查會(huì)獲得大量數(shù)據(jù),而這些數(shù)據(jù)又相對(duì)復(fù)雜,但在可視化技術(shù)下就可以通過(guò)圖表、曲線(xiàn)圖或立柱圖的方式展示出來(lái),經(jīng)過(guò)可視化技術(shù)的作用,了解到患者的血糖為5.6mmol/L,醫(yī)生可以根這一數(shù)據(jù)做出診斷,而不必再分析這些數(shù)據(jù)。據(jù)不完全統(tǒng)計(jì),80%的醫(yī)療檢查工作都是需要利用可視化技術(shù)。
地質(zhì)勘探是我國(guó)最重要的工作之一,由于多數(shù)礦藏都深埋地下,即便使用探測(cè)儀受多種因素影響也無(wú)法了解到實(shí)際礦藏情況,這就需要應(yīng)用到可視化技術(shù),在可視化技術(shù)的作用下,相關(guān)工作人員可以了解到地下有無(wú)礦藏,如果存在礦藏,相關(guān)工作人員也可以了解到礦藏所在位置與實(shí)際儲(chǔ)備量,進(jìn)而為礦藏開(kāi)采奠定基礎(chǔ)。如在地質(zhì)勘探中,相關(guān)工作人員利用可視化技術(shù)做地形圖整理,然后從中提取地形數(shù)據(jù),再用CATIA做導(dǎo)入,這樣就可以完成地形模型創(chuàng)建,這樣就完成了三維地質(zhì)模型創(chuàng)建工作,同時(shí)在相關(guān)工作臺(tái)的影響下,還可以完成地形數(shù)據(jù)導(dǎo)入,進(jìn)而生成一定的地形云點(diǎn),如果其中存在錯(cuò)誤,可視化技術(shù)也可以將其中的錯(cuò)誤內(nèi)容刪除,這些都是可視化技術(shù)所帶來(lái)的好處[8]。由此可見(jiàn),可視化技術(shù)已經(jīng)成為地質(zhì)勘探中不缺少的技術(shù)。
最后,在氣象預(yù)報(bào)中的應(yīng)用(如圖4所示)。利用可視化技術(shù)能夠?qū)?shù)據(jù)轉(zhuǎn)化為圖像,通過(guò)觀(guān)察圖像就可以了解到云層變化情況,同時(shí)也能了解到實(shí)際風(fēng)力大小與風(fēng)走向等,氣象預(yù)報(bào)人員就可以根據(jù)圖像做出精準(zhǔn)分析,需要了解氣象變化的人也能了解到現(xiàn)實(shí)情況,如果氣象條件惡劣,相關(guān)工作人員也可以及時(shí)做出工作調(diào)整,減少危險(xiǎn)事件的發(fā)生。據(jù)不完全統(tǒng)計(jì),可視化技術(shù)在氣象預(yù)報(bào)中的應(yīng)用頻率高達(dá)100%,由此挽回的經(jīng)濟(jì)損失高達(dá)13.2億元,可見(jiàn),可視化技術(shù)在氣象預(yù)報(bào)中的應(yīng)用十分有必要,因此,應(yīng)重視可視化技術(shù)在氣象預(yù)報(bào)中的應(yīng)用。
4 結(jié)語(yǔ)
通過(guò)以上研究得知,計(jì)算機(jī)圖形學(xué)、計(jì)算機(jī)視覺(jué)以及可視化技術(shù)三者各具特色,三者間也存在一定的關(guān)系,尤其是可視化技術(shù)綜合了前兩者的特點(diǎn),并融合了其他技術(shù),在很多領(lǐng)域中都有應(yīng)用??梢暬夹g(shù)是現(xiàn)階段應(yīng)用最多的一種技術(shù),在計(jì)算機(jī)圖形學(xué)教學(xué)中也有應(yīng)用,并發(fā)揮著不可替代的作用。本文分析了計(jì)算機(jī)圖形學(xué)、計(jì)算機(jī)視覺(jué)以及可視化技術(shù)的含義與應(yīng)用,希望能為相關(guān)人士帶來(lái)有效參考,正確利用這些技術(shù)。
摘 要:用C、C++、Java等計(jì)算機(jī)語(yǔ)言編一個(gè)圖像識(shí)別程序,常常需要借助一些圖像處理的工具庫(kù),OpenCV就是其中之一,使用OpenCV要比使用計(jì)算機(jī)應(yīng)用軟件困難,需要前期復(fù)雜的準(zhǔn)備工作,如果了解了OpenCV與其他圖像處理應(yīng)用軟件的區(qū)別、學(xué)習(xí)OpenCV的基礎(chǔ)、運(yùn)行環(huán)境、圖像操作原理以及OpenCV文檔包含的內(nèi)容,學(xué)習(xí)和使用OpenCV就會(huì)容易很多。
關(guān)鍵詞:圖像處理 OpenCV C
圖像識(shí)別技術(shù)已經(jīng)應(yīng)用到生活中的許多方面。文字識(shí)別系統(tǒng),直接把圖片上的文字掃描成文本文檔格式。人臉識(shí)別技術(shù)已經(jīng)用到了智能手機(jī)之中,現(xiàn)在的手機(jī)解鎖可以直接使用人臉識(shí)別。指文圖像識(shí)別的應(yīng)用更為廣泛,如辦理身份證、入學(xué)考試、駕照等用來(lái)確認(rèn)身份。百度、Google、蘋(píng)果等公司研究的無(wú)人駕駛汽車(chē),將該技術(shù)用于對(duì)障礙物、路標(biāo)、行人及其他車(chē)輛的判斷。道路交通監(jiān)控系統(tǒng)中,系統(tǒng)自動(dòng)檢索違規(guī)車(chē)輛,并對(duì)車(chē)輛的車(chē)牌等信息進(jìn)行識(shí)別。通過(guò)車(chē)牌提取、圖像預(yù)處理、特征提取、車(chē)牌字符識(shí)別等技術(shù),識(shí)別車(chē)輛牌號(hào),目前,字母和數(shù)字的識(shí)別率可達(dá)96%,漢字的識(shí)別率可達(dá)95% [1-2]。所有的這些都用到了圖像識(shí)別功能,要編寫(xiě)圖像識(shí)別程序使用OpenCV是一個(gè)不錯(cuò)的選擇。
1 OpenCV簡(jiǎn)介
OpenCV是Intel公司于1999年推出的一種面向圖像處理的開(kāi)源計(jì)算機(jī)視覺(jué)庫(kù),其中,OpenCV是Open Source Computer Vision Library的縮寫(xiě),如今由Willow Garage提供支持,其中包括了3個(gè)版本OpenCV1、OpenCV2、OpenCV3,除了OpenCV1現(xiàn)在很少使用外,其他兩個(gè)版本已經(jīng)有了很多改進(jìn)的版本。OpenCV有開(kāi)源的函數(shù)庫(kù),可以滿(mǎn)足不同領(lǐng)域的圖像處理需求,使用時(shí)以函數(shù)調(diào)用的形式提供給用戶(hù),也可以對(duì)其代碼進(jìn)行改進(jìn),便于用戶(hù)實(shí)驗(yàn)教學(xué)或程序開(kāi)發(fā)使用。
2 OpenCV的特點(diǎn)
(1)開(kāi)源。OpenCV是一個(gè)開(kāi)源的圖像處理函數(shù)庫(kù),無(wú)論是商業(yè)應(yīng)用,還是做科學(xué)研究,完全是免費(fèi)的,與Linux類(lèi)似它的源代碼也是公開(kāi)的,這樣程序的安全性就得到保障,OpenCV的函數(shù)庫(kù)是用C語(yǔ)言和C++語(yǔ)言進(jìn)行編寫(xiě)的,源代碼可讀性比較高,發(fā)現(xiàn)其中不足之可以自行進(jìn)行修改,避免編譯后的可執(zhí)行文件出現(xiàn)漏洞。
(2)跨平臺(tái)。OpenCV是一個(gè)基于BSD許可(開(kāi)源)發(fā)行的跨平臺(tái)計(jì)算機(jī)視覺(jué)庫(kù),可以運(yùn)行在Windows、Linux、Mac OS和嵌入式等操作系統(tǒng)上[3]。
(3)應(yīng)用領(lǐng)域廣。OpenCV圖像處理可以使用到多個(gè)領(lǐng)域當(dāng)中,包括生物醫(yī)學(xué)、工業(yè)、軍事安防、機(jī)器視覺(jué)、航空航天等。目前已知OpenCV編程系統(tǒng)在航空航天定位、衛(wèi)星地圖繪制、工廠(chǎng)大規(guī)模生產(chǎn)視覺(jué)檢測(cè)等方面得到了廣泛的應(yīng)用,同時(shí)對(duì)于無(wú)人飛行器的視覺(jué)捕捉技術(shù)也有極大的幫助[4]。
(4)支持多種語(yǔ)言進(jìn)行開(kāi)發(fā)。OpenCV中包括了多種編程語(yǔ)言的接口,其中支持的編程語(yǔ)言包括C、C++、C#、Java、Python等。
3 OpenCV與圖像處理應(yīng)用軟件
在計(jì)算機(jī)學(xué)習(xí)中也會(huì)學(xué)到一些其他的圖像處理軟件,如Photo Shop、Windows畫(huà)圖工具等在計(jì)算機(jī)中使用的圖像處理工具。在手機(jī)中有一個(gè)比較流行的軟件,在拍好照片后可以對(duì)個(gè)人照片進(jìn)行智能美化,這些軟件都是應(yīng)用軟件缺少編程需要的接口,這些軟件處理圖像后只是給出結(jié)果,無(wú)法取到程序處理所需要的中間參數(shù),只能局限于最后的結(jié)果展示,如果只是單純的圖像制作, Photo Shop類(lèi)的圖像處理工具已經(jīng)足夠了。但是對(duì)于圖像識(shí)別、機(jī)器視覺(jué)等,需要對(duì)圖像內(nèi)容做出判斷,用類(lèi)似于Photo Shop這樣的圖像處理軟件就無(wú)法完成了,因?yàn)闊o(wú)法集成到所編寫(xiě)的程序當(dāng)中。OpenCV是一個(gè)圖像處理函數(shù)庫(kù),其中包涵了對(duì)于計(jì)算機(jī)操作系統(tǒng)和計(jì)算機(jī)語(yǔ)言編譯平臺(tái)支持的API接口以及源碼庫(kù),可以在編寫(xiě)的程序中去處理圖像,不但可以得到圖像處理后的結(jié)果,還可以對(duì)圖像中間的處理過(guò)程進(jìn)行控制,可以對(duì)圖像中的內(nèi)容用自己編寫(xiě)的程序代碼進(jìn)行判定,實(shí)現(xiàn)識(shí)別操作。
4 學(xué)習(xí)OpenCV的基礎(chǔ)
C和C++語(yǔ)言在工科類(lèi)專(zhuān)業(yè)中一般設(shè)置必修課程,C語(yǔ)言常作為一門(mén)基礎(chǔ)的編程語(yǔ)言來(lái)教,有的學(xué)生覺(jué)得C比較容易,有的學(xué)生感覺(jué)比較難,這個(gè)取決于每個(gè)人對(duì)計(jì)算機(jī)語(yǔ)言的理解能力與對(duì)計(jì)算機(jī)語(yǔ)言的興趣,C和C++的區(qū)別在于C++增加了類(lèi),支持面向?qū)ο缶幊?。新版OpenCV函數(shù)庫(kù)是基于C++的,打開(kāi)源代碼的文件夾可以看到許多以.cpp結(jié)尾的C++代碼文件,所以對(duì)于C和C++的掌握情況直接關(guān)系到對(duì)OpenCV的學(xué)習(xí)。
5 OpenCV的運(yùn)行環(huán)境
在學(xué)習(xí)每種計(jì)算機(jī)語(yǔ)言之前都要對(duì)每種計(jì)算機(jī)語(yǔ)言的IDE(Integrated Development Environment,集成開(kāi)發(fā)環(huán)境)進(jìn)行安裝和配置,集成開(kāi)發(fā)環(huán)境不只是用來(lái)編輯程序代碼,還包括了對(duì)代碼的編譯、調(diào)試與運(yùn)行等。如Java語(yǔ)言,在Windows操作系統(tǒng)中Java語(yǔ)言最簡(jiǎn)單的編輯環(huán)境是記事本,對(duì)于Java的編譯與運(yùn)行需要用到命令窗調(diào)用所安裝JDK(Java Development Kit,Java開(kāi)發(fā)包)中的編譯程序與運(yùn)行環(huán)境,如果是集成的IDE,如Eclipse、MyEclipse等,點(diǎn)擊IDE上的運(yùn)行或是調(diào)試按鈕,就可以在IDE中的結(jié)果輸出窗口上直接查看運(yùn)行結(jié)果。OpenCV是用C和C++語(yǔ)言所編寫(xiě)的圖像處理函數(shù)庫(kù),它沒(méi)有自己獨(dú)立的IDE,所以它需要借助其他編程語(yǔ)言的IDE進(jìn)行編寫(xiě)和調(diào)用,如Microsoft Visual Studio、QT Creator等。
配置開(kāi)發(fā)環(huán)境是學(xué)習(xí)OpenCV中重要的一步,但是這個(gè)過(guò)程相對(duì)于初學(xué)者來(lái)說(shuō)有些復(fù)雜。首先,要從網(wǎng)上下載并安裝計(jì)算機(jī)語(yǔ)言的開(kāi)發(fā)環(huán)境,如微軟的Visual Studio、QT集成開(kāi)發(fā)環(huán)境等。其次,下載并安裝OpenCV的安裝包,安裝OpenCV是一個(gè)解壓的過(guò)程。下一步,就是對(duì)開(kāi)發(fā)環(huán)境的配置,其中要對(duì)系統(tǒng)變量、包含目錄、附加依賴(lài)項(xiàng)進(jìn)行配置。然后進(jìn)行調(diào)試運(yùn)行。在對(duì)開(kāi)發(fā)環(huán)境配置時(shí),為保證OpenCV庫(kù)與本地開(kāi)發(fā)環(huán)境兼容性更好,最好使用CMaker(Cross Platform Make)在本地環(huán)境中對(duì)OpenCV源代碼重新編譯。
6 OpenCV中的Hello World
在學(xué)習(xí)C或是java語(yǔ)言時(shí),常常會(huì)有一個(gè)重要的標(biāo)志就是‘Hello World!’,標(biāo)志著系統(tǒng)配置完成并且整個(gè)IDE環(huán)境運(yùn)行正常,編譯系統(tǒng)成功的編譯了所寫(xiě)的代碼,并且在操作系統(tǒng)中執(zhí)行成功。OpenCV中這個(gè)標(biāo)志有所不同,它的‘Hello World!’是在IDE中寫(xiě)好代碼后,調(diào)用OpenCV中的函數(shù)打開(kāi)一幅代碼中指定的圖片并顯示到新建的窗口中,標(biāo)志著IDE中的參數(shù)是正確的,這是進(jìn)行圖像操作的重要一步。
7 OpenCV圖像像素操作
對(duì)于數(shù)值的計(jì)算是第一步一般輸出一個(gè)結(jié)果,在學(xué)任何一門(mén)計(jì)算機(jī)語(yǔ)言時(shí)會(huì)有一個(gè)很好的例子“計(jì)算器”,那圖像如何去表示?其實(shí)圖像是多個(gè)結(jié)果的一個(gè)集合,就像在C語(yǔ)言中打出星號(hào)所組成的菱形,每一個(gè)星號(hào)可以比喻成一個(gè)圖像中的像素點(diǎn)。對(duì)于圖像處理過(guò)程中常常見(jiàn)到的有3種:第一種,RGB圖像,彩色的圖像,每個(gè)像素點(diǎn)由3個(gè)數(shù)值表示。第二種,灰度圖像,像以前的黑白電視機(jī),每個(gè)像素點(diǎn)由一個(gè)數(shù)值就可以表示。第三種,二值圖像,每個(gè)像素點(diǎn)由一個(gè)數(shù)值表示。在OpenCV中有多種方法可以對(duì)圖像進(jìn)行操作,其中比較方便的就是利用cv::Mat類(lèi),對(duì)圖像進(jìn)行打開(kāi)、顯示、修改和保存,這也是進(jìn)行圖像操作的重要一步。
8 OpenCV的文檔
大家在OpenCV官網(wǎng)提供的文檔中可以得到更多幫助。在OpenCV的文檔中包括了對(duì)組件結(jié)構(gòu)的介紹,了解OpenCV的組件結(jié)構(gòu)對(duì)學(xué)習(xí)OpenCV是十分有利的,該介紹包括了一系列的動(dòng)態(tài)或靜態(tài)庫(kù),如矩陣數(shù)組的定義、圖像處理模塊包含的內(nèi)容、視頻分析所需要的算法、基本的多視覺(jué)算法、外部特征的檢測(cè)類(lèi)、物體的檢測(cè)類(lèi)、UI類(lèi)的使用、圖像算法的硬件加速等,在編寫(xiě)代碼時(shí)可以查找其類(lèi)中對(duì)象所包含成員和方法。一些OpenCV圖書(shū)所帶的光盤(pán)中或互聯(lián)網(wǎng)上網(wǎng)友提供的圖像處理代碼,由于編程使用的操作系統(tǒng)或編譯環(huán)境不同,有些代碼會(huì)包含未知的頭文件或者缺少頭文件,代碼本身并沒(méi)有錯(cuò)誤,但總是編譯出錯(cuò),了解了這些知識(shí)后在編程時(shí),有利于定位在程序中所引用的文件所屬的位置,從而有效地處理文件引用出現(xiàn)的問(wèn)題。
無(wú)論對(duì)什么樣的物體進(jìn)行識(shí)別,圖像識(shí)別過(guò)程基本是不變的,包括:圖像預(yù)處理、圖像分割,特征提取、判斷匹配、輸出結(jié)果。圖像預(yù)處理中會(huì)用到圖像的灰度化、圖像的二值化、去除圖像的噪聲等算法。特征提取中會(huì)用到圖像變換、圖像邊緣檢測(cè)等算法。判斷匹配中用到直方圖、投影等算法。圖像分割有3種:基于閾值的分割、基于區(qū)域分割、基于邊緣的分割[5]。在OpenCV的文檔中都詳細(xì)提供了基本算法類(lèi)的定義與方法,通過(guò)OpenCV的代碼庫(kù)中的基本算法類(lèi)或幾個(gè)基本算法類(lèi)的組合可以實(shí)現(xiàn)以上所列算法的所有功能。
9 結(jié)語(yǔ)
據(jù)統(tǒng)計(jì),一個(gè)人獲取的信息大約有75%來(lái)自視覺(jué)。在工業(yè)4.0的時(shí)代里機(jī)器也需要有自己的視覺(jué)系統(tǒng),基于圖像處理的機(jī)器視覺(jué)在人工智能領(lǐng)域會(huì)得到更廣泛的應(yīng)用,如:無(wú)人駕駛汽車(chē)、智能機(jī)器人、智能安防系統(tǒng)等。OpenCV是一個(gè)進(jìn)入這些行業(yè)的重要工具之一,圖像處理的學(xué)習(xí)過(guò)程是一個(gè)循序漸進(jìn)的過(guò)程,希望學(xué)習(xí)者在OpenCV的基礎(chǔ)上提高對(duì)于圖像處理的認(rèn)識(shí)及對(duì)圖像處理的技術(shù)水平。
摘 要: 在對(duì)比了傳統(tǒng)運(yùn)動(dòng)車(chē)輛實(shí)時(shí)檢測(cè)方法的基礎(chǔ)上,提出了一種新的G?C二重差分法,將視頻流中的某一當(dāng)前幀與背景幀進(jìn)行邊緣檢測(cè),將兩幀的結(jié)果相減,得到梯度差分,再將此結(jié)果與背景顏色差分結(jié)果進(jìn)行“或”運(yùn)算,提高了車(chē)輛存在判斷的準(zhǔn)確度,此算法可以準(zhǔn)確檢測(cè)出路面運(yùn)動(dòng)車(chē)輛存在同時(shí)有效消除車(chē)輛陰影的影響,為后續(xù)車(chē)輛運(yùn)動(dòng)速度的實(shí)時(shí)檢測(cè)提供了有力保證?;谶\(yùn)動(dòng)車(chē)輛檢測(cè)的結(jié)果,在VC環(huán)境下進(jìn)行了編程實(shí)現(xiàn),自動(dòng)檢測(cè)出運(yùn)動(dòng)車(chē)輛的實(shí)時(shí)速度,測(cè)試結(jié)果表明該算法效果很好。
關(guān)鍵詞: 計(jì)算機(jī)視覺(jué); 車(chē)輛檢測(cè); 速度檢測(cè); 消除車(chē)輛陰影
0 引 言
計(jì)算機(jī)視覺(jué)(Computer Vision)主要研究如何運(yùn)用照相機(jī)和計(jì)算機(jī)獲取被拍攝對(duì)象的數(shù)據(jù)與信息,形象的說(shuō),就是給計(jì)算機(jī)安裝上“眼睛”(照相機(jī))和“大腦”(算法)。目前,計(jì)算機(jī)視覺(jué)技術(shù)的應(yīng)用領(lǐng)域十分廣泛,其在道路交通管理中的應(yīng)用更是取得了很好的效果。隨著科學(xué)技術(shù)的飛速發(fā)展,現(xiàn)代交通在經(jīng)濟(jì)發(fā)展中所起的作用越來(lái)越大,而交通現(xiàn)代化帶來(lái)的問(wèn)題也越來(lái)越多,諸如交通擁擠、交通事故頻發(fā)、交通環(huán)境惡化等。在這樣的大背景下,智能交通系統(tǒng)(Intelligent Traffic System,ITS)作為一種強(qiáng)有力的交通管理手段應(yīng)運(yùn)而生,其高效率的管理特點(diǎn)使其成為當(dāng)今世界道路交通管理的發(fā)展趨勢(shì),而計(jì)算機(jī)視覺(jué)技術(shù)則是ITS的重要技術(shù)支持。
實(shí)時(shí)車(chē)輛運(yùn)動(dòng)速度檢測(cè)是ITS對(duì)交通實(shí)施監(jiān)測(cè)和管理的重要一環(huán),對(duì)車(chē)輛速度的檢測(cè)一方面可以監(jiān)控超速等違章問(wèn)題,減少交通事故的發(fā)生,另一方面可以根據(jù)車(chē)速判斷道路擁擠程度,進(jìn)而迅速采取措施,保證道路交通的安全和暢通,從而實(shí)現(xiàn)智能交通管理的目的。在上一代ITS中,實(shí)時(shí)車(chē)輛運(yùn)動(dòng)速度檢測(cè)的方法主要有線(xiàn)圈檢測(cè)、激光檢測(cè)、雷達(dá)檢測(cè)等,這些速度檢測(cè)方法多多少少都存在一定的問(wèn)題,如容易受路基狀況、自然環(huán)境等的影響精度降低,而在新一代ITS中基于計(jì)算機(jī)視覺(jué)的車(chē)輛速度檢測(cè)法則大大提高了測(cè)速的精度,這有賴(lài)于計(jì)算機(jī)有一個(gè)“超強(qiáng)大腦”,即好的算法。
1 運(yùn)動(dòng)車(chē)輛的檢測(cè)
運(yùn)動(dòng)車(chē)輛的檢測(cè)是實(shí)時(shí)運(yùn)動(dòng)車(chē)輛速度檢測(cè)的基礎(chǔ),使計(jì)算機(jī)能夠自動(dòng)的把相機(jī)攝取的視頻里的靜止物體與運(yùn)動(dòng)物體區(qū)別開(kāi),并且自動(dòng)提取出運(yùn)動(dòng)物體。所以,在研究實(shí)時(shí)車(chē)輛速度檢測(cè)算法前,先要研究運(yùn)動(dòng)車(chē)輛的檢測(cè)算法。
1.1 現(xiàn)有運(yùn)動(dòng)目標(biāo)檢測(cè)方法比較
目前,常用的運(yùn)動(dòng)車(chē)輛實(shí)時(shí)檢測(cè)方法主要有幀間差分法和背景差分法。
1.2.2 預(yù)處理幀的顏色差分
由于無(wú)論車(chē)身像素值是否低于路面像素值,其梯度邊緣必然存在,而交通路面一般都很平坦,除了車(chē)道線(xiàn)外檢測(cè)不到邊緣,將當(dāng)前幀與路面背景模型均進(jìn)行邊緣檢測(cè),再將兩個(gè)邊緣圖像按式(8)做差得到運(yùn)動(dòng)物體的邊緣梯度差分圖像:
3 實(shí)驗(yàn)結(jié)果與分析
筆者用實(shí)際拍攝的視頻圖像對(duì)上述算法進(jìn)行了試驗(yàn)測(cè)試,實(shí)驗(yàn)時(shí)模擬實(shí)際交通攝像機(jī)的安裝情況,使其固定不動(dòng),計(jì)算機(jī)處理的速度約為20 f/s。首先將視頻中的某一幀進(jìn)行邊緣檢測(cè),與背景做梯度差分,并與背景顏色差分的結(jié)果進(jìn)行“或”運(yùn)算,最后對(duì)圖像去噪并二值化,通過(guò)測(cè)試多種路況、天氣和光照條件,試驗(yàn)結(jié)果顯示該算法可以在陽(yáng)光充足、遇到物體陰影明顯的情況下準(zhǔn)確地將運(yùn)動(dòng)車(chē)輛從視頻的背景中提取出來(lái),并能準(zhǔn)確檢測(cè)出車(chē)輛的速度,如圖3所示。
4 結(jié) 語(yǔ)
計(jì)算視覺(jué)的應(yīng)用提高了智能交通系統(tǒng)的準(zhǔn)確性,本文在對(duì)比了傳統(tǒng)運(yùn)動(dòng)車(chē)輛實(shí)時(shí)檢測(cè)方法的基礎(chǔ)上,提出了一種新的運(yùn)動(dòng)車(chē)輛實(shí)時(shí)速度檢測(cè)算法,此算法與傳統(tǒng)的算法相比,可以更加準(zhǔn)確地檢測(cè)出路面運(yùn)動(dòng)車(chē)輛的存在,同時(shí)有效消除車(chē)輛陰影的影響,為后續(xù)車(chē)輛運(yùn)動(dòng)速度的實(shí)時(shí)檢測(cè)提供有力保證?;谶\(yùn)動(dòng)車(chē)輛檢測(cè)的結(jié)果,進(jìn)行編程實(shí)現(xiàn),可以自動(dòng)檢測(cè)出運(yùn)動(dòng)車(chē)輛的實(shí)時(shí)速度,測(cè)試結(jié)果表明該算法效果很好。
[摘 要]石材大板表面輪廓提取是石材加工生產(chǎn)過(guò)程中的重要步驟和關(guān)鍵工序。它對(duì)于實(shí)時(shí)優(yōu)化切割不規(guī)則石材以及優(yōu)化排版和下料具有決定性的作用,對(duì)于提高生產(chǎn)效率和石材利用率、節(jié)約石材資源具有重要意義。本文基于計(jì)算機(jī)視覺(jué)理論,研究了石材輪廓提取的算法。通過(guò)分析石材目標(biāo)圖像的灰度、顏色和紋理等特征,提出了石材輪廓提取算法,較準(zhǔn)確的提取出石材目標(biāo)輪廓。
[關(guān)鍵詞]石材大板;輪廓提取;圖像處理
1、 引言
圖像處理是在線(xiàn)測(cè)量系統(tǒng)中很重要的一部分,本文就是利用圖像處理技術(shù)提取石材大板的輪廓信息,然后利用其目標(biāo)點(diǎn)的間距最終求得石材大板尺寸。本文對(duì)圖像處理的相關(guān)算法進(jìn)行研究,提取石材大板的輪廓信息,最終計(jì)算其尺寸。提取過(guò)程主要包括圖像預(yù)處理和圖像分割兩部分。圖像處理過(guò)程如圖1所示。
2、圖像處理
2.1 圖像預(yù)處理
通過(guò)CCD攝像機(jī)獲取的石材大板圖像在其傳輸、接收和處理的過(guò)程中,由于受多種因素的影響,如系統(tǒng)噪聲、曝光不足或過(guò)量、傳輸過(guò)程中的誤差以及人為因素等等,均會(huì)對(duì)石材大板圖像產(chǎn)生一定的噪聲干擾。噪聲會(huì)惡化圖像質(zhì)量,有時(shí)會(huì)使提取的信息減少甚至淹沒(méi)某些有用特征,給分析帶來(lái)困難。因此,對(duì)圖像進(jìn)行預(yù)處理是非常必要的,這樣可以去除噪聲,使其更接近真實(shí)圖像,更有利于對(duì)石材大板圖像進(jìn)行后續(xù)處理。圖像預(yù)處理主要包括濾波和增強(qiáng)。
2.1.1 圖像灰度化
圖像的灰度化是圖像增強(qiáng)處理技術(shù)中一種非?;?、直接的圖像處理方法。圖像的增強(qiáng)用于調(diào)整圖像的對(duì)比度,為了獲得對(duì)后續(xù)計(jì)算機(jī)處理、分析過(guò)程更有利的圖像,需要對(duì)采集的原始圖像進(jìn)行圖像增強(qiáng),從而淡化背景,消除噪聲干擾,提高對(duì)比度,突出圖像中的重要細(xì)節(jié)[1]。
本文采用的是加權(quán)平均值法:R=G=B=aR+bG+cB??紤]到圖像的合理性,取a=0.11,b=0.59,c=0.30,即采用公式(1)進(jìn)行灰度轉(zhuǎn)換:
其中:為轉(zhuǎn)換后的灰度圖像在點(diǎn)處的灰度值;、和分別為彩色圖像在點(diǎn)處的紅色分量值、綠色分量值和藍(lán)色分量值。
在OpenCV函數(shù)庫(kù)中,圖像的灰度化可以通過(guò)cvCvtColor(const CvArr* src,CvArr* dst,int code)函數(shù)實(shí)現(xiàn),其中src為原彩色圖像,dst為處理后的圖像,code為色彩空間轉(zhuǎn)換方式,在這里code定義為CV_RGB2GRAY。彩色石材大板圖像經(jīng)過(guò)式(1)轉(zhuǎn)換后,變成灰度圖像。圖2所示為4個(gè)彩色石材圖像灰度化后的結(jié)果。
2.1.2 圖像平滑
圖像的平滑處理技術(shù)即圖像的去噪聲處理,它是將輸入的圖像進(jìn)行濾波去除噪聲。圖像平滑一是平滑非邊緣區(qū)域,二是使圖像邊緣得到保護(hù)。一個(gè)較好的平滑方法應(yīng)該是既能消掉這些噪聲效應(yīng)又不使圖像的邊緣輪廓和線(xiàn)條模糊。在濾波方法中,最常用的有均值濾波和中值濾波兩種,本文采用此兩種方法分別對(duì)石材大板平滑處理,效果如圖3所示。
這里僅選取了其中的一幅圖像進(jìn)行處理。從圖中可以看出均值濾波和中值濾波對(duì)含有高斯噪聲的圖像都能夠有效地抑制噪聲的干擾,對(duì)含有椒鹽噪聲的圖像也能抑制部分噪聲。但通過(guò)比較明顯可以看出,,中值濾波在椒鹽噪聲處理方面的能力是均值濾波無(wú)法比擬的,因此,本文采用中值濾波對(duì)圖像進(jìn)行濾波去噪。
2.2 圖像分割與邊緣檢測(cè)
圖像分割是圖像處理和計(jì)算機(jī)視覺(jué)中基本而關(guān)鍵的技術(shù)之一,其目的就是將目標(biāo)物體與背景分離開(kāi)來(lái),為后續(xù)的處理提供堅(jiān)實(shí)的基礎(chǔ)。圖像分割的方法主要包括閾值法、邊緣檢測(cè)法、區(qū)域跟蹤法等。本論文采用的是邊緣檢測(cè)法。
2.2.1 邊緣檢測(cè)
檢測(cè)石材大板邊緣是其輪廓提取的基礎(chǔ)。邊緣檢測(cè)實(shí)現(xiàn)的難點(diǎn)在于邊緣檢測(cè)的精度和抗噪聲的能力。邊緣檢測(cè)有很多算法,例如Roberts算子、Sobel算子、Prewitt算子、拉普拉斯算子等[2]。
(1)Roberts算子
Roberts算子采用的是對(duì)角方向相鄰的兩個(gè)像素之差。從圖像處理的實(shí)際效果來(lái)看,邊緣定位準(zhǔn),對(duì)噪聲敏感。Roberts算子是一種利用局部差分算子尋找邊緣的算子,該算子對(duì)具有陡峭邊緣且含噪聲少的圖像效果較好。
(2)Sobel算子
Sobel邊緣檢測(cè)算子是先做加權(quán)平均,再微分,然后求梯度。以下兩個(gè)卷積核形成了Sobel邊緣檢測(cè)算子,圖中的每個(gè)點(diǎn)都用這兩個(gè)核做卷積,其中一個(gè)對(duì)垂直邊緣影響最大,而另一個(gè)對(duì)水平邊緣影響最大。邊緣檢測(cè)算子的中心與中心像素相對(duì)應(yīng),進(jìn)行卷積運(yùn)算。兩個(gè)卷積核的最大值作為該點(diǎn)的輸出位。運(yùn)算結(jié)果是一幅邊緣幅度圖像。在邊沿檢測(cè)中,Sobel算子對(duì)于像素的位置的影響做了加權(quán),加權(quán)平均邊寬2像素,因此效果更好。Sobel算子都對(duì)噪聲具有很好的抑制能力,但仍然不能完全排除檢測(cè)出來(lái)的邊緣中存在虛假邊緣的情況。
(3)Prewitt算子
Prewitt算子與Sobel算子基本相同,只是沒(méi)有加權(quán),所有系數(shù)全為1。Prewitt算子產(chǎn)生一幅邊緣強(qiáng)度圖像。
(4)拉普拉斯算子
拉普拉斯(Laplacian)算子是一種二階導(dǎo)數(shù)算子,對(duì)一個(gè)連續(xù)函數(shù), Laplacian算子是不依賴(lài)于邊緣方向的二階微分算子,對(duì)圖像中的階躍型邊緣點(diǎn)定位準(zhǔn)確。該算子對(duì)噪聲非常敏感,它使噪聲成分得到加強(qiáng)。這兩個(gè)特性使得該算子容易丟失一部分邊緣的方向信息,造成一些不連續(xù)的檢測(cè)邊緣,同時(shí)抗噪聲能力比較差。
圖4為不同邊緣檢測(cè)算子對(duì)石材大板邊緣進(jìn)行檢測(cè)的結(jié)果。
從圖4中可以看出,不同的邊緣檢測(cè)算法應(yīng)用到石材大板圖像上會(huì)有不同的檢測(cè)效果,通過(guò)比較可以發(fā)現(xiàn)Sobel和Prewitt算子的處理效果相對(duì)較好。經(jīng)多次試驗(yàn)比較,而且由于Sobel算子對(duì)于水平和垂直邊緣的檢測(cè)有更好的效果,因此效果相對(duì)較好。
2.2.2 圖像二值化
圖像的二值化處理就是將圖像上每點(diǎn)的灰度值變?yōu)?或者255,也就是將整個(gè)圖像呈現(xiàn)出明顯的黑白效果。在數(shù)字圖像處理中,二值化是一種簡(jiǎn)單有效的方法。設(shè)定某一閾值,可以用將圖像的數(shù)據(jù)分成兩部分:大于的像素群和小于的像素群。因此圖像二值化可按公式(5)進(jìn)行:
式中,是原始圖像中位于處像素的灰度;是二值化后該處的像素值,它只能取0或1。
圖5所示為用二值化方法提取的石材大板輪廓,通過(guò)這組圖像處理過(guò)程我們可以發(fā)現(xiàn),這類(lèi)提取石材輪廓的方法適用于石材大板和圖像背景圖案有很大的區(qū)別的圖像,而且我們也可以看出這種方法的提取效果很好。
2.2.3 數(shù)學(xué)形態(tài)學(xué)處理
數(shù)學(xué)形態(tài)學(xué)(Mathematical Morphology)是由一組形態(tài)學(xué)的代數(shù)運(yùn)算子組成的,它的基本運(yùn)算有4個(gè):膨脹(或擴(kuò)張)、腐蝕(或侵蝕)、開(kāi)啟和閉合,它們?cè)诙祱D像和灰度圖像中各有特點(diǎn)。數(shù)字圖像處理中的形態(tài)學(xué)處理是指將數(shù)字形態(tài)學(xué)作為工具從圖像中提取對(duì)于表達(dá)和描繪區(qū)域形狀有用處的圖像分量,比如邊界、骨架以及凸殼,還包括用于預(yù)處理或后處理的形態(tài)學(xué)過(guò)濾、細(xì)化和修剪等[3]。
本文采用的是閉運(yùn)算,先膨脹,反復(fù)膨脹后得到需要的狀態(tài),如圖6(2)所示。很明顯邊界得到了擴(kuò)張,于是逐步進(jìn)行腐蝕,以恢復(fù)原始邊界,如圖6(3)所示。最后提取石材大板輪廓,如圖6(4)所示。輪廓提取是接下來(lái)計(jì)算石材大板尺寸的基礎(chǔ),最終實(shí)現(xiàn)在線(xiàn)測(cè)量尺寸。
3、結(jié)論
本文介紹了石材大板在線(xiàn)測(cè)量系統(tǒng)的重要階段,先后介紹了圖像的灰度化處理、平滑處理、二值化、圖像分割和數(shù)學(xué)形態(tài)學(xué)處理的相關(guān)原理及算法,提取了石材大板的邊緣輪廓信息。本文的設(shè)計(jì)為石材領(lǐng)域的發(fā)展提供了一個(gè)創(chuàng)新點(diǎn),將其應(yīng)用到現(xiàn)有石材加工設(shè)備上可以實(shí)現(xiàn)石材加工自動(dòng)化水平,解決了國(guó)內(nèi)石材企業(yè)針對(duì)不規(guī)則外型的石材大板不能進(jìn)行實(shí)時(shí)測(cè)量的困擾,提高了生產(chǎn)效率和經(jīng)濟(jì)效益。
摘 要: 針對(duì)傳統(tǒng)四輪定位儀精度不高、操作復(fù)雜的問(wèn)題,設(shè)計(jì)了一套基于圖像處理與計(jì)算機(jī)視覺(jué)的車(chē)輛四輪定位儀,給出了該儀器基于2D平面靶標(biāo)的攝像機(jī)定標(biāo)方法及攝像頭拍攝連續(xù)圖像的處理方法。最后分析了該車(chē)輛四輪定位儀的工作過(guò)程及工作原理,并與手工測(cè)量的車(chē)輛四輪定位參數(shù)進(jìn)行了對(duì)比實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果表明基于圖像處理與計(jì)算機(jī)視覺(jué)的車(chē)輛四輪定位儀的設(shè)計(jì)理論和方法都是正確的。
關(guān)鍵詞: 計(jì)算機(jī)視覺(jué); 攝像機(jī)定標(biāo); 圖像處理; 四輪定位
0 引 言
隨著汽車(chē)行駛速度的加快,影響車(chē)輛安全性的車(chē)輪定位參數(shù)就越發(fā)的重要。當(dāng)車(chē)軸、轉(zhuǎn)向機(jī)構(gòu)和車(chē)架發(fā)生磨損和變形[1]后,車(chē)輪定位將會(huì)失準(zhǔn)從而影響車(chē)輛的安全性。但現(xiàn)有的四輪定位儀精度不高、操作復(fù)雜,嚴(yán)重的影響了車(chē)輪定位調(diào)校的效率[2?4]。
針對(duì)上述問(wèn)題,設(shè)計(jì)了一套基于圖像處理與計(jì)算機(jī)視覺(jué)的車(chē)輛四輪定位儀。給出了該儀器基于2D平面靶標(biāo)的攝像機(jī)定標(biāo)方法及攝像頭拍攝連續(xù)圖像的處理方法,并分析了該四輪定位儀的工作原理,最后通過(guò)實(shí)驗(yàn)證明了該儀器設(shè)計(jì)理論和測(cè)量方法的正確性。
1 基于2D平面靶標(biāo)的攝像機(jī)定標(biāo)
1.1 圖像坐標(biāo)系、攝像機(jī)坐標(biāo)系與世界坐標(biāo)系
攝像機(jī)拍攝的圖像采用標(biāo)準(zhǔn)電視信號(hào)的形式存儲(chǔ)于計(jì)算機(jī)中,然后計(jì)算機(jī)使用數(shù)模板轉(zhuǎn)換為數(shù)字圖像。在圖1所示的直角坐標(biāo)系[(u,v)]中,各像素的坐標(biāo)[(u,v)]表示該像素在整個(gè)數(shù)組中的列數(shù)編碼和行數(shù)編碼。但并沒(méi)有物理單位能夠表示出該像素在整幅圖像中的具體位置,所以還需創(chuàng)建以物理單位為刻度的圖像坐標(biāo)系。圖像坐標(biāo)系以圖像內(nèi)一點(diǎn)作為坐標(biāo)原點(diǎn),其中[x]軸 與[u]軸平行,[y]軸與[v]軸平行,具體如圖1所示,[(u,v)]表示以像素作為單位的圖像坐標(biāo)系,[(x,y)]表示以物理單位毫米作為單位的圖像坐標(biāo)系,兩個(gè)坐標(biāo)系均為圖像坐標(biāo)系,但所采用的坐標(biāo)單位不同。
攝像機(jī)的光心為[O]點(diǎn),攝像機(jī)的光軸為[zc]軸,垂直于圖像平面,[xc]軸與圖像坐標(biāo)系的[x]軸平行,[yc]軸與圖像坐標(biāo)系的[y]軸平行。圖像坐標(biāo)系的坐標(biāo)原點(diǎn)為圖像平面和光軸的交點(diǎn),[xc]軸,[yc]軸和[zc]軸與點(diǎn)[O]組成的坐標(biāo)系即為攝像機(jī)坐標(biāo)系,[OO1]即為攝像機(jī)焦距。
1.2 基于2D平面靶標(biāo)的攝像機(jī)定標(biāo)
由于3D立體靶標(biāo)加工精度受到一定的限制且制作成本較高,此處采用2D平面靶進(jìn)行攝像機(jī)定標(biāo)[5]。在定標(biāo)過(guò)程中,攝像機(jī)以多于兩個(gè)方位對(duì)同一個(gè)平面靶標(biāo)進(jìn)行拍攝,平面靶標(biāo)和攝像機(jī)均能夠自由移動(dòng)且無(wú)需知曉其運(yùn)動(dòng)參數(shù)。在定標(biāo)過(guò)程中,攝像機(jī)內(nèi)部參數(shù)始終為定常數(shù),僅外部參數(shù)發(fā)生變化。
2 圖像處理
為了降低圖像的噪聲干擾,靶盤(pán)為黑底,上面有若干個(gè)白色圓斑,并以圓心作為特征點(diǎn),為了取得特征點(diǎn)(白色橢圓中心)的二維圖像坐標(biāo),首先進(jìn)行圖像閾值分割,然后完成邊緣檢測(cè),最后尋找特征點(diǎn)坐標(biāo)[6]。四輪定位系統(tǒng)工作中拍攝的靶盤(pán)圖像如圖3所示。
2.1 圖像閾值分割和邊緣檢測(cè)
根據(jù)實(shí)際觀(guān)測(cè),將閾值設(shè)置為150,則閾值分割處理后的結(jié)果如圖4所示。
2.2 Hough變換求取橢圓參數(shù)
對(duì)于平面上的任意橢圓,設(shè)橢圓圓心為點(diǎn)[c,]在平面上任取一點(diǎn)[p,]則點(diǎn)[p]距橢圓上任意點(diǎn)的最大距離必然大于點(diǎn)[c]距橢圓上任意點(diǎn)的最大距離。根據(jù)橢圓的該性質(zhì),可以通過(guò)尋找平面內(nèi)距橢圓上任意點(diǎn)的最大距離數(shù)值最小的點(diǎn)來(lái)確定橢圓圓心,而且找到的這個(gè)最大距離的最小值即為橢圓的長(zhǎng)軸長(zhǎng)度。通過(guò)該方法,可以得到橢圓長(zhǎng)、短軸長(zhǎng),橢圓圓心點(diǎn)橫、縱坐標(biāo)和旋轉(zhuǎn)角度5個(gè)參數(shù)中的3個(gè),剩下的2個(gè)橢圓參數(shù)就能夠通過(guò)Hough變換的方法求得,算法的具體實(shí)現(xiàn)步驟如下:
(1) 首先對(duì)需處理的圖像完成邊緣檢測(cè),取得二值化的圖像邊緣輪廓,將邊緣輪廓圖上的各點(diǎn)數(shù)據(jù)存入數(shù)組[A;]
(2) 針對(duì)二維平面上的所有點(diǎn),分別計(jì)算與上步中得到的數(shù)組[A]中點(diǎn)的距離,得到所有點(diǎn)與數(shù)組[A]中點(diǎn)的最大距離,在計(jì)算的最大距離中的最小值對(duì)應(yīng)的點(diǎn)就是橢圓圓心的橫縱坐標(biāo)[p,q,]該最大距離就是橢圓長(zhǎng)軸的長(zhǎng)度[a;]
(3) 將第一步中數(shù)組[A]所有點(diǎn)的數(shù)值與橢圓參數(shù)[p,q,a]代入橢圓方程[E,]橢圓方程為:
然后在二維空間內(nèi)對(duì)參數(shù)[b,θ]進(jìn)行統(tǒng)計(jì)分析,得到一組峰值大于一定閾值的參數(shù)即為橢圓的參數(shù)。
2.3 特征點(diǎn)三維坐標(biāo)求取
通過(guò)前面的分析可知,當(dāng)靶盤(pán)上圓的實(shí)際大小與圖像上橢圓長(zhǎng)、短軸尺寸都知道時(shí),攝像機(jī)與圓心間的距離為:
式中:[F]表示攝像機(jī)鏡頭的焦距;[P]表示圓半徑;[A]表示橢圓長(zhǎng)軸長(zhǎng)度,[A=μ×N,][μ]表示像元尺寸,[N]表示圖像中橢圓長(zhǎng)軸的長(zhǎng)度,單位為像素。
根據(jù)式(3)世界坐標(biāo)系與圖像坐標(biāo)系的關(guān)系,可以通過(guò)求解該方程得到特征點(diǎn)坐標(biāo)[(xw,yw,zw)。]此處選取測(cè)量靶盤(pán)中相距0.075 m的兩圓心的距離進(jìn)行實(shí)驗(yàn),攝像機(jī)拍到的照片如圖6所示。
3 四輪定位儀的工作流程及原理
3.1 工作流程
基于圖像處理與計(jì)算機(jī)視覺(jué)的車(chē)輛四輪定位系統(tǒng)由兩臺(tái)數(shù)字?jǐn)z相機(jī)、計(jì)算機(jī)主機(jī)和四個(gè)靶盤(pán)組成,具體如圖7所示。
攝像機(jī)僅能獲取單側(cè)靶盤(pán)的圖像,紅外線(xiàn)由特制的光源發(fā)射,靶盤(pán)接收到紅外線(xiàn)后,將其反射至高性能數(shù)字?jǐn)z像機(jī)成像,攝像機(jī)依據(jù)獲取的圖像通過(guò)計(jì)算得出相機(jī)與目標(biāo)之間的距離,然后將數(shù)據(jù)處理后就能夠得出車(chē)輪的定位參數(shù),車(chē)輪定位參數(shù)的測(cè)量流程具體如下:將汽車(chē)放置于舉升機(jī)上,使汽車(chē)進(jìn)入攝像機(jī)的拍攝視角范圍;打開(kāi)攝像機(jī),固定方向盤(pán)后推動(dòng)汽車(chē)行駛,然后拍攝行駛中的靶盤(pán);根據(jù)攝像機(jī)拍攝到的圖像(三幅以上)計(jì)算出車(chē)輪的外傾角和前束角;將汽車(chē)整體固定使其無(wú)法前后移動(dòng),轉(zhuǎn)動(dòng)方向盤(pán),獲取車(chē)輪轉(zhuǎn)動(dòng)過(guò)程中靶盤(pán)的圖像,然后計(jì)算出主銷(xiāo)后傾角和內(nèi)傾角。
3.2 建立測(cè)量基準(zhǔn)平面?車(chē)身平面
在汽車(chē)行駛過(guò)程中,靶盤(pán)本身是傾斜的,車(chē)輛前輪兩個(gè)旋轉(zhuǎn)中心點(diǎn)即為汽車(chē)前輪定位平面;同樣,車(chē)輛后輪兩個(gè)旋轉(zhuǎn)中心點(diǎn)即為后輪定位平面。這兩個(gè)面作為整個(gè)四輪定位測(cè)量系統(tǒng)的基準(zhǔn)平面,其優(yōu)點(diǎn)是該平面無(wú)需依賴(lài)于重力和重力傳感器。所以,在車(chē)輛行駛過(guò)程中,不論車(chē)輛是前后傾斜還是左右傾斜,都不會(huì)影響車(chē)輪定位參數(shù)的測(cè)量[7]。
3.3 汽車(chē)定位參數(shù)數(shù)學(xué)模型的建立
靶盤(pán)固定于車(chē)輪,所以可將靶盤(pán)和車(chē)輪當(dāng)做一個(gè)剛體來(lái)分析,車(chē)輪的運(yùn)動(dòng)可分解為平動(dòng)和旋轉(zhuǎn)兩個(gè)分運(yùn)動(dòng)。由于車(chē)輪的旋轉(zhuǎn)軸與車(chē)輪輪面垂直,所以可將車(chē)輪前束角和外傾角看作是車(chē)輪旋轉(zhuǎn)軸與各坐標(biāo)軸間的夾角。
由于汽車(chē)前輪上安裝的兩靶盤(pán)是完全相同的,且其能夠與車(chē)輪共同當(dāng)做一個(gè)剛體處理[8],汽車(chē)車(chē)輪運(yùn)動(dòng)驅(qū)動(dòng)靶盤(pán)運(yùn)動(dòng),將靶盤(pán)的運(yùn)動(dòng)分解成平移運(yùn)動(dòng)和旋轉(zhuǎn)運(yùn)動(dòng),同時(shí)假設(shè)靶盤(pán)先平移后旋轉(zhuǎn)。在靶盤(pán)的旋轉(zhuǎn)過(guò)程中,車(chē)輪滾動(dòng)一圈,則靶盤(pán)上所有白色圓心的運(yùn)動(dòng)軌跡均是圓。但在四輪定位儀的實(shí)際測(cè)量中,車(chē)輪滾動(dòng)軌跡達(dá)不到一圈,靶盤(pán)圓心軌跡是一段弧,但仍能夠通過(guò)圓弧上任意三點(diǎn)求出軌跡圓心。在車(chē)輪的平動(dòng)過(guò)程中,左右靶盤(pán)上同一位置的白色圓心的連線(xiàn)隨車(chē)輪平動(dòng)形成前輪定位平面,后輪則形成后輪定位平面。
在汽車(chē)轉(zhuǎn)向過(guò)程中,車(chē)輪繞主銷(xiāo)旋轉(zhuǎn),通過(guò)旋轉(zhuǎn)前后靶盤(pán)特征點(diǎn)的坐標(biāo)變化就能夠得出主銷(xiāo)軸線(xiàn)本身與[X,Y,Z]軸間的夾角[α,β,γ,]進(jìn)一步就可求出主銷(xiāo)后傾角和內(nèi)傾角,具體求解示意圖如圖9所示。
4 實(shí) 驗(yàn)
為了驗(yàn)證本文所設(shè)計(jì)的車(chē)輪定位儀的準(zhǔn)確性,選取車(chē)輪外傾角和前束角進(jìn)行了實(shí)驗(yàn)。實(shí)驗(yàn)通過(guò)車(chē)輪外傾角和前束角的變化,從四輪定位儀中輸出各定位參數(shù)的變化,同時(shí)選取手工測(cè)量作為對(duì)比數(shù)據(jù)。各組實(shí)驗(yàn)數(shù)據(jù)如表2~表4所示。
5 結(jié) 論
針對(duì)傳統(tǒng)四輪定位儀精度不高、操作復(fù)雜這一問(wèn)題,設(shè)計(jì)了一套基于圖像處理與計(jì)算機(jī)視覺(jué)的車(chē)輛四輪定位儀。給出了該儀器的設(shè)計(jì)方法并進(jìn)行了測(cè)量精度實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果表明所設(shè)計(jì)的四輪定位儀操作簡(jiǎn)單并具有較高的精度。但為了進(jìn)一步提高儀器的測(cè)量精度,后續(xù)還要對(duì)圖像質(zhì)量和圖像處理算法進(jìn)行改進(jìn),并提高攝像機(jī)的定標(biāo)精度。
時(shí)展日新月異,人們的生活也瞬息萬(wàn)變。人們每天會(huì)接受到很多視覺(jué)信息,隨著時(shí)間的流逝,城市中的每一處光影、每一個(gè)街角,都定格著屬于它的美好。“衣+” (北京陌上花科技有限公司)人工智能計(jì)算機(jī)視覺(jué)引擎將AR(增強(qiáng)現(xiàn)實(shí))和AI(人工智能)融合,會(huì)讓你眼中的世界完全不同,它更智能化、更懂你的需求,把你所看到的視覺(jué)信息經(jīng)過(guò)人工智能“大腦系統(tǒng)”處理后,通過(guò)AR展現(xiàn)和交互,帶給你更多全新的驚喜與感動(dòng)。
小時(shí)候,我們都有過(guò)這樣的夢(mèng)想:生活實(shí)景都變成游戲,隨時(shí)隨地看到的場(chǎng)景、人物、好看的好吃的好玩的都能動(dòng)起來(lái),穿越時(shí)空,虛擬和現(xiàn)實(shí)世界夢(mèng)幻疊加?!耙?”將AR技術(shù)和人工智能技術(shù)深度結(jié)合,使用復(fù)雜的計(jì)算機(jī)視覺(jué)技術(shù)和深度學(xué)習(xí)算法,去理解場(chǎng)景,然后增強(qiáng)場(chǎng)景,幫你達(dá)成這個(gè)愿望。仿佛擁有一雙慧眼+超強(qiáng)大腦,而且這只是“衣+”暫時(shí)制定的一個(gè)小目標(biāo)而已。
AR技術(shù)是通過(guò)計(jì)算機(jī)系統(tǒng)提供的信息疊加用戶(hù)對(duì)現(xiàn)實(shí)世界感知的技術(shù),將虛擬的信息應(yīng)用到真實(shí)世界,并將計(jì)算機(jī)生成的虛擬物體、場(chǎng)景或系統(tǒng)提示信息疊加到真實(shí)場(chǎng)景中,從而實(shí)現(xiàn)對(duì)現(xiàn)實(shí)的增強(qiáng)。更通俗一點(diǎn)的說(shuō)法是,它是一種全新的人機(jī)交互技術(shù),利用攝像頭、傳感器、實(shí)時(shí)計(jì)算和匹配技術(shù),將真實(shí)的環(huán)境和虛擬的物體實(shí)時(shí)地疊加到同一個(gè)畫(huà)面或空間。用戶(hù)可以通過(guò)虛擬現(xiàn)實(shí)系統(tǒng)感受到在客觀(guān)物理世界中所經(jīng)歷的“身臨其境”的逼真性,還能突破空間、時(shí)間,以及其他客觀(guān)限制,感受到在真實(shí)世界中無(wú)法親身經(jīng)歷的體驗(yàn)。
“衣+”是世界領(lǐng)先的人工智能計(jì)算機(jī)視覺(jué)引擎,致力于讓計(jì)算機(jī)看懂世界,屬于人工智能中的感知和認(rèn)知智能,在圖像視頻中對(duì)場(chǎng)景、通用物體、商品、人臉的檢測(cè)、識(shí)別、理解、搜索及推薦均達(dá)到領(lǐng)先水平。陌上花自主研發(fā)的深層次多屬性深度學(xué)習(xí)網(wǎng)絡(luò),是人工智能在云和端上計(jì)算的核心基礎(chǔ)。在國(guó)際頂級(jí)計(jì)算機(jī)視覺(jué)競(jìng)賽ImageNet2015和ImageNet2016中,先后獲得五項(xiàng)和三項(xiàng)世界第一。
“衣+”技術(shù)團(tuán)隊(duì)正在做這樣一個(gè)嘗試,利用AR技術(shù)結(jié)合人工智能大數(shù)據(jù)技術(shù)感知認(rèn)知世界,并增強(qiáng)了交互方式,這將大大改變?nèi)藗兊纳睿瑢⑸疃葘W(xué)習(xí)的人工智能科技和AR技術(shù)相結(jié)合應(yīng)用到視頻、直播、時(shí)尚、購(gòu)物、美食、出行、運(yùn)動(dòng)、旅行等生活體驗(yàn)的各個(gè)方面,提供全生活場(chǎng)景智能服務(wù),打造前所未有的智能視覺(jué)體驗(yàn)。
增強(qiáng)現(xiàn)實(shí)技術(shù),不僅展現(xiàn)了真實(shí)世界的信息,而且將虛擬的信息同時(shí)顯示出來(lái),兩種信息相互補(bǔ)充、疊加。在視覺(jué)化的增強(qiáng)現(xiàn)實(shí)中,用戶(hù)利用AR設(shè)備,把真實(shí)世界與電腦圖形合成在一起?!耙?”AR技術(shù)結(jié)合人工智能,以計(jì)算機(jī)視覺(jué)技術(shù)為基礎(chǔ)實(shí)現(xiàn)感知認(rèn)知,能將人眼看到的所有信息,包括商品、物體、食物、服飾、汽車(chē)、建筑等,都精準(zhǔn)匹配出同款及相關(guān)商品。它的展現(xiàn)方式更加生動(dòng)、立體、多樣化,能夠帶給用戶(hù)高品質(zhì)、高時(shí)效、一站式的服務(wù)體驗(yàn)。
“衣+”AR技術(shù)和人工智能的結(jié)合實(shí)現(xiàn)了對(duì)現(xiàn)實(shí)世界的感知和認(rèn)知的能力,可以在圖像視頻中完成對(duì)場(chǎng)景、通用物體、商品、人臉的檢測(cè)、識(shí)別、理解、搜索等。如今,每個(gè)月有上億次的商品推薦通過(guò)“衣+”邊看邊買(mǎi)引擎來(lái)完成,幫助用戶(hù)搜索、識(shí)別他們所看到的物品。目前“衣+”支持服飾、3C數(shù)碼、商超、家居、日用品、交通工具等超過(guò)幾百類(lèi)商品的檢測(cè)和識(shí)別。
通過(guò)對(duì)海量數(shù)據(jù)進(jìn)行深度學(xué)習(xí),“衣+”視覺(jué)引擎能夠檢測(cè)識(shí)別視頻或圖像中的商品,并通過(guò)分析商品特征,準(zhǔn)確判斷商品類(lèi)目等商品信息。在餐飲方面,當(dāng)用戶(hù)用不同的手持終端對(duì)餐廳的食品進(jìn)行拍攝后,餐廳的位置以及菜品的食材等將即刻呈現(xiàn)在手持終端上,使就餐體驗(yàn)的科技含量越來(lái)越高。
此外,“衣+”利用技術(shù)手段可以實(shí)現(xiàn)對(duì)視頻和圖像中的物體的位置、名稱(chēng)、運(yùn)動(dòng)軌跡、輪廓等屬性的實(shí)時(shí)分析。目前已支持超過(guò)10000類(lèi)常用物體、大于400類(lèi)室內(nèi)外場(chǎng)景的識(shí)別。
利用深度學(xué)習(xí)技術(shù),“衣+”還可以在視頻、圖像中實(shí)現(xiàn)人臉關(guān)鍵點(diǎn)檢測(cè),可用于相機(jī)、直播等多種娛樂(lè)場(chǎng)景。讓場(chǎng)景營(yíng)銷(xiāo)變得更自然、更直觀(guān)、更有趣味?!耙?”人臉屬性識(shí)別,可以準(zhǔn)確識(shí)別出人物的性別、年齡、種族、情緒、顏值、性感、時(shí)尚等屬性信息,平均準(zhǔn)確率超過(guò)93%。基于深度學(xué)習(xí)的人臉對(duì)比技術(shù),實(shí)現(xiàn)人臉相似度測(cè)量,可用于人臉聚類(lèi)、敏感人物監(jiān)控等場(chǎng)景。這一切,都是在人工智能計(jì)算機(jī)視覺(jué)搜索引擎中實(shí)時(shí)完成。
目前,AR技術(shù)越來(lái)越火熱,并將全面融入人們的日常生活。目前,“衣+”和阿里云、華為、優(yōu)酷土豆、微博、360、華數(shù)、京東、天貓魔盒、CIBN、英偉達(dá)、趣拍、花椒等數(shù)十家頂級(jí)機(jī)構(gòu)深度合作,通過(guò)提供邊看邊買(mǎi)引擎、圖像視頻內(nèi)容分析引擎、人臉屬性分析引擎服務(wù)海量用戶(hù),同時(shí)幫助用戶(hù)實(shí)現(xiàn)場(chǎng)景營(yíng)銷(xiāo)、智能分析和內(nèi)容互動(dòng)。AR技術(shù)與人工智能相融合的市場(chǎng)將快速增長(zhǎng)?!耙?”也將不斷利用無(wú)處不在的AR技術(shù)和人工智能技術(shù),創(chuàng)造一個(gè)智能世界,將生活中的美好愿望變?yōu)楝F(xiàn)實(shí)。
摘 要
在我國(guó)市場(chǎng)經(jīng)濟(jì)不斷發(fā)展的盛況下,我國(guó)科技發(fā)展水平也緊隨其后,成為世界上的科技強(qiáng)國(guó)之一。在計(jì)算機(jī)水平的不斷提高下,計(jì)算機(jī)視覺(jué)技術(shù)應(yīng)運(yùn)而生。其中,計(jì)算機(jī)視覺(jué)技術(shù)被應(yīng)用與各個(gè)領(lǐng)域,并在各個(gè)領(lǐng)域都得到廣泛有效的應(yīng)用,比如軍事領(lǐng)域、醫(yī)療領(lǐng)域、工業(yè)領(lǐng)域等。本文針對(duì)計(jì)算機(jī)視覺(jué)技術(shù)在交通領(lǐng)域中的應(yīng)用進(jìn)行分析。
【關(guān)鍵詞】計(jì)算機(jī)視覺(jué) 交通領(lǐng)域 探究
近年來(lái),隨著科技水平的提高,計(jì)算機(jī)視覺(jué)技術(shù)逐漸被人們熟知并廣泛應(yīng)用。相較于其他傳感器來(lái)說(shuō),視覺(jué)能獲得更多的信息。因此,在我國(guó)交通領(lǐng)域中,也對(duì)計(jì)算機(jī)視覺(jué)技術(shù)進(jìn)行研究完善,將計(jì)算機(jī)視覺(jué)技術(shù)應(yīng)用在交通領(lǐng)域各個(gè)方面中,并取得了顯著的成效。
1 計(jì)算機(jī)視覺(jué)的概述及基本體系結(jié)構(gòu)
1.1 計(jì)算機(jī)視覺(jué)概述
通過(guò)使用計(jì)算機(jī)和相關(guān)設(shè)備,對(duì)生物視覺(jué)進(jìn)行模擬的方式,就是計(jì)算機(jī)視覺(jué)。對(duì)采集到的圖片或視頻進(jìn)行相應(yīng)的技術(shù)處理,從而獲得相應(yīng)的三維信息場(chǎng)景,是計(jì)算機(jī)視覺(jué)的主要任務(wù)。
計(jì)算機(jī)視覺(jué)是一門(mén)學(xué)問(wèn),它就如何通過(guò)計(jì)算機(jī)和照相機(jī)的運(yùn)用,使人們獲得被拍攝對(duì)象的數(shù)據(jù)與信息所需等問(wèn)題進(jìn)行研究。簡(jiǎn)單的說(shuō),就是讓計(jì)算機(jī)通過(guò)人們給其安裝上的“大腦”和“眼睛”,對(duì)周?chē)h(huán)境進(jìn)行感知。
計(jì)算機(jī)視覺(jué)是一門(mén)綜合性學(xué)科,在各個(gè)領(lǐng)域都有所作為,已經(jīng)吸引了各個(gè)領(lǐng)域的研究者對(duì)其研究。同時(shí),計(jì)算機(jī)視覺(jué)也是科學(xué)領(lǐng)域中一個(gè)具有重要挑戰(zhàn)性的研究。
1.2 計(jì)算機(jī)視覺(jué)領(lǐng)域基本體系結(jié)構(gòu)
提出第一個(gè)較為完善的視覺(jué)系統(tǒng)框架的是Marr,他從信息處理系統(tǒng)角度出發(fā),結(jié)合圖像處理、心理物理學(xué)等多領(lǐng)域的研究成果,提出被計(jì)算機(jī)視覺(jué)工作者基本接受的計(jì)算機(jī)視覺(jué)系統(tǒng)框架。在此基礎(chǔ)上,研究者們針對(duì)視覺(jué)系統(tǒng)框架的各個(gè)角度、各個(gè)階段、各個(gè)功能進(jìn)行分析研究,得出了計(jì)算機(jī)視覺(jué)系統(tǒng)的基本體系結(jié)構(gòu),如圖1。
2 計(jì)算機(jī)視覺(jué)在交通領(lǐng)域的應(yīng)用
2.1 牌照識(shí)別
車(chē)輛的唯一身份是車(chē)輛牌照。在檢測(cè)違規(guī)車(chē)輛、稽查被盜車(chē)輛和管理停車(chē)場(chǎng)工作中,車(chē)輛牌照的有效識(shí)別與檢測(cè)具有重要的作用和應(yīng)用價(jià)值。然而在實(shí)際應(yīng)用工作中,雖然車(chē)牌識(shí)別技術(shù)相對(duì)成熟,但是由于受到拍攝角度、光照、天氣等因素的影響,車(chē)牌識(shí)別技術(shù)仍需改善。車(chē)牌定位技術(shù)、車(chē)牌字符識(shí)別技術(shù)和車(chē)牌字符分割技術(shù)是組成車(chē)牌識(shí)別技術(shù)的重要部分。
2.2 車(chē)輛檢測(cè)
目前,城市交通路口處紅綠燈的間隔時(shí)間是固定不變的,但是受交通路口的位置不同、時(shí)間不同的影響,每個(gè)交通路口的交通流量也是持續(xù)變化的。此外,對(duì)于某些交通區(qū)域來(lái)說(shuō),公共資源的配備,比如交通警察、交通車(chē)輛的數(shù)量是有限的。如果能根據(jù)計(jì)算機(jī)視覺(jué)技術(shù),對(duì)交通路口的不同時(shí)間、不同位置的交通情況進(jìn)行分析計(jì)算,并對(duì)交通流量進(jìn)行預(yù)測(cè),有利于為交通警察縮短出警時(shí)間、為交通路口的紅綠燈根據(jù)實(shí)際情況設(shè)置動(dòng)態(tài)變化等技術(shù)提供支持。
2.3 統(tǒng)計(jì)公交乘客人數(shù)
城市公共交通的核心內(nèi)容是城市公交調(diào)度問(wèn)題,一個(gè)城市如何合理的解決公交調(diào)度問(wèn)題,是緩解城市運(yùn)力和運(yùn)量矛盾,緩解城市交通緊張的有效措施。城市公交調(diào)度問(wèn)題,為公交公司與乘客的平衡利益,為公交公司的經(jīng)濟(jì)利益和社會(huì)效益的提高做出了巨大的貢獻(xiàn)。由于在不同的地域、不同的時(shí)間,公交客流會(huì)存在不均衡性,高峰時(shí)段的公交乘客過(guò)多,平峰時(shí)段的公交乘客過(guò)少,造成了公交調(diào)度不均衡問(wèn)題,使有限資源浪費(fèi)嚴(yán)重。在計(jì)算機(jī)視覺(jué)智能公交系統(tǒng)中,自動(dòng)乘客計(jì)數(shù)技術(shù)是其關(guān)鍵技術(shù)。自動(dòng)乘客計(jì)數(shù)技術(shù),是對(duì)乘客上下車(chē)的時(shí)間和地點(diǎn)自動(dòng)收集的最有效的技術(shù)之一。根據(jù)其收集到的數(shù)據(jù),從時(shí)間和地點(diǎn)兩方面對(duì)客流分析,為城市公交調(diào)度進(jìn)行合理的安排。
2.4 對(duì)車(chē)道偏離程度和駕駛員工作狀態(tài)判斷
交通事故的發(fā)生率隨著車(chē)輛數(shù)量的增加而增加。引發(fā)交通事故的重要因素之一就是駕駛員疲勞駕駛。據(jù)相關(guān)數(shù)據(jù)顯示,因車(chē)道偏離導(dǎo)致的交通事故在40%以上。其中,駕駛員的疲勞駕駛就是導(dǎo)致車(chē)道偏離的主要原因。針對(duì)此種現(xiàn)象,為減少交通事故的發(fā)生,計(jì)算機(jī)視覺(jué)中車(chē)道偏離預(yù)警系統(tǒng)被研究開(kāi)發(fā)并被廣泛應(yīng)用。針對(duì)駕駛員眨眼頻率,利用計(jì)算機(jī)視覺(jué)對(duì)駕駛員面部進(jìn)行圖像處理和分析,再根據(jù)疲勞駕駛關(guān)注度與眨眼頻率的關(guān)系,對(duì)駕駛員的工作狀態(tài)進(jìn)行判斷。此外,根據(jù)道路識(shí)別技術(shù),對(duì)車(chē)輛行駛狀態(tài)進(jìn)行檢測(cè),也是判斷駕駛員工作狀態(tài)的方法之一。這兩種方法,是目前基于計(jì)算機(jī)視覺(jué)的基礎(chǔ)上,檢測(cè)駕駛員疲勞狀態(tài)的有效方法。
2.5 路面破損檢測(cè)
最常見(jiàn)的路面損壞方式就是裂縫。利用計(jì)算機(jī)視覺(jué),及時(shí)發(fā)現(xiàn)路面破損情況,并在其裂縫程度嚴(yán)重之前進(jìn)行修補(bǔ),有利于節(jié)省維護(hù)成本,也避免出現(xiàn)路面坍塌,車(chē)輛凹陷的情況發(fā)生。利用計(jì)算機(jī)視覺(jué)進(jìn)行路面檢測(cè),相較于之前人工視覺(jué)檢測(cè)相比,有效提高了視覺(jué)檢測(cè)的效率,增強(qiáng)了自動(dòng)化程度,提高了安全性,為市民的出行安全帶來(lái)了更高保障。
3 結(jié)論
本文從計(jì)算機(jī)視覺(jué)的概述,及計(jì)算機(jī)視覺(jué)基本體系結(jié)構(gòu),和計(jì)算機(jī)視覺(jué)在交通領(lǐng)域中的應(yīng)用三面進(jìn)行分析,可見(jiàn)計(jì)算機(jī)視覺(jué)在交通領(lǐng)域中的廣泛應(yīng)用,在交通領(lǐng)域中應(yīng)用的有效性、顯著性,以此可得計(jì)算機(jī)視覺(jué)在現(xiàn)展過(guò)程中的重要性。隨著計(jì)算機(jī)視覺(jué)技術(shù)的越來(lái)越成熟,交通領(lǐng)域的檢測(cè)管理一定會(huì)加嚴(yán)格,更加安全。
【摘要】由于計(jì)算機(jī)技術(shù)的不斷發(fā)展,計(jì)算機(jī)視覺(jué)技術(shù)也得到了很大的發(fā)展。從產(chǎn)生的時(shí)間來(lái)看,計(jì)算機(jī)視覺(jué)產(chǎn)生于上個(gè)世紀(jì)中葉,當(dāng)時(shí)它的主要工作內(nèi)容是進(jìn)行統(tǒng)計(jì)模式識(shí)別,較為簡(jiǎn)單,目前為止已經(jīng)經(jīng)過(guò)了長(zhǎng)時(shí)間的發(fā)展,工作內(nèi)容明顯增加,依然發(fā)展為一門(mén)獨(dú)立的學(xué)科,而且在多個(gè)領(lǐng)域都得到了廣泛的應(yīng)用。對(duì)于人們的生活產(chǎn)生了很大的影響。本文主要是簡(jiǎn)單介紹計(jì)算機(jī)視覺(jué)技術(shù)的發(fā)展歷程,并分析它在那些社會(huì)生產(chǎn)領(lǐng)域中得到了推廣以及應(yīng)用。
【關(guān)鍵詞】計(jì)算機(jī)視覺(jué)技術(shù) 推廣 應(yīng)用
在人工智能領(lǐng)域的研究中,計(jì)算機(jī)視覺(jué)是主要的研究對(duì)象之一,目前它已經(jīng)發(fā)展為一門(mén)獨(dú)立的科學(xué)學(xué)科,主要是對(duì)相關(guān)的理論以及技術(shù)進(jìn)行研究,從而建立一個(gè)完善的人工信息系統(tǒng)。
一、計(jì)算機(jī)視覺(jué)技術(shù)的產(chǎn)生與發(fā)展歷程
計(jì)算機(jī)視覺(jué)產(chǎn)生于20世紀(jì)50年代,其當(dāng)時(shí)主要的工作內(nèi)容為統(tǒng)計(jì)模式識(shí)別,尤其是需要進(jìn)行分析二維圖像的特點(diǎn)和作用,例如對(duì)航空?qǐng)D片進(jìn)行研究、對(duì)顯微圖片進(jìn)行分析等。直至60年代初,Roberts使用計(jì)算機(jī)從大量的數(shù)字圖像當(dāng)中選取出棱柱體、長(zhǎng)方體等物體的三維圖形,并且分析物體空間的主要特點(diǎn)。在70年代初期,視覺(jué)應(yīng)用系統(tǒng)開(kāi)始得到應(yīng)用,然后過(guò)了幾十年之后,專(zhuān)家們已經(jīng)了解了機(jī)器視覺(jué)的特點(diǎn),并且開(kāi)設(shè)了對(duì)應(yīng)的課程。到了80年代中期,計(jì)算機(jī)視覺(jué)已經(jīng)逐漸被人們應(yīng)用與工作和生活當(dāng)中。計(jì)算機(jī)技術(shù)的不斷發(fā)展,使得計(jì)算機(jī)視覺(jué)系統(tǒng)的實(shí)用性得以提升,現(xiàn)已被大量使用于機(jī)器人學(xué)、幾何計(jì)算等領(lǐng)域,直接影響著人們的生活。
二、計(jì)算機(jī)視覺(jué)技術(shù)的推廣與應(yīng)用領(lǐng)域
2.1應(yīng)用于工業(yè)生產(chǎn)領(lǐng)域
目前為止計(jì)算機(jī)視覺(jué)技術(shù)已經(jīng)普遍應(yīng)用于工業(yè)生產(chǎn)領(lǐng)域中,除了在工業(yè)探傷、檢測(cè)方面得到了推廣,而且還在辦公以及生產(chǎn)自動(dòng)化等各方面都得到了廣泛的應(yīng)用。一般來(lái)說(shuō)在工業(yè)生產(chǎn)中推廣計(jì)算機(jī)視覺(jué)技術(shù),能夠在很大程度上提高自動(dòng)化程度,從而提高產(chǎn)品生產(chǎn)的效率,同時(shí)還能防止人工的失誤,導(dǎo)致不必要的損失。
2.2應(yīng)用于農(nóng)業(yè)生產(chǎn)領(lǐng)域中
從農(nóng)業(yè)生產(chǎn)領(lǐng)域的角度來(lái)看,計(jì)算機(jī)視覺(jué)技術(shù)的應(yīng)用也越愛(ài)越普遍,一方面主要是利用該技術(shù)全程監(jiān)測(cè)農(nóng)作物的生產(chǎn)過(guò)程,已達(dá)到預(yù)防病害蟲(chóng)的作用,另一方面利用該技術(shù)對(duì)農(nóng)產(chǎn)品進(jìn)行檢測(cè),以便對(duì)其進(jìn)行分類(lèi)與分級(jí)。由于在農(nóng)業(yè)生產(chǎn)領(lǐng)域中利用計(jì)算機(jī)視覺(jué)技術(shù)能夠?qū)崿F(xiàn)自動(dòng)化管理,因此能夠減少大量的勞動(dòng)力,降低生產(chǎn)的人工成本,進(jìn)一步提高管理生產(chǎn)效率。
2.3應(yīng)用于社會(huì)公共安全領(lǐng)域中
社會(huì)公共安全是人們非常重視的一個(gè)問(wèn)題,計(jì)算機(jī)視覺(jué)技術(shù)在這方面也得到了有效的應(yīng)用,不僅應(yīng)用于偵查、犯罪偵破工作中,而且還應(yīng)用于指紋配比、人臉合成等工作中。應(yīng)用這種技術(shù)能夠進(jìn)一步提高犯罪案件的偵破效率,避免更多的犯罪行為發(fā)生,從而影響人們的正常生活。
2.4應(yīng)用于視覺(jué)導(dǎo)航領(lǐng)域中
通過(guò)對(duì)計(jì)算機(jī)視覺(jué)技術(shù)進(jìn)行長(zhǎng)時(shí)間的研究后,當(dāng)前已將之推廣于視覺(jué)導(dǎo)航領(lǐng)域中,主要是應(yīng)用于太空探測(cè)、航天飛行等方面,在此基礎(chǔ)上還應(yīng)用于巡航導(dǎo)彈制導(dǎo)、智能交通等方面。在視覺(jué)導(dǎo)航領(lǐng)域中,應(yīng)用計(jì)算機(jī)視覺(jué)技術(shù)可以解放大量的勞動(dòng)力,避免工作帶來(lái)的危險(xiǎn),而且還能有效提高工作效率。
2.5應(yīng)用于人機(jī)交互領(lǐng)域中
一般來(lái)說(shuō)在人機(jī)交互領(lǐng)域中應(yīng)用計(jì)算機(jī)視覺(jué)技術(shù),可以通過(guò)人的肢體語(yǔ)言、人臉表情進(jìn)行測(cè)定,進(jìn)一步分析人的意愿,從而按照要求認(rèn)真完成指令,這樣不僅可以有效增加交互的方便性,而且還可以有效增加臨場(chǎng)感,具有其他技術(shù)不可替代的作用。
2.6應(yīng)用于虛擬現(xiàn)實(shí)領(lǐng)域中
當(dāng)前計(jì)算機(jī)視覺(jué)技術(shù)在虛擬現(xiàn)實(shí)領(lǐng)域中得到了推廣,利用這種技術(shù)可以進(jìn)行不同的軍隊(duì)?wèi)?zhàn)場(chǎng)場(chǎng)景模擬,在此基礎(chǔ)上還能對(duì)飛行員飛行、醫(yī)生手術(shù)等現(xiàn)場(chǎng)進(jìn)行模擬??傊?,利用這種技術(shù)能夠帶給人們一種身臨其境的感覺(jué),從而進(jìn)一步提高工作效率。
2.7應(yīng)用于衛(wèi)星遙感領(lǐng)域中
從衛(wèi)星遙感領(lǐng)域的角度來(lái)看,計(jì)算機(jī)視覺(jué)技術(shù)的應(yīng)用并不少見(jiàn),不僅應(yīng)用于礦藏勘探、資源探測(cè)等方面,而且還應(yīng)用于氣象預(yù)報(bào)、自然災(zāi)害監(jiān)測(cè)等方面。一般來(lái)說(shuō)衛(wèi)星遙感涉及的信息量非常大,而且類(lèi)別也很多,分析識(shí)別工作稍不注意,就會(huì)出現(xiàn)錯(cuò)誤,而利用這種技術(shù)后,能夠快速、有效的進(jìn)行信息的收集以及分析工作,進(jìn)一步提高信息的準(zhǔn)確性。
三、結(jié)語(yǔ)
計(jì)算機(jī)視覺(jué)技術(shù)發(fā)展到現(xiàn)在,已經(jīng)在多個(gè)領(lǐng)域得到應(yīng)用與推廣,在虛擬現(xiàn)實(shí)、工農(nóng)業(yè)生產(chǎn)等眾多領(lǐng)域中隨處可見(jiàn)。而隨著社會(huì)的不斷進(jìn)步,市場(chǎng)對(duì)于計(jì)算機(jī)視覺(jué)技術(shù)的需求也越來(lái)越大,具有很大的發(fā)展?jié)摿?。為了能夠滿(mǎn)足市場(chǎng)增長(zhǎng)的需求,使計(jì)算機(jī)視覺(jué)技術(shù)得到更廣泛的應(yīng)用,需要研發(fā)人員通過(guò)不斷的努力研制出更加完善的計(jì)算機(jī)視覺(jué)技術(shù)系統(tǒng),這是當(dāng)前科研工作的主要課題。
摘要:該文基于OpenCV的計(jì)算機(jī)視覺(jué)技術(shù)進(jìn)行研究,探討了視頻中計(jì)算機(jī)對(duì)運(yùn)動(dòng)物體視覺(jué)檢測(cè)的原理,并對(duì)OpenCV的應(yīng)用情況進(jìn)行說(shuō)明,闡述了基于OpenCV的計(jì)算機(jī)視覺(jué)技術(shù)體系,最終重點(diǎn)敘述了計(jì)算機(jī)視覺(jué)三維模擬技術(shù),以期能為相關(guān)工作提供參考。
關(guān)鍵詞:OpenCV;計(jì)算機(jī)視覺(jué)技術(shù);三維模擬技術(shù)
21世紀(jì)是國(guó)際計(jì)算機(jī)技術(shù)高度發(fā)展的時(shí)代,人們生活中的每個(gè)角落都可以看到計(jì)算機(jī)技術(shù)的身影,尤其是現(xiàn)代計(jì)算機(jī)視覺(jué)技術(shù)和圖像處理功能發(fā)展更加迅猛,各技術(shù)分支也逐漸趨于成熟。計(jì)算機(jī)視覺(jué)技術(shù)主要指的就是利用智能計(jì)算機(jī)系統(tǒng)來(lái)代替人類(lèi)的眼睛對(duì)現(xiàn)實(shí)三維世界進(jìn)行辨識(shí)和理解,整個(gè)過(guò)程均是計(jì)算機(jī)自我學(xué)習(xí)的過(guò)程,而隨著這項(xiàng)技術(shù)研究的不斷深入,其不再僅僅包含計(jì)算機(jī)技術(shù)科學(xué),同時(shí)還涉獵了包括生理學(xué)、神經(jīng)學(xué)、物理學(xué)、應(yīng)用數(shù)學(xué)等多門(mén)學(xué)科,為人類(lèi)科技的進(jìn)步提供了有效的動(dòng)力。
1 計(jì)算機(jī)對(duì)視頻中運(yùn)動(dòng)物體檢測(cè)的原理概述
在現(xiàn)代計(jì)算機(jī)技術(shù)基礎(chǔ)下,對(duì)視頻當(dāng)中的運(yùn)動(dòng)物體檢測(cè)原理主要包括兩種,分別是從微觀(guān)和宏觀(guān)的角度出發(fā)。其中宏觀(guān)檢測(cè)技術(shù)指的是當(dāng)計(jì)算機(jī)截取了視頻中的某一個(gè)圖像,其以整幅圖像為對(duì)象進(jìn)行檢測(cè);微觀(guān)檢測(cè)技術(shù)是指在截取圖像后,根據(jù)實(shí)際需求對(duì)某一區(qū)域內(nèi)的圖像內(nèi)容進(jìn)行檢測(cè)。在計(jì)算機(jī)視覺(jué)技術(shù)實(shí)際應(yīng)用時(shí),其第一步就是對(duì)圖像的采集,第二步是對(duì)已經(jīng)采集的圖像進(jìn)行預(yù)分析處理,如果采用宏觀(guān)檢測(cè)技術(shù)則對(duì)圖像整體進(jìn)行分析;如果采用微觀(guān)檢測(cè)技術(shù)則首先將圖像進(jìn)行分割,然后對(duì)分割后各圖像內(nèi)容中出現(xiàn)的運(yùn)動(dòng)物體影像進(jìn)行分析。在圖像數(shù)據(jù)獲取過(guò)程中應(yīng)用的是背景差分法,這一技術(shù)主要是將背景和運(yùn)動(dòng)物體進(jìn)行分離提取,以獲取沒(méi)有背景圖像的運(yùn)動(dòng)物體影像數(shù)據(jù)。還可以利用幀間差分法,這種方法主要是對(duì)一個(gè)視頻圖像的逐幀畫(huà)面進(jìn)行差別比較,從而獲得各幀圖像上的差值,而將這些差值幀圖結(jié)合起來(lái)就是一個(gè)物體在計(jì)算機(jī)視覺(jué)下的運(yùn)動(dòng)軌跡?,F(xiàn)代研究者更傾向于將背景和幀間差分法進(jìn)行結(jié)合運(yùn)用,這樣可以獲得無(wú)背景下的運(yùn)動(dòng)物體軌跡,進(jìn)而提升計(jì)算機(jī)視覺(jué)系統(tǒng)捕捉數(shù)據(jù)的準(zhǔn)確性。
2 OpenCV的應(yīng)用概述
OpenCV是現(xiàn)代計(jì)算機(jī)視覺(jué)技術(shù)當(dāng)中具有開(kāi)源性的視覺(jué)庫(kù),其最早是由俄羅斯Intel分公司所研發(fā),不僅高效,而且具有兼容的優(yōu)勢(shì)。同時(shí)與傳統(tǒng)IPL圖像處理系統(tǒng)相比,OpenCV所處理的圖像數(shù)據(jù)等級(jí)更高,例如在對(duì)運(yùn)動(dòng)物體進(jìn)行特征跟蹤、目標(biāo)分割、運(yùn)動(dòng)軌跡分析以及三維模型重建等方面都有著巨大的優(yōu)勢(shì)。
OpenCV本身編輯的源代碼是開(kāi)放式的,編寫(xiě)過(guò)程簡(jiǎn)潔且方便,并且程序中大多數(shù)函數(shù)已經(jīng)通過(guò)了匯編的最優(yōu)化,使其能夠更加高效地被應(yīng)用。在使用OpenCV的攝像機(jī)標(biāo)定模塊已經(jīng)為用戶(hù)設(shè)計(jì)了實(shí)用性較強(qiáng)的接口,并且能夠支持Windows界面的操作平臺(tái),使得這一技術(shù)的操作更加簡(jiǎn)便。這一技術(shù)本身操作簡(jiǎn)便,對(duì)于編程人員和檢驗(yàn)人員個(gè)人技能素質(zhì)要求并不高,視覺(jué)技術(shù)系統(tǒng)研發(fā)人員可以利用簡(jiǎn)便的操作來(lái)檢驗(yàn)其設(shè)想是否能夠?qū)崿F(xiàn),這就使得現(xiàn)代計(jì)算機(jī)視覺(jué)技術(shù)開(kāi)發(fā)團(tuán)隊(duì)能夠形成更好的協(xié)作研發(fā)關(guān)系,進(jìn)一步提升技術(shù)研究效率。目前已知OpenCV編程系統(tǒng)在航空航天定位、衛(wèi)星地圖繪制、工廠(chǎng)大規(guī)模生產(chǎn)視覺(jué)檢測(cè)等方面得到了廣泛的應(yīng)用,同時(shí)對(duì)于無(wú)人飛行器的視覺(jué)捕捉技術(shù)也有極大的幫助。最為重要的是OpenCV編程語(yǔ)言的兼容性較強(qiáng),編程人員可以根據(jù)自己的意愿對(duì)源代碼進(jìn)行披露,并且國(guó)內(nèi)也已經(jīng)形成了規(guī)模較大的交流社區(qū),給更多同行業(yè)者提供答疑解惑的場(chǎng)所,進(jìn)一步擴(kuò)大了OpenCV的應(yīng)用范圍。
3 基于OpenCV的計(jì)算機(jī)視覺(jué)技術(shù)
3.1 基于OpenCV下的運(yùn)動(dòng)物體檢測(cè)技術(shù)
在常規(guī)運(yùn)動(dòng)物體檢測(cè)技術(shù)下,均是直接通過(guò)圖像背景和運(yùn)動(dòng)物體的區(qū)分來(lái)實(shí)現(xiàn)運(yùn)動(dòng)物體的捕捉。而基于OpenCV下的運(yùn)動(dòng)物體檢測(cè)技術(shù)則不僅能夠針對(duì)于圖像背景的分離實(shí)現(xiàn)運(yùn)動(dòng)物體的觀(guān)察,還可通過(guò)物體本身特定的信息來(lái)進(jìn)行檢測(cè),主要包括形狀、輪廓以及顏色等。這樣就能夠?qū)崿F(xiàn)在復(fù)雜的背景當(dāng)中將特定的運(yùn)動(dòng)物體完整抽離出來(lái)。其基本流程包括:首先,對(duì)影像數(shù)據(jù)當(dāng)中某一時(shí)間點(diǎn)的圖像進(jìn)行捕捉,然后對(duì)這一視頻圖像的格式進(jìn)行轉(zhuǎn)化;其次,對(duì)轉(zhuǎn)化格式后的視頻圖像進(jìn)行早期處理,并將運(yùn)動(dòng)物體和復(fù)雜的背景區(qū)分開(kāi),降低周?chē)鳝h(huán)境因素對(duì)運(yùn)動(dòng)物體主體圖像的影響;第三,根據(jù)完成提取后的運(yùn)動(dòng)物體圖像進(jìn)行辨識(shí),然后再?gòu)囊曨l當(dāng)中捕捉擁有相同特征的物體,并對(duì)該物體進(jìn)行跟蹤識(shí)別。而這一過(guò)程的實(shí)質(zhì)則在于先利用圖像捕捉技術(shù)對(duì)畫(huà)面進(jìn)行截取,然后同時(shí)利用背景差分法和幀間差分法對(duì)圖像進(jìn)行分割,逐幀地將運(yùn)動(dòng)物體完成提取出來(lái),以供計(jì)算機(jī)進(jìn)行視覺(jué)跟蹤處理。
3.2 基于OpenCV的圖像預(yù)處理技術(shù)
一般情況下,計(jì)算機(jī)視覺(jué)處理技術(shù)應(yīng)用的環(huán)境情況較為復(fù)雜,大多數(shù)應(yīng)用環(huán)境當(dāng)中均有光照的變化,并且部分計(jì)算機(jī)視覺(jué)處理設(shè)備還需要在露天環(huán)境下進(jìn)行工作,此時(shí)周?chē)h(huán)境中的風(fēng)、溫度、光照、氣候以及運(yùn)動(dòng)物體數(shù)量等對(duì)視頻圖像的采集均有著極大的影響。環(huán)境因素會(huì)使圖像采集的質(zhì)量大幅度降低,同時(shí)圖像當(dāng)中的噪點(diǎn)問(wèn)題也難以避免,而噪點(diǎn)是視覺(jué)捕捉和圖像處理當(dāng)中最大的影響因素。因此,在基于OpenCV下的計(jì)算機(jī)視覺(jué)技術(shù)在捕捉視頻圖像之后先對(duì)其進(jìn)行預(yù)處理,然后再由系統(tǒng)對(duì)運(yùn)動(dòng)物體進(jìn)行分離、檢測(cè)和跟蹤。一般的預(yù)處理過(guò)程主要包括平滑度濾波、圖像填充、背景實(shí)時(shí)更新等。
1)圖像的平滑度濾波預(yù)處理技術(shù)
由于在實(shí)際計(jì)算機(jī)視覺(jué)捕捉過(guò)程中圖像噪點(diǎn)是難以避免的問(wèn)題,以此在對(duì)圖像中運(yùn)動(dòng)物體進(jìn)行檢測(cè)前,應(yīng)該相對(duì)這些噪點(diǎn)進(jìn)行預(yù)處理,降低環(huán)境噪聲對(duì)圖像的影響。圖像的平滑度濾波處理共分為兩種方式,分別為線(xiàn)性和非線(xiàn)性。其中線(xiàn)性處理方式就是通過(guò)計(jì)算機(jī)處理設(shè)備的簡(jiǎn)單運(yùn)算,對(duì)圖像當(dāng)中的噪點(diǎn)進(jìn)行直接清除,但這一技術(shù)使用后會(huì)造成截獲圖像模糊不清的情況,因此僅對(duì)噪點(diǎn)較少的圖像采用該處理方式;非線(xiàn)性濾波處理則是利用復(fù)雜的圖像處理運(yùn)算,將截獲圖像當(dāng)中的噪點(diǎn)無(wú)限縮小,使其不對(duì)圖像整體造成影響,并且可以有效保證圖像的局部調(diào)整,但這種處理方式在運(yùn)算時(shí)速度沒(méi)有線(xiàn)性濾波處理快,因此需應(yīng)用在噪點(diǎn)較多,圖像信息較復(fù)雜的處理當(dāng)中。
2)圖像的填充預(yù)處理技術(shù)
這一處理技術(shù)在使用過(guò)程中運(yùn)算速度較慢,主要是由于其需要對(duì)逐幀的圖像均進(jìn)行處理,也包括兩種處理方式,分別為邊緣填充和腐蝕膨脹處理。其中邊緣填充處理主要指的是在確定運(yùn)動(dòng)物體之后,利用計(jì)算機(jī)系統(tǒng)自身的邊緣檢測(cè)處理技術(shù),對(duì)物體的輪廓進(jìn)行辨識(shí),并利用形態(tài)學(xué)上的漫水填充方式對(duì)運(yùn)動(dòng)物體周?chē)脑朦c(diǎn)進(jìn)行顏色填充,減小其對(duì)畫(huà)面整體元素的影響。而腐蝕膨脹處理與邊緣填充處理原理相類(lèi)似,但這種處理技術(shù)主要是針對(duì)于噪點(diǎn)進(jìn)行腐蝕和膨脹,使其在畫(huà)面當(dāng)中所占比例擴(kuò)大,但對(duì)運(yùn)動(dòng)物體本身不造成影響,這使運(yùn)動(dòng)物體和噪點(diǎn)之間的差異就會(huì)更加明顯,就可以將噪點(diǎn)的影響降到最低,但這種處理方法的效果和攝像機(jī)本身的性能、質(zhì)量等有著密切的關(guān)聯(lián)。
3)背景的實(shí)時(shí)更新預(yù)處理技術(shù)
在進(jìn)行運(yùn)動(dòng)物體和背景分離過(guò)程中,計(jì)算機(jī)系統(tǒng)需要對(duì)圖像上的背景元素進(jìn)行辨識(shí),并對(duì)其開(kāi)展初始化處理,這樣就能夠?yàn)楹笃趯?shí)時(shí)背景圖像的差異進(jìn)行凸顯,以增加前景圖像的效果,降低噪點(diǎn)對(duì)圖像的影響。在運(yùn)用這一技術(shù)時(shí),首先要先對(duì)第一幀的圖像進(jìn)行確定,并將第一幀圖像當(dāng)中的背景圖像元素進(jìn)行辨識(shí),然后在后期圖像更新和運(yùn)動(dòng)物體檢測(cè)過(guò)程中對(duì)背景進(jìn)行實(shí)時(shí)更新處理。在更新的過(guò)程中其流程主要包括:首先,系統(tǒng)要對(duì)所讀取的畫(huà)面進(jìn)行有效的判斷,了解該圖像是否為第一幀;其次,將Opencv處理的圖像轉(zhuǎn)變?yōu)閱瓮ǖ阑叶戎?;第三,?duì)轉(zhuǎn)變后的圖像進(jìn)行高斯平滑度濾波處理,將圖像當(dāng)中的噪點(diǎn)進(jìn)行去除;第四,采用形態(tài)學(xué)噪點(diǎn)填充技術(shù)對(duì)圖像當(dāng)中的噪點(diǎn)進(jìn)行二次處理,以獲得所需要更新的背景圖像。
3.3 前景運(yùn)動(dòng)物體的提取技術(shù)
在計(jì)算機(jī)視覺(jué)技術(shù)進(jìn)行運(yùn)動(dòng)物體的檢測(cè)時(shí),只有有效保障檢測(cè)流程的準(zhǔn)確度,才能夠有效保障對(duì)前景運(yùn)動(dòng)物體的跟蹤效果。其主要分為兩大步驟,其一是對(duì)二值化后的圖像數(shù)據(jù)進(jìn)行分割處理;其二是在圖像分析前對(duì)其進(jìn)行充分的填充處理,保證前景圖數(shù)據(jù)的完整性。同時(shí),在前景圖像提取的過(guò)程中也分為多個(gè)步驟,其包括:首先,對(duì)所提出的前景圖像和背景圖像進(jìn)行差分處理;其次,將差分處理后的圖像二值化處理;第三,對(duì)背景當(dāng)中前景物體的輪廓或邊緣進(jìn)行辨識(shí),根據(jù)前景圖像的輪廓對(duì)其進(jìn)行填充。由于在實(shí)際操作過(guò)程中,攝像頭所處環(huán)境的變化較大,并且會(huì)在不同場(chǎng)所內(nèi)的不同角度捕捉畫(huà)面,因此就需要在前景圖像提取時(shí)有效提高背景圖像實(shí)時(shí)更新的效果。
利用閥值二值化的分割方式能夠有效將前景圖像和背景圖像分離開(kāi),從而使目標(biāo)運(yùn)動(dòng)物體能夠呈現(xiàn)獨(dú)立化,并且閥值分割方式開(kāi)展前要相對(duì)每個(gè)像素點(diǎn)進(jìn)行確定,判斷其是否位于灰度值的范圍內(nèi)。而將該圖像的像素灰度和閥值進(jìn)行對(duì)比后會(huì)出現(xiàn)兩種結(jié)果,分別是灰度值低于或高于閥值。在實(shí)際應(yīng)用過(guò)程中,有效確定圖像的分割閥值T,就能夠降低環(huán)境當(dāng)中光照因素對(duì)圖像質(zhì)量的影響。
4 計(jì)算機(jī)視覺(jué)技術(shù)當(dāng)中的三維重建技術(shù)
1)三維重建的視覺(jué)系統(tǒng)
計(jì)算機(jī)視覺(jué)技術(shù)在對(duì)圖像進(jìn)行捕捉時(shí)可以視為是對(duì)大量的圖像信息進(jìn)行處理,從攝像機(jī)的視覺(jué)角度出發(fā),其所輸入的圖像一般為二維屬性,但輸出的信息確是三維數(shù)據(jù),而這種三維空間數(shù)據(jù)能夠提升對(duì)運(yùn)動(dòng)物體所處空間位置、距離等描述的準(zhǔn)確性。在三維重建視覺(jué)系統(tǒng)工作過(guò)程中,其相對(duì)基本的圖像數(shù)據(jù)框架進(jìn)行確定,然后利用一個(gè)坐標(biāo)點(diǎn)建立2.5D圖像數(shù)據(jù),即以此點(diǎn)為視角能夠觀(guān)察到的圖像數(shù)據(jù),再將2.5D圖像數(shù)據(jù)進(jìn)行整合從而建立三維圖像。
2)雙目視覺(jué)系統(tǒng)
當(dāng)人體利用雙眼在不同角度、同一時(shí)間內(nèi)觀(guān)察同一個(gè)物體時(shí),就可以利用算法來(lái)測(cè)量該物體和人體之間的距離,而這種方法也被稱(chēng)為雙目立體感,其應(yīng)用的原理主要是人體視覺(jué)差所帶來(lái)的影響。同時(shí)利用兩臺(tái)攝像機(jī)對(duì)同一圖像從不同角度進(jìn)行觀(guān)察,就能夠獲得人體雙目觀(guān)察后的效果,因此這一三維重建技術(shù)也被稱(chēng)為“雙目視覺(jué)系統(tǒng)”。兩臺(tái)不同的攝像機(jī)即可代表人體雙眼,其對(duì)圖像進(jìn)行逐幀捕獲,但由于角度不同和環(huán)境影響因素的差異,因此造成了圖像差異,必須對(duì)其捕捉的圖像進(jìn)行預(yù)處理。
3)三維重構(gòu)算法
在計(jì)算機(jī)視覺(jué)技術(shù)中對(duì)于視頻流的采集主要依靠的是彩色攝像機(jī)、紅外攝像機(jī)、紅外接收攝像頭等設(shè)備。還可以利用微軟所提供的Kinect設(shè)備,在進(jìn)行運(yùn)動(dòng)物體檢測(cè)前能夠?qū)UI進(jìn)行初始化處理,將系統(tǒng)內(nèi)函數(shù)的參數(shù)設(shè)定為用戶(hù)信息深度圖、彩圖、骨骼追蹤圖等數(shù)據(jù)。在使用Kinect設(shè)備對(duì)視頻流進(jìn)行打開(kāi)時(shí),其可以遵循三個(gè)步驟,其一是彩色和深度數(shù)據(jù)的處理;其二是根據(jù)數(shù)據(jù)的索引添加顏色信息,并將其引入到深度圖數(shù)據(jù)當(dāng)中;其三是骨骼追蹤數(shù)據(jù)。
5 結(jié)束語(yǔ)
計(jì)算機(jī)視覺(jué)捕捉技術(shù)是現(xiàn)代計(jì)算機(jī)應(yīng)用當(dāng)中較為先進(jìn)的內(nèi)容,其應(yīng)用范圍較廣,對(duì)于運(yùn)動(dòng)物體的捕捉準(zhǔn)確度較高,能夠有效推進(jìn)現(xiàn)代計(jì)算機(jī)模擬技術(shù)的發(fā)展。
摘 要計(jì)算機(jī)視覺(jué)具有實(shí)時(shí)、客觀(guān)、無(wú)損的優(yōu)點(diǎn),能對(duì)馬鈴薯的表面外部品質(zhì)進(jìn)行快速有效的檢測(cè)。本文闡述了應(yīng)用計(jì)算機(jī)視覺(jué)技術(shù)對(duì)馬鈴薯進(jìn)行外部品質(zhì)檢測(cè)的必要性,并對(duì)基于計(jì)算機(jī)視覺(jué)的馬鈴薯的大小檢測(cè)、形狀檢測(cè)以及表面缺陷檢測(cè)的應(yīng)用進(jìn)行了研究。
【關(guān)鍵詞】計(jì)算機(jī)視覺(jué)技術(shù) 馬鈴薯外部品質(zhì) 檢測(cè)
隨著計(jì)算機(jī)技術(shù)的不斷發(fā)展,計(jì)算機(jī)視覺(jué)技術(shù)應(yīng)運(yùn)而生并在工業(yè)自動(dòng)化以及農(nóng)產(chǎn)品檢驗(yàn)檢測(cè)等領(lǐng)域成功應(yīng)用。其中,將計(jì)算機(jī)視覺(jué)技術(shù)用于以自動(dòng)化采集和品級(jí)分級(jí)為代表的果蔬商品化處理具有非常廣闊的發(fā)展空間。我國(guó)政府將“農(nóng)產(chǎn)品深加工技術(shù)與設(shè)備研究開(kāi)發(fā)”列為我國(guó)“十五”重大科技攻關(guān)項(xiàng)目的第一項(xiàng),這標(biāo)志著計(jì)算機(jī)視覺(jué)技術(shù)在果蔬外部品質(zhì)檢測(cè)中會(huì)發(fā)揮越來(lái)越重要的作用。
馬鈴薯是世界上僅僅排在小麥、水稻和玉米之后的第四種主要農(nóng)作物,種植區(qū)域非常廣泛。馬鈴薯品質(zhì)檢測(cè)是馬鈴薯深加工的一個(gè)關(guān)鍵步驟,目前,該檢驗(yàn)過(guò)程多數(shù)采用人工檢測(cè),不僅成本高、效率低,而且與檢驗(yàn)員的專(zhuān)業(yè)素質(zhì)有密切的關(guān)系,受到人為因素影響的程度較大,嚴(yán)重制約的馬鈴薯加工企業(yè)的發(fā)展。計(jì)算機(jī)視覺(jué)技術(shù)能對(duì)農(nóng)產(chǎn)品的某些特性變化和缺陷進(jìn)行識(shí)別,具有客觀(guān)、無(wú)損害等特點(diǎn)。本文對(duì)基于計(jì)算機(jī)視覺(jué)的馬鈴薯外部品質(zhì)檢測(cè)的應(yīng)用進(jìn)行了研究。
1 應(yīng)用計(jì)算機(jī)視覺(jué)技術(shù)對(duì)馬鈴薯進(jìn)行外部品質(zhì)檢測(cè)的必要性
隨著“麥當(dāng)勞”、“肯德基”的餐飲服務(wù)業(yè)的快速發(fā)展,炸薯?xiàng)l、炸薯片已經(jīng)成為一種休閑食品深受消費(fèi)者的喜愛(ài),推動(dòng)了我國(guó)馬鈴薯產(chǎn)業(yè)的發(fā)展。然而,情況并不十分樂(lè)觀(guān),與國(guó)外的馬鈴薯企業(yè)相比,我國(guó)馬鈴薯加工企業(yè)生產(chǎn)規(guī)模小、生產(chǎn)產(chǎn)品單一、技術(shù)設(shè)備落后、產(chǎn)品質(zhì)量不高的現(xiàn)象導(dǎo)致我國(guó)的馬鈴薯產(chǎn)品銷(xiāo)售困難,經(jīng)濟(jì)效益逐漸下滑。
基于以上現(xiàn)狀,對(duì)馬鈴薯的加工研究還有很長(zhǎng)的一段路程。企業(yè)要擴(kuò)大生產(chǎn)規(guī)模,針對(duì)中國(guó)的消費(fèi)趨勢(shì)與消費(fèi)水平開(kāi)發(fā)出新的馬鈴薯產(chǎn)品,從而提高我國(guó)馬鈴薯產(chǎn)品的競(jìng)爭(zhēng)力。這就要求馬鈴薯加工企業(yè)要對(duì)馬鈴薯的加工技術(shù)進(jìn)行創(chuàng)新,保證產(chǎn)品質(zhì)量。其中,馬鈴薯外部品質(zhì)檢測(cè)對(duì)馬鈴薯產(chǎn)品的最終品質(zhì)起著決定性作用。當(dāng)前的人工檢測(cè)方式已經(jīng)不再適應(yīng)社會(huì)發(fā)展的要求,利用計(jì)算機(jī)視覺(jué)檢驗(yàn)代替人工檢驗(yàn)成為社會(huì)發(fā)展的必然趨勢(shì),這是因?yàn)橛?jì)算機(jī)視覺(jué)技術(shù)具有以下優(yōu)點(diǎn):
(1)精度高,能夠進(jìn)行定量測(cè)量。
(2)自動(dòng)化程度高,一次就可完成包括大小、形狀、顏色以及缺陷在內(nèi)的檢測(cè)和分析,并能進(jìn)行綜合識(shí)別。
(3)無(wú)損檢測(cè),計(jì)算機(jī)視覺(jué)檢測(cè)過(guò)程不需要接觸產(chǎn)品,是通過(guò)傳感器掃面獲取圖像的,不會(huì)造成產(chǎn)品的損傷。
(4)信息量大,可對(duì)大量信息進(jìn)行采集,對(duì)光譜的敏感范圍也很廣。
2 基于計(jì)算機(jī)視覺(jué)的馬鈴薯外部品質(zhì)檢測(cè)的應(yīng)用研究
2.1 馬鈴薯大小的檢測(cè)方法
馬鈴薯的大小檢測(cè)不僅影響馬鈴薯深加工的商業(yè)價(jià)值,在在遺傳和育種方面也有很高的應(yīng)用價(jià)值。
利用計(jì)算機(jī)視覺(jué)技術(shù)對(duì)馬鈴薯大小的檢測(cè)步驟如下:先從攝像機(jī)中獲取馬鈴薯的圖像信息,在圖像信息的基礎(chǔ)上對(duì)馬鈴薯三維空間的幾何信息進(jìn)行計(jì)算,并由此重建和識(shí)別馬鈴薯。而馬鈴薯物體表面某點(diǎn)的三維幾何位置與其在圖像中對(duì)應(yīng)點(diǎn)之間的相互關(guān)系是由攝像機(jī)成像的幾何模型決定的,這些幾何參數(shù)成為攝像機(jī)參數(shù)。要想準(zhǔn)確的獲取這些攝像機(jī)參數(shù),就必須將實(shí)驗(yàn)與計(jì)算相結(jié)合,此過(guò)程成為系統(tǒng)定標(biāo)。
系統(tǒng)定標(biāo)的基本步驟:根據(jù)設(shè)定好的攝像機(jī)模型和特定的實(shí)驗(yàn)條件包括形狀、尺寸等已知的定標(biāo)參照物,經(jīng)過(guò)對(duì)馬鈴薯圖像的處理,并利用一系列的數(shù)學(xué)轉(zhuǎn)換和計(jì)算方法將攝像機(jī)模型的內(nèi)部和外部參數(shù)計(jì)算出來(lái),從而建立照片與實(shí)物的聯(lián)系推算出馬鈴薯的真實(shí)尺寸。
2.2 馬鈴薯形狀的檢測(cè)方法
根據(jù)《中國(guó)馬鈴薯栽培學(xué)》中的知識(shí),我們可以把馬鈴薯的塊莖形狀分為三類(lèi),分別是圓形、長(zhǎng)筒形和橢圓形,除了這三種形狀,其余都是這三種形狀的變形。此次研究將馬鈴薯分為圓形、橢圓形和長(zhǎng)筒形,并且采用橢圓的短長(zhǎng)軸比來(lái)模擬馬鈴薯的縱橫直徑之間的關(guān)系。
2.2.1 馬鈴薯形狀特征參數(shù)的提取
將馬鈴薯橢圓的短長(zhǎng)軸比R作為形狀特征參數(shù),并按照R的大小將馬鈴薯進(jìn)行分類(lèi)。當(dāng)R小于0.67時(shí),稱(chēng)之為長(zhǎng)筒馬鈴薯;當(dāng)R大于0.85時(shí),稱(chēng)之為圓形馬鈴薯;當(dāng)R介于0.67到0.85之間時(shí),稱(chēng)之為橢圓形馬鈴薯。
2.2.2 結(jié)果與分析
隨機(jī)抽取114塊馬鈴薯,對(duì)抽取的馬鈴薯進(jìn)行正反兩面拍照,挑選清晰度最高的228張圖片。人工分類(lèi)后進(jìn)行計(jì)算機(jī)視覺(jué)分類(lèi),操作步驟具體如下:
(1)用DIPS預(yù)處理:B通道灰度化,中值濾波和Otsu分割;
(2)通過(guò)計(jì)算機(jī)視覺(jué)技術(shù)提取馬鈴薯圖片的短長(zhǎng)軸比R;
(3)將人工分類(lèi)與計(jì)算機(jī)視覺(jué)分類(lèi)進(jìn)行對(duì)比,并得出正確率。
根據(jù)圖表,我們可以看出在228張僅有兩張圖片被分類(lèi)錯(cuò)誤,正確率高達(dá)99.1%,而這兩個(gè)分類(lèi)錯(cuò)誤的馬鈴薯的短長(zhǎng)軸比處于0.67周?chē)?,分別為0.667604 , 0.67193和0.671887, 0.661063,又因?yàn)閷?duì)馬鈴薯形狀的分類(lèi)不需要類(lèi)似工業(yè)生產(chǎn)那樣精密,所以,當(dāng)正反兩面短長(zhǎng)軸比接近時(shí)都可看作是橢圓形。
2.3 馬鈴薯的缺陷檢測(cè)
計(jì)算機(jī)視覺(jué)技術(shù)具有實(shí)時(shí)、客觀(guān)、無(wú)損的檢測(cè)特點(diǎn),能對(duì)馬鈴薯的表面缺陷和某些特征要素進(jìn)行快速檢測(cè)?;诖?,國(guó)內(nèi)外很多研究學(xué)者進(jìn)行了大量的實(shí)驗(yàn)研究,在1998年開(kāi)發(fā)了利用PC機(jī)輔助的實(shí)時(shí)馬鈴薯檢測(cè)系統(tǒng),能夠?qū)︸R鈴薯的重量、顏色以及形狀進(jìn)行快速檢測(cè);2000年,相關(guān)研究者在此基礎(chǔ)上建立了計(jì)算機(jī)視覺(jué)檢測(cè)系統(tǒng),不僅能實(shí)現(xiàn)大小、形狀的檢測(cè),還能對(duì)馬鈴薯表面的生長(zhǎng)裂縫、機(jī)械裂縫、綠皮等表面缺陷進(jìn)行檢測(cè)。當(dāng)前對(duì)馬鈴薯表面缺陷進(jìn)行檢測(cè)的主要計(jì)算機(jī)視覺(jué)技術(shù)包括缺陷分割法和缺陷識(shí)別法兩種方法。
3 結(jié)論
本文應(yīng)用計(jì)算機(jī)視覺(jué)技術(shù)對(duì)馬鈴薯的大小、形狀和表面缺陷等外部品質(zhì)進(jìn)行了檢測(cè),但是還未能實(shí)現(xiàn)利用計(jì)算機(jī)視覺(jué)技術(shù)對(duì)馬鈴薯的表面缺陷進(jìn)行分類(lèi)這一技術(shù)。因此,相關(guān)部門(mén)要加大研究力度,爭(zhēng)取早日完善計(jì)算機(jī)視覺(jué)技術(shù),從而推動(dòng)我國(guó)馬鈴薯加工企業(yè)快速高效的發(fā)展。
摘要:為解決通訊機(jī)殼部件測(cè)量中遇到的圓擬合和邊緣提取不準(zhǔn)確的問(wèn)題,提出了利用加權(quán)函數(shù)進(jìn)行修正的方法。首先,針對(duì)圓擬合過(guò)程中容易受到干擾點(diǎn)影響的情況,提出采用雙平方形式的加權(quán)函數(shù)對(duì)圓擬合過(guò)程進(jìn)行修正,去除了離群值較大的點(diǎn),從而使圓擬合更準(zhǔn)確。為了準(zhǔn)確的定位邊緣,提出了利用三角形模糊隸屬函數(shù)作為加權(quán)函數(shù),對(duì)邊緣選取過(guò)程進(jìn)行修正,從而達(dá)到準(zhǔn)確提取邊緣的目的。同時(shí),本文采用了魯棒性強(qiáng)的字符提取算法及支持向量機(jī)的字符檢測(cè)算法,實(shí)現(xiàn)了字符提取和識(shí)別。
關(guān)鍵詞:加權(quán)函數(shù);圓擬合;邊緣選??;字符檢測(cè)
通訊天線(xiàn)設(shè)備的電性能直接與設(shè)備的各個(gè)零部件的精度相關(guān),通訊天線(xiàn)零部件的高精度是保障通信質(zhì)量的基本條件。通訊機(jī)殼零部件的尺寸精度、幾何形狀精度、相互位置精度、表面粗糙度等都有嚴(yán)格規(guī)范和公差范圍。在檢測(cè)過(guò)程中不但要高精度地測(cè)量幾何尺寸、幾何形狀和相互位置精度,同時(shí)還要識(shí)別零部件表面的各種符號(hào)、數(shù)字和字母等。本文以通訊機(jī)殼零部件測(cè)量為例,以滿(mǎn)足精度、提高可靠性為目的,研究了基于單目計(jì)算機(jī)視覺(jué)條件下滿(mǎn)足亞像素精度的檢測(cè)方法,其關(guān)鍵檢測(cè)技術(shù)主要有標(biāo)定技術(shù)、復(fù)雜輪廓的基元擬合技術(shù)、模糊測(cè)量技術(shù)和字符提取技術(shù)等。文中針對(duì)機(jī)殼部件測(cè)量中,存在圓擬合與邊緣提取不準(zhǔn)確的問(wèn)題,提出了利用加權(quán)函數(shù)進(jìn)行修正的方法。該方法的基本思想是:圓擬合不準(zhǔn)確主要是由于受到較大的離群點(diǎn)影響,因此采用一種雙平方模式的加權(quán)函數(shù)來(lái)去除這些離群點(diǎn),從而得到準(zhǔn)確的擬合圓。邊緣提取不準(zhǔn)確也是由于提取到了不需要的邊緣,因此采用三角形模式的加權(quán)函數(shù)對(duì)不需要的邊緣進(jìn)行抑制,只允許正確的邊緣輸出,從而達(dá)到正確檢測(cè)目的。檢測(cè)結(jié)果表明,所提出的方法能夠滿(mǎn)足測(cè)量要求。由于機(jī)殼部件表面的字符也要求識(shí)別,因此本文根據(jù)字符及其背景,選擇了魯棒性強(qiáng)的動(dòng)態(tài)閥值分割算法和支持向量機(jī)分類(lèi)器實(shí)現(xiàn)了字符的檢測(cè)和識(shí)別。
1 攝像機(jī)標(biāo)定技術(shù)
本文采用傳統(tǒng)的攝像機(jī)標(biāo)定方法,利用一個(gè)標(biāo)定板與其圖像的對(duì)應(yīng)約束關(guān)系來(lái)確定攝像機(jī)的內(nèi)參數(shù)和外參數(shù)。測(cè)量中,采用的是遠(yuǎn)心相機(jī)模型。從三維空間坐標(biāo)到二維圖像坐標(biāo)的映射關(guān)系可以使用一個(gè)固定數(shù)量的參數(shù)來(lái)表示:
2 最小二乘法的加權(quán)擬合
由于部件的邊界點(diǎn)組成的輪廓會(huì)產(chǎn)生大量的數(shù)據(jù),而我們所關(guān)心的是確定部件輪廓的位置信息,因此需要將輪廓擬合成直線(xiàn)、圓、橢圓等基元,進(jìn)而確定被測(cè)部件的形狀精度、相互位置精度等關(guān)鍵參數(shù)。本文提出一種圓擬合算法,該算法基于各個(gè)擬合點(diǎn)的權(quán)重值的大小對(duì)圓進(jìn)行擬合,使得到圓更為精確。
3 模糊測(cè)量
相對(duì)于經(jīng)典標(biāo)準(zhǔn)的測(cè)量方法,模糊測(cè)量對(duì)邊緣選擇更加靈活。它可以依據(jù)圖像的對(duì)比度、位置、尺寸及灰度值等信息實(shí)現(xiàn)測(cè)量。
設(shè)模糊集合記為;并在[0,1]閉區(qū)間的特征函數(shù)稱(chēng)為隸屬函數(shù),記為,它表示對(duì)于的隸屬程度,用它來(lái)描述“亦此亦彼”的模糊概念。在經(jīng)典集合論中,集合元素要么屬于或不屬于集合,該集合的邊界是清晰的。模糊集理論則允許有關(guān)集合元素模糊漸進(jìn)評(píng)估,這就是通過(guò)隸屬函數(shù)來(lái)描述的。模糊集合的定義式為:
由于在圖像中的灰度值存在模糊性,其主要體現(xiàn)在物體的邊緣,因此適合用模糊理論對(duì)圖像邊緣的不確定性進(jìn)行描述。對(duì)單一不確定性測(cè)量,在量化的區(qū)域內(nèi),包含準(zhǔn)確的值,即在gray zone范圍內(nèi)[6]。對(duì)物體進(jìn)行測(cè)量前,要選擇模糊隸屬函數(shù)。常用的有Triangular、S-curve function、Z-function和Pi-function四種。其他隸屬函數(shù)可由這四種組合而成[7]。在實(shí)際的測(cè)量中,由于光照等因素影響,常導(dǎo)致邊緣檢測(cè)不準(zhǔn)確,進(jìn)而影響測(cè)量結(jié)果,圖2(a)所示為由于檢測(cè)出多個(gè)邊緣,其測(cè)量結(jié)果有多個(gè)。
5 結(jié)論
本文研究了基于單目計(jì)算機(jī)視覺(jué)的機(jī)殼測(cè)量方法。針對(duì)測(cè)量中圓擬合不準(zhǔn)確的問(wèn)題,提出了圓擬合算法的改進(jìn),即對(duì)擬合過(guò)程中,先計(jì)算各個(gè)點(diǎn)的加權(quán)值,對(duì)大于指定值的視為離群點(diǎn),將其忽略已達(dá)到去除離群點(diǎn)的目的,從而得到更準(zhǔn)確的圓。對(duì)檢測(cè)到多個(gè)邊緣的問(wèn)題,根據(jù)其正確的邊緣位置信息,設(shè)計(jì)相應(yīng)的加權(quán)函數(shù),只選擇需要的邊緣輸出,從而得到正確的測(cè)量結(jié)果。加權(quán)函數(shù)的方法的優(yōu)點(diǎn)是使檢測(cè)結(jié)果更準(zhǔn)確;其缺點(diǎn)是增加了計(jì)算量,從而使檢測(cè)時(shí)間加長(zhǎng)。因此,對(duì)于檢測(cè)時(shí)間要求比較苛刻的場(chǎng)合,該方法還有進(jìn)一步改進(jìn)的空間。另外本文還根據(jù)檢測(cè)要求,運(yùn)用動(dòng)態(tài)閥值分割算法和SVM分類(lèi)器對(duì)機(jī)殼表面的字符進(jìn)行了提取和識(shí)別。