時間:2023-12-20 10:48:55
引言:易發表網憑借豐富的文秘實踐,為您精心挑選了九篇計算機視覺研究內容范例。如需獲取更多原創內容,可隨時聯系我們的客服老師。
1、引言
隨著經濟的迅猛發展,汽車的迅速普及,根據社會對汽車產業的要求,車輛的各方面指標都受到人們越來越多地關注,汽車涂裝過程中的瑕疵直接影響汽車的外觀質量,因此如何在生產過程中利用計算機視覺檢測技術檢測出并及時修補汽車涂裝過程中產生的瑕疵就成了首要的任務[1]。本文的研究內容是首先了解計算機視覺檢測系統的工作原理,汽車涂裝瑕疵的種類,然后結合兩者的特點,應用計算機視覺檢測系統檢測汽車涂裝瑕疵。該研究的價值在于兩方面:①對于汽車生產的自動化和過程自動化,計算機視覺是現實真正意義的自動的基礎和一種重要的質量控制的手段;②對于汽車涂裝瑕疵的修補可以提高其修補的精度。
2、汽車涂裝瑕疵的計算機視覺檢測系統
汽車涂裝瑕疵檢測系統主要包括照明系統、圖像采集卡、CCD攝像機、計算機以及軟件處理等幾個主要部分[2]。綜合計算機視覺檢測系統的構成和線結構光測量的原理,基于計算機視覺的汽車涂裝瑕疵的檢測系統大致是這樣構成的:將線結構光投射到被測物上,所形成的光斑作為傳感信號,用CCD攝像機采集光斑圖像,采集到的圖像信號被傳輸到計算機,根據圖像處理和計算機視覺檢測系統的處理產生處理結果,返回到涂裝生產線,對車身的涂裝進行修正,從而提高產品質量。汽車涂裝瑕疵的視覺檢測系統如圖1所示[3]。
3、計算機視覺檢測
計算機視覺是計算機對圖像進行自動處理并報告“圖像中有什么”的過程,也就是說它識別圖像中的內容。圖像中的內容往往是某些機器零件,而處理的目標不僅要能對機器零件定位,還要能對其進行檢驗。計算機視覺系統基本原理:機器視覺系統通常采用CCD相機攝取圖像,將其轉化為數字信號,再采用先進的計算機硬件與軟件技術對圖像數字信號進行處理,從而得到所需要的各種目標圖像特征值,并在此基礎上實現模式識別、坐標計算、灰度分布圖等多種功能。計算機視覺系統能夠根據其檢測結果快速地顯示圖像、輸出數據、指令,執行機構可以配合其完成指令的實施。計算機視覺系統主要由圖像獲取、圖像分析和處理、輸出顯示或控制三個功能模塊組成[4]。視覺檢測按其所處理的數據類型可分為二值圖像、灰度圖像、彩色圖像和深度圖像的視覺檢測。另外,還有X射線檢測、超聲波檢測和紅外線檢測。一個完整視覺檢測系統包括:圖像采集、圖像分割、零件識別、模型匹配和決策判斷。Newman[5]等描述了利用深度圖像進行零件檢測的AVI系統,具有一定的代表性。一個典型的AVI系統如圖2所示。
4、汽車涂裝瑕疵的檢測算法
由于汽車涂膜中一些缺陷的邊界比較模糊,例如:氣泡、爆裂氣泡孔、氣泡針孔、抽縮等等。邊緣處灰度變化很小,直接用傳統的微分邊緣檢測算法無法有效的檢測出來。所以對缺陷模糊邊緣的檢測成為了算法的關鍵[6]。本文介紹了基于線結構光的邊緣檢測方法。汽車涂裝表面被光源投射器發出的線結構光照射,反射出的圖像被CCD攝像機所接收傳輸到計算機視覺檢測系統中。若涂裝表面沒有瑕疵,則產生圖3的圖像。若涂裝表面有瑕疵,則產生圖4的圖像[7]。
在我國市場經濟不斷發展的盛況下,我國科技發展水平也緊隨其后,成為世界上的科技強國之一。在計算機水平的不斷提高下,計算機視覺技術應運而生。其中,計算機視覺技術被應用與各個領域,并在各個領域都得到廣泛有效的應用,比如軍事領域、醫療領域、工業領域等。本文針對計算機視覺技術在交通領域中的應用進行分析。
【關鍵詞】計算機視覺 交通領域 探究
近年來,隨著科技水平的提高,計算機視覺技術逐漸被人們熟知并廣泛應用。相較于其他傳感器來說,視覺能獲得更多的信息。因此,在我國交通領域中,也對計算機視覺技術進行研究完善,將計算機視覺技術應用在交通領域各個方面中,并取得了顯著的成效。
1 計算機視覺的概述及基本體系結構
1.1 計算機視覺概述
通過使用計算機和相關設備,對生物視覺進行模擬的方式,就是計算機視覺。對采集到的圖片或視頻進行相應的技術處理,從而獲得相應的三維信息場景,是計算機視覺的主要任務。
計算機視覺是一門學問,它就如何通過計算機和照相機的運用,使人們獲得被拍攝對象的數據與信息所需等問題進行研究。簡單的說,就是讓計算機通過人們給其安裝上的“大腦”和“眼睛”,對周圍環境進行感知。
計算機視覺是一門綜合性學科,在各個領域都有所作為,已經吸引了各個領域的研究者對其研究。同時,計算機視覺也是科學領域中一個具有重要挑戰性的研究。
1.2 計算機視覺領域基本體系結構
提出第一個較為完善的視覺系統框架的是Marr,他從信息處理系統角度出發,結合圖像處理、心理物理學等多領域的研究成果,提出被計算機視覺工作者基本接受的計算機視覺系統框架。在此基礎上,研究者們針對視覺系統框架的各個角度、各個階段、各個功能進行分析研究,得出了計算機視覺系統的基本體系結構,如圖1。
2 計算機視覺在交通領域的應用
2.1 牌照識別
車輛的唯一身份是車輛牌照。在檢測違規車輛、稽查被盜車輛和管理停車場工作中,車輛牌照的有效識別與檢測具有重要的作用和應用價值。然而在實際應用工作中,雖然車牌識別技術相對成熟,但是由于受到拍攝角度、光照、天氣等因素的影響,車牌識別技術仍需改善。車牌定位技術、車牌字符識別技術和車牌字符分割技術是組成車牌識別技術的重要部分。
2.2 車輛檢測
目前,城市交通路口處紅綠燈的間隔時間是固定不變的,但是受交通路口的位置不同、時間不同的影響,每個交通路口的交通流量也是持續變化的。此外,對于某些交通區域來說,公共資源的配備,比如交通警察、交通車輛的數量是有限的。如果能根據計算機視覺技術,對交通路口的不同時間、不同位置的交通情況進行分析計算,并對交通流量進行預測,有利于為交通警察縮短出警時間、為交通路口的紅綠燈根據實際情況設置動態變化等技術提供支持。
2.3 統計公交乘客人數
城市公共交通的核心內容是城市公交調度問題,一個城市如何合理的解決公交調度問題,是緩解城市運力和運量矛盾,緩解城市交通緊張的有效措施。城市公交調度問題,為公交公司與乘客的平衡利益,為公交公司的經濟利益和社會效益的提高做出了巨大的貢獻。由于在不同的地域、不同的時間,公交客流會存在不均衡性,高峰時段的公交乘客過多,平峰時段的公交乘客過少,造成了公交調度不均衡問題,使有限資源浪費嚴重。在計算機視覺智能公交系統中,自動乘客計數技術是其關鍵技術。自動乘客計數技術,是對乘客上下車的時間和地點自動收集的最有效的技術之一。根據其收集到的數據,從時間和地點兩方面對客流分析,為城市公交調度進行合理的安排。
2.4 對車道偏離程度和駕駛員工作狀態判斷
交通事故的發生率隨著車輛數量的增加而增加。引發交通事故的重要因素之一就是駕駛員疲勞駕駛。據相關數據顯示,因車道偏離導致的交通事故在40%以上。其中,駕駛員的疲勞駕駛就是導致車道偏離的主要原因。針對此種現象,為減少交通事故的發生,計算機視覺中車道偏離預警系統被研究開發并被廣泛應用。針對駕駛員眨眼頻率,利用計算機視覺對駕駛員面部進行圖像處理和分析,再根據疲勞駕駛關注度與眨眼頻率的關系,對駕駛員的工作狀態進行判斷。此外,根據道路識別技術,對車輛行駛狀態進行檢測,也是判斷駕駛員工作狀態的方法之一。這兩種方法,是目前基于計算機視覺的基礎上,檢測駕駛員疲勞狀態的有效方法。
2.5 路面破損檢測
最常見的路面損壞方式就是裂縫。利用計算機視覺,及時發現路面破損情況,并在其裂縫程度嚴重之前進行修補,有利于節省維護成本,也避免出現路面坍塌,車輛凹陷的情況發生。利用計算機視覺進行路面檢測,相較于之前人工視覺檢測相比,有效提高了視覺檢測的效率,增強了自動化程度,提高了安全性,為市民的出行安全帶來了更高保障。
3 結論
本文從計算機視覺的概述,及計算機視覺基本體系結構,和計算機視覺在交通領域中的應用三面進行分析,可見計算機視覺在交通領域中的廣泛應用,在交通領域中應用的有效性、顯著性,以此可得計算機視覺在現展過程中的重要性。隨著計算機視覺技術的越來越成熟,交通領域的檢測管理一定會加嚴格,更加安全。
參考文獻
[1]段里仁.智能交通系境在我國道路空通管理中的應用[J].北方工業時報,2015(06).
[2]王豐元.計算機視覺在建筑區間的應用實例分析[J].河北電力學報,2015(04).
[3]李釗稱.主動測距技術在計算機數據分析中的作用探析[J].計算機應用,2015(08).
[4]馬良紅.三維物體影像的攝取與分析[J].中國公路學報,2014(05).
[5]朱學君,沈睿.關于計算機視覺在交通領域中的探討[J].信息通信,2013(01):123.
[6]王大勇.關于計算機視覺在交通領域中的應用分析[J].科技與企業,2013(01):115.
作者簡介
夏棟(1988-),男,湖北省孝感市人。現為同濟大學軟件學院在讀碩士。研究方向為計算機視覺。
關鍵詞 計算機;視覺技術;應用研究
中圖分類號:TP212 文獻標識碼:A 文章編號:1671-7597(2013)16-0114-01
計算機視覺技術自20世紀70年代產生以來就得到了全世界的廣泛關注。作為一種多學科綜合應用下的新技術,隨著專家對其研究會的不斷深入,其應用領域也越來越廣,給人們的生產生活帶來了極大方便。
1 計算機視覺技術
計算機視覺技術是在計算機技術應用下發展起來的一種新技術,主要用來研究計算機模擬生物的宏觀或外顯功能。該技術在應用過程中會涉及到計算機科學、神經生物學、人工智能、模式識別以及圖像處理等多個學科,多學科技術的綜合運用使得計算機具有了“感知”周圍世界的能力,這也正是該技術發揮作用的核心所在。計算機視覺技術的特點就在于,首先,它能在不接觸被測者的前提下完成對被測者的檢測;其次,該技術應用的領域和檢測的對象非常廣,能在敏感器件的應用下,完成對人類難以觀察到的超聲波、微波和紅外線等的檢測;最后,該技術還突破了人在視覺觀察上長時間工作的限制,能對檢測對象進行長時間觀察。
2 計算機視覺技術在各領域的應用分析
隨著計算機視覺技術研究的不斷加深,該技術的應用領域也越來越廣,下面,本文就選取工業、農業、林業、農產品檢測、電力系統自動化及圖書館工作這6個方面對計算機視覺技術的應用進行簡要分析。
2.1 在工業領域中的應用
工業生產對產品的質量要求極高,計算機視覺技術在工業上的應用主要集中在以下3方面:1)產品形狀和尺寸的檢測上。對制造業而言,產品的形狀和尺寸是否合格直接影響到產品在實際應用過程中作用的發揮。計算機視覺技術的應用能對產品進行二維和三維等幾何特征的檢測,如產品的圓度、位置及形狀等。2)產品零部件缺失情況的檢測。在生產線運行過程中,計算機視覺技術能準確檢測出產品在生產過程中是否存在鉚釘、螺絲釘等零部件的缺失以及產品內部是否在生產過程中摻進雜質等。3)產品表面質量的檢測。為了從各個方面保證產品的合格性,對其進行表面質量的檢測也是一個極其重要的環節。計算機視覺技術實現了對產品表面的紋理、粗糙度、劃痕、裂紋等各方面的有效檢測。
2.2 在農業生產領域中的應用
該技術在農業領域的應用主要集中在以下兩方面:1)對病蟲害的預測預報。預測預報作用發揮的關鍵環節是建立起計算機視覺技術對所有昆蟲的識別體系。對昆蟲圖像識別系統進行數字化建模所使用的方法主要以下2種,一種是運用數學形態學的方法對害蟲的邊緣進行檢測,進而提取害蟲的特征;第二種是從昆蟲的二值化圖像中提取出昆蟲的周長、面積和復雜度等基本信息,并對這些信息建立害蟲的模板庫以實現對昆蟲的模糊決策分析。2)對農作物生長的監測。常用的方法就是運用計算機視覺技術下的非接觸式監測系統對農作物生長環境下的光照、溫度、濕度、風速、營養液濃度等相關因素進行連續地監測,進而判斷出農作物長勢。
2.3 在林業生產中的應用
該技術在林業生產中的應用主要集中在農藥噴灑和林木球果采集這兩方面。就林業的農藥噴灑而言,常規的農藥噴灑方式易造成農藥的大量流失,不僅達不到防止林業有害生物的目的,還浪費了大量的人力、物力和財力。計算機視覺技術的應用能通過對施藥目標圖像進行實時分析,得出具體的施藥量和準確的施藥位置,該技術指導下的施藥工作極大發揮了農藥的效果。就林木球果采集而言,該采集工作的操作難度一直都很大,我國當前使用的方法主要是人工使用專業工具下的采集以及機械設備運用下的高空作業車采集和搖振采種機采集,這兩種方式都存在一定的安全性和效率問題。計算機視覺技術的應用能通過對需要進行采集的林木球果進行圖像采集來得出球果所處的具置,再結合專業機械手的使用完成球果采集。該技術不僅節省了大量勞動力,還極大提高了采摘效率。
2.4 在農產品檢測中的應用
農產品在生產過程中受自然環境的影響比較大,所以農產品不僅會產生質量上的差異,還會造成顏色、大小、形狀等外觀上的極大不同。由于農產品在出售時大多要進行產品等級的劃分,所以將計算機視覺技術運用到對其顏色和外形尺寸的檢測上,有效達到了對農產品進行檢測的目的。通過對外觀大小尺寸的檢測,不僅提高了對農產品進行分門別類地等級劃分的效率,還在很大程度上減少了對產品的損壞;通過對西瓜等農產品進行顏色上的檢測,能準確判斷其是否成熟,有效避免了人工操作下的失誤。
2.5 在電力系統自動化中的應用
計算機視覺技術在電力系統自動化應用的表現當前主要表現在以下2個方面:1)在人機界面中的應用。人機界面在運行過程中更加強調人的主體地位,實現了用戶對各種效應通道和感覺通道的運用。具體來講,計算機視覺技術在用戶向計算機的輸入方面,效應通道實現了手動為主向手、足、口、身體等的轉變;在計算機向用戶的輸出方面,感覺通道實現了視覺為主向觸覺、嗅覺、聽覺等的轉變。2)在電廠煤粉鍋爐火焰檢測中的應用。對煤粉鍋爐火焰的檢測既能有效判斷鍋爐的運行狀況,又能在很大程度上實現電廠的安全性運營。由于煤的負荷變化和種類變化會在使著火位置發生移動,所以為了保證爐膛火焰檢測的準確性,必須彌補之前單純應用火焰檢測器只能判斷有無火焰開關量信號的弊端。計算機視覺技術的應用,就在彌補火焰檢測器應用弊端的基礎上,實現了對火焰形狀的進一步檢測。
2.6 在圖書館工作中的應用
隨著當前數字圖書館和自動化管理系統的建立,計算機技術在圖書館方面的應用越來越廣泛。當前計算機視覺技術在圖書館方面的應用主要集中在古籍修補和書刊剔舊這兩方面。就古籍修補而言,古籍圖書等在收藏的過程中,受溫度、濕度、光照等的影響,極易導致紙張變黃、變脆以及蟲洞等現象的出現。在進行修補時,依靠計算機視覺技術開展具體的修補工作,能在很大程度上提高修補工作的效率。就書刊剔舊而言,由于圖書館藏書眾多,對那些使用率低且較為陳舊的文獻資料進行及時地剔除,能實現圖書資源的及時更新。計算機視覺技術在該方面的應用,極大地保證了工作的準確性和效率性。
3 結束語
通過以上對計算機視覺技術在工業、農業、林業、農產品檢測、電力系統自動化及圖書館工作這6個方面的研究可以看出,隨著計算機技術的進一步發展以及計算機與各專業學科的不斷滲透,該技術的發展前景和應用領域都將更加廣闊。
參考文獻
關鍵詞:動態場景;自適應預測;多特征融合;計算機視覺;運動目標
接受信息的關鍵手段之一就是視覺系統,隨著科學技術水平的不斷發展,以及計算機和信號處理理論的誕生,讓機器擁有人類視覺功能已經不再是夢。對所采集視頻中的運動目標進行跟蹤、檢測,并對其目標行為進行分析,就是運動目標分析的內容,運動目標分析是計算機視覺領域關鍵內容之一,其屬于圖像理解與圖像分析的范疇。而在運動目標分析系統中,跟蹤與檢測運動目標則為中級和低級處理部分,是分析與理解行為的高等層分析模塊的基礎。檢測與跟蹤運動目標技術主要包括了:機器人視覺導航、軍事領域、運動圖像編碼、交通管制、視覺監視等。
1目標檢測算法
連續圖像序列由視頻中提取出,由前景區域與背景區域共同組成了整個畫面。前景區域包含了如運動的人體、車輛等動態要素,它是指人們較為感興趣的區域。而背景區域主要包含例如樹木、建筑物等靜態要素,它的像素值僅發生微弱變化或者不產生變化。在連續圖像序列中,采用一系列算法分隔開背景區域和前景區域,將運動目標信息有效提取,則為運動目標檢測。以靜態場景為基礎的運動目標檢測算法包括了光流法、背景差分法、幀間查分法等,文章主要針對背景差分法進行介紹。
背景差分法通常適用于靜態場景,其是將背景圖像與當前幀圖像進行差分,運動目標依靠閥值化進行檢測,因為該算法僅能夠在背景變化緩慢或者不發生變化的情況下應用,因此就有著一定的局限性。假設當前幀圖像為fk(x,y),背景圖像B(x,y)可通過一定的方法得出,而這時背景差分圖像則為:
(1)
而假設二值化閥值為Th,二值化圖像B(x,y)則為:
(2)
運動目標檢測結果可通過數學形態學處理獲得。
2 背景模型的實時更新
要更新背景圖像可采用一階KALMAN濾波來實現,為了克服氣候變化、光照變化等外部環境變化對運動檢測產生的影響,采用一階KALMAN濾波更新背景圖像公式如下:
Bk+1(p)=Bk(p)+g(Ik(p)-Bk(p)) (3)
而增益因子則為:g=?琢1(1-Mk(p))+?琢2Mk(p) (4)
公式中?琢1和?琢2是權值系數;M是第k時刻二值化后目標圖像中p像素的值;B為背景圖像;I為當前幀圖像。要想將運動目標從背景序列圖像中有效分割出來,就必須要達到?琢2足夠小的條件,且?琢1應等于或者大于10?琢2,若?琢1值過大,就會將算法自身的去噪特性喪失,在序列背景圖像中也會存儲越來越多的運動變化。
3 更新車輛目標模型
核與活動輪廓算法具有效率高、技術復雜度低等特點,它以非參數核概率密度估計理論為基礎,在視頻運動目標跟蹤中廣泛應用。彩色圖像序列通過攝像機獲取,人臉目標模型可以采用RGB顏色空間來進行描述。在跟蹤車輛的過程中,噪聲、遮擋、光照等干擾或多或少存在,因干擾因素的存在,車輛像素特征也會發生相應的微弱變化。若不對目標模型進行更新,會對跟蹤精度產生影響,所以,采用的矩形模板會包括一定背景。而在實施跟蹤的過程中,要對車輛目標模型進行更換。如果其過程物遮擋,當BHATTACHARYYA系數滿足?籽>Tudm條件時,更新車輛目標模型,更新模型為:
(5)
公式中Tudm是模板更新閥值;qk-1是更新之前的車輛目標模型。通過視頻跟蹤,在近場景和遠場景拍攝到的視頻中,多尺度圖像空間由各個幀圖像構成。例如:將將書本作為跟蹤對象,由遠及近從書本的正上方拍攝六十幀圖像,為了能使矩形框正好能夠包含書本,對每幀圖像張書本手工劃定矩形框,并對框內圖像的信息量進行統計。最后,隨書本尺度的變化,給出圖像信息量變化曲線。
4 計算機視覺原理
計算機視覺是一門研究怎樣使機器進行觀察的科學,更切確地說,就是指利用電腦和攝影機代替人眼對目標進行識別、跟蹤和測量等機器視覺,并進一步做圖形處理,用電腦處理成為傳送給儀器檢測或更適合人眼觀察的圖像。計算機視覺研究相關的理論和技術作為一個科學學科,嘗試創建能夠從圖像或者多維數據中獲取信息的人工智能系統。這里所指的信息指Shannon定義的,可以用來幫助做一個決定的信息。因為感知可以看作是從感官信號中提取信息,所以計算機視覺也可以看作是研究如何使人工系統從圖像或多維數據中感知的科學。
計算機視覺就是由計算機來代替大腦完成處理和解釋,用各種成象系統代替視覺器官作為輸入敏感手段。使計算機能象人那樣通過視覺觀察和理解世界,具有自主適應環境的能力就是計算機視覺的最終研究目標,而需要經過長期的努力才能達到這個目標。所以,在實現最終目標以前,通過努力的中期目標是建立一種視覺系統,這個系統能依靠反饋的某種程度的智能和視覺敏感完成一定的任務。例如:計算機視覺的一個重要應用領域就是自主車輛的視覺導航,但要實現自主導航的系統,卻還沒有條件實現象人那樣能識別和理解任何環境。所以,人們通過不懈的努力,研究在高速公路上具有道路跟蹤能力,有效避免與前方車輛碰撞的視覺輔助駕駛系統。人類視覺系統是有史以來,人們所知道的功能最強大和完善的視覺系統。這里要指出的一點是在計算機視覺系統中計算機起代替人腦的作用。計算機視覺可以而且應該根據計算機系統的特點來進行視覺信息的處理,但并不等于計算機必須按人類視覺的方法完成視覺信息的處理。可以說,對人類視覺處理機制的研究將給計算機視覺的研究提供指導和啟發,所以,用計算機信息處理的方法研究人類視覺的機理,建立人類視覺的計算理論,與此同時也是一個十分重要和讓人感興趣的研究領域。這方面的研究被稱為計算視覺。計算視覺可被認為是計算機視覺中的一個研究領域。計算機視覺領域的不完善性與多樣性為其突出特點。
5 結束語
對視頻中的運動目標進行跟蹤、識別、檢測,并對目標行為進行研究、分析,這就是基于視覺運動目標分析。以計算機視覺為基礎,分析運動目標,包括了目標行為的理解與分析、目標跟蹤、運動目標檢測、預處理圖像等,它是計算機視覺領域重要內容之一。理解與分析運動目標的行為,既是計算機視覺的根本目的之一,也是檢測與跟蹤運動目標的最終目標。從理論層考慮,理解與分析運動目標的行為可以分為人工智能理論研究與模式識別。簡要闡述基于計算機視覺的運動目標分析,而所面臨的是對運動目標行為的理解。
參考文獻
[1]楊可,劉明軍,毛欣,夏維建,劉偉,周旋,吳煒,周凱.基于計算機視覺的電纜終端表面溫升分析系統[J].電視技術,2013(7).
[2]葉闖,沈益青,李豪,曹思汗,王柏祥.基于人類視覺特性(HVS)的離散小波變換(DWT)數字水印算法[J].浙江大學學報:理學版,2013(2).
[3]何青海,馬本學,瞿端陽,李宏偉,王寶.基于機器視覺棉葉螨自動監測與分級方法研究[J].農機化研究,2013(4).
[4]賈挺猛,茍一,鮑官軍,董茂,楊慶華.基于機器視覺的葡萄樹枝骨架提取算法研究[J].機電工程,2013(4).
關鍵詞:計算機圖形學;計算機視覺;可視化技術
中圖分類號:TM862 文獻標識碼:A 文章編號:1671-2064(2017)01-0054-02
計算機圖形學、計算機視覺以及可視化技術三者均是計算機領域重要組成部分,要做好計算機知識,就要先學好計算機圖形學,但計算機圖形學學習相對枯燥,尤其是算法教學難以理解,為解決這一問題,計算機視覺與可視化技術被應用到計算機圖形學中。可見,三者之間存在一定的聯系,因此,有必要對計算機圖形學、計算機視覺以及可視化技術展開研究。
1 計算機圖形學概述
1.1 計算機圖形學目的
所謂的計算機圖形學實際上就是怎樣利用計算機表示圖形,并利用計算機完成圖形計算與處理,而這一過程的實現需要得到相關算法的支持。學習計算機圖形學的目的是利用計算機技術為人們呈現既帶有美感又不缺真實的圖形(如下圖1所示),為實現這一目標,就需要按照圖形的要求創設合適的場景,并在一些光照模型的作用下,做好光照效果設計,在這一過程中需要計算機圖形學能夠與其他計算機技術相配合。經過計算機圖形學出來的圖像,多會以數字圖像的方式展示出來,總的來說,計算機圖形學與圖像處理之間存在著一定的聯系[1]。計算機圖形學的涉及范圍相對寬泛,不僅有圖形硬件設計,還包括動畫制作,虛擬現實等多個部分。此外,計算機圖形學在動畫制作中的應用頻率也很高,如45分鐘一集的動畫影片中,85%的畫面都需要用算機圖形學來完成,由此可見,計算機圖形學的應用頻率極高,并在動畫制作中發揮著不可替代的作用。因此,應重視計算機圖形學的應用。
1.2 計算機圖形學應用
隨著計算機圖形學的發展,它被應用到各個領域中,并發揮著重要作用。首先,在計算機輔助設計與制造中的應用,這是計算機圖形學應用最多的領域,在計算機圖形學被應用以后,不僅可以設計出更精準的圖形,還能做好人機交互設計,強化修改能力。計算機圖形學還被應用到三維形體重建中,利用該技術可以將原理的二維信息轉化為三維信息,如在某次工程圖紙設計中就應用了計算機圖形學,經過一系列的處理以后,三維形體逐漸形成,最終實現了重建。其次,在醫學領域中的應用。計算機圖形學在醫學領域中的應用多以計算可視化的形式展示出來,如在腦部手術中,醫生為看清患處真實情況,經常需要利用在可視化技術的作用下將復雜的數據轉化為圖像,這時就體現了計算機圖形學在其中的應用[2]。再者,在計算機動畫中的應用,人們看到的動畫影片就是計算機圖形學作用的結果,以動畫人物的行走為例,為保證動畫人物的行走與自然人不存在過大差異,就需要應用大量的計算機技術,并在計算機圖形學的作用下完成設計。最后,在計算機藝術中的應用。計算機圖形學在計算機藝術中也有廣泛應用,它不僅可以用于藝術制作,很多場景都是通過計算機圖形學來完成的,現階段,一些人正在利用計算機圖形學創設人體模擬系統,其目的是讓已故人士再次出現在熒屏上,這一目標的實現就需要得到計算機圖形學的支持。
2 計算機視覺技術
2.1 計算機視覺技術含義
所謂的計算機視覺技術,實際上就是用計算機取代人眼做識別、跟蹤以及測量等,同時也兼顧圖形處理,其目的是讓圖像在計算機被處理以后更適于識別。對于計算機視覺技術來說,意在實現人工智能,主要是從圖像與多維數據等方面實現人工智能系統設計[3]。計算機視覺是一種在相關理論與模型基礎上發展起來的視覺系統,其主要構成部分有以下幾種:
(1)程序控制,這一點主要體現在機器人設計上;(2)事件檢測,多體現在圖像監測上;(3)信息組織,主要體現在圖像數據庫等方面。計算機視覺三個階段如圖2所示,通過觀察圖1可以發現,計算機視覺存在于圖像處理始終,從早期處理直到后期結束都存在,最終實現了3D描述,可見,計算機視覺具有十分重要的作用[4]。
2.2 計算機視覺技術的應用
現階段,現代社會已經進入信息化時代,計算機技術也被應用到各個領域,并發揮著重要作用。計算機視覺的應用促使計算機實現了智能化,在該技術的支持下,計算機可以像人一樣透過視覺看待世界萬物,且具有良好的適應能力,但這一目標的實現還需要很長時間,需要一系列的努力才能實現。現階段,計算機視覺應用最多的就是車輛視覺導航,然而,這種導航還沒有實現完全自主導航,這也是需要進一步研究的地方。計算機視覺技術的適應性較好,特別適合在工業領域應用,即便是存在電子在干擾或溫度變化較大的地方都能很好的運行,其整體效果也不會受到影響,再者,計算機視覺技術的嵌入性較好,成本相對較低,尤其適合在PC方案中使用,同時,具有一定的非接觸能力,能夠獲取大量信息,且不受距離限制,總的來說,計算機視覺技術總體效果較好,適合利用在各種工業環境中應用,因此,應重視計算機視覺技術的應用[5]。同時計算機視覺還被應用到移動機器人設計中,主要是利用小波模板展示人體形態,然后做圖像掃描,這樣就可以順利完成小波變換,進而了解到人的存在。同樣,將計算機視覺應用到機器人設計上,可以自動檢測出正在行動的人或車輛,而無法檢測到靜止的人,之所以會出現這樣情況,主要是由于其中采用率步態分析法。
3 可視化技術
3.1 可視化技術含義
可視化技術是一種綜合了計算機圖形學與圖像處理于一體的技術,它可以將復雜的數據轉化為圖像并在屏幕上展示出來。在可視化技術中,融合了以上兩種技術的特點,并在多個領域都有應用,隨著可視化技術的應用,不僅有效實現了數據表示,還強化了數據處理能力,更對數據決策分析有一定作用[6]。現階段,虛擬現實技術已經成為可視化技術主要發展方向。
3.2 可視化技術的應用
首先,在計算機圖形學教學中的應用,計算機圖形學相對枯燥,相關知識也很抽象,不便于學生理解,在計算機圖形學中最重要的部分是曲線曲面,而這些曲線曲面多是與數學模型有關,具有一定的抽象性,學生理解難度較大,以往教師只能通過一系列的公式演算幫助學生理解,盡管這樣依然難以讓學生掌握曲線變化情況,學生依舊無法正確理解。為減少這種情況的發生,可視化技術被應用到計算機圖形學教學中,教師將抽象的知識用動畫的形式展示出來,學生只要觀看動畫,拖動一定的控制點就可以了解到曲線變化情況,這樣一來不僅增加了教學趣味性,學生也可以隨意變動曲線,讓復雜的知識變得簡單,深化學生對計算機圖形學知識的深度理解,同時,利用可視化技術在一定條件下,還可以完成代碼編譯,如在Actoin ScriPt中做編譯,這樣也可以增強學生的理解能力[7]。
其次,在醫學領域中的應用。醫學領域對于可視化技術的應用主要體現在放射治療與矯正手術上。通過可視化技術可以屏幕上看到手術整個過程,并將原來細節部位放大,手術醫生觀察的更加細致,手術成功幾率也會大幅度提升,患者生命也能得到保證(如圖3所示)。如在對某名患者進行身體檢查的過程中需要應用到可視化技術,由于通過檢查會獲得大量數據,而這些數據又相對復雜,但在可視化技術下就可以通過圖表、曲線圖或立柱圖的方式展示出來,經過可視化技術的作用,了解到患者的血糖為5.6mmol/L,醫生可以根這一數據做出診斷,而不必再分析這些數據。據不完全統計,80%的醫療檢查工作都是需要利用可視化技術。
地質勘探是我國最重要的工作之一,由于多數礦藏都深埋地下,即便使用探測儀受多種因素影響也無法了解到實際礦藏情況,這就需要應用到可視化技術,在可視化技術的作用下,相關工作人員可以了解到地下有無礦藏,如果存在礦藏,相關工作人員也可以了解到礦藏所在位置與實際儲備量,進而為礦藏開采奠定基礎。如在地質勘探中,相關工作人員利用可視化技術做地形圖整理,然后從中提取地形數據,再用CATIA做導入,這樣就可以完成地形模型創建,這樣就完成了三維地質模型創建工作,同時在相關工作臺的影響下,還可以完成地形數據導入,進而生成一定的地形云點,如果其中存在錯誤,可視化技術也可以將其中的錯誤內容刪除,這些都是可視化技術所帶來的好處[8]。由此可見,可視化技術已經成為地質勘探中不缺少的技術。
最后,在氣象預報中的應用(如圖4所示)。利用可視化技術能夠將數據轉化為圖像,通過觀察圖像就可以了解到云層變化情況,同時也能了解到實際風力大小與風走向等,氣象預報人員就可以根據圖像做出精準分析,需要了解氣象變化的人也能了解到現實情況,如果氣象條件惡劣,相關工作人員也可以及時做出工作調整,減少危險事件的發生。據不完全統計,可視化技術在氣象預報中的應用頻率高達100%,由此挽回的經濟損失高達13.2億元,可見,可視化技術在氣象預報中的應用十分有必要,因此,應重視可視化技術在氣象預報中的應用。
4 結語
通過以上研究得知,計算機圖形學、計算機視覺以及可視化技術三者各具特色,三者間也存在一定的關系,尤其是可視化技術綜合了前兩者的特點,并融合了其他技術,在很多領域中都有應用。可視化技術是現階段應用最多的一種技術,在計算機圖形學教學中也有應用,并發揮著不可替代的作用。本文分析了計算機圖形學、計算機視覺以及可視化技術的含義與應用,希望能為相關人士帶來有效參考,正確利用這些技術。
參考文獻:
[1]陳敏雅,金旭東.淺談計算機圖形學與圖形圖像處理技術[J].長春理工大學學報,2011(01):138-139+146.
[2]柳海蘭.淺談計算機圖形學的發展及應用[J].電腦知識與技術,2010(33):9551-9552.
[3]滑瑞朋.計算機圖形學的應用及研究[J].山西科技,2012(05):37-38+45.
[4]劉濤,仲曉春,孫成明,郭文善,陳瑛瑛,孫娟.基于計算機視覺的水稻葉部病害識別研究[J].中國農業科學,2014(04):664-674.
[5]關然,徐向民,羅雅愉,苗捷,裘索.基于計算機視覺的手勢檢測識別技術[J].計算機應用與軟件,2013(01):155-159+164.
[6]許志杰,王晶,劉穎,范九倫.計算機視覺核心技術現狀與展望[J].西安郵電學院學報,2012(06):1-8.
關鍵詞: 計算機視覺;快速開發;框架;模塊化;模塊耦合;底層剝離
中圖分類號:TP311 文獻標識碼:A 文章編號:1009-3044(2012)29-7084-04
在視覺分析實際應用項目中,如何通過建立計算機視覺分析快速開發框架,搭建一個分工明確,快捷有效的圖像學應用處理平臺,提高開發效率,縮短開發時間,已成為項目開發人員關注的重點內容之一。本框架從項目應用和實際需求出發,將計算機視覺技術的核心算法從底層研究工作中剝離,可極大的縮短開發時間,提高開發效率。
在本框架下,開發人員可各司其職,分工、構成和職能劃分明確,框架開發人員只專注于框架接口的定義;算法開發人員只專注于圖像處理與識別等算法的開發;上層應用開發人員只負責抽取出一般的處理流程,專注于項目的具體實現和功能模塊的組合應用。
1 研究與應用
1.1背景
計算機視覺是用攝像機和電腦代替人眼對目標進行識別、跟蹤和測量的機器視覺。系統將獲取的視頻或圖像資料,通過計算機處理成為更適合人眼觀察或傳送給儀器檢測的圖像,其中包括圖像處理、模式識別或圖像識別、景物分析、圖像理解等相關內容,它們之間既有差別,又有相互重疊。
在計算機視覺分析技術中,對于一些復雜的問題,往往不是某單一學科能夠解決的,它需要一系列相關技術的支持。例如:對航道中船舶的識別,獲取的視頻流往往要經過平滑、去噪等圖像處理操作后,便于下一步運用基于直方圖分類器的圖像識別算法來區分船舶和水面,通過圖像分割技術來提取檢測目標。而這些方案的實現中,同一個問題的解決又往往需要有一系列的算法來支持。還是以船舶識別為例,圖像平滑有領域平均、低通濾波等算法;圖像去噪有各種濾波器算法;基于直方圖的分類器也存在決策樹、貝葉斯、SVM等等算法。雖然上述的算法本身沒有優劣之分,但在特定的環境下一定會有某個最佳算法。
因此,在實際應用項目中如何找出其最優路徑,除了需要開發者擁有深厚的圖像學功底,更需要的是通過大量的對比實驗來找出該最優路徑的解決方案。即便如此,也只能解決特定環境下的計算機視覺需求,換個應用場景,上述步驟又需要重新進行,此類過程的重復,既增加了開發成本,又延長了開發時間。
本框架從工程化的角度出發,在不同項目中的計算機視覺軟件開發中,研究如何提高開發結果的復用性,盡量降低上述各條件間的相互依賴關系,將視覺技術的核心算法從底層研究中剝離,達到縮短開發時間,提高開發效率的目的。
1.2研究目標
1) 框架系統的扁平化、模塊化;
2) 完成處理過程的任意組合,使圖像處理模塊單一化;
3) 理行為在處理模塊內部完成,處理結果可通過接口方式進行輸出;
4) 處理模塊間的數據流動定義在框架之中,框架負責配置數據流;
5) 置好的數據流,通過指定圖像處理模塊實現對物體的識別、行為的識別。
1.3.5框架的效果演示
從右側功能區中選取兩個輸入模塊:MediaOpen00和MediaOpen01,分別打開視頻文件“.\公司監控視頻.avi”和圖片“.\Lena.jpg”,任意添加一些圖像處理模塊或者圖像識別模塊,這里我們選取了行人檢測算法、基本全局閾值二值算法、人臉檢測算法、輪廓檢測算法,加入輸出展示模塊用于顯示處理結果。最后我們用曲線將模塊間的輸入輸出點連起來,完成數據流向的配置過程。其中一個輸出點可以連接多個輸入點,但一個輸入點只能接入一個輸出點。
2 結論
隨著計算機視覺技術發展的日新月異,算法的更新和積累將會越來越多。計算機視覺快速開發框架從實際應用工程的角度出發,在不同項目計算機視覺軟件的開發過程中,將視覺技術的核心算法從底層研究中剝離,使視覺分析應用項目中的框架開發人員專注于框架接口定義的開發,而項目中的算法、上層應用等開發人員各司其職,分工明確,不但提高了開發結果的復用性,同時,也降低了項目開發中各條件間的相互依賴關系,縮短了開發時間,提高了開發效率。
參考文獻:
[1] Gary bradski,Adrian Kaebler.《Learning OpenCV》[M].O’Reilly Media Inc,2008.
[2] 張廣軍.機器視覺[M].北京:科學出版社,2005.
[3] 張少輝,沈曉蓉,范耀祖.一種基于圖像特征點提取及匹配的方法[J].北京航空航天大學學報,2008,34(5).
[4] 劉立,彭復員,趙坤,萬亞平.采用簡化SIFT算法實現快速圖像匹配[J].紅外與激光工程,2008,37(1).
[5] 戴斌,方宇強,孫振平,王亮.基于光流技術的運動目標檢測和跟蹤方法研究[D].國防科學技術大學機電工程與自動化學院.
[6] 陳勝勇,劉盛.基于OpenCV的計算機視覺技術實現[M].科學出版社.
關鍵詞 模式分析 計算機視覺 教學改革
中圖分類號:G643.2 文獻標識碼:A DOI:10.16400/ki.kjdkz.2016.03.015
Research and Practice on Course Group of Pattern Analysis and
Visual Processing for Graduated Students
SUN Han, CHEN Songcan, LIU Ningzhong, HUANG Yuanyuan, ZHU Qi
(College of Computer Science and Technology, Nanjing University of
Aeronautics and Astronautics, Nanjing, Jiangsu 210016)
Abstract By analyzing the teaching status of pattern analysis and visual processing course group, this paper puts forward the new teaching goal, which includes improving students' international vision, the ability of linking theory with practice, and promoting the engineering practice ability and innovative consciousness. Then this paper discusses the whole process of course group reform. Firstly the structure of teachers' group is optimized. And then the knowledge system of course group is sorted and the teaching mode is improved. Finally the practice system of course group is optimized and the assessment system is reformed.
Key words pattern analysis; computer vision; teaching reform
1 背景
我校模式分析與智能計算研究所師資團隊是江蘇省“青藍工程”創新團隊,主要研究領域包括智能數據分析、圖像處理和機器視覺等方向,承擔研究生和本科生的模式識別、機器學習、數據挖掘、智能信息檢索、數字圖像處理、計算機視覺等課程的教學任務。以往的教學過程中雖然積累了豐富的教學經驗,但當前新知識不斷涌現、新技術發展迅猛,對模式分析與視覺處理課程群的知識體系、實踐體系改進提出了新的挑戰。
近年來,國內外高校在該類課程教學上,已涌現出眾多新理念、新方法。Coursera聯合創始人Andrew Ng推出的機器學習課程,開啟了教育領域的MOOC時代,引領了教育教學方法的新革命。①深圳大學、②江蘇科技大學③分別進行了基于CDIO工程教育理念的計算機視覺課程教學改革實踐,實現多層次項目設計的教學模式改革,講座式、討論式、實踐式教學方法的探索。國防科技大學④在計算機視覺課程中引入研討式教學模式,通過案例教學、小組研討的方式來替代傳統的教學方式。華中科技大學⑤從教學內容國際化、教學方式國際化、教學成果國際化三個方面開展了計算機視覺課程的國際化建設。另外,也有高校進行了圖像工程課程群建設,⑥基于圖像分析與計算機視覺應用課程結合的項目協同創新能力培養實踐。⑦
在分析上述國內外高校該類課程改革的基礎上,我們重點以模式分析與視覺處理課程群的實踐教學體系改革為切入點,優化師資隊伍結構,梳理課程群知識體系,優化課程授課模式,完善課程群實踐體系,改革實踐考核模式,實現學生國際化視野、理論聯系實際、工程實踐和創新能力全面提升的目標。
2 模式分析與視覺處理課程群特點
模式分析與視覺處理課程群涵蓋了模式識別、機器學習、數據挖掘、數字圖像處理、計算機視覺等多門課程。該類課程存在以下特點。
(1)該類課程屬于多學科交叉,涉及的知識面既廣又深。由于該方向涉及計算機科學與技術、應用數學、自動化、電子科學與技術、信息工程等多學科內容,而學生在大學本科階段很難學習和了解如此多的知識模塊,這對研究生階段學習來說,具有相當大的挑戰。同時,對于每個知識模塊,所要求的數學基礎較高,理論具有相當的深度,理解和掌握不容易。
(2)該類課程既重視扎實的基礎理論,也強調良好的工程實踐能力。該類課程的基礎理論教學一直受到各高校的重視。隨著近年來產業界的迅猛發展,計算機視覺應用層出不窮,對學生的工程實踐也提出了更高要求,需要能夠在系統層次上有整體認知,同時要能對各功能模塊進行優化,提升系統的整體性能。
(3)該類課程所面向的選修學生面廣。該類課程既是多學科交叉,也面向計算機應用、電子科學與技術、自動化、應用數學等不同研究方向、不同水平層次的研究生開設。這對課堂教學和實驗實踐也帶來更大挑戰。
3 模式分析與視覺處理課程群改革舉措
針對上述分析的課程群特點,我們重點以實踐體系改革為突破口,通過優化師資隊伍結構,梳理課程群知識體系,優化課程授課模式,完善課程群實踐體系,改革實踐考核模式等舉措,實現學生國際化視野、理論聯系實際、工程實踐和創新能力全面提升的目標。
3.1 師資隊伍結構優化
為了學生能夠適應模式分析與視覺處理產業的快速發展,在課程群建設過程中更強調學生的工程實踐和創新能力培養。這首先對師資隊伍結構提出了新的要求。
近年來,課程教學團隊引進海內外具有深厚理論功底和較強工程能力的高水平師資4名,大大充實了機器學習、數據挖掘、圖像處理等課程的教學力量。對于現有教師隊伍,鼓勵教師跟產業一線企業廣泛合作,目前已與華為、中興等企業在視頻檢索、智能交通視覺處理等方面開展了實質合作。這些來源于產業界的高質量課題對科研和教學起到了良好的促進作用。
與此同時,通過研究生工作站、企業短期實習等渠道,鼓勵企業高級研發人員參與到學生實踐能力培養環節中,將實際項目進行適當切分或提煉,實現該類課程實踐環節的模塊化、專題化訓練。
綜上,通過引培并舉,優化校內師資隊伍結構;通過校企合作,積極吸引企業師資參與。良好的師資隊伍為該類課程的實踐體系改革提供了有力支撐。
3.2 課程群知識體系梳理與授課模式改革
模式識別、機器學習、數據挖掘、智能信息檢索、數字圖像處理、計算機視覺等課程既有一定的邏輯關系,也存在相互交叉的混雜關系。一般認為,模式識別、機器學習是模式分析與視覺處理領域的基礎理論課程,數據挖掘是建立在模式識別、機器學習和數據庫基礎上的應用類課程,智能信息檢索則是數據挖掘基礎上更為具體的應用實現。數字圖像處理為計算機視覺課程提供了基礎支撐,計算機視覺則是在綜合利用模式識別、機器學習、數字圖像處理、數據挖掘等知識模塊基礎上面向應用的系統實現。但是,這些課程也存在著知識點的交叉或重復。例如,模式識別和機器學習中都有貝葉斯參數估計、支持向量機模型等知識點,但視角和側重點有所不同;圖像處理、計算機視覺中都有顏色模型、成像模型等知識點,也同時存在與模式識別、機器學習交叉的知識點。
我們針對來自不同研究領域的學生群體,對該課程群的知識點進行系統梳理,既避免知識點的重復講授,也防止重要知識點的缺漏。課程教師集體討論,形成每門課程的核心知識集,和針對不同研究領域的選講知識集。學生在學習課程時,在掌握核心知識集的基礎上,結合自己的研究方向選擇相關的選講知識集學習。
在課程教材和參考書的選擇上,注重挑選國際上有影響力的教材。例如,模式識別的參考書為Richard O. Duda等人編著的Pattern Classification;機器學習的參考書為Tom M. Mitchell編著的Machine Learning和Christopher M. Bishop編著的Pattern Recognition and Machine Learning;數據挖掘的參考書為Jiawei Han等人編著的Data Mining:Concepts and Techniques;數字圖像處理的參考書為K. R. Castleman編著的Digital Image Processing;計算機視覺的參考書為D. A. Foryth編著的Computer Vision: A Modern Approach和Richard Szeliski編著的Computer Vision: Alogrithms and Applications。這些教材已被國內外著名大學普遍采用。同時,每門課程都提供相關的國內外頂級會議和期刊的列表,供學生課后追蹤研究領域的熱點問題。
在課堂授課環節上,注意采用靈活多樣的授課方式。對于核心基礎知識模塊,以教師講授為主,同時提供國內外該類課程的熱門MOOC網址給學生參考。對于選講知識模塊,鼓勵學生事先結合各自研究方向有目的自學,在學生報告的基礎上進行課堂討論方式進行。充分發揮學生學習的主體作用,也便于教師了解學生的水平和學習狀況。
除此以外,不定期邀請國內外著名學者來校做學術報告,讓學生充分了解該研究領域的最新前沿動態,并就熱點問題進行專題討論。
3.3 課程群實踐體系完善與考核方式改革
工程實踐和創新能力的培養是該課程群改革的重要目標。我們在上述師資隊伍結構優化、課程群知識體系梳理與授課模式改革的基礎上,著力進行課程群實踐體系的改革與完善。我們通過多層次菜單式的實驗項目選擇、項目牽引的創新能力訓練、學生綜合研究能力的全面考查等方面來實現。
首先,整合和優化課程群實踐內容,實現多層次菜單式靈活選擇。根據各研究領域的要求進行靈活搭配,根據學生個體的能力與水平選擇適當規模和難度的實踐內容,通過課程內的基礎實驗、課程間的綜合實驗、課程群的創新實驗來選擇和組合,如圖1所示。
圖1 多層次菜單式實驗內容示意圖
基礎型實驗內容主要是各課程核心知識點的實驗驗證,主要包括模式識別,機器學習,數據挖掘,圖像處理與分析,計算機視覺等課程的實驗。要求選課學生對這些基礎實驗必做,打下良好的研究基礎。
綜合探索型實驗在基礎型實驗基礎上,既有單門課程內總的綜合實驗,也有課程間知識的綜合應用。主要分為兩大塊,包括模式分析與機器學習方向的綜合實驗,以及圖像處理與機器視覺方向的綜合實驗。實驗目的主要是針對這兩大塊方向重點知識的綜合分析和比較,能夠熟練掌握和靈活應用。例如模式分析、機器學習、數據挖掘等方向都用到的線性判別分析、支持向量機、均值聚類等內容;圖像處理與機器視覺中的圖像特征抽取、視覺系統選型、目標檢測、特定平臺的算法優化等內容。學生可根據各自研究方向有目的的選擇兩塊綜合實驗的大部分內容。
在綜合型實驗基礎上,該課程群通過若干創新型實驗來檢驗學生理論知識掌握程度和實踐方法應用能力,為后續的研究課題開展打下良好的科研素養。主要內容包括人臉識別、二維條碼識別、車輛屬性識別、智能視覺監控、以及企業來源的關鍵技術等。這些項目實踐既涉及用到圖像處理與機器視覺的內容,也涉及模式分析與機器學習方向的知識。并且需要學生在綜合運用相關知識的基礎上有創新能力。
其次,重視各類項目牽引的創新能力訓練。一方面,鼓勵教師從國家自然科學基金、企業合作項目等研究中提煉出問題規模和難度適中的訓練項目,作為課程群的綜合能力訓練項目。另一方面,鼓勵學生參加挑戰杯、全國研究生智慧城市技術與創意設計大賽等各類具有挑戰性的競賽項目,以賽代練,提升學生的工程實踐和創新能力。同時,也鼓勵學生利用百度、微軟等相關研究領域的企業實習機會,參與產品一線的工程實踐能力訓練。
再次,注重考核環節,實現科研素養和實踐能力的全面考查。只有嚴格、公平、公正的考核,才能保證實驗實踐的質量和水平,才能提升學生的科研素養和實踐能力。我們主要在手段、方式方法上進行了改進。在題目選擇上,根據學生個體水平和研究領域要求的差異,在選題上有適當的難易區分度,讓每位學生都有鍛煉和提升的機會;在考核方式上,采用結題書面報告來檢驗學術論文的寫作能力,采用程序演示檢驗系統的設計與實現水平,采用上臺匯報的方式檢驗學生的表達能力,多管齊下全面檢查學生的綜合科研素養;在考核成績評定上,采用現場教師和學生共同評分的方式,公平合理;最后,通過網站展示、發表學術小論文、專利、軟件著作權等方式展示和公開優秀成果,激發學生的學習熱情,并由此形成積累,有利于學生實驗實踐氛圍的傳承。
4 結語
本文在分析國內外高校模式分析與視覺處理類課程群改革現狀的基礎上,以學生國際化視野、理論聯系實際、工程實踐和創新能力全面提升為目標,重點開展了師資隊伍結構優化、課程群知識體系梳理、課程授課模式改革、課程群實踐體系完善和實踐考核模式改革等工作,取得了良好的效果,并為校內其他課程群的教學改革作為示范推廣。
注釋
① https:///learn/machine-learning/
② 郭小勤,曹廣忠.計算機視覺課程的CDIO教學改革實踐.理工高教研究,2010.29(5):98-100,148.
③ 史金龍,白素琴,龐林斌,錢強.研究生機器視覺課程的CDIO教學改革實踐.計算機教育,2013.9:40-43.
④ 陳芳林,劉亞東,沈輝.在《計算機視覺》課程中引入研討式教學模式.當代教育理論與實踐,2013.5(7):112-114.
⑤ 王岳環,桑農,高常鑫.計算機視覺課程的國際化教學模式.計算機教育,2014.19:101-103.
關鍵詞:三目攝像機;標定;立體視覺;外部參數
一、緒論
1.1研究的背景及意義
計算機視覺是當今極為重要的學科之一,它在具有很強的挑戰性的同時又擁有廣泛的應用前景和實用價值。計算機視覺以視覺理論為中心,以圖像處理、模式識別、計算機技術和生理學、心理學為基礎,研究內容主要有兩個方面:一是開發從輸入圖像數據自動構造場景描述的圖像處理系統;二是理解人類視覺機理,用機器代替人去做人類難以達到或根本無法達到的工作[1]。
計算機視覺應用的廣泛性體現在其不僅用于文字、指紋、面部、商標以及圖像數據庫、檢測集成電路芯片、多媒體技術這些圖像方面,還應用到機器人導航、工業檢測和產品的自動裝配、CT圖像器官重建和遙感照片解釋等空間物體的定位、識別以及重建上。現如今,計算機視覺已經應用到機器人、地理、醫學、物理、化學、天文等各大的研究領域。
作為多個學科交叉與融合中心的計算機視覺,攝像機是其研究的重要工具,而攝像機標定又是計算機視覺研究的一個關鍵問題,故攝像機的標定越來越受到廣泛的重視。攝像機標定是通過物體空間上的點與圖像中的對應點的幾何關系,來確定攝像機的內外參數的過程。標定結果是否準確影響著三維測量的精度和三維重建的結果,而且實時的標定更能滿足自動導航機器視覺的需要[2]。
伴隨著應用的發展,攝像機廣泛地被應用于三維立體的測量、視覺檢測、運動檢測等領域。由此,對攝像機標定的精度要求也日益增加。攝像機標定結果的優劣影響了計算機視覺在各領域的應用。攝像機標定的準確與否,對能否提高計算機視覺在各領域測量的準確度有重要影響[3]。因此,研究攝像機標定方法具有重要的理論研究意義和實際應用價值。
1.2攝像機標定技術研究的發展及現狀
攝像機有一個圖像平面和提供三維空間到圖像平面轉換的鏡頭。由于鏡頭會產生畸變,不能把這個轉化過程簡單描述為投射變換。所以它表示的是畸變的模型,這些模型近似于真實數據,而其精確性則依靠于建立的模型及模型參數的準確性。
首先進行攝像機標定工作的是加拿大的Deville,他于1910年建立實驗室,使用多個瞄準儀對他的“測量攝像機”(surveying camera)進行標定[4]。上個世紀三十年代后期,美國標準局發明了一種精確鏡頭,用來檢測攝像機,同時將它用在攝像機標定上。四十年代后期,該項工作得到進一步加深,有了更多對高精度的需求和對易操作設備的需求。1955年,Carman出版了 《棋盤平面度的干涉測量和控制》,該書引起了社會各界對攝像機標定的關注。二戰時期,隨著飛機的大規模使用,航空攝影與制圖興起,為得到更加精確的測量結果,對攝像機鏡頭的校正要求也變得更高。五十到七十年代也是鏡頭校正技術發展最為迅速的時間段。在這期間,各種鏡頭像差的表達式逐步被提出并且得到普遍認同與采用,建立了很多的鏡頭像差的模型,D.C.Brown等人作出了比較大的貢獻,他們導出了近焦距情況下給定位置處徑向畸變表達式并證明了近焦距情況下測量出鏡頭兩個位置的徑向畸變就可以求出任何位置的徑向畸變[5]。這些徑向與切向像差表達式成為后來各攝像機的標定非線性模型的基礎。這段時間里,研究的重點是如何校正鏡頭與用何種方法補償鏡頭像差,這些研究對促進各性能鏡頭組的研制起到了重要作用。在1999年,張正友提出了一種簡便的攝像機標定方法,該方法介于傳統標定和自標定之間,操作方便靈活,能夠得到不錯的精度,滿足了眾多擁有桌面視覺系統的用戶在攝像機標定方面的需求。
1.3本文的主要研究內容
本文的主要研究多個攝像機的標定問題。標定主要是對攝像機內外參的測量計算,利用這些參數對多個攝像機識別的物體尺寸進行衡量并建立起多攝像機系統的數字環境。
論文的內容包括:
第一章為緒論,介紹攝像機標定相關的研究背景、國內外研究現狀。
第二章為攝像機標定理論基礎:主要介紹標定的坐標系與待標定的參數。
第三章提出本文的多攝像機標定方法與實驗過程。
第四章進行全文的總結。
二、攝像機標定方法研究
2.1攝像機標定原理
攝像機通過透鏡將三維物體投影到--維圖像平面上,這個成像變換的過程稱為攝像機成像模型。攝像機成像模型有多種,最常用的為小孔成像模型。由于實際的攝像機鏡頭會發生一定的畸變,使得空間點所成的像不在線性模型描述的位置而會發生一定的偏移,為了能準確的標定攝像機參數,標定的過程中要考慮非線性畸變因子。
一般來說,得到標定結果后要對其精度進行評估,然而很難得到準確的攝像機標定參數真值作為參考,其中基于圖像坐標和世界坐標的絕對和相對誤差的評價方法應用廣泛,本文將對這些方法的原理進行探討。
2.2攝像機標定坐標系建立
首先定義了四個坐標系,如圖1所示,圖像坐標系的坐標原點為O0,列與行由坐標軸u和v表示;成像平面坐標系的原點是攝像機光軸與圖像坐標系的交點0l,x、y 軸分別與u、v 軸平行;在攝像機坐標系中,坐標原點0c即為在攝像機的光心,Xc、Yc軸與x、y 軸平行,與圖像平面垂直是攝像機光軸作為Zc軸,0c0l為攝像機焦距f;世界坐標系是假想的參考坐標系,可固定于場景中某物體上,用于描述攝像機的位置,由Xw,Yw,Zw軸組成。
圖(1)
2.3攝像機外部參數構成
主動視覺傳感器從在笛卡爾直角坐標系中的運動表現為相應的旋轉矩陣和平移矩陣,故攝像機外部參數表現為旋轉矩陣R和平移矩陣T,則攝像機坐標系與世界坐標系的轉化關系可以表示成:
上式中(Xc,Yc,Zc)表示空間點在攝像機坐標系下的坐標,(Xw,Yw,Zw)表示空間點在世界坐標系下的坐標。根據靶標點在像空間坐標系和物方空間坐標系中的坐標,通過分解旋轉矩陣線性計算像空間坐標系與物方空間坐標之間的轉換參數,即外方位元素(攝站參數)[6]。
2.4各攝像機相對位置確定
三目攝像機擁有三個視覺傳感器,而三個傳感器之間的相對位置可通過已獲得的外部參數進行確定。將三個攝像機坐標系設置為,Oci xci yci zci(i=1,2,3),由2.3中所介紹的內容可知,這三個攝像機坐標系與世界坐標系的關系為:
i=(1,2,3)
由此我們可以得到任意兩個攝像機i,j的坐標系轉換關系:
其中: = = i,j=1,2,3
三、攝像機標定實驗過程及結果
3.1實驗系統介紹
實驗中被用來標定的是一個多攝像機系統,攝像機標定有關的基本參數、系統組成和開發環境如下:
(1)硬件環境
標定板、三目攝像機和圖像采集卡等。
(2)軟件環境
OpenCV開源視覺庫,它僅由一系列C函數和少量C++類構成,為Python、MATLAB等語言提供了接口,在圖像處理和計算機視覺方面實現了很多通用算法。
3.2實驗過程
本系統以棋盤格模板作為標定模板。采用激光打印機打印棋盤格黑白方塊間隔紙,方塊邊長為3cm,共6行9列,將打印紙固定在一塊平板上,作為標定模板,如圖(2)。安裝三目攝像機系統,調節固定好個攝像機位置,如圖(3)。手持標定板在三目攝像機前方各個位置拍攝5組共15張各姿態的照片,利用Canny算子進行像點灰度中心提取、同名像點匹配并解算出三個攝像機在標定板坐標系中的外部參數值。
3.3標定結果
攝像機1:
R= T=
攝像機2:
R= T=
攝像機3:
R= T=
四、總結
隨著計算機技術的高速發展,計算機視覺成為當今熱門的研究課題,受到了廣泛關注。本文就如何在機器視覺的理論基礎上對三目視覺系統進行標定進行了研究,討論了計算機視覺理論知識,分析攝像機標定原理以及標定坐標系的建立。同時通過計算機視覺知識的分析討論了基于三目視覺系統的攝像機標定技術,完成了三目視覺系統的外部參數標定實驗。三目攝像機測量系統外部參數的標定能夠解決測量作業現場、測量控制場建立難的問題,為快速地建立簡單實用的控制場提供了方案,有一定的實用價值。
參考文獻
[1] 荊麗秋.雙目視覺系統標定與匹配的研究與實現[D].哈爾濱工程大學,2009.DOI:10.7666/d.y1489086.
[2] 馬頌德.計算機視覺―計算理論與算法基礎[M].北京:科學出版社,1998.
[3] 王榮一.攝像機標定及關鍵技術研究[D].哈爾濱理工大學,2011.DOI:10.7666/d.y2012483.
[4] Clarke T A,Fryer J G.The development of camera calibration methods andmodels.Photogrammetric Record,1998,16(91):51-66
[5] Brown D C.Decentering distortion of lenses.Photogrammetric Engineering,1 966,32(3):444-462.
[6] 范亞兵,黃桂平,高寶華等.三目立體工業攝影測量系統外部參數的快速標定[J].測繪工程,2012,21(5):48-52.DOI:10.3969/j.issn.1006-7949 .2012.05.013
關鍵詞:計算機視覺分析;微小尺寸;精密校正;閾值;圖像分割
中圖分類號:TP274.4
計算機視覺分析理論是基于精密模式識別和人工智能程序化校驗技能進行綜合整編的方法,利用光學信息對真實物理結構的實時反映,配合人機協調手段進行二維圖像的呈現。在工件表面進行質量檢測和圖片制備要素分析的系統環節中,闡述物體在空間環境之間的關系樣式,爭取三維場景的科學搭建。集合要素內容包括邊緣、線條和曲面的配備,建立以工業部件為中心的坐標體系,并適當運用不同符號表現模式實現必要三維結構和空間關系的調整,促進精密儀器細節檢驗工作質量的不斷提高。
1 計算機視覺檢測技術的相關理論研究
1.1 技術原理分析
滲透性計算機輔助支持結構的視覺鑒定技術在被測實體中的圖像顯示支持功能基礎形勢上進行質量狀況的把控,這其實就是根據既定的偏差標準實現規模物件的逐個排查。細致的檢測工作在深度零件的誘導性特征和完整性配件的支持下,對整體完好效果的幾何制備模型進行測量[1]。近階段的視覺規范系統利用電耦合器件和攝像機進行主題元素的捕捉,并利用計算機內部程序的數字信號轉化工具實現圖像的并行處理。采用目標圖像的特殊坐標記錄,利用灰度分布圖內的多種綜合功能處理系統改善的要務。常規視覺下的檢測過程相對比較繁瑣,主要是將被檢測物體放置于照明效果相對均勻的可控制背景環境中,聯結CCD技術和圖像卡實現被測部件和數字圖像的共性要素融合,保證計算機自動化處理程序的錄入。當然,這類研究系統是需要利用相關軟體進行放大的,其主要必備功能就是進行圖像的預處理、識別和有效分析,將整個過程內部的實際結果數值,包括被測部件的自身缺陷、尺寸等進行整理。
1.2 計算機視覺微小尺寸精密檢測工業應用技術的現狀
在科學設計信息內容和工業加工制備要領集成化對待的環節中,通常不會直接進行部件表面的接觸,一般運用計算機程序下的掃描認知和圖像即時呈現功能進行快速的比對檢測,整體信號抗干擾能力較強,因此在現代工業生產技術領域內部廣受好評。電子工業是在建立計算機視覺分析工藝之后表現最為活躍的行業類型,在此基礎上衍生的印刷電板路和集成電路芯片就是利用標準模型的整改,實現規模工序的緊密排列。目前,時下流行的汽車生產、紡織、商品包裝等也逐漸向這類手段靠攏,全面改善了現代化工業制備的應用效果。
2 應用視覺微小尺寸分析技術內部拓展機能的補充
灰度圖像的主要分割方法包括灰度閾值校正、邊緣檢測制備等手段。
2.1 灰度閾值校正
這是區域分割方法中一種常見的手段,主要配合多個或單個閾值將圖像自身的灰度級別劃分為幾個項目組,對相同像素的單位數據進行整編。根據實效范圍進行分類,包括局部和全局閾值探究兩種手段,全局規模下的閾值分析方法就是利用整幅圖的灰度直方分布圖進行內部最優閾值分割,包括單閾值和多閾值兩種形式;同時還可以將初始分析的圖像進行子元素的拆解,之后利用單個子圖像的既定閾值范圍進行最優化分割[2]。分割的基本原理公式為:
其中,合理閾值的選取是非常重要的,目前閾值確定的手段主要包括直方圖雙峰對照法和最大類間方差累積法等。這種利用灰度閾值實現精準質量的劃分手段,計算執行工作相對比較簡單,并且實際工作效率水平較高,即便是實際需要分割的物體與圖像背景對比深度較強也可以收放自如,但唯一的缺點就是缺少對空間信息的掌控,涉及亮度不足的圖像問題,這種閾值分割技術的施工質量往往不會太高。
2.2 邊緣檢測制備工序
圖像內部元素的分割其實就是進行部件邊界效益的提取,而邊緣檢測制備工序則是利用像元及鄰域的整體狀態進行物體邊界相關結構的搭建。邊緣檢測分割制備技術具體包括并行和串行兩種模式,并行手法是運用梯度信息的提取實現不同類別算子的整理;串行邊界分割原理則是根據適當強度標準和相似走向的兩個邊緣端點位置實現連接,主要代表算法包括啟發式智能搜索手段等。這種串行算法較并行邊界積累統計原則來說具有更強的抗干擾能力,但實際的邊緣檢測同樣不能完好地維持連續效果,需要利用其余技術內容進行邊緣制備技巧的修復。
(1)原始圖像 (2)Robert算子邊緣檢測 (3)Sobel算子邊緣檢測
(4)Prewitt算子邊緣檢測 (5)Kirsch算子邊緣檢測 (6)Gauss-Laplace算子檢測
圖1 微小雙聯齒輪邊緣檢測
3 視覺檢測系統的創新性改進
根據以上現狀問題,創新式視覺整改校驗系統利用照明光源、攝像機和圖像采集卡等結構實現計算機輸出結果質量的補充。其主要運行過程如下:利用被測部件在均勻照明背景的全面優化控制基礎,實現物體結構的全面清晰呈現,使用攝像機對相關圖像信號進行梳理并轉化為電荷信號,配合相關的圖像資源采集卡進行部件數字化圖像的格式轉化;計算機內部軟體操作程序將得到的數字圖像進行處理和識別,并將最終結果數據輸出,實現現代工業技術整體質量規模控制的既定要求。
系統硬件在實現部件轉化圖像信息的環節中,連接檢測機理下的連續軟件規劃和照明光源等相關設備進行圖像適當分辨率的調整,維持圖像較為清晰的對比效果。全面控制獲取數字圖像的時間,抵抗不良因素的干擾影響,維持內部成本經濟規模的合理控制,促進科技應用和可持續發展經濟戰略雙重價值標準的同步進展。其中,光源設備的選擇必須落實到部件既定的幾何形狀條件下,利用相關性能參數進行實際工作要求的提供,包括光源位置、亮度、壽命特性等因素的堆積,常用的可見光源包括水銀燈、熒光燈等,但這類光源使用壽命有限,因此現下多配用LED光源進行快捷反應、小功耗標準的補充,并且長期使用后的照明效果比較穩定[3]。而攝像機等結構主要還是校正參數的表達方式,進行圖像合理分辨率的整改,促進圖像采集數字化協調功能的發展,提高系統工作速度等。
4 結束語
計算機視覺檢測系統在進行一定部件性能評比的活動中有著很高的貢獻,不僅配合硬件的照明、參數制備要領制備功能,同時促進數字化圖像對比的速度,使得工業生產環節中的部件檢查工序得到大范圍整改,滿足可持續發展戰略規模的視覺意義,促進現代智能化分析處理技術的全面覆蓋。
參考文獻:
[1]陸春梅.基于數字圖像處理技術的接桿激光環焊焊縫視覺檢測系統研究[D].上海交通大學,2008.
[2]羅敏.基于機器視覺的黑片缺陷檢測圖像邊緣提取算法研究[D].沈陽理工大學,2010.