機器視覺是一項綜合技術,包括圖像處理、機械工程技術、控制、電光源照明、光學成像、傳感器、模擬與數(shù)字視頻技術、計算機軟硬件技術(圖像增強和分析算法、圖像卡、I/O卡等)。中國正成為世界機器視覺發(fā)展最活躍的地區(qū)之一,其重要原因是中國已經成為全球制造業(yè)的加工中心,高要求的零部件加工及其相應的先進生產線,使許多具有國際先進水平的機器視覺系統(tǒng)和應用經驗也進入了中國。2010年中國機器視覺市場迎來了爆發(fā)式增長。數(shù)據顯示當年,中國機器視覺市場規(guī)模達到8.3億元,同比增長48.2%,其中智能相機、軟件、光源和板卡的增長幅度都達到了50%,工業(yè)相機和鏡頭也保持了40%以上的增幅,皆為2007年以來的最高水平。安防行業(yè),近年在人工智能技術的滲透下,在深度算法、智能芯片、業(yè)務技術架構等產業(yè)鏈上的完善進一步加快了安防智能分析技術的落地應用。
機器視覺在安防行業(yè)應用 離不開四項技術
一、機器視覺在安防領域的應用
智能視覺分析技術是指計算機圖像視覺分析技術,計算機圖像視覺技術是人工智能(AI,Artificial Intelligent)研究的分支之一,它能夠在圖像及圖像描述之間建立映射關系,從而使計算機能夠通過數(shù)字圖像處理和分析來理解視頻畫面中的內容。而視頻監(jiān)控中所提到的智能視頻技術主要指的是“自動分析和抽取視頻源中的關鍵信息”。
如果把攝像機看作人的眼睛,智能視頻系統(tǒng)或設備則可以看作人的大腦。智能視頻技術借助計算機強大的數(shù)據處理功能,通過將場景中背景和目標分離,進而分析并追蹤在攝像機場景內出現(xiàn)的目標,對視頻畫面中的海量數(shù)據進行高速分析,過濾用戶不關心的信息,僅僅為監(jiān)控者提供有用的關鍵信息。
智能視頻解決方案以數(shù)字化、網絡化視頻監(jiān)控為基礎,用戶可以根據視頻內容分析功能,通過在不同攝像機的場景中預設不同的報警規(guī)則,系統(tǒng)識別不同的物體,同時識別目標行為是否符合這些規(guī)則,一旦目標在場景中出現(xiàn)了違反預定義規(guī)則的行為,系統(tǒng)能夠以最快和最佳的方式發(fā)出警報并提供有用信息,從而能夠更加有效的協(xié)助安全人員處理危機,最大限度的降低誤報和漏報現(xiàn)象,切實提高監(jiān)控區(qū)域的安全防范能力。
智能視覺分析技術在安防領域的重要作用是毋庸置疑的,具有廣泛的應用前景,可以應用在公安、司法、交通、教育、金融等主流行業(yè)應用,比如十字路口、高速公路、停車場、飛機場等交通場景;比如軍事基地、銀行等軍事場景監(jiān)控、國家重要部門以及人們日常生活的場所;比如天安門廣場、火車站等敏感的公共場合監(jiān)控,相關智能視覺分析產品也隨著技術的發(fā)展不斷地細化,比如人臉識別比對系統(tǒng),公安機關搭建人臉識別比對系統(tǒng),建立人臉捕捉數(shù)據庫,將人臉信息歸檔,并與個人身份建立關系,在實際運用過程中采用人臉搜索、黑名單布防、陌生人識別等多項智能分析功能,大大提高視頻監(jiān)控的防范功效,可以讓犯罪分子無可遁形。
由于和智能視覺分析相關的高清產品并未得到真正的普及,社會上的監(jiān)控布局點也并不完善,目前還只是針對某些行業(yè)進行使用,還遠遠未達到全面普及,只有大批量的使用高清攝像機,增大捕獲到清晰、正面人臉的可能性,才能有更好的實戰(zhàn)效果。此外,還需要公安和企業(yè)加強合作,加大監(jiān)控點的部署密度。由于大量監(jiān)控點的部署會帶來海量視頻,需要重視智能視頻分析技術的應用,合理利用技術,人機配合,發(fā)揮技術的長處,從而有效輔助偵辦人員。
二、智能視覺分析技術的發(fā)展
隨著高清探頭不斷投入,人們對于智能視覺分析技術產品化的需求越來越多,要求也越來越高,這給安防行業(yè)帶來了廣闊的思路,許多智能化新產品快速涌現(xiàn):
1、雙目技術
雙目立體技術核心目的是提高識別的準確率。由于立體視覺技術形成的視場中帶有物體的三維幾何信息,因此能夠有效的設定檢測規(guī)則,排除光線、影子等干擾因素,大幅提高智能分析的準確度。如果說高清技術通過提升可用像素來提高分析的準確率,是戰(zhàn)術性的舉措,那么雙目立體視覺技術對視頻分析準確率的影響則是戰(zhàn)略性的。雙目立體視覺技術是基于視差原理,并利用成像設備從不同的位置獲取被測物體的兩幅圖像,通過計算圖像對應點間的位置偏差,來獲取物體三維幾何信息的方法。采用雙相機或多相機,對視場內空間的自由運動體的三維位置坐標及姿態(tài)進行高精度的測量,確定運動目標的質心位置,并根據標定結果對運動目標進行高精度跟蹤。
立體視覺技術的跟蹤,由于能夠辨識目標的三維坐標、姿態(tài)、相對距離、與背景環(huán)境的空間距離,因此能適應復雜的跟蹤背景環(huán)境。雙目技術應用于人體屬性識別是人臉識別技術一次技術應用的跨步,這對更準確的定位和分析人的特征有著支援重要的作用。
2、多球機聯(lián)動跟蹤技術
多球機聯(lián)動跟蹤技術是以單球機智能跟蹤技術作為基礎的。從應用的層面上看,能夠將普通的跟蹤球機的單點式監(jiān)控,提升為系統(tǒng)內對單個目標的無縫式接力跟蹤,配合電子地圖的使用,能夠容易的實現(xiàn)對高安全等級區(qū)域的無縫式跟蹤,并實現(xiàn)目標軌跡描繪、犯罪行為預警等高等級的安保需求。多球機聯(lián)動跟蹤技術的實現(xiàn),需要具備多目標識別與跟蹤技術。在應用中,通常設定一臺球機作為發(fā)起點,對廣域范圍內目標進行的智能行為分析,并將同時監(jiān)控的多個目標按照既定的策略進行排序,并按照先后順序,指揮智能跟蹤球機逐個跟蹤監(jiān)控目標。與單目標跟蹤相比,多目標跟蹤技術的關鍵點是數(shù)據關聯(lián)問題,即建立一個統(tǒng)一的坐標系,使得發(fā)起球機可以將目標的坐標信息傳遞給跟蹤球機,實現(xiàn)聯(lián)動跟蹤。
3、面向事后應用的智能技術
隨著監(jiān)控探頭的普及,監(jiān)控系統(tǒng)中存有海量的錄像數(shù)據,在目前人工查看的模式下,傳統(tǒng)的方法需要從頭到尾順序播放,往往需要數(shù)倍于原始視頻的時間才能審看完成,因此需要大量人員連續(xù)加班數(shù)周進行視頻的審看。為了規(guī)避遺漏和誤差,就要加大人力投入的方法。但是經過實踐證明,這種方法吃力不討好,仍然解決不了根本的問題,如何有效、高效的應用,減輕人工查看回放帶來的時效性差、成本高、疲勞問題,并在不同分辨率、不同清晰度的錄像中準確的辨別出需要獲取的信息,基于以上需求,安防廠家研發(fā)了視頻摘要、視頻檢索等技術手段。
視頻摘要技術
將視頻摘要形成視頻片斷,不同時刻的目標“穿越時空”同時展現(xiàn)播放,使24小時的視頻被制作成一個簡短到幾分鐘摘要視頻成為現(xiàn)實。視頻摘要不僅濃縮的是事件的精華,也是活動事件的全部,沒有價值的視頻將被剔除。通過多分格快照技術,可以在幾秒中看完所有的活動目標成為可能,回溯原始視頻功能,瞬間鎖定目標在原始視頻中的位置。這些智能視頻分析功能的實現(xiàn)和應用將大大提高海量視頻監(jiān)控錄像分析的效率。
視頻檢索技術
視頻檢索主要是依賴于視頻算法對視頻進行預處理,通過對視頻內容進行結構化處理,提取出視頻內容中的有效信息,進行標記或者相關處理后,人后可以通過各種屬性描述進行快速檢索。因此視頻檢索最主要的是利用視頻檢測算法對視頻進行結構化描述,目前已經在相應的產品中得到應用的算法主要有以下幾種:行為分析算法、車牌識別算法、車輛顏色識別算法、車標識別算法、車型識別算法、人臉檢測識別算法、人體特征識別算法等。其中人體特征識別又包括人的年齡、性別、身高、衣服顏色、是否戴眼鏡等特征信息的識別。在視頻檢索中已經得到比較成熟應用的算法技術是行為分析算法、車牌識別算法、車輛顏色識別算法、人臉檢測識別算法等。由于監(jiān)控探頭的布置也會有盲點等原因,當雙目技術和多球機跟蹤技術無法每時每刻準確的撲捉到嫌疑人的軌跡信息的時候,可以通過校園內遍布的探頭錄像進行事后檢索分析,找到相關線索,幫助刑偵人員及時快速的定位嫌疑人。
4、視頻拼接技術
視頻拼接系統(tǒng)是基于圖像拼接技術得以實現(xiàn)的,而圖像拼接技術是根據實際的科研和工程的需要而發(fā)展來的。在很多領域經常會用到超過人眼視角的高分辨率圖像,而普通相機或攝像機的視角往往不能滿足需要,例如由于距離的限制,某些超大尺寸的物體無法清晰的用視頻拍攝下來。
目前來說,許多大型應用場景都需要高清晰高覆蓋的拍攝,比如機場跑道、碼頭等,一個攝像機無法真正清晰的展示這些大型應用場景的全貌,無法給出一種用戶滿意的高清視頻,更無法對視頻中的事物進行高清分析,由此而帶來的就是高投入和多畫面展示,不僅僅視覺效果不好,也不能最大程度的滿足用戶的高清大畫面的需求;谝陨闲枨,圖像拼接技術解決了這一難題,該技術將來自不同視角的圖像拼接在一起得到高分辨率圖像,解決了用戶大場景高清晰監(jiān)控的迫切需求,用戶可以在一幅視頻圖像上瀏覽高清晰畫面。