一臺(tái)機(jī)器為什么能看到你?因?yàn)樗辛俗约旱囊曈X。
機(jī)器視覺技術(shù)是一門涉及人工智能、神經(jīng)生物學(xué)、心理物理學(xué)、計(jì)算機(jī)科學(xué)、圖像處理、模式識(shí)別等諸多領(lǐng)域的交叉學(xué)科。機(jī)器視覺主要用計(jì)算機(jī)來模擬人的視覺功能,從客觀事物的圖像中提取信息,進(jìn)行處理并加以理解,最終用于實(shí)際檢測、測量和控制,技術(shù)最大的特點(diǎn)是速度快、信息量大、功能多。
機(jī)器視覺主要用計(jì)算機(jī)來模擬人的視覺功能,但并不僅僅是人眼的簡單延伸,更重要的是具有人腦的一部分功能一一從客觀事物的圖像中提取信息,進(jìn)行處理并加以理解,最終用于實(shí)際檢測、測量和控制。
一個(gè)典型的工業(yè)機(jī)器視覺應(yīng)用系統(tǒng),包括數(shù)字圖像處理技術(shù)、機(jī)械工程技術(shù)、控制技術(shù)、光源照明技術(shù)、光學(xué)成像技術(shù)、傳感器技術(shù)、模擬與數(shù)字視頻技術(shù)、計(jì)算機(jī)軟硬件技術(shù)、人機(jī)接口技術(shù)等。
發(fā)展歷史簡介
機(jī)器視覺的研究是從20世紀(jì)60年代中期美國學(xué)者L.R.羅伯茲關(guān)于理解多面體組成的積木世界研究開始的。當(dāng)時(shí)運(yùn)用的預(yù)處理、邊緣檢測、輪廓線構(gòu)成、對(duì)象建模、匹配等技術(shù),后來一直在機(jī)器視覺中應(yīng)用。
羅伯茲在圖像分析過程中,采用了自底向上的方法。用邊緣檢測技術(shù)來確定輪廓線,用區(qū)域分析技術(shù)將圖像劃分為由灰度相近的像素組成的區(qū)域,這些技術(shù)統(tǒng)稱為圖像分割。其目的在于用輪廓線和區(qū)域?qū)λ治龅膱D像進(jìn)行描述,以便同機(jī)內(nèi)存儲(chǔ)的模型進(jìn)行比較匹配。
實(shí)踐表明,只用自底向上的分析太困難,必須同時(shí)采用自頂向下,即把目標(biāo)分為若干子目標(biāo)的分析方法,運(yùn)用啟發(fā)式知識(shí)對(duì)對(duì)象進(jìn)行預(yù)測。這同言語理解中采用的自底向上和自頂向下相結(jié)合的方法是一致的。在圖像理解研究中,A.古茲曼提出運(yùn)用啟發(fā)式知識(shí),表明用符號(hào)過程來解釋輪廓畫的方法不必求助于諸如最小二乘法匹配之類的數(shù)值計(jì)算程序。
70年代以后,機(jī)器視覺形成幾個(gè)重要研究分支:一、目標(biāo)制導(dǎo)的圖像處理;二、圖像處理和分析的并行算法;三、從二維圖像提取三維信息;四、序列圖像分析和運(yùn)動(dòng)參量求值;五、視覺知識(shí)的表示;六、視覺系統(tǒng)的知識(shí)庫等。
全球應(yīng)用情況
在國外,機(jī)器視覺的應(yīng)用普及主要體現(xiàn)在半導(dǎo)體及電子行業(yè),其中大概40%-50%都集中在半導(dǎo)體行業(yè)。機(jī)器視覺系統(tǒng)還在質(zhì)量檢測的各個(gè)方面已經(jīng)得到了廣泛的應(yīng)用,并且其產(chǎn)品在應(yīng)用中占據(jù)著舉足輕重的地位。除此之外,機(jī)器視覺還用于其他各個(gè)領(lǐng)域。
而在中國,視覺技術(shù)的應(yīng)用開始于90年代,因?yàn)樾袠I(yè)本身就屬于新興的領(lǐng)域,再加之機(jī)器視覺產(chǎn)品技術(shù)的普及不夠,導(dǎo)致以上各行業(yè)的應(yīng)用幾乎空白。目前國內(nèi)機(jī)器視覺大多為國外品牌。國內(nèi)大多機(jī)器視覺公司基本上是靠代理國外各種機(jī)器視覺品牌起家,隨著機(jī)器視覺的不斷應(yīng)用,公司規(guī)模慢慢做大,技術(shù)上已經(jīng)逐漸成熟。
在行業(yè)應(yīng)用方面,主要有制藥、包裝、電子、汽車制造、半導(dǎo)體、紡織、煙草、交通、物流等行業(yè),用機(jī)器視覺技術(shù)取代人工,可以提供生產(chǎn)效率和產(chǎn)品質(zhì)量。例如在物流行業(yè),可以使用機(jī)器視覺技術(shù)進(jìn)行快遞的分揀分類,不會(huì)出現(xiàn)大多快遞公司人工進(jìn)行分揀,減少物品的損壞率,可以提高分揀效率,減少人工勞動(dòng)。
提升三維技術(shù)
在現(xiàn)實(shí)生活中,我們?cè)絹碓叫枰嗟娜S模型來實(shí)現(xiàn)對(duì)物體或環(huán)境的全面掌握。獲得三維模型有兩種基本方式,一種是利用激光掃描儀,一種是拍攝照片。但激光掃描儀的成本高,也有可能會(huì)對(duì)樣本帶來一些損害。第二種方式的成本小,而且在精度上也跟激光掃描儀相差無幾,因此成為了現(xiàn)在研究的一個(gè)熱點(diǎn)。
我們知道,一般的圖像上是沒有長度、距離等深度信息的,而三維模型則能更加全面、精確地記錄環(huán)境,可以直觀呈現(xiàn)物體的位置、距離、姿態(tài)等。比如中國古代建筑全自動(dòng)三維重建系統(tǒng),能夠?qū)崿F(xiàn)全自動(dòng)三維建模,即從底層圖像處理到生成最終的三維模型,全部自動(dòng)實(shí)現(xiàn),無需人工交互。它對(duì)圖像的拍攝方式也無特殊約束和限制,只需手持自由拍攝即可。在精度上,也與激光掃描精度相當(dāng),精度小于3cm/100米,通過配備更高像素?cái)?shù)量的相機(jī)和長焦鏡頭還可以實(shí)現(xiàn)毫米級(jí)重建。
此外,在實(shí)時(shí)定位與在線三維重建方面,機(jī)器視覺也具有極大的應(yīng)用潛力。將手機(jī)上攝像頭讀取的視頻作為輸入,通過初始化、特征點(diǎn)提取、動(dòng)態(tài)模板特征點(diǎn)匹配、幾何變化計(jì)算階段后得到視頻每一幀中感興趣區(qū)域的位置。
目前,我國基于機(jī)器視覺的三維重建技術(shù)在國際上可以說處于領(lǐng)先地位,應(yīng)用也比較廣泛。除了上述之外,還能用在一些不太適合人工作業(yè)的環(huán)境監(jiān)測方面,像對(duì)露天煤礦的監(jiān)測,就是通過無人機(jī)對(duì)煤礦進(jìn)行全方位拍攝,生成三維模型來實(shí)時(shí)監(jiān)測礦山的變化。此外,也能應(yīng)用于城市規(guī)劃、數(shù)字媒體、三維試衣、牙模制造等多方面。
未來發(fā)展趨勢
由于機(jī)器視覺是自動(dòng)化的一部分,沒有自動(dòng)化就不會(huì)有機(jī)器視覺,機(jī)器視覺軟硬件產(chǎn)品正逐漸成為協(xié)作生產(chǎn)制造過程中不同階段的核心系統(tǒng),無論是用戶還是硬件供應(yīng)商都將機(jī)器視覺產(chǎn)品作為生產(chǎn)線上信息收集的工具,這就要求機(jī)器視覺產(chǎn)品大量采用標(biāo)準(zhǔn)化技術(shù),直觀地說就是要隨著自動(dòng)化的開放而逐漸開放,可以根據(jù)用戶的需求進(jìn)行二次開發(fā)。
當(dāng)今,自動(dòng)化企業(yè)正在倡導(dǎo)軟硬一體化解決方案,機(jī)器視覺的廠商在未來十年內(nèi)也應(yīng)該不單純是只提供產(chǎn)品的供應(yīng)商,而是逐漸向一體化解決方案的系統(tǒng)集成商邁進(jìn)。隨著中國加工制造業(yè)的發(fā)展,對(duì)于機(jī)器視覺的需求也逐漸增多。隨著機(jī)器視覺產(chǎn)品的增多,技術(shù)的提高,國內(nèi)機(jī)器視覺的應(yīng)用狀況將由初期的低端轉(zhuǎn)向高端。由于機(jī)器視覺的介入,自動(dòng)化將朝著更智能、更快速的方向發(fā)展。