之前我們主要講的是視野檢查或者測量,但是對視覺識別這個(gè)課題從來沒有深入的了解。不是我們對這個(gè)細(xì)分不夠了解,而是我們公司落地案例太多,大多數(shù)人都覺得不起眼。
今天,陜西永輝我們的識別技術(shù)與大家進(jìn)行了深入的交流。對于識別來說,其實(shí)大部分問題都已經(jīng)被源頭廠商通過其他方式解決了,比如康耐視的液體鏡頭,不僅解決了遠(yuǎn)近物體的對焦問題,還利用液體本身的性質(zhì),實(shí)現(xiàn)了快速識別的功能。大部分視覺工程師只需要在工作環(huán)境中設(shè)置設(shè)備,使用環(huán)境光源等其他情況略顯復(fù)雜。

Ocr字符識別
通過機(jī)器視覺識別技術(shù),我們不僅可以通過圖像檢索更快地獲取信息,還可以創(chuàng)造一種與外界對話的新方式,讓外界的工作更加智能化。隨著模式識別技術(shù)的發(fā)展,越來越多的科技公司涉足模式識別領(lǐng)域,這標(biāo)志著圖像閱讀時(shí)代的正式到來,將引領(lǐng)我們走向更加智能的未來。
機(jī)器視覺識別的初始階段
在這個(gè)初始階段,用戶主要使用機(jī)器視覺識別技術(shù)來滿足一些娛樂需求。類似的圖片可以像百度開發(fā)的圖片檢索一樣找到。臉書開發(fā)了DeepFace用于基于照片的人臉匹配;IQ Engine開發(fā)的Glow通過機(jī)器視覺識別自動生成照片標(biāo)簽,讓用戶可以管理手機(jī)照片。
現(xiàn)階段有一個(gè)非常重要的細(xì)分領(lǐng)域,即光學(xué)字符識別(—— ocr)。光學(xué)儀器檢查印在紙上的文字,通過檢測明暗圖案來確定其形狀,通過文字識別將圖像的形狀轉(zhuǎn)化為計(jì)算機(jī)文字的過程就是計(jì)算機(jī)識讀文字的過程。
當(dāng)然,對于視覺識別來說,不僅僅是字符識別。在很多情況下,我們還需要識別其他信息,比如logo,或者結(jié)合其他技術(shù)來定位目標(biāo)的位置,并將表單識別為一個(gè)項(xiàng)目,這也說明這個(gè)技術(shù)領(lǐng)域遠(yuǎn)沒有我們想象的那么簡單。