Email:[email protected]
(一)“活在三維空間、困于二維信息”的難題,將在5G時(shí)代得到解決
在現(xiàn)實(shí)世界中,我們通過(guò)鍵盤(pán)、鼠標(biāo)等設(shè)備與PC進(jìn)行交互,通過(guò)觸屏方式與移動(dòng)設(shè)備進(jìn)行交互,這些都是建立在二維世界的2D界面交互。而在VR虛擬現(xiàn)實(shí)的世界,2D交互顯然遠(yuǎn)遠(yuǎn)不足以滿(mǎn)足“沉浸感”的需求,這就要求交互方式要全面的顛覆:從傳統(tǒng)2D交互升級(jí)為用多種方式(動(dòng)作捕捉、手勢(shì)控制、眼球追蹤、觸覺(jué)反饋、語(yǔ)音交互,甚至腦電波)與多維信息環(huán)境的3D立體交互。3D視覺(jué)是計(jì)算機(jī)視覺(jué)的終極體現(xiàn)形式,2D視覺(jué)技術(shù)主要在二維空間下完成工作,三維信息基本上沒(méi)有得到任何利用,而三維信息才真正能夠反映物體和環(huán)境的狀態(tài),也更接近人類(lèi)的感知模式。近年來(lái),學(xué)術(shù)界和工業(yè)界推出了一系列優(yōu)秀的算法和產(chǎn)品,被廣泛應(yīng)用到各個(gè)領(lǐng)域。
視覺(jué)是一個(gè)感知的過(guò)程,在視覺(jué)中我們經(jīng)歷了從黑白到彩色,再?gòu)哪M數(shù)字普清到高清的四次革命。截至目前,仍有很多應(yīng)用場(chǎng)景都以2D為主,2D拍攝到的是平面信息,沒(méi)有辦法獲取空間的三維結(jié)構(gòu)。因此眼下2D也達(dá)到了瓶頸期,在消費(fèi)電子、以VR/AR為助視體驗(yàn)、以及裸眼3D都在不斷地向3D做升級(jí)。我們生存在三維的立體空間,我們希望通過(guò)3D攝像頭獲取到三維空間,所以3D視覺(jué)是人工智能感知硬件的入口,能夠通過(guò)視覺(jué)的部分,讓我們的硬件達(dá)到AI的感知到認(rèn)知,最后實(shí)現(xiàn)決策的功能。
3D攝像頭正在成為智能設(shè)備的一個(gè)入口,3D攝像頭特點(diǎn)在于除了能夠獲取平面圖像以外,還可以獲得拍攝對(duì)象的深度信息,即三維的位置及尺寸信息,其通常由多個(gè)攝像頭+深度傳感器組成。3D攝像頭實(shí)現(xiàn)實(shí)時(shí)三維信息采集,為消費(fèi)電子終端加上了物體感知功能,從而引入多個(gè)“痛點(diǎn)型應(yīng)用場(chǎng)景”,包括人機(jī)交互、人臉識(shí)別、三維建模、AR、安防和輔助駕駛等多個(gè)領(lǐng)域,取得3D影像主要有四種方法,包括立體視覺(jué)法、結(jié)構(gòu)光3D成像、雷射三角法以及ToF(光飛時(shí)間)。隨著蘋(píng)果iPhone集成了雙攝像頭后,掀起攝像頭產(chǎn)業(yè)發(fā)展新浪潮,國(guó)內(nèi)外各大企業(yè)如英特爾、微軟、圖漾科技、奧比中光、華捷艾米、海康威視、舜宇光學(xué)、樂(lè)行天下、縱目科技、凌云光技術(shù)、弼智仿生已經(jīng)在電子產(chǎn)品等配置3D攝像頭。以英特爾RealSense為例,其智能3D攝像頭主要有三部分組成:(1)傳統(tǒng)的2D攝像頭;(2)近紅外圖像傳感器;(3)紅外激光發(fā)射器。英特爾RealSense 3D攝像頭有兩種類(lèi)型:一種是用于遠(yuǎn)距離、精度稍低的后置3D攝像頭;另一種是用于近距離、精度較高的前置3D攝像頭。