1. 什么是视(shì)觉
视觉是一个古老的(de)研(yán)究课题,同时又是人(rén)类观察世(shì)界、认知世界的(de)重要功能(néng)和手段。人类从(cóng)外界获得的信息约有75%来自视觉系(xì)统,用(yòng)机器(qì)模拟(nǐ)人类的(de)视(shì)觉功能是人们多(duō)年的梦想。视觉神经(jīng)生理学,视觉心里学(xué),特别是(shì)计算机技术、数字图像处理、计算机图形学、人工智能等学科(kē)的发展,为利用计算机实(shí)现模(mó)拟人(rén)类的视觉成为可能。在现代工业自动化生产过程中(zhōng),计(jì)算机视觉(jiào)正成(chéng)为一种提高生产效(xiào)率和检验产(chǎn)品质(zhì)量的关键技术之一,如(rú)机器零件的自动检测、智能机器人控制、生(shēng)产线的自(zì)动监控等;在国防和航天(tiān)等领域(yù),计算机视(shì)觉也(yě)具有较重要的意义,如运(yùn)动目标(biāo)的自动跟踪与识别、自(zì)主车导航及空(kōng)间机(jī)器人的视(shì)觉控制等。
人类视觉过程(chéng)可以看作是一个(gè)从感(gǎn)觉到知觉的复杂过程,从狭(xiá)义上(shàng)来说视觉的最终目的是要对场(chǎng)景作出对(duì)观察者有意义的解释和(hé)描述(shù);从广义上说,是根据(jù)周围的环境和观(guān)察者的意愿,在解释(shì)和描(miáo)述的基础上做(zuò)出行为(wéi)规划或行为决策。计(jì)算机视觉研究的目的使计算机具有通过二维图(tú)像信息(xī)来(lái)认知三维环(huán)境信息的能力(lì),这种能力(lì)不仅(jǐn)使机器能感(gǎn)知三维(wéi)环(huán)境中物体的几何(hé)信息(如形状、位置(zhì)、姿态运(yùn)动等),而且能进一步对它们进行描述(shù)、存储、识(shí)别(bié)与理解,计算机视觉己(jǐ)经(jīng)发展(zhǎn)起一套独立的计(jì)算理(lǐ)论(lùn)与算法(fǎ)。
2. 什么是计算机双目立体视觉
双目立体视觉(Binocular Stereo Vision)是机(jī)器视觉的一种重要形式,它是基于视差原理并利用成像设(shè)备(bèi)从不同的位(wèi)置(zhì)获(huò)取被测物体的两幅图像,通(tōng)过计算图(tú)像对应点间的位(wèi)置(zhì)偏差(chà),来获取物体三维(wéi)几何信息的方(fāng)法。融合两只眼睛获得的图像并观察它们之间的差别,使(shǐ)我(wǒ)们(men)可以获得明显的深度感,建立(lì)特征间的对(duì)应关系,将同一空间物理点在不同(tóng)图像中的映像点对应(yīng)起来,这个差别,我们称(chēng)作视差(Disparity)图像。
双目立体视觉测量(liàng)方法具有效率高、精度(dù)合适、系统结构简单(dān)、成本低等优点,非常适合于制造现场的在线、非接触产品检测和(hé)质量控(kòng)制。对(duì)运动物体(包括动物和人体形体)测量中,由于图像获取是在瞬间(jiān)完成的,因此立体视觉方法是一(yī)种更(gèng)有效的测量方法。双目(mù)立体视觉系统是计算机(jī)视(shì)觉的关(guān)键技术之(zhī)一,获取(qǔ)空间(jiān)三维场(chǎng)景的距(jù)离(lí)信息也是计算机视觉研究中最基础的内容(róng)。
双目(mù)立体视觉的开创性(xìng)工作始于(yú)上世(shì)纪的(de)60年代中期。美国MIT的(de)Roberts通过从数字图(tú)像中提取(qǔ)立方体(tǐ)、楔形体和棱柱体等(děng)简(jiǎn)单规(guī)则多(duō)面体的(de)三维结构,并对物体的形状和空间关系进行(háng)描述,把过去(qù)的简(jiǎn)单二维图像分析推广到了复杂的三维场景,标志着立体视觉技术的(de)诞生。随着研究的深入,研(yán)究的(de)范围从边缘、角点等特征的提取,线条、平(píng)面、曲面等几何要(yào)素的分析(xī),直到对图像明暗、纹(wén)理、运动(dòng)和成像几何等(děng)进行分析,并建立(lì)起各种数据结(jié)构和(hé)推(tuī)理规则。特别是上世纪80年代初,Marr首次将(jiāng)图像(xiàng)处理、心理物理(lǐ)学、神经生理学和临床精神病学的研究(jiū)成果从信息(xī)处理的角度进行概括,创立了视(shì)觉计(jì)算理论框架。这(zhè)一基(jī)本(běn)理论对立体视觉技(jì)术的发展产生了极大(dà)的推动作用,在这一领(lǐng)域已形成了从(cóng)图像的获取(qǔ)到(dào)最(zuì)终的三维场景可视表面重构(gòu)的(de)完整体系,使得立体视(shì)觉已成为计算机视觉中一个非常(cháng)重要的分支(zhī)。
3、总结
经过几十年来(lái)的发(fā)展,立体视觉在机器人(rén)视觉、航空测(cè)绘、反求工程、军事运用、医学成像和工业(yè)检测等领域(yù)中的运用越来越广(guǎng)。
以视觉系(xì)统为基(jī)础的三维(wéi)非(fēi)接触式高(gāo)速测量是一个(gè)重要的研究方向,双目(mù)立体视觉方法是其(qí)中一种最常用的(de)方法。为了能够(gòu)将(jiāng)这些技(jì)术应用在实际的无(wú)人机项目中,需要(yào)尽可(kě)能提高算法(fǎ)的效(xiào)率(lǜ)与精度。

咨询航(háng)拍服务可加(jiā)昆明(míng)俊鹰无人机飞控手(shǒu)老鹰的微信laoyingfly |