时间:2024-05-04
王一波,娄伯韬,杨玉华,李 兴
(柳州工学院 信息科学与工程学院,广西 柳州 545616)
视 觉SLAM(Simultaneous Localization and Mapping,SLAM)成本低、纹理信息丰富、场景辨识能力强,始终是自主移动定位研究的热点,近年也出现了诸如Mono[1]、PTAM[2]、ORBSLAM[3]、SVO[4]、LSD-SLAM[5]、ORBSLAM2[6]等成熟的技术框架,在室内移动机器人、自动驾驶、无人机等领域得到应用。但视觉SLAM 受光照影响较大,已公布的成熟解决方案基本都是在比较理想的光照条件下实施,考虑到低光照因素较为常见且难以避免,例如阴天、夜晚等场景,为此通过对低照度图像进行增强,提升视觉SLAM 的鲁棒性能是较为合理的技术路径。当前,对于静态低照度图像(如医学、遥感等)的增强技术已比较成熟,大致分为三类:基于分布映射的方法、基于模型优化的方法和基于深度学习的方法。基于分布映射的方法属于传统处理方法,处理速度较快,但精度较低;基于模型优化方法的核心在于以物理成像规律导出的数据项作为基本成分,但由于物理成像模型缺乏普适性,已成熟的方案难以进行有效拓展;深度学习方法则有赖于大量数据的驱动,应用过程中占用资源较多,虽然处理精度最高,但耗时较长[7]。综合来看,基于传统的低照度图像增强方法处理速度快,更加贴合视觉SLAM 对实时性的要求。低光照下,图像受到的干扰较大,增强处理的关键在于:一是尽可能保留图像细节信息;二是最大限度限制噪声。本文将采用频域与空间域相结合的思路,通过自适应参数调节,满足多种光照条件下的应用需求。
视觉SLAM 通过传感器感知周围环境来估计相机运动并建立地图视觉,一般包括五部分,即输入、前端、后端、回环检测、建图,如图1 所示。
图1 视觉SLAM 基本框架
输入端采集外部环境数据,为连续的图像帧序列;后端优化需根据前端得出的初步位姿做整体优化,保证位姿的准确性和地图的全局一致性;建图即构建周围环境地图,根据应用环境,其可分为二维栅格地图、三维点云地图、语义地图。前端即视觉里程计,是视觉SLAM 的核心,其通过摄像机获取周围环境图像信息,通过对图像进行预处理及特征提取,实现相邻帧的数据关联,基于多视几何的原理解算相机的位姿并估计地图点的空间位置。当环境光照较低时,特征提取精度将受到极大影响,为此需进行图像增强处理。
按照Retinex 理论[8],视觉SLAM 过程采集图像可以分解为入射图像I(x,y)、反射图像R(x,y)及噪声图像N(x,y),其中:I(x,y)表示环境照明,变化缓慢,代表低频成分;R(x,y)反映事物本身特性,与光照无关,一般变化较快,代表高频成分;N(x,y)表示成像过程中的环境干扰,光照条件较好的情况下可以忽略,而对于低照度环境,此项在建模过程中应予考虑。因此,成像过程模型如下:
由于N(x,y)随机性带来的处理复杂性,在初始滤波中,暂且不做考虑,后续处理过程中进行补偿处理,上述模型可简化为:
低照度条件下,视觉SLAM 所采集图像通常因感兴趣部分由于光照不均匀无法辨认细节,从而导致后续图像特征提取误差较大。因此,视觉SLAM 低照度图像增强根本目的在于滤除图像中的低频成分,提高图像的对比度。通过比较,本文选取保留图像细节较好的同态滤波算法,其原理如下:
式中:γH为高频系数,γL为低频系数,当γH>1,γL<1 时,可衰减低频成分,保留高频细节;c为控制滤波函数的坡度;D(u,v)、D0分别表示频率中心及截止频率,D0控制低频滤除的效果,其越大,表示低频成分滤除越多。
通常情况下,视觉SLAM 采集彩色图像,同态滤波增强前须转化为灰度图像,在此使用普遍认可的转化公式:
式中:Grey 表示转化得到的灰度图像;R、G、B表示彩色图像的红、绿、蓝3 图层。
选取一幅低照度图像进行同态滤波增强,通过调节γH、γL发现,当γH取值在0.5 附近,而γL取值在0.2 附近时,以上系数对于滤波影响不大。在此,c分别取0.1、0.5 和1,滤波效果如图2 所示。
图2 不同c 取值滤波比较
由图2 可以发现,c取值对图像整体增强效果影响较小,取值越大,对比度越高,为此,在接下来的处理中c取1,D0分别取20、60 及100 进行处理,结果如图3 所示。
图3 不同D0 取值滤波比较
由图3 可知,D0对于滤波效果影响较大,且其不存在适用于所有低照度图像的最佳值,应根据图像特性进行针对性选取。同时,直接对由彩色图像转化得到的灰度图像进行处理,其细节保留较完整,但有明显的块效应,噪声处理不甚理想。
D0与原始图像对比度和平均亮度有着较强的相关性,对比度较低的图像,D0越小越好,而对比度较高的图像,D0越大越好;平均亮度较高的图像,说明低照度占比相对较低,D0越大,则整体动态拉升加大,效果较好。为此,初步定义:
式中:CM表示原图像对比度,是对图像中明暗区域最亮与最暗之间不同亮度层级的测量,定义为:
式中:Lavg表示图像的平均灰度;Dres表示参考截止频率,在此根据经验选取20。
D0自适应取值滤波结果如图4 所示。
图4 D0 自适应取值滤波
可以看出,图4(a)中D0=5,图4(c)中D0=2,图像都得到了较好的增强,但图像中有比较明显的色块。考虑以上对比度是一种全局特性,未能体现图像细节的变化,在此使用图像梯度替代对比度,则式(5)变为:
式中:Gagv表示图像平均梯度,在此选用Sobel 算子进行梯度计算。再次对图4(a)、图4(c)进行处理,结果如图5所示。
图5 改进D0 自适应取值滤波
由此可知,借助平均梯度自适应滤波,低照度图像内容得以恢复到人眼可辨认的程度,细节得到更好的保留,但在增强过程中,噪声也被相应放大,必须做进一步处理。
通过使用自适应参数算法,进一步提升了细节的增强效果,但噪声问题尚未得到较好解决。为此,本文选用均值滤波算法对图5(b)、图5(d)进行处理,结果如图6 所示。
图6 均值滤波
由图6 看出,噪声虽然得到了较好抑制,但图像出现细节丢失现象,这对于视觉SLAM 应用而言不可接受。
彩色图像通常使用RGB 色彩空间表达,R、G、B 三个图层都含有原始图像的细节信息,考虑一般情况下,图像的干扰为高斯噪声,可通过多幅图像平均进行有效抑制。假设原始彩色图像分解后的R、G、B 图层受到相同分布的随机噪声干扰,可对上述算法进行改进:分解图像;求取3 图层的均值并做归一化处理;自适应同态化滤波。图4(a)、图4(c)经上述算法处理后的结果如图7 所示。
图7 RGB 分解算法处理
为验证本文提出的自适应增强算法的可靠性,选取2 幅不同光照条件下的连续场景图像进行处理,并且将其与当前流行的深度学习算法进行比较,结果如图8 所示。
图8 低照度图像处理比较
可以看出,在光照允许的范围内,同态滤波自适应算法与深度学习算法效果相当,但在细节保留方面稍差;而当照度低到某种条件时,同态自适应滤波算法增强效果有限,同时特征点提取出现错误,而深度学习算法增强效果较好,特征点检测准确率也较高;但在照度特别低时,两种算法同时失效。深度学习算法处理精度较高,但耗时过长,难以满足视觉SLAM 的实时要求,自适应同态滤波算法在照度较低的情况下,基本可以满足特征检测的需求,同时处理时间较短,符合SLAM 动态检测要求[9-10]。
为验证本文提出的自适应同态滤波算法,采集1 组相同光照条件下2 帧连续场景图像进行处理。其次,对处理前后的图像分别进行ORB 特征点检测,结果如图9 所示。
图9 低照度图像处理比较
由图9 可知,未处理图像特征点提取数量较多,但错误匹配也相对较多;而经同态滤波算法处理后图像正确检测出了特征点,并且匹配无误。
本文针对视觉SLAM 存在的低光照运行不稳定问题,对于实时低照度图像增强进行了研究,在传统的同态滤波算法基础上,提出了低照度条件下图像自适应增强算法。经实验验证,算法得到的增强图像细节丰富,降低了图像失真度,避免了伪影现象的出现,提高了图像质量,虽然无法达到基于深度学习算法增强的精细程度,但已基本可以满足视觉SLAM 的应用需求。今后,将围绕复杂光照条件下的图像质量改善展开进一步研究。
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!