图像拼接是计算机视觉中的关键技术之一,其目的是生成具有广阔视野的图像。传统图像拼接方法严重依赖于图像特征检测,要求图像中的场景特征密集均匀分布,易导致重影效果参差不齐且鲁棒性差。而基于深度学习的方法通常受到固定视图和输入大小的限制,在其他真实数据集上缺乏泛化能力。
本文提出了一种图像拼接深度学习框架,该框架由大基线深度单应模型和边缘保持变形模型组成。首先,同时采用特征金字塔和特征相关,构建了一个大基线深单应模型来估计不同尺度特征下参考图像和目标图像之间的精确投影变换。在此基础上,设计了边缘保持变形模块,学习图像从边缘到内容的拼接变形规律,尽可能消除重影效应。特别是,所提出的深度学习框架可以拼接任意视图和输入大小的图像,从而有助于在其他真实图像中具有良好泛化能力的有监督深度图像拼接方法。实验结果表明,在大基线场景中,所提出的单应模型明显优于现有的深度单应方法。在图像拼接方面,该方法优于现有的学习方法,并显示出与最先进的传统方法相竞争的性能。 |