视频分析是图像处理和计算机视觉领域中的重要方向,也是近几十年来最根本的研究课题之一,其主要目标包括从非结构性的视频数据中获取语义信息,同时这也是人工智能领域的重要任务。视频分析问题是一个非常具有挑战性的问题,因为通常视频是一个有着有很大的差异性和复杂性的信息密集媒体,而视频分析技术能够在视频及视频类别和描述等标注之间建立映射关系,从而使计算机能够通过图像处理和分析来理解画面中的内容。
视频分析有多个分类,针对不同场景和用途,主要有行为识别、时域行为检测和目标跟踪等。相比于单张图像,视频最大的不同在于视频还包含了时序上的连续信息,而不仅仅是图像的不规则堆叠,而这些时序信息往往直接决定了视频的类别等属性。此外,相比较图像而言,视频分析与处理所需要的计算量通常也大很多。近些年来,随着深度学习技术的发展,以及工作站和服务器计算能力的进步(包括硬件上GPU的迅速更新迭代与算法上针对底层硬件的优化等),现在基于视频的研究领域越来越受到重视,计算机视觉和多媒体领域的研究人员现在利用深度学习技术能够大幅度的提高视频分析的性能,并开始在分析视频上开辟了许多新的研究方向。 |