为加强研究生学术交流活动,推进学术创新,特开通“研究生学术报告预告区”。我校研究生和教师可以在预告区及时发布和了解有关研究生学术报告的信息,届时参加。也可就某学术报告展开专题讨论与交流。
在当今的信息时代,人们通常以视频途径获取信息,由此产生的视频搜索、网络视频监控等领域蓬勃发展。本文对视频中字幕信息进行精确定位和准确提取。在得到视频中丰富的语义信息同时,通过对视频文本信息的分析实现对视频进行快速准确搜索以及定位。
本文分析了现有的视频文本定位与提取系统的框架和主流算法,提出高效算法构造了一个高性能的文本定位与提取系统。本文设计的系统通过以固定帧率抽取视频帧保证视频字幕的无漏失,首先通过提取视频帧图像角点响应图来得到候选文本区域,然后通过模糊C均值聚类方法得到候选文本层实现文本行分割,再利用迁移学习得到的深度神经网络进行文本判定,最后对判定为真的候选文本进行形态学修复后输入到光学字符识别软件来得到文本信息。实验结果表明本系统具有较高的查准率和查全率。