基于边缘检测的视频字幕自动定位方法

基于边缘检测的视频字幕自动定位方法

ID:10154506

大小:27.00 KB

页数:5页

时间:2018-06-11

基于边缘检测的视频字幕自动定位方法_第1页
基于边缘检测的视频字幕自动定位方法_第2页
基于边缘检测的视频字幕自动定位方法_第3页
基于边缘检测的视频字幕自动定位方法_第4页
基于边缘检测的视频字幕自动定位方法_第5页
资源描述:

《基于边缘检测的视频字幕自动定位方法》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、基于边缘检测的视频字幕自动定位方法[摘要]视频中的字幕蕴含丰富的语义信息,字幕检测方法对视频检索就尤为重要。因此,提出了一种高效率的方法对视频中的字幕完成自动检测与定位。对输入的图像进行锐化预处理,突出字幕区域的信息,求取经锐化处理后图像的最佳分割阀值,结合最佳分割阀值进行边缘检测得到二值图,很好的分离了字幕区域与背景区域。运用形态学处理使文字连接成块,最后依据文字的先验特征去除干扰区域。实验证明,该方法复杂程度低,能准确的定位字幕区域。[关键词]视频字幕;字幕检测;边缘检测;数学形态学;中图分类号:TP391.41文献

2、标识码:A文章编号:1009-914X(2014)41-0139-01随着多媒体技术在互联网上的高速发展,视频在人们的日常生活中己经成为不可或缺的一部分。迫切地需要一种有效的方法对视频进行管理、索引和检索。由于这种需求,基于图像、声音等各种视频信息检索的方法被大量提出,其中,视频中的字幕信息对于视频的检索有着十分重要的意义。本文针对运用边缘算法提取视频字幕生成二值图像时,需要设定经验阈值,通用性差的缺点,提出一种结合图像预处理及最佳阀值分割的视频字幕检测算法。1字幕区域提取方法描述51.1字幕提取流程为了便于人眼识别,视

3、频中后期制作加入的文字一般具有下述特性:文字颜色与背景有较大差别,具有比较丰富的边缘信息;文字均具有一定规格尺寸;文字的分布比较集中且多为水平方向排列;任意一个文字区域都包含多个文字。正是基于以上特征,本研究设计了一种方法来检测视频中的文本区域,步骤如下:(1)输入彩色图像,做灰度化处理;(2)使用二阶拉普拉斯算子做锐化处理;(3)用最小误差法求图像的分割阀值T;(4)用sobel算子结合阀值T做边缘检测;(5)将边缘图用数学形态学连通为区域;(6)文字区域进行粗筛选;(7)文字区域进行细筛选,确定文字区域;1.2输入图

4、像的预处理在处理彩色图像前先把彩色图像转化为灰度图像,一般常用的有R、G、B三色等权和不等权两种变换,本方法采用不等权策略。由于拉普拉斯算子是微分操作符,对输入的灰度图像滤波,可以突出灰度值快速变化的区域,可以使图像锐化。对于文字提取来说,边缘图像的二值化至关重要。阀值过大,会减少文字的边缘信息。阀值过小,会使保留较多的非文字边缘,使误检增多。本文采用最小误差法求阈值。求得增强后图像?(x,y)的最佳分割阈值为T。5本文使用sobel边缘检测算子。Sobel算子两个模板组成,分别用来检测图像中的垂直边缘和水平边缘。将两个

5、模板与图像卷积得到的最大值作为该点的边缘响应值输出。得到图像的边缘图,与图像的最佳分割阈值T比较,大于T的点赋值逻辑值1输出,小于T的点赋值0输出,最后生成二值图像。1.3形态学处理形态学是一种非线性信号处理和分析的工具,应用在图像上,它可将图像信号与其几何形状联系起来,利用一定形态的结构元素度量和提取图像中的对应形状和结构,可以简化图像。基本概念是腐蚀、膨胀、开、闭运算。本文中使用五次闭运算,两次开运算,三次膨胀运算可有效的将边缘图像连接成候选的连通区域。1.4字幕区域粗筛选在经过形态学处理后,在通过文字区域的启发性规

6、则就能剔除虚假的文本区域,得到精确的文本区域。其中主要用到字幕区域的宽度、面积、中心、宽高比、饱和度[7]。宽度:为了清晰显示,提出的高度标准是边界窗的高度必须高于10个像素。面积:字幕连通域的面积大于一个经验阈值150。中心:连通域最小外接矩形的中心。中心大于二分之一倍宽度。5宽高比:最小外接矩形宽度和高度的比例,宽高比大于1而小于50。饱和度:连通域内已填充像素数占最小外接矩形的比例。设置饱和度阈值为0.4.1.5字幕区域细筛选根据字幕的先验知识,能排除掉大部分虚假连通域,但仍会有少量的连通域误检出来。为进一步提高准

7、确率。设计如下思路:将检测出的连通域的位置信息映射回二值图像,对二值图相应位置进行水平方向投影,因为字幕通常由水平的几个字符组成,边缘信息比其他区域丰富,选取出水平投影均值最大的默认为字幕区。非字幕区零散且无规律,对未达到默认字幕区的50%的其他区域予以排除。最后得到满足条件的连通域的位置信息,映射回到原图上。2结束语通过大量的实验,证明本方法的普适性和鲁棒性,为解决一般边缘检测方法效率低,提出一种先对图像做锐化预处理,突出字幕区域信息的方法。在用sobel算子对图像做边缘检测时,解决了需要人为设定经验阀值生成二值图像的

8、问题。以最小误差法求取的值作为边缘图二值化的阈值,可以分离出字幕区与背景区域。运用数学形态学使文字区域连通为块,根据文字的先验规则去排除非字幕区。参考文献5[1]蔡波,周洞汝,胡宏斌.数字视频中字幕检测及提取的研究和实现[J].计算机辅助设计与图形学学报,2003(7):898-903.[2]万罡,周洞汝,崔永毅等.

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。