基于边缘检测的视频字幕自动定位方法

ID：10154506

大小：27.00 KB

页数：5页

时间：2018-06-11

资源描述：

《基于边缘检测的视频字幕自动定位方法》由会员上传分享，免费在线阅读，更多相关内容在学术论文-天天文库。

1、基于边缘检测的视频字幕自动定位方法[摘要]视频中的字幕蕴含丰富的语义信息，字幕检测方法对视频检索就尤为重要。因此，提出了一种高效率的方法对视频中的字幕完成自动检测与定位。对输入的图像进行锐化预处理，突出字幕区域的信息，求取经锐化处理后图像的最佳分割阀值，结合最佳分割阀值进行边缘检测得到二值图，很好的分离了字幕区域与背景区域。运用形态学处理使文字连接成块，最后依据文字的先验特征去除干扰区域。实验证明，该方法复杂程度低，能准确的定位字幕区域。[关键词]视频字幕；字幕检测；边缘检测；数学形态学；中图分类号：TP391.41文献

2、标识码：A文章编号：1009-914X（2014）41-0139-01随着多媒体技术在互联网上的高速发展，视频在人们的日常生活中己经成为不可或缺的一部分。迫切地需要一种有效的方法对视频进行管理、索引和检索。由于这种需求，基于图像、声音等各种视频信息检索的方法被大量提出，其中，视频中的字幕信息对于视频的检索有着十分重要的意义。本文针对运用边缘算法提取视频字幕生成二值图像时，需要设定经验阈值，通用性差的缺点，提出一种结合图像预处理及最佳阀值分割的视频字幕检测算法。1字幕区域提取方法描述51.1字幕提取流程为了便于人眼识别，视

3、频中后期制作加入的文字一般具有下述特性：文字颜色与背景有较大差别，具有比较丰富的边缘信息；文字均具有一定规格尺寸；文字的分布比较集中且多为水平方向排列；任意一个文字区域都包含多个文字。正是基于以上特征，本研究设计了一种方法来检测视频中的文本区域，步骤如下：（1）输入彩色图像，做灰度化处理；（2）使用二阶拉普拉斯算子做锐化处理；（3）用最小误差法求图像的分割阀值T；（4）用sobel算子结合阀值T做边缘检测；（5）将边缘图用数学形态学连通为区域；（6）文字区域进行粗筛选；（7）文字区域进行细筛选，确定文字区域；1.2输入图

4、像的预处理在处理彩色图像前先把彩色图像转化为灰度图像，一般常用的有R、G、B三色等权和不等权两种变换，本方法采用不等权策略。由于拉普拉斯算子是微分操作符，对输入的灰度图像滤波，可以突出灰度值快速变化的区域，可以使图像锐化。对于文字提取来说，边缘图像的二值化至关重要。阀值过大，会减少文字的边缘信息。阀值过小，会使保留较多的非文字边缘，使误检增多。本文采用最小误差法求阈值。求得增强后图像？（x，y）的最佳分割阈值为T。5本文使用sobel边缘检测算子。Sobel算子两个模板组成，分别用来检测图像中的垂直边缘和水平边缘。将两个

5、模板与图像卷积得到的最大值作为该点的边缘响应值输出。得到图像的边缘图，与图像的最佳分割阈值T比较，大于T的点赋值逻辑值1输出，小于T的点赋值0输出，最后生成二值图像。1.3形态学处理形态学是一种非线性信号处理和分析的工具，应用在图像上，它可将图像信号与其几何形状联系起来，利用一定形态的结构元素度量和提取图像中的对应形状和结构，可以简化图像。基本概念是腐蚀、膨胀、开、闭运算。本文中使用五次闭运算，两次开运算，三次膨胀运算可有效的将边缘图像连接成候选的连通区域。1.4字幕区域粗筛选在经过形态学处理后，在通过文字区域的启发性规

6、则就能剔除虚假的文本区域，得到精确的文本区域。其中主要用到字幕区域的宽度、面积、中心、宽高比、饱和度[7]。宽度：为了清晰显示，提出的高度标准是边界窗的高度必须高于10个像素。面积：字幕连通域的面积大于一个经验阈值150。中心：连通域最小外接矩形的中心。中心大于二分之一倍宽度。5宽高比：最小外接矩形宽度和高度的比例，宽高比大于1而小于50。饱和度：连通域内已填充像素数占最小外接矩形的比例。设置饱和度阈值为0.4.1.5字幕区域细筛选根据字幕的先验知识，能排除掉大部分虚假连通域，但仍会有少量的连通域误检出来。为进一步提高准

7、确率。设计如下思路：将检测出的连通域的位置信息映射回二值图像，对二值图相应位置进行水平方向投影，因为字幕通常由水平的几个字符组成，边缘信息比其他区域丰富，选取出水平投影均值最大的默认为字幕区。非字幕区零散且无规律，对未达到默认字幕区的50%的其他区域予以排除。最后得到满足条件的连通域的位置信息，映射回到原图上。2结束语通过大量的实验，证明本方法的普适性和鲁棒性，为解决一般边缘检测方法效率低，提出一种先对图像做锐化预处理，突出字幕区域信息的方法。在用sobel算子对图像做边缘检测时，解决了需要人为设定经验阀值生成二值图像的

8、问题。以最小误差法求取的值作为边缘图二值化的阈值，可以分离出字幕区与背景区域。运用数学形态学使文字区域连通为块，根据文字的先验规则去排除非字幕区。参考文献5[1]蔡波，周洞汝，胡宏斌.数字视频中字幕检测及提取的研究和实现[J].计算机辅助设计与图形学学报，2003（7）：898-903.[2]万罡，周洞汝，崔永毅等.

当前文档最多预览五页，下载文档查看全文

侵权申诉



1 1 2 3 4 5 / 5



此文档下载收益归作者所有

当前文档最多预览五页，下载文档查看全文

温馨提示：
1. 部分包含数学公式或PPT动画的文件，查看预览时可能会显示错乱或异常，文件下载后无此问题，请放心下载。
2. 本文档由用户上传，版权归属用户，天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容，确认文档内容符合您的需求后进行下载，若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误，付费完成后未能成功下载的用户请联系客服处理。

基于边缘检测的视频字幕自动定位方法

基于边缘检测的视频字幕自动定位方法

相关文章

相关标签