基于小波压缩域的字符自动定位
Automatic character location in wavelet compressed domain
李晓华 沈兰荪
本文提出一种基于小波压缩域的图像/视频字符自动检测定位方法。对于基于小波变换的压缩格式图像/视频,仅部分解压即可实现具有复杂背景的字符区域定位。与其他定位方法相比,明显降低计算复杂度,对字符尺寸的鲁棒性,检测精度显著提高。初步实验结果验证了该方法的有效性和快速性。
Run_Length压缩算法的改进及C++的实现
全立新
针对传统的Run_Length压缩算法在应对极端数据时所遇到的问题,提出了改进极端数据影响的措施,采取调整计数长度和调整传统Run_Length算法的策略,不用特定字符作为压缩标志,而使用特殊字节位来用作压缩标志,并调整了区分计数字节和数据字节的方法,改进后的算法,大大提高了重复数据长度大于63和大于127的数据的压缩率,为Run_Length算法有针对性应用提供了改进方案,同时,给出了Run_Length压缩算法的C++程序代码。
最大频长积字符串及其高效查找算法
STRING WITH THE BIGGEST PFL AND EFFICIENT SEARCHING ALGORITHM
严铭清 陶晓鹏 胡运发
在传统的字符串处理算法中往往分别考虑字符串的频度和长度。然而,在实际应用中,将字符串的频度和长度结合考虑是有意义的。基于这点我们提出了频长积的概念,规定字符串的频度和长度的乘积为字符串的频长积。并基于广义后缀树和uk—konen算法,提出了时间复杂度为O(N)的查找算法。效率实验证实了该算法的高效性。语义实验表明,本算法找出的最大频长积字符串相比于最大频度字符串或最大长度字符串,其实际语义更为明确。这样的字符串在文本压缩、基因序列的分析以及其他注重语义的应用中将具有很高的应用价值。
压缩域互联网信息监测过滤仪关键技术研究
Research on Key Techniques of Compressed Domain Networking Information Surveillance and Filtering Instrument
沈兰荪 王素玉
针对互联网信息监测管理的需求,我们提出基于压缩域的网络信息监测过滤仪的概念,并从压缩域纹理信息的分类、轮廓提取、字符定位、肤色分割、人脸检测等几个方面对其所涉及的关键技术进行了广泛深入的研究,提出了一系列高效的压缩域图像处理算法,为监测过滤仪的进一步开发设计奠定了基础。
集合游程编码算法介绍与实验分析
Set Run Length Encoding Introduction and the Experiments Analysis
常传文 茅文深
游程编码是一种无损压缩算法,其简单、易于实现的特性也使它得到了广泛的应用。传统的游程编码选取固定的阈值区分特征字符和非特征字符,限制了压缩率的提高。从集合论的角度研究游程编码,提出了一种新的游程编码算法一集合游程,算法中不再使用阈值,而将全域字符划分成两个互不相交的集合,分别为特征字符和非特征字符,通过对特征字符进行合理的映射来表示连续出现次数,将游程编码算法的效率利用到了极限。最后,给出了集合划分的方法,并编程进行了验证,与原游程编码算法进行了比较。
一种高性能的字符串匹配硬件实现法
A High-performance Hardware Implementation of String Matching
姚小威 黄建 唐兴旺
随着网络技术的快速发展和Internet的普及,网络的安全性越来越受到重视,字符串匹配作为实现网络安全检测的核心技术和实现难点,也越发受到人们的关注。文章提出了一种基于分离武状态表的硬件实现法,吸取了AC算法中自动跳转状态机的思想.能实现线速并行的匹配且具有较少的硬件开销,是一种高性能的多模式串匹配实现法。
基于DCT压缩域的快速字符定位算法研究
A Fast Text Location Algorithm in DCT-Compressed Domain
孙慧平 刘党辉 沈兰荪
提出一种面向复杂背景JPEG压缩图像的快速字符定位算法.首先从部分解码后的DCT(Discrete Cosine Transform)数据中,提取出一种基于加权频率的字符区新特征,然后经过自适应阈值分类,采用基于二次投影及框融合算法的字符区分割方法,直接在DCT压缩域实现字符区的快速定位.实验表明,该算法可应用于实时或存储空间有限场合下的JPEG图像中的中、英文字符定位,准确率较高,且对图像的背景复杂度具有较好的鲁棒性.
基于字符的MTF压缩算法
胡元福
在前移(MTF)编码原理的基础上提出了一种基于字符的MTF压缩算法。结合游程长度编码技术,对文本文件取得了较好的压缩效果。