基于xml+schema的xml数据流压缩技术研究

基于xml+schema的xml数据流压缩技术研究

ID:33361276

大小:2.23 MB

页数:54页

时间:2019-02-25

基于xml+schema的xml数据流压缩技术研究_第1页
基于xml+schema的xml数据流压缩技术研究_第2页
基于xml+schema的xml数据流压缩技术研究_第3页
基于xml+schema的xml数据流压缩技术研究_第4页
基于xml+schema的xml数据流压缩技术研究_第5页
资源描述:

《基于xml+schema的xml数据流压缩技术研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、内蒙古科技大学硕士学位论文摘要随着现代化社会逐步迈向信息化,在互联网迅速发展的推动下,产生了大量的各种形式的信息。长期以来建立的孤立、自主、异构的信息已经无法满足Intemet时代人们对这些信息的共享和进行数据交换的迫切需要。近年来出现的XML(eXtensiblemarkuplanguage)成为了Intemet以及电子商务中进行数据交换和表示事实上的标准,与之相关的ⅪⅥL数据流技术也相继出现。XML数据流压缩即是研究的热点问题之一,数据流不同于传统的、静态的、持久稳定的关系数据,它是动态的、快速连续的,因此传统的对XML文档、数据的压缩方法将不能满足数据流环

2、境的要求。因为传统的压缩方法一般需要扫描数据两边甚至多遍来分析数据的结构,然后才进行压缩,而此种方式对于网络中的数据流而言将造成极大的延迟。因此,如何有效地完成XML数据流的压缩以节省储存空间,降低传输代价,同时如果能支持对压缩的XML数据流的进行直接查询处理以避免解压缩操作对系统资源的消耗,成为一个迫切需要解决的问题和研究方向。本文从分析XML数据流运行环境的特点和XML数据本身结构开始,将XMLSchema作为可以提高压缩效率和压缩比率的入口。.XMLSchema是W3C于2001年正式推荐使用的“X晰L规范标记语言’’。XMLSchema作为XML的约束,

3、已经得到越来越广泛的应用。在XML数据流所满足的XMLSchema中包括所有XML数据流中元素类型的定义。所以在数据流处理之前,可以先分析XMLSchema,获取XML数据流中出现的结构事件序列,进而确定元素事件序列的编码,完成XML数据流的压缩。这样虽然不如先进行一遍扫描获得的元素事件序列频率准确,但是这种方法不需要扫描数据流就可以得到相对准确的元素事件序列频率,压缩过程可以只进行一遍扫描,适合网络的XML数据流环境。最后通过对本文提出的压缩进行了测试实验和性能分析,从实验结果看,此压缩算法在压缩效率和压缩比率上要优于传统算法。关键词:XML数据流;XML模式

4、;动态哈夫曼;解析;压缩内蒙古科技大学硕士学位论文AbstractWimthemodeminformationsocietyisgraduallymovingtowardstheIntemet,resultinginalargenumberofvariousformsofinformationdrivenbyrapiddevelopment.Theseisolated,independent,heterogeneousinformationgenerated证alongperiodhavebeenunabletomeettheIntemeteraofspatia

5、linformationsharinganddataexchangeneeds.XML(eXtensiblemarkuplanguage)emerginginrecentyearshasbecometheIntemetande-commercedataexchangeandthatthedefactostandard,theXMLdatastreamtechnology,ThecompressionofXMLdatastreanlisoneofthehotresearches.Datastreamisdifferentfromthetraditional,sta

6、tic,stableandlastingrelationshipbetweenthedata,itisdynamic,fastcontinuous.SothetraditionalcompressionmethodoftheXMLdocument,datacannotmeettherequirementsofthedatastreamenvironment.Thetraditionalcompressionmethodneedtwo·-SCandataandevenmultiple·-SCantoanalyzethestructureofthedatabefor

7、ethecompression,andinthiswayforthenetworkintermsofthedatastreamwillcauseagreatdelay.Therefore,howtoeffectivelycompletethecompressionofXMLdatastreamtosavestoragespaceandreducetransmissioncosts,atthesametimeifweCansupportcompressionofXMLdatastreamsdirectlyquerypmcessinginordertoavoidde

8、compressiono

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。