xml数据修复与转换的研究

xml数据修复与转换的研究

ID:33097608

大小:6.03 MB

页数:67页

时间:2019-02-20

xml数据修复与转换的研究_第1页
xml数据修复与转换的研究_第2页
xml数据修复与转换的研究_第3页
xml数据修复与转换的研究_第4页
xml数据修复与转换的研究_第5页
资源描述:

《xml数据修复与转换的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、指导小组成员名单汪卫教授张党教授谈子敬副教授目录1前言11.1数据修复11.2数据转换21.3主要贡献71.4相关工作82XML相关概念112.1XML112.2DTD112.2.1键122.3路径和函数依赖132.4映射143数据修复的问题定义184数据修复224.1基于超图的初始修复224.2完全修复254.3数据修复的实现285数据转换的问题定义和映射语言306数据转换346.1提取数据346.2转换371G.3合并导出396.4数据转换的实现417实验457.1数据修复45

2、7.1.1实验设置457.1.2实验结果467.2数据转换507.2.1实验设置507.3实验结果507.3.1效率和扩展性527.3.2比较538总结549参考文献5510致谢6111论文发表622摘要本文主要研究XML数据转换的问题,主要有两个方面:一个是数据质量的问题,另一个是不同模式间模式映射定义及转换实现的问题。在进行转换之荊要确保数据中没有违反约束的冲突,否则数据转换会失败,所以要先对数据进行修复。我们利用函数依赖来描述数据的一致性,能过修复结点的值进行修复,并为每一个结点赋一个权值,修复代价即

3、是所修改的结点的权值之和。我们采用了两步启发式的方法进行修复,第一步我们利用超图来表示冲突,并修复超图的顶点集覆盖;第二步我们修复冲突的结点和与冲突结点相关的结点,以防止不会有新的冲突产生。修复之后,我们再对修复的结果进行转换。在XML数据转换的工作中,我们主要对现有的基于treepattern的映射语言进行增强,加入集合,使其能表达结点数量不固定的情况。然后提出了路径查询语言,其可以操作在SAX流上,又可以将映射语言转换成路径査询语句;通过路径査询语句,只需一遍遍历即可获取所需的所有数据;通过三步进行数据转换:提取数据、转换数据、合并

4、数据。由于釆用SAX流,数据转换可以处理大规模的数据。实验结果表明我们的数据修复和数据转换算法都有很好的效率和扩展性,而且数据修复算法有很好的准确性。关键词:修复,函数依赖,超图,数据转换,映射,树模式AbstractWestudytheproblemofXMLdataexchange,ithastwoaspects,first,thequalityofthedata,thenthemappingofdifferentschemasandtheimple?mentation.Beforedataexchange,weneedtoensu

5、rethatthedataiscleanaccordingtofunctionaldepenencies.otherwisethedataexchangewillfail,sowerepairxmlfirst,weuseXMLfunctionaldependencytodescribedatacon?sistency,andrepairviolationsbyvaluemodifications.AndassignsaweighttoeachleafnodeintheXMLdocument,andthecostofarepairisme

6、asuredbythetotalweightofthemodifiednodes.Weprovideanefficienttwo-stepheuristicmethodtorepairXMLfunctionaldependencyviolations.First,theinitialviolationsarecapturedandfixedbyleveragingtheconflicthypergraph.Second,theremainingconflictsareresolvedbymodifyingtheviolatingnode

7、sandtheirrelatednodescalleddeterminants,inawaythatguaranteesnonewviolations.Thenweprocessdataexchangeontherepairedresult,inourworkofdataexchange,weenhancethemappinglanguagewhichisbased011treepattern,weaddthesupportofsettothemapping,soitcanexpressthenodeswhosenumberisnotf

8、ixed.Thenweintroducethe"pathquerylanguage".whichcanworksonSAXstream,andmappingscanbeeasilyconvertedtoth

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。