xml 012 使用dom解析xml文档

xml 012 使用dom解析xml文档

ID:36040169

大小:4.92 MB

页数:16页

时间:2019-04-30

xml 012 使用dom解析xml文档_第1页
xml 012 使用dom解析xml文档_第2页
xml 012 使用dom解析xml文档_第3页
xml 012 使用dom解析xml文档_第4页
xml 012 使用dom解析xml文档_第5页
资源描述:

《xml 012 使用dom解析xml文档》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、使用DOM解析XML文档一、XML解析我们已经学会了如何写XML,包括用DTD去验证XML如何用Schema去验证XML。这些东西非常重要,解析同样是非常重要。解析就涉及到程序了。如何通过java代码去处理XML,如何给你一个xml把你想要的东西给提取出来。二、DOM和SAX图解说:左边是我们的XML应用程序,右边是我们的XML文档。我们程序是不会跟文档直接打交道,是通过中间有个程序,叫XML分析器,这个分析器会读取这个文档,文档只要被分析器所读取到之后,我们就可以通过分析器向我们提供的DOM这样的接口,或者是SAX提供的接口从XML解析器里面将

2、我们需要的内容提取出来。这就是XML解析器的一个大体的思路。通过一个分析器,分析器有很多种,通过分析器将XML里面的内容从分析器里面给提取出来。提取出来之后,内容已经解析出来,想怎么做都可以了。W3C制定了一大套书写XML分析器的标准接口规范—DOM.除此之外,XML_DEV邮件列表中的成员根据应用的需求也自发地定义了一套对XML文档进行操作的接口规范——SAX。这两种接口规范各有侧重,互有长短,应用都比较广泛。DOM:DocumentObjectModel(文档对象模型)SAX是民间的,DOM是官方的。DOM解说:DOM主要是基于一种树形的模型

3、。XML文档本身是一个树形,是一棵树,DOM也是按照这种树形结构来去处理的。所以它跟我们的XML文档是非常吻合的。是完全一致的。对于DOM来说,它的解析方式是这样的,首先它读取XML文档,然后在我们内存里面形成一棵树形的结构。这个结构就反映出了XML文档的结构。接下来,我们就可以遍历这棵树,比如说从顶点遍历的,然后到它的子节点,每一个节点可以认为是一个元素,从节点里面我们提取出来元素的内容。元素的属性等等。都可以拿到。所以DOM的处理方式是跟XML的本意是非常吻合的。但是DOM它有一个缺点,它需要将XML文档读到内存里面,如果这个文档相当大,肯定

4、内存消耗比较高。这就是它最大的一个缺点。文档是几百行这个没关系。如果几千行,上万行的XML文档,内存里面构造出来就是一个对象了,对象就要占用内存的。这么多对象构造出来之后,肯定会消耗大量的内存,这就是DOM的最大的一个缺陷。就因为这个缺陷,才产生出来SAX,SAX就没有这个缺陷。DOM的组成非常重要:对于XML应用开发来说,DOM就是一个对象化的XML数据接口,一个与语言无关,与平台无关的标准接口规范。解说:提到的都是接口。这个接口是由W3C这个协会,给我们定义好的,全都是接口,我们知道,接口是没有实现的。那么如何去实现呢?是由各个厂商根据W3C

5、它制定出来的接口,根据接口的描述把对应的实现类给我们提供出来。所以在java里面jdk里面所看到的那些东西,全都是接口。但是我们知道,接口自己是做不了事情的,一定要自己有实现类帮助,我们就完成的。与语言无关:也就是说,java还要实现DOM的这种接口规范。就按照它的那种定义实现方式,然后去把它实现出来,用java代码实现出来.那么其他的比如C#、.NET,它也要参照这个同样的接口用C#、.NET的代码去将它实现出来。接口都是一样的,但是实现的方式是不一样的。但是不同的实现方式,它们所完成的功能又都是一样的。这就是接口的含义。如何用DOM处理XML

6、图形解说:右边儿的图形是左边XML文档在内存里面的一个布局,是一种树形的,既然这个XML文档是一个树形结构,那么它在内存里面所形成的对象布局也是一种树形结构。那么怎么去访问它,可以从最上面开始。进入到根节点,往下走,走到子节点,往左边儿走,往右边儿走,到一个子节点之后,分支,从左往右走。这样就可以访问到我想访问的任何内容。这就是DOM的一个基本的思想。解说:根节点与根元素节点是两个不同的概念。根节点代表整个文档,就是Document,代表的是整个文档。它是访问XML,解析XML的一个入口。我们都要从根节点开始。去获取到这个XML文档所对应的Doc

7、ument对象。获取到这个对象之后,接下来才能去获得它的根元素,根元素得到了,逐层的递进。根元素节点代表文档的根元素,它代表一个节点而已。注意:要严格区分XML文档树中的根节点与根元素节点:根节点(DOCUMENT)代表的是XML文档本身,是我们解析XML文档的入口,而根元素节点则表示XML文档的根元素,它对应于XML文档的Root.最常见的节点类型1、元素:元素是XML的基本构件。典型地,元素可以有其它元素、文本节点或两者兼有来作为其子节点。元素节点还是可以有属性的唯一类型的节点。2、属性:属性节点包含关于元素节点的信息,但实际上,不认为它是元

8、素的子节点。3、文本:确切来讲,文本节点是:文本。它可以包含许多信息或仅仅是空白。4、较不常见的节点类型CDATA、注释、处理指令DOM

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。