XML

官方文档：https://www.w3school.com.cn/xml/index.asp

1.为什么需要xml？

xml技术用于解决什么问题？

解决程序间数据传输的问题：

比如qq之间的数据传送，用xml格式来传输数据，具有良好的可读性，可维护性

以前两个程序间的通信用xml作为数据通信的格式，现在一般用json

xml可以做配置文件

xml做配置文件可以说是非常的普遍，比如我们的tomcat服务器的server.xml web.xml

xml可以充当小型的数据库

我们程序中可能用到的数据，如果放在数据库中读取不合适（因为你要增加维护数据库工作），可以考虑直接用xml文件来做小型数据库，而且直接读取文件显然要比读取数据库快

现在也不太使用xml作数据存储了

2.xml语法

快速入门

需求：使用idea创建Students.xml存储多个学生信息

<?xml version="1.0" encoding="UTF-8" ?>

<!--    1.xml：表示该文件的类型为xml

        2.version 表示版本

        3.encoding="UTF-8" 文件编码为UTF-8

        4.students：root元素/根元素，名字自己定义

        5.<student> </student>表示一个students的子元素，可以有多个

        6.id就是属性，name，age，gender是student元素的子元素

    -->

<students>

    <student id="100">

        <name>jack</name>

        <age>10</age>

        <gender>男</gender>

    </student>

    <student id="200">

        <name>Mary</name>

        <age>18</age>

        <gender>女</gender>

    </student>

</students>

一个xml文档分为如下几部分内容

文档声明
元素
属性
注释
CDATA区、特殊字符

2.1文档声明

<?xml version="1.0" encoding="UTF-8" ?>

2.2元素

元素语法要求：

每个xml文档必须有且只有一个根元素
根元素是一个完全包括文档中其他所有元素的元素
根元素的起始标记要放在所有其他元素的起始标记之前
根元素的结束标记要放在所有其他元素的结束标记之后

xml元素指xml文件中出现的标签，一个标签分为开始标签和结束标签，一个标签有如下几种书写形式

包含标签体：<a>www.baidu.com</a>

不含标签体：<a></a>，简写为<a/>

一个标签中也可以嵌套若干子标签。但所有的标签必须合理地嵌套，绝对不允许交叉嵌套

<P>

<p>

:

2.3属性

属性介绍：

属性值用双引号""或单引号''分隔（如果属性值中有单引号''，就用双引号""分隔，如过属性值中有双引号""，就用单引号''分隔）

一个元素可以用多个属性，它的基本格式为：<元素名属性名="属性值">

特定的属性名称在同一个元素标记中只能出现一次

即属性名称在同一个元素中不能重复

属性值不能包括&字符

2.4注释

--

<Name >TOM</Name>

2.5CDATA节

有些内容不想让解析引擎执行，而是当做原始内容（普通文本）处理，可以使用CDATA括起来，CDATA节中的所有字符都会被当做简单文本，而不是xml标记

语法：

<![CDATA[这里可以把你输入的字符原样显示，不会解析xml]]>

可以输入任意字符（除]]>外）

不能嵌套

例子

<?xml version="1.0" encoding="UTF-8" ?>

<students>

    <student>

        <code>

            <!--如果希望把某些字符串当做普通文本使用，就用CDATA括起来-->

            <![CDATA[

            <script data-compress=strip>

            function h(obj){

            alert("一段js代码");

            }

            </script>

            ]]>

        </code>

    </student>

</students>

3.转义字符

对于一些单个字符，若想显示其原始样式，也可以使用转义的形式予以处理

例子

<?xml version="1.0" encoding="UTF-8" ?>

<students>

    <student>

        <name>jack</name>

        <age>10</age>

        <gender>男</gender>

        <!--转义字符表示一些特殊的字符-->

        <resume>年龄&lt;&gt;&amp;</resume>

    </student>

</students>

小结：

遵循如下规则的xml文档称为格式正规的xml文档：

<?xml version="1.0" encoding="UTF-8" ?>

4.DOM4j

4.1xml解析技术原理和介绍

xml技术原理

DOM （Document Object Model，文档对象模型）定义了访问和操作文档的标准方法。

xml解析技术介绍

早期 JDK 为我们提供了两种xml的解析技术：DOM和Sax

这两种技术已经过时，简单了解即可

第三方的XML解析技术

4.2dom4j介绍

dom4j是一个简单、灵活的开放源代码的库（用于解析/处理xml文件）。dom4j是由早期开发JDOM的人分离出来后独立开发的。

与JDOM不同的是，dom4j使用接口和抽象基类，虽然dom4j的API相对要复杂一些，但他提供了比JDOM更好的灵活性

Dom4j是一个非常优秀的Java XML API，具有性能优异、功能强大和极易使用的特点。现在很多软件采用的dom4j

使用dom4j开发，需要下载dom4j对象的jar文件

dom4j的jar包下载地址（内有使用案例）：dom4j

官方api文档：Overview (dom4j 1.6.1 API)

4.3dom4j获得document对象的方式

开发dom4j要导入dom4j的jar包

DOM4j中，获得document对象的方式有三种：

读取XML文件，获得document对象

SAXReader reader = new SAXReader();//创建一个解析器

Document document = reader.read(new File("src/input.xml"));//XML Document

解析XML形式的文本，得到document对象

String text = "<members></members>";//直接对一个字符串的xml文本进行解析

Document document = DocumentHelper.parseText(text);

主动创建document对象

Document document = DocumentHelper.createDocument();//创建根节点

Element root = document.addElement("members");

下面只演示方式一的使用：读取XML文件，获得document对象

dom4j应用实例-读取XML文件，获得document对象

使用dom4j对students.xml文件进行增删改查

重点讲解查询（遍历和指定查询）
xml增删改使用少，作为拓展，给出案例

引入dom4j的依赖的jar包

在src文件下创建Dom4j_类以及students.xml文件

students.xml:

<?xml version="1.0" encoding="UTF-8" ?>

<students>

    <student id="01">

        <name>小龙女</name>

        <gender>女</gender>

        <age>16</age>

        <resume>古墓派掌门人</resume>

    </student>

    <student id="02">

        <name>欧阳锋</name>

        <gender>男</gender>

        <age>18</age>

        <resume>白驼山弟子</resume>

    </student>

</students>

Dom4j_.java:

import org.dom4j.Document;

import org.dom4j.DocumentException;

import org.dom4j.io.SAXReader;

import org.testng.annotations.Test;

import java.io.File;

public class Dom4j_ {

    /**

     * 演示如何加载xml文件

     */

    @Test

    public void loadXML() throws DocumentException {

        //得到一个解析器

        SAXReader reader = new SAXReader();

        //debug-->看看document对象的属性

        Document document = reader.read(new File("src/students.xml"));

        System.out.println(document);

    }

}

如下：在Document document=reader.read(new File("src/students.xml"));处打上断点：

点击debug，点击step over，可以看到document对象，它代表整个文档。

展开document对象，rootElement代表的就是students根元素

rootElement下面有一个content属性，content属性存储着所有的elementData

点击elementData属性，可以看到该属性有5个对象：

和html-dom解析一样，这五个对象中有三个是换行符号\n，其余的两个才是根元素下面的子元素student

点击展开索引为1的元素对象（即student元素），可以看到该元素对象中又包含了9个对象，除了换行符之外，其余的对象就是student元素的子元素，name节点，gender节点，age节点和resume节点

点击name节点，展开，即可看到name节点的值

document对象的整体结构为：

1.方式一遍历

演示案例1：遍历xml指定元素

import org.dom4j.Document;

import org.dom4j.DocumentException;

import org.dom4j.Element;

import org.dom4j.io.SAXReader;

import org.testng.annotations.Test;

import java.io.File;

import java.util.List;

public class Dom4j_ {

    /**

     * 遍历所有的student信息

     */

    @Test

    public void listStus() throws DocumentException {

        //得到一个解析器

        SAXReader reader = new SAXReader();

        Document document = reader.read(new File("src/students.xml"));

        //1.得到rootElement

        Element rootElement = document.getRootElement();

        //2.得到rootElement的student节点

        List<Element> students = rootElement.elements("student");

        System.out.println(students.size());//2

        for (Element student : students) {//student就是student节点/元素

            //获取student节点的name节点

            Element name = student.element("name");//因为name只有一个，这里用element方法

            Element age = student.element("age");

            Element gender = student.element("gender");

            Element resume = student.element("resume");

            System.out.println("学生信息=" + name.getText() + " " +

                    age.getText() + " " + gender.getText() + " " + resume.getText());

        }

    }

}

2.方式一查询

案例2：读取指定xml元素

import org.dom4j.Document;

import org.dom4j.DocumentException;

import org.dom4j.Element;

import org.dom4j.io.SAXReader;

import org.testng.annotations.Test;

import java.io.File;

public class Dom4j_ {

    /**

     * 指定读取第一个学生的信息

     */

    @Test

    public void readOne() throws DocumentException {

        //得到一个解析器

        SAXReader reader = new SAXReader();

        Document document = reader.read(new File("src/students.xml"));

        //1.得到rootElement

        Element rootElement = document.getRootElement();

        //2.获取第一个学生

        Element student = (Element) rootElement.elements("student").get(0);

        //3.输出该学生的信息

        System.out.println("学生信息=" +

                student.element("name").getText() + " " +

                student.element("age").getText() + " " +

                student.element("gender").getText() + " " +

                student.element("resume").getText());

        //4.获取student元素的属性

        System.out.println("id="+student.attributeValue("id"));

    }

}

如果想要省略层层取元素的步骤，直接在根节点取出指定的元素，可以使用xpath(https://dom4j.github.io/#xpath)

day08-XML

XML

1.为什么需要xml？

2.xml语法

2.1文档声明

2.2元素

2.3属性

2.4注释

2.5CDATA节

3.转义字符

4.DOM4j

4.1xml解析技术原理和介绍

4.2dom4j介绍

4.3dom4j获得document对象的方式

1.方式一遍历

2.方式一查询

3.方式一增删改

day08-XML的相关教程结束。

相关推荐

Redis序列化使用XML还是JSON

怎么使用Scala进行XML处理

VB中如何使用XML进行数据交换

SpringBoot集成JmsTemplate(队列模式和主题模式)及xml和JavaConfig配置详解

spring中怎么利用xml装配bean

Mybatis在Xml中如何处理大于号和小于号

MyBatis中XML映射配置文件的示例分析

python如何实现XML解析