XML_解析_Jsoup快速入门(jar包导入)

2022-07-27,,,

XML解析

概念:操作xml文档,将文档中的数据读取到内存中

  • 操作xml文档

    • 1.解析(读取):将文档中的数据读取到内存中。
    • 2.写入:将内存中的数据保存到xml文档中。持久化的存储
  • 解析xml的方式:

    • 1.DOM :将标记语言文档一次性加载进内存,在内存中形成一颗dom树

      • 优点:操作方便,可以对文档进行CRUD的所有操作
      • 缺点:占内存
    • 2.SAX:逐行读取,基于事件驱动的。

      • 优点:不占内存。
      • 缺点:只能读取,不能增删改
  • xml常见的解析器:
    1. JAXP:sun公司提供的解析器,支持dom和sax两种思想
    2. DOM4J:一款非常优秀的解析器
    3. Jsoup:jsoup 是一款Java 的HTML解析器,可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API,可通过DOM,CSS以及类似于jQuery的操作方法来取出和操作数据。
    4. PULL:Android操作系统内置的解析器,sax方式的。

Jsoup

Jsoup:jsoup 是一款Java 的HTML解析器,可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API,可通过DOM,CSS以及类似于jQuery的操作方法来取出和操作数据。

  • 快速入门
    • 步骤:
    1. 导入jar包
      链接:https://pan.baidu.com/s/1H-44lBJuUH0isBz8AlgmKg
      提取码:3ktf
    2. 获取Document对象
    3. 获取对应的标签Element对象
    4. 获取数据

案例演示

代码:

package cn.xml.jsoup;

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;

import java.io.File;
import java.io.IOException;

/**
 * Jsoup快速入门
 */
public class JsoupDemo1 {
    public static void main(String[] args) throws IOException {
        //1.导入jar包
        //2.获取Document对象,根据xml文档获取
        //2.1获取student.xml的path
        String path = JsoupDemo1.class.getClassLoader().getResource("student.xml").getPath();
        //2.2解析xml文档,加载文档进内存,获取dom树--->Document
        Document document = Jsoup.parse(new File(path), "utf-8");
        //3.获取元素对象Element
        Elements elements = document.getElementsByTag("name");

        System.out.println(elements.size());

        //3.1获取第一个name 的Element对象
        /*Element element = elements.get(0);
        //3.2获取数据
        String name = element.text();
        System.out.println(name);*/

        for (Element element : elements) {
            System.out.println(element.text());
        }
    }
}

<?xml version="1.0" encoding="UTF-8" ?>

<students>
 	<student number="ky_0001">
 		<name>tom</name>
 		<age>18</age>
 		<sex>male</sex>
 	</student>

	<student number="ky_0002">
		<name>lisi</name>
		<age>24</age>
		<sex>male</sex>
	</student>
		 
</students>

运行结果:

本文地址:https://blog.csdn.net/weixin_44664432/article/details/110197566

《XML_解析_Jsoup快速入门(jar包导入).doc》

下载本文的Word格式文档,以方便收藏与打印。