暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

XML介绍

敲代码的人 2019-07-15
280

XML: eXtensible Markup Language 可扩展标记语言 version="1.0"

  • 可扩展:所有的标签都是自定义的 

  • 功能:数据的存储,配置文件和数据传输


XML和HTML的区别

  1. html语法松散,xml语法严格

  2. html做页面展示,xml做数据存储

  3. html所有标签都是预定义的,xml所有标签都是自定义的


xml语法:

文档声明

  1. 必须写在XML文档的第一行

  2. 写法:<?xml version="1.0" ?>

  3. 属性:version:版本号 固定值 1.0,

    1.    encoding:指定文档的码表。默认值为 iso-8859-1,

         standalone:指定文档是否独立  yes 或 no

  

元素:xml文档中的标签

  1. 文档中必须有且只能有一个根元素

  2. 元素需要正确闭合。<body></body> <br/>

  3. 元素需要正确嵌套      

  4. 元素名称要遵守:元素名称要遵守:元素名称要遵守:元素遵守:名称区分大小写,数字不能开头


文本:

  1. 转义字符:&gt;

  2. CDATA: 里边的数据会原样显示--- <![CDATA[ 数据内容 ]]>


属性:

  1. 属性值必须用引号引起来。单双引号都行


注释:

  1. <!-- -->


处理指令:现在基本不用

  1. <?xml-stylesheet type="text/css" href="1.css"?>

<?xml version="1.0" encoding="UTF-8"?><!--声明  -->
<!-- books根标签 -->
<books>
<!-- book元素 -->
<!-- number属性 -->
<book number="s001">
<name>java</name>
<price>35</price>
</book>
<book>
<name>c++</name>
<price>35</price>
<![CDATA[ if(2>1){} ]]>
</book>
</books>
复制



XML约束:就是xml的书写规则

dtd约束:

  1. 内部dtd:在xml内部定义dtd

  2. 本地dtd文件:<!DOCTYPE students SYSTEM  "student.dtd">

  3. 网络dtd文件:<!DOCTYPE students PUBLIC "名称空间"  "student.dtd">


对标签和属性进行约束 ,这种dtd的方式不严谨

<!ELEMENT students (student*) >
<!ELEMENT student (name,age,sex)>
<!ELEMENT name (#PCDATA)>
<!ELEMENT age (#PCDATA)>
<!ELEMENT sex (#PCDATA)>
<!ATTLIST student number ID #REQUIRED>
复制

<?xml version="1.0" encoding="UTF-8" ?>
<!DOCTYPE students SYSTEM "student.dtd">


<students>
<student number="s0001" >
<name>zs</name>
<age>abc</age>
<sex>yao</sex>
</student>
</student
复制



schema约束:

  1. 编写根标签

  2. 引入实例名称空间 xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"

  3. 引入名称空间 xsi:schemaLocation="http://www.itcast.cn/xml student.xsd"

  4. 引入默认的名称空间

<?xml version="1.0"?>
<!-- namespace给xml文档引用 -->
<!--xmlns:xsd="http://www.w3.org/2001/XMLSchema"
固定写法,xsd:string解析是就能认出是string类型
-->
<xsd:schema xmlns="http://www.langlihuge.cn/xml"
xmlns:xsd="http://www.w3.org/2001/XMLSchema"
targetNamespace="http://www.langlihuge.cn/xml" elementFormDefault="qualified">
<!-- 这个也是namespace给xml文档引用 -->
<!-- 约束根标签students,别名 studentsType-->
<xsd:element name="students" type="studentsType"/>
<!-- 约束复杂标签,就是students -->
<xsd:complexType name="studentsType">
<!-- 序列,按顺序出现 -->
<xsd:sequence>
<!-- minOccurs最小0此,最大无限次 -->
<xsd:element name="student" type="studentType" minOccurs="0" maxOccurs="unbounded"/>
</xsd:sequence>
</xsd:complexType>
<!-- 对student约束 -->
<xsd:complexType name="studentType">
<!-- 序列,name,age,sex顺序出现 -->
<xsd:sequence>
<!-- 对三个简单的约束说明 -->
<xsd:element name="name" type="xsd:string"/>
<xsd:element name="age" type="ageType" />
<xsd:element name="sex" type="sexType" />
</xsd:sequence>
<!-- 对属性的约束 -->
<xsd:attribute name="number" type="numberType" use="required"/>
</xsd:complexType>
<!-- 对sex约束 -->
<xsd:simpleType name="sexType">
<!-- String类型,只有male,和female两种 -->
<xsd:restriction base="xsd:string">
<xsd:enumeration value="male"/>
<xsd:enumeration value="female"/>
</xsd:restriction>
</xsd:simpleType>
<!-- 对age标签的约束 -->
<xsd:simpleType name="ageType">
<!-- xsd:integer类型0-256之间 -->
<xsd:restriction base="xsd:integer">
<xsd:minInclusive value="0"/>
<xsd:maxInclusive value="256"/>
</xsd:restriction>
</xsd:simpleType>
<xsd:simpleType name="numberType">
<!-- String类型,已lianglihuge_后面根四个数字 -->
<xsd:restriction base="xsd:string">
<xsd:pattern value="langlihuge_\d{4}"/>
</xsd:restriction>
</xsd:simpleType>
</xsd:schema>
复制

xml文档

<?xml version="1.0" encoding="UTF-8" ?>
<students
xmlns="http://www.itheima.cn/xml"
xsi:schemaLocation="http://www.langlihuge.cn/xml student.xsd"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
<!--
xmlns:langligehuc="http://www.itheima.cn/xml"
相当于取一个别名
<langligehu:student number="itheima_1001">
<name>asfd</name>
<age>12</age>
<sex>male</sex>
</langligehu:student>
-->
<student number="itheima_1001">
<name>asfd</name>
<age>12</age>
<sex>male</sex>
</student>
</students>
复制



XML解析:

 如果xml作为配置文件:读取

如果xml作为传输文件:写,读


xml解析思想:

     DOM:将文档加载进内存,形成一颗dom树(document对象),将文档的各个组成部分封装为一些对象,Document,Element,Text,Attribute,Comment

优点:因为,在内存中会形成dom树,可以对dom树进行增删改查。

缺点:dom树非常占内存,解析速度慢。


     SAX:逐行读取,基于事件驱动

优点:不占内存,速度快

缺点:只能读取,不能回写



XML常用解析器:

JAXP:sun公司提供的解析。支持dom和sax。

JDOM:

 DOM4J:dom for java民间方式,但是是事实方式。非常好。  支持dom

步骤:

  1. 导入jar包 dom4j.jar

  2. 创建解析器SAXReader reader = new SAXReader();

  3. 解析xml 获得document对象 Document document = reader.read(url); 


<?xml version="1.0" encoding="UTF-8"?>
<书架>
< 出版社="浪里虎哥">
<书名>java</书名>
<作者>huge</作者>
<单价>10</单价>
<批发价>20</批发价>
</>
<>
<书名>C++</书名>
<作者>huge</作者>
<单价>10</单价>
</>
</书架
复制

public class TestDom4j {
@Test// 1、得到某个具体的节点内容:第2本书的书名--》葵花宝典
public void test1() throws DocumentException{
SAXReader reader = new SAXReader();//创建一个xml解析对象
Document document = reader.read("src/Book.xml");//把xml文档加载到document对象中
Element root = document.getRootElement();
/* Element bookNode = root.element("书");
System.out.println(bookNode.getName());*/
List list = root.elements();//得到当前节点的所有子节点
Element secondBook = (Element) list.get(1);//得到第二本书对象
String name = secondBook.element("书名").getText();//得到当前节点的文本内容
System.out.println(name);
}

@Test // 2、遍历所有元素节点
public void test2() throws DocumentException{
SAXReader reader = new SAXReader();//创建一个xml解析对象
Document document = reader.read("src/Book.xml");//把xml文档加载到document对象中
Element root = document.getRootElement();
treeWalk(root);
}


private void treeWalk(Element ele) {
System.out.println(ele.getName());//输出当前节点的名子
for (int i = 0; i < ele.nodeCount(); i++) {//ele.nodeCount()得到当前节点的所有子节点的数量
Node node = ele.node(i);//取出下标为i的节点
if(node instanceof Element){//判断当前节点是否为标签
treeWalk((Element)node);//把node强转为标签(Element)
}else{
System.out.println(node.getText());
}
}
}
复制


 XPATH:专门用于查询

定义了一种规则。

使用的方法:selectSingleNode(),selectNodes():

使用步骤:

  1. 注意:要导包 jaxen-1.1-beta-6.jar

  2. 创建解析器SAXReader reader = new SAXReader();

  3. 解析xml 获得document对象 ,Document document = reader.read(url);

public class TestXPath {
@Test
public void test() throws Exception{
SAXReader read = new SAXReader();
Document document = read.read("src/Book.xml");
Node node = document.selectSingleNode("/书架/书[2]/书名");
System.out.println(node.getText());
}

@Test
public void test2() throws Exception{
SAXReader read = new SAXReader();
Document document = read.read("src/Book.xml");
List list = document.selectNodes("//*");
for (int i = 0; i < list.size(); i++) {
Node node = (Node)list.get(i);
System.out.println(node.getName()+"\t"+node.getText());
}
}
}
复制


XPath:

// nodename 选取此节点。

// / 从根节点选取。

// // 从匹配选择的当前节点选择文档中的节点,而不考虑它们的位置。

// .. 选取当前节点的父节点。

// @ 选取属性。

//      [@属性名]    属性过滤

//      [标签名]     子元素过滤


文章转载自敲代码的人,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论