由于Python对XML读写有多种库,本文以xml.etree import ElementTree为例。

解析

from xml.etree import ElementTree as ET
############ 解析方式一 ############
# 打开文件,读取XML内容
str_xml = open('xo.xml', 'r').read()

# 利用ElementTree.XML将字符串解析成xml对象,root代指xml文件的根节点
root = ET.XML(str_xml)

操作XML

XML遍历

from xml.etree import ElementTree as ET
############ 解析方式二 ############
# 直接解析xml文件
tree = ET.parse("xo.xml")
# 获取xml文件的根节点
root = tree.getroot()

### 操作
# 顶层标签
print(root.tag)

# 遍历XML文档的第二层
for child in root:
    # 第二层节点的标签名称和标签属性
    print(child.tag, child.attrib)
    # 遍历XML文档的第三层
    for i in child:
        # 第二层节点的标签名称和内容
        print(i.tag,i.text)


# 遍历XML中所有的year节点
for node in root.iter('year'):
    # 节点的标签名称和内容
    print(node.tag, node.text)
    #修改:将year节点中的内容自增一
    new_year = int(node.text) + 1
    node.text = str(new_year)
    # 设置属性
    node.set('name', 'alex')
    node.set('age', '18')
    # 删除属性
    del node.attrib['name']

# 遍历data下的所有country节点
for country in root.findall('country'):
    # 获取每一个country节点下rank节点的内容
    rank = int(country.find('rank').text)

    if rank > 50:
        # 删除指定country节点
        root.remove(country)

############ 保存文件 ############
tree = ET.ElementTree(root)
tree.write("new.xml", encoding='utf-8')

##  可能需要的调整格式
from xml.dom import minidom
def xmlwrite(root,filepath)
    rough_string = ET.tostring(root, 'utf-8')
    reparsed = minidom.parseString(rough_string)
    raw_str = reparsed.toprettyxml(indent='',newl="")
    output = open(filepath,'w+',encoding='utf-8')
    output.write('<?xml version="1.0" encoding="UTF-8"?> 
 <!DOCTYPE topic PUBLIC "-//OASIS//DTD DITA Topic//EN" 
    "topic.dtd">')
    output.write(raw_str)
    output.close()

每个节点都具有以上方法,通过root可以操作整个xml文件。推荐学习《Python教程》!

来源:PY学习网:原文地址:https://www.py.cn/article.html

hmoban主题是根据ripro二开的主题,极致后台体验,无插件,集成会员系统
自学咖网 » python支持xml读写么