Python利用xmltodict实现字典和xml互相转换的代码_F11

本站首页收藏本站

广告位联系

APP正在开发中...

返回顶部

分享到

Python利用xmltodict实现字典和xml互相转换的代码

python 来源：互联网作者：佚名发布时间：2024-12-05 21:48:38 人浏览

摘要

xmltodict简介概念 xmltodict是Python中用于处理XML数据的模块，它可将XML数据转换为字典，简化XML解析过程，同时保留数据结构，便于操作。反之，也可将字典转回XML格式。此模块在处理XML时提供

xmltodict简介

概念

xmltodict是Python中用于处理XML数据的模块，它可将XML数据转换为字典，简化XML解析过程，同时保留数据结构，便于操作。
反之，也可将字典转回XML格式。此模块在处理XML时提供了直观、简洁的接口；

xmltodict按照

xmltodict模块属于Python第三方库，需要额外下载安装，命令如下：

1	pip install xmltodict

生成XML数据

unparser函数用于将Python字典转换为XML数据，便于数据的存储和传输；

参数含义如下：

input_dict：要转换为XML的Python字典。
output（可选）：输出的目标。可以是字符串（默认）或文件对象。
pretty（可选）：是否美化输出。默认为False。
full_document（可选）：是否输出完整的XML文档，包括XML声明。默认为True。

import xmltodict

# Python 字典

data = {

'persons':

{

'person':

[

{

'name': '张三', 'age': '18', 'gender': '男',

'address': {'street': '浦东大道', 'district': '浦东新区', 'city': '上海', 'state': '中国'}

{

'name': '李四', 'age': '20', 'gender': '女',

'address': {'street': '蓝靛厂路', 'district': '海淀区', 'city': '北京', 'state': '中国'}}

]

}

# 将字典转换为 XML 数据

xml_string = xmltodict.unparse(data, pretty=True)

# 打印 XML 数据

print(xml_string)

# <?xml version="1.0" encoding="utf-8"?>

# <persons>

# <person>

# <name>张三</name>

# <age>18</age>

# <gender>男</gender>

# <address>

# <street>浦东大道</street>

# <district>浦东新区</district>

# <city>上海</city>

# <state>中国</state>

# </address>

# </person>

# <person>

# <name>李四</name>

# <age>20</age>

# <gender>女</gender>

# <address>

# <street>蓝靛厂路</street>

# <district>海淀区</district>

# <city>北京</city>

# <state>中国</state>

# </address>

# </person>

# </persons>

解析XML数据

parse函数将XML数据解析为Python字典，使得你可以使用Python的语法来访问和操作XML数据。

参数含义如下：

xml_input：要解析的XML数据。可以是字符串或文件对象。
encoding（可选）：XML文档的编码。默认为None，意味着使用XML文档中指定的编码。
expat（可选）：自定义的XML解析器。默认使用Python标准库中的xml.parsers.expat。
process_namespaces（可选）：是否处理命名空间。默认为False。
namespace_separator（可选）：当process_namespaces=True时，命名空间和标签名之间的分隔符。默认为:。
postprocessor（可选）：一个函数，它会在每个元素解析完成后被调用。这允许用户修改解析结果，例如，可以用来转换数据类型或合并节点。它接收三个参数：path、key和value。path是当前元素的父元素路径，key是当前元素的标签名，value是当前元素的值（可能是文本、属性字典或子元素的字典）。
dict_constructor（可选）：用于创建字典的构造函数。默认情况下，xmltodict使用内置的dict函数来构造字典。如果你想使用其他类型的字典（例如，collections.OrderedDict以保持元素的顺序），可以通过这个参数指定。
xml_attribs（可选）：控制解析器是否应该包含元素的属性。默认为True，意味着元素的属性会被包含在解析结果中。如果设置为False，则属性将被忽略，只有元素的文本内容和子元素会被包含。

import xmltodict

# XML 数据

xml_string = '''

</address>

</person>

</address>

</person>

</persons>

'''

# 解析 XML 数据

data = xmltodict.parse(xml_string)

print(type(data), data) # <class 'dict'> {'persons': {'person': [{'name': '张三', 'age': '18', 'gender': '男', 'address': {'street': '浦东大道', 'district': '浦东新区', 'city': '上海', 'state': '中国'}}, {'name': '李四', 'age': '20', 'gender': '女', 'address': {'street': '蓝靛厂路', 'district': '海淀区', 'city': '北京', 'state': '中国'}}]}}

# 访问数据

print(data['persons']['person'][0]['name']) # 输出: 张三

print(data['persons']['person'][1]['name']) # 输出: 李四

拓展

1.改变属性前缀

attr_prefix参数用于指定XML属性在转换为字典时的键前缀。默认值是’@'。

import xmltodict

xml_string = '''

<address>上海市浦东新区</address>

</person>

<address>北京市海淀区</address>

</person>

</persons>

'''

data1 = xmltodict.parse(xml_string)

print(data1)

# 使用默认的attr_prefix='@'参数值，输出如下:

# {'persons':

# {

# 'person': [

# {'@name': 'zhangsan', '@age': '18', '@gender': '男', 'address': '上海市浦东新区'},

# {'@name': 'lisi', '@age': '20', '@gender': '女', 'address': '北京市海淀区'}

# ]

# }

data2 = xmltodict.parse(xml_string, attr_prefix='attr_')

print(data2)

# 使用自定义attr_prefix='attr_'参数值，输出如下:

# {'persons':

# {

# 'person': [

# {'attr_name': 'zhangsan', 'attr_age': '18', 'attr_gender': '男', 'address': '上海市浦东新区'},

# {'attr_name': 'lisi', 'attr_age': '20', 'attr_gender': '女', 'address': '北京市海淀区'}

# ]

# }

2.去除文本值中的空白字符

strip_whitespace参数用于控制是否去除文本值中的空白字符。默认值是True。

import xmltodict

xml_string = '''

<address> 上海市浦东新区</address>

</person>

'''

# strip_whitespace=True (默认)

data1 = xmltodict.parse(xml_string)

print(data1) # {'person': {'@name': 'zhangsan', 'address': '上海市浦东新区'}}

# strip_whitespace=False

data2 = xmltodict.parse(xml_string, strip_whitespace=False)

print(data2) # {'person': {'@name': 'zhangsan', 'address': ' 上海市浦东新区', '#text': '\n \n'}}

3.去除空值标签

利用postprocessor钩子指定一个按照预想逻辑处理key、value值的函数；

import xmltodict

xml_string = '''

</address>

</person>

</address>

</person>

</persons>

'''

def _remove_empty(_, key, value):

if value is None:

return

return key, value

result1 = xmltodict.parse(xml_string)

result2 = xmltodict.parse(xml_string, postprocessor=_remove_empty)

print(result1['persons']['person'][0]['address']) # 输出: {'street': None, 'district': {'@desc': 'test', '#text': '浦东新区'}, 'city': None, 'state': '中国'}

print(result2['persons']['person'][0]['address']) # 输出: {'district': {'@desc': 'test', '#text': '浦东新区'}, 'state': '中国'}

print(result1['persons']['person'][1]['address']) # 输出: {'street': None, 'district': {'@desc': 'test'}, 'city': '北京', 'state': '中国'}

print(result2['persons']['person'][1]['address']) # 输出: {'district': {'@desc': 'test'}, 'city': '北京', 'state': '中国'}

总结

xmltodict模块是处理XML数据的强大工具，它结合了XML的灵活性和Python字典的简便性；
无论是需要解析复杂的XML文档，还是需要生成结构化的XML数据，xmltodict都能简单而又直观的胜任；
通过将XML处理过程与Python字典操作相结合，xmltodict极大地简化了XML数据的处理流程，使得开发者可以更加专注于业务逻辑的实现。

您可能感兴趣的文章 :

原文链接 :

Tag : 字典(9)

PIL图像与数组之间转换的使用二十j

getpixel 如果想对图像进行细致地处理，那么操作像素是必不可少的一步。在Image类中，通过getpixel可以得到图像在某个坐标位置处的像素值，
Python利用xmltodict实现字典和xml互相转换的代码

xmltodict简介概念 xmltodict是Python中用于处理XML数据的模块，它可将XML数据转换为字典，简化XML解析过程，同时保留数据结构，便于操作。反
python中pip的使用方法介绍

pip 是 Python 的默认包管理工具，随 Python 3.x 版本一同安装。它使得安装和管理 Python 包变得非常简单。本文将介绍 pip 的基本使用方法、常用
基于Python制作一个全自动微信清粉小工具

在当今社交软件中，微信是最常用的通讯工具之一。然而，随着时间的推移，我们的好友列表中可能会出现一些不再活跃的账号，也就是我
YOLOv8模型pytorch格式转为onnx格式的步骤介绍

一、YOLOv8的Pytorch网络结构 yolov8网络从1-21层与pt文件相对应是BackBone和Neck模块，22层是Head模块。二、转ONNX步骤 2.1 yolov8官方 1 2 3 4 5 6 7 8 9
Python中addict库使用Dict的类

from addict import Dict这行代码导入了 Dict 类，它来自于 addict 模块。在这个上下文中，addict 是一个 Python 库，它提供了一个名为 Dict 的类，用于
Python利用标签实现清理微信好友的自动化脚本

微信已经成为我们日常生活中不可或缺的社交工具。随着使用时间的增长，我们的微信好友列表可能会变得越来越臃肿。在上一篇文章中，
Python判断空的五种方法介绍

一、使用if语句判断在Python中，可以使用if语句判断一个变量是否为空，若为空，则可以执行相应的操作。此处判断的是var是否为None，如果
Python的json模块中json.load()和json.loads()的区别

json.load和json.loads都是Python的json模块中用于解析JSON数据的方法，但它们之间有一些重要的区别。 1. json.load json.load用于从一个文件对象中读取
Python遍历文件和文件路径拼接介绍

一、os.walk()文件（夹）读取遍历指定路径下的所有文件和文件夹示例代码如下 1 2 3 4 5 6 7 8 9 10 mdfFolder= D:\hanshan\MDF for root, dirs, files in os.w