Python XML 文件 – 如何读取、写入和解析

什么是 XML?

XML 代表可扩展标记语言。它旨在存储和传输少量到中等量的数据,并广泛用于共享结构化信息。

Python 使您能够解析和修改 XML 文档。为了解析 XML 文档,您需要将整个 XML 文档保存在内存中。在本教程中,我们将了解如何在 Python 加载和解析 XML 文件。

如何使用 minidom 解析 XML

我们已经创建了一个要解析的示例 XML 文件。

步骤 1) 创建示例 XML 文件

在文件中,我们可以看到名字、姓氏、家庭和专业领域(SQL、 Python、测试和业务)

如何使用 minidom 解析 XML

步骤2)使用解析函数加载并解析XML文件

一旦我们解析了文档,我们将打印出 “节点名称” 文档根目录和“firstchild 标签名”.Tagname 和 nodename 是 XML 文件的标准属性。

使用 minidom 解析 XML

  • 导入 xml.dom.minidom 模块并声明需要解析的文件(myxml.xml)
  • 该文件包含员工的一些基本信息,如名字、姓氏、家庭、专业知识等。
  • 我们使用 XML minidom 上的解析函数来加载和解析 XML 文件
  • 我们有变量 doc,doc 获取解析函数的结果
  • 我们想要从文件中打印节点名和子标记名,因此我们在打印函数中声明它
  • 运行代码 - 它从 XML 文件中打印出节点名称 (#document) 以及 XML 文件中的第一个子标记名 (employee)

备注:

节点名和子标记名是 XML dom 的标准名称或属性。

步骤 3)从 XML 文档中调用 XML 标签列表并打印出来

接下来,我们还可以从 XML 文档中调用 XML 标签列表并打印出来。这里我们打印出了 SQL 的技能集, Python, 测试 和商业。

使用 minidom 解析 XML

  • 声明变量专业知识,从中提取员工所拥有的所有专业知识名称
  • 使用名为“getElementsByTagName”的 dom 标准函数
  • 这将获取所有名为 skill 的元素
  • 声明循环遍历每个技能标签
  • 运行代码-它将列出四项技能

如何编写 XML 节点

我们可以使用“createElement”函数创建一个新属性,然后将这个新属性或标签附加到现有的 XML 标签中。我们在 XML 文件中添加了一个新标签“BigData”。

  1. 您必须编写代码将新属性 (BigData) 添加到现有的 XML 标签中
  2. 然后,您必须打印出附加了现有 XML 标签的新属性的 XML 标签

写入 XML 节点

  • 要添加新的 XML 并将其添加到文档中,我们使用代码“doc.create elements”
  • 此代码将为我们的新属性“大数据”创建一个新的技能标签
  • 将此技能标签添加到文档的第一个子项(员工)中
  • 运行代码 - 新标签“大数据”将与其他专业知识列表一起出现

XML 解析器示例

Python 2示例

import xml.dom.minidom

def main():
# use the parse() function to load and parse an XML file
   doc = xml.dom.minidom.parse("Myxml.xml");
  
# print out the document node and the name of the first child tag
   print doc.nodeName
   print doc.firstChild.tagName
  
# get a list of XML tags from the document and print each one
   expertise = doc.getElementsByTagName("expertise")
   print "%d expertise:" % expertise.length
   for skill in expertise:
     print skill.getAttribute("name")
    
#Write a new XML tag and add it into the document
   newexpertise = doc.createElement("expertise")
   newexpertise.setAttribute("name", "BigData")
   doc.firstChild.appendChild(newexpertise)
   print " "

   expertise = doc.getElementsByTagName("expertise")
   print "%d expertise:" % expertise.length
   for skill in expertise:
     print skill.getAttribute("name")
    
if name == "__main__":
  main();

Python 3示例

import xml.dom.minidom

def main():
    # use the parse() function to load and parse an XML file
    doc = xml.dom.minidom.parse("Myxml.xml");

    # print out the document node and the name of the first child tag
    print (doc.nodeName)
    print (doc.firstChild.tagName)
    # get a list of XML tags from the document and print each one
    expertise = doc.getElementsByTagName("expertise")
    print ("%d expertise:" % expertise.length)
    for skill in expertise:
        print (skill.getAttribute("name"))

    # Write a new XML tag and add it into the document
    newexpertise = doc.createElement("expertise")
    newexpertise.setAttribute("name", "BigData")
    doc.firstChild.appendChild(newexpertise)
    print (" ")

    expertise = doc.getElementsByTagName("expertise")
    print ("%d expertise:" % expertise.length)
    for skill in expertise:
        print (skill.getAttribute("name"))

if __name__ == "__main__":
    main();

如何使用 ElementTree 解析 XML

ElementTree 是用于操作 XML 的 API。ElementTree 是处理 XML 文件的简便方法。

我们使用以下 XML 文档作为示例数据:

<data>
   <items>
      <item name="expertise1">SQL</item>
      <item name="expertise2">Python</item>
   </items>
</data>

使用 ElementTree 读取 XML:

我们必须首先导入 xml.etree.ElementTree 模块。

import xml.etree.ElementTree as ET

现在让我们获取根元素:

root = tree.getroot()

以下是读取上述 xml 数据的完整代码

import xml.etree.ElementTree as ET
tree = ET.parse('items.xml')
root = tree.getroot()

# all items data
print('Expertise Data:')

for elem in root:
   for subelem in elem:
      print(subelem.text)

输出:

Expertise Data:
SQL
Python

总结

Python 使您可以一次性解析整个 XML 文档,而不是一次解析一行。为了解析 XML 文档,您需要将整个文档保存在内存中。

  • 解析 XML 文档
  • 导入 xml.dom.minidom
  • 使用函数“parse”解析文档(doc=xml.dom.minidom.parse(文件名));
  • 使用代码从 XML 文档中调用 XML 标签列表 (=doc.getElementsByTagName(“xml 标签的名称”)
  • 在 XML 文档中创建和添加新属性
  • 使用函数“createElement”

每日Guru99新闻简报

通过立即获取最新、最重要的人工智能新闻报道来开始您的一天。