Python Arquivo XML – Como ler, escrever e analisar

O que é XML?

XML significa eXtensible Markup Language. Ele foi projetado para armazenar e transportar pequenas e médias quantidades de dados e é amplamente utilizado para compartilhar informações estruturadas.

Python permite analisar e modificar documentos XML. Para analisar o documento XML, você precisa ter todo o documento XML na memória. Neste tutorial, veremos como podemos usar a classe minidom XML em Python para carregar e analisar arquivos XML.

Como analisar XML usando minidom

Criamos um arquivo XML de amostra que iremos analisar.

Etapa 1) Criar arquivo XML de amostra

Dentro do arquivo, podemos ver o nome, sobrenome, residência e área de atuação (SQL, Python, Testes e Negócios)

Como analisar XML usando minidom

Etapa 2) Use a função de análise para carregar e analisar o arquivo XML

Depois de analisar o documento, imprimiremos o “nome do nó” da raiz do documento e o “nome da tag firstchild”. Tagname e nodename são as propriedades padrão do arquivo XML.

Analisar XML usando minidom

  • Importe o módulo xml.dom.minidom e declare o arquivo que deve ser analisado (myxml.xml)
  • Este arquivo contém algumas informações básicas sobre um funcionário, como nome, sobrenome, residência, especialização, etc.
  • Usamos a função de análise no minidom XML para carregar e analisar o arquivo XML
  • Temos a variável doc e doc obtém o resultado da função de análise
  • Queremos imprimir o nome do nó e o tagname filho do arquivo, então declaramos na função de impressão
  • Execute o código - ele imprime o nome do nó (#document) do arquivo XML e o primeiro tagname filho (funcionário) do arquivo XML

Note:

Nodename e tagname filho são os nomes ou propriedades padrão de um dom XML.

Etapa 3) Chame a lista de tags XML do documento XML e imprima

A seguir, também podemos chamar a lista de tags XML do documento XML e imprimi-la. Aqui imprimimos o conjunto de habilidades como SQL, Python, Ensaios e Negócios.

Analisar XML usando minidom

  • Declare a variável expertise, da qual extrairemos toda a expertise que o nome do funcionário possui
  • Use a função padrão dom chamada “getElementsByTagName”
  • Isso obterá todos os elementos chamados habilidade
  • Declarar loop sobre cada uma das tags de habilidade
  • Execute o código - ele fornecerá uma lista de quatro habilidades

Como escrever um nó XML

Podemos criar um novo atributo usando a função “createElement” e então anexar esse novo atributo ou tag às tags XML existentes. Adicionamos uma nova tag “BigData” em nosso arquivo XML.

  1. Você precisa codificar para adicionar o novo atributo (BigData) à tag XML existente
  2. Então, você deve imprimir a tag XML com novos atributos anexados à tag XML existente

Gravar nó XML

  • Para adicionar um novo XML e adicioná-lo ao documento, usamos o código “doc.create elements”
  • Este código criará uma nova tag de habilidade para nosso novo atributo “Big data”
  • Adicione esta tag de habilidade ao documento primeiro filho (funcionário)
  • Execute o código – a nova tag “big data” aparecerá com a outra lista de expertise

Exemplo de analisador XML

Python 2 Exemplo

import xml.dom.minidom

def main():
# use the parse() function to load and parse an XML file
   doc = xml.dom.minidom.parse("Myxml.xml");
  
# print out the document node and the name of the first child tag
   print doc.nodeName
   print doc.firstChild.tagName
  
# get a list of XML tags from the document and print each one
   expertise = doc.getElementsByTagName("expertise")
   print "%d expertise:" % expertise.length
   for skill in expertise:
     print skill.getAttribute("name")
    
#Write a new XML tag and add it into the document
   newexpertise = doc.createElement("expertise")
   newexpertise.setAttribute("name", "BigData")
   doc.firstChild.appendChild(newexpertise)
   print " "

   expertise = doc.getElementsByTagName("expertise")
   print "%d expertise:" % expertise.length
   for skill in expertise:
     print skill.getAttribute("name")
    
if name == "__main__":
  main();

Python 3 Exemplo

import xml.dom.minidom

def main():
    # use the parse() function to load and parse an XML file
    doc = xml.dom.minidom.parse("Myxml.xml");

    # print out the document node and the name of the first child tag
    print (doc.nodeName)
    print (doc.firstChild.tagName)
    # get a list of XML tags from the document and print each one
    expertise = doc.getElementsByTagName("expertise")
    print ("%d expertise:" % expertise.length)
    for skill in expertise:
        print (skill.getAttribute("name"))

    # Write a new XML tag and add it into the document
    newexpertise = doc.createElement("expertise")
    newexpertise.setAttribute("name", "BigData")
    doc.firstChild.appendChild(newexpertise)
    print (" ")

    expertise = doc.getElementsByTagName("expertise")
    print ("%d expertise:" % expertise.length)
    for skill in expertise:
        print (skill.getAttribute("name"))

if __name__ == "__main__":
    main();

Como analisar XML usando ElementTree

ElementTree é uma API para manipulação de XML. ElementTree é a maneira fácil de processar arquivos XML.

Estamos usando o seguinte documento XML como dados de amostra:

<data>
   <items>
      <item name="expertise1">SQL</item>
      <item name="expertise2">Python</item>
   </items>
</data>

Lendo XML usando ElementTree:

devemos primeiro importar o módulo xml.etree.ElementTree.

import xml.etree.ElementTree as ET

Agora vamos buscar o elemento raiz:

root = tree.getroot()

A seguir está o código completo para leitura dos dados xml acima

import xml.etree.ElementTree as ET
tree = ET.parse('items.xml')
root = tree.getroot()

# all items data
print('Expertise Data:')

for elem in root:
   for subelem in elem:
      print(subelem.text)

saída:

Expertise Data:
SQL
Python

Resumo

Python permite analisar todo o documento XML de uma só vez e não apenas uma linha por vez. Para analisar o documento XML você precisa ter o documento inteiro na memória.

  • Para analisar documento XML
  • Importar xml.dom.minidom
  • Use a função “parse” para analisar o documento ( doc=xml.dom.minidom.parse (nome do arquivo);
  • Chame a lista de tags XML do documento XML usando o código (=doc.getElementsByTagName( “nome das tags xml”)
  • Para criar e adicionar novo atributo no documento XML
  • Use a função “createElement”