Python Arquivo XML – Como ler, escrever e analisar
O que é XML?
XML significa eXtensible Markup Language. Ele foi projetado para armazenar e transportar pequenas e médias quantidades de dados e é amplamente utilizado para compartilhar informações estruturadas.
Python permite analisar e modificar documentos XML. Para analisar o documento XML, você precisa ter todo o documento XML na memória. Neste tutorial, veremos como podemos usar a classe minidom XML em Python para carregar e analisar arquivos XML.
Como analisar XML usando minidom
Criamos um arquivo XML de amostra que iremos analisar.
Etapa 1) Criar arquivo XML de amostra
Dentro do arquivo, podemos ver o nome, sobrenome, residência e área de atuação (SQL, Python, Testes e Negócios)
Etapa 2) Use a função de análise para carregar e analisar o arquivo XML
Depois de analisar o documento, imprimiremos o “nome do nó” da raiz do documento e o “nome da tag firstchild”. Tagname e nodename são as propriedades padrão do arquivo XML.
- Importe o módulo xml.dom.minidom e declare o arquivo que deve ser analisado (myxml.xml)
- Este arquivo contém algumas informações básicas sobre um funcionário, como nome, sobrenome, residência, especialização, etc.
- Usamos a função de análise no minidom XML para carregar e analisar o arquivo XML
- Temos a variável doc e doc obtém o resultado da função de análise
- Queremos imprimir o nome do nó e o tagname filho do arquivo, então declaramos na função de impressão
- Execute o código - ele imprime o nome do nó (#document) do arquivo XML e o primeiro tagname filho (funcionário) do arquivo XML
Observação:
Nodename e tagname filho são os nomes ou propriedades padrão de um dom XML.
Etapa 3) Chame a lista de tags XML do documento XML e imprima
A seguir, também podemos chamar a lista de tags XML do documento XML e imprimi-la. Aqui imprimimos o conjunto de habilidades como SQL, Python, Testes e Negócios.
- Declare a variável expertise, da qual extrairemos toda a expertise que o nome do funcionário possui
- Use a função padrão dom chamada “getElementsByTagName”
- Isso obterá todos os elementos chamados habilidade
- Declarar loop sobre cada uma das tags de habilidade
- Execute o código - ele fornecerá uma lista de quatro habilidades
Como escrever um nó XML
Podemos criar um novo atributo usando a função “createElement” e então anexar esse novo atributo ou tag às tags XML existentes. Adicionamos uma nova tag “BigData” em nosso arquivo XML.
- Você precisa codificar para adicionar o novo atributo (BigData) à tag XML existente
- Então, você deve imprimir a tag XML com novos atributos anexados à tag XML existente
- Para adicionar um novo XML e adicioná-lo ao documento, usamos o código “doc.create elements”
- Este código criará uma nova tag de habilidade para nosso novo atributo “Big data”
- Adicione esta tag de habilidade ao documento primeiro filho (funcionário)
- Execute o código – a nova tag “big data” aparecerá com a outra lista de expertise
Exemplo de analisador XML
Python 2 Exemplo
import xml.dom.minidom
def main():
# use the parse() function to load and parse an XML file
doc = xml.dom.minidom.parse("Myxml.xml");
# print out the document node and the name of the first child tag
print doc.nodeName
print doc.firstChild.tagName
# get a list of XML tags from the document and print each one
expertise = doc.getElementsByTagName("expertise")
print "%d expertise:" % expertise.length
for skill in expertise:
print skill.getAttribute("name")
#Write a new XML tag and add it into the document
newexpertise = doc.createElement("expertise")
newexpertise.setAttribute("name", "BigData")
doc.firstChild.appendChild(newexpertise)
print " "
expertise = doc.getElementsByTagName("expertise")
print "%d expertise:" % expertise.length
for skill in expertise:
print skill.getAttribute("name")
if name == "__main__":
main();
Python 3 Exemplo
import xml.dom.minidom
def main():
# use the parse() function to load and parse an XML file
doc = xml.dom.minidom.parse("Myxml.xml");
# print out the document node and the name of the first child tag
print (doc.nodeName)
print (doc.firstChild.tagName)
# get a list of XML tags from the document and print each one
expertise = doc.getElementsByTagName("expertise")
print ("%d expertise:" % expertise.length)
for skill in expertise:
print (skill.getAttribute("name"))
# Write a new XML tag and add it into the document
newexpertise = doc.createElement("expertise")
newexpertise.setAttribute("name", "BigData")
doc.firstChild.appendChild(newexpertise)
print (" ")
expertise = doc.getElementsByTagName("expertise")
print ("%d expertise:" % expertise.length)
for skill in expertise:
print (skill.getAttribute("name"))
if __name__ == "__main__":
main();
Como analisar XML usando ElementTree
ElementTree é uma API para manipulação de XML. ElementTree é a maneira fácil de processar arquivos XML.
Estamos usando o seguinte documento XML como dados de amostra:
<data>
<items>
<item name="expertise1">SQL</item>
<item name="expertise2">Python</item>
</items>
</data>
Lendo XML usando ElementTree:
devemos primeiro importar o módulo xml.etree.ElementTree.
import xml.etree.ElementTree as ET
Agora vamos buscar o elemento raiz:
root = tree.getroot()
A seguir está o código completo para leitura dos dados xml acima
import xml.etree.ElementTree as ET
tree = ET.parse('items.xml')
root = tree.getroot()
# all items data
print('Expertise Data:')
for elem in root:
for subelem in elem:
print(subelem.text)
saída:
Expertise Data: SQL Python
Resumo
Python permite analisar todo o documento XML de uma só vez e não apenas uma linha por vez. Para analisar o documento XML você precisa ter o documento inteiro na memória.
- Para analisar documento XML
- Importar xml.dom.minidom
- Use a função “parse” para analisar o documento ( doc=xml.dom.minidom.parse (nome do arquivo);
- Chame a lista de tags XML do documento XML usando o código (=doc.getElementsByTagName( “nome das tags xml”)
- Para criar e adicionar novo atributo no documento XML
- Use a função “createElement”




