Python Arquivo XML – Como ler, escrever e analisar
O que é XML?
XML significa eXtensible Markup Language. Ele foi projetado para armazenar e transportar pequenas e médias quantidades de dados e é amplamente utilizado para compartilhar informações estruturadas.
Python permite analisar e modificar documentos XML. Para analisar o documento XML, você precisa ter todo o documento XML na memória. Neste tutorial, veremos como podemos usar a classe minidom XML em Python para carregar e analisar arquivos XML.
Como analisar XML usando minidom
Criamos um arquivo XML de amostra que iremos analisar.
Etapa 1) Criar arquivo XML de amostra
Dentro do arquivo, podemos ver o nome, sobrenome, residência e área de atuação (SQL, Python, Testes e Negócios)
Etapa 2) Use a função de análise para carregar e analisar o arquivo XML
Depois de analisar o documento, imprimiremos o “nome do nó” da raiz do documento e o “nome da tag firstchild”. Tagname e nodename são as propriedades padrão do arquivo XML.
- Importe o módulo xml.dom.minidom e declare o arquivo que deve ser analisado (myxml.xml)
- Este arquivo contém algumas informações básicas sobre um funcionário, como nome, sobrenome, residência, especialização, etc.
- Usamos a função de análise no minidom XML para carregar e analisar o arquivo XML
- Temos a variável doc e doc obtém o resultado da função de análise
- Queremos imprimir o nome do nó e o tagname filho do arquivo, então declaramos na função de impressão
- Execute o código - ele imprime o nome do nó (#document) do arquivo XML e o primeiro tagname filho (funcionário) do arquivo XML
Note:
Nodename e tagname filho são os nomes ou propriedades padrão de um dom XML.
Etapa 3) Chame a lista de tags XML do documento XML e imprima
A seguir, também podemos chamar a lista de tags XML do documento XML e imprimi-la. Aqui imprimimos o conjunto de habilidades como SQL, Python, Ensaios e Negócios.
- Declare a variável expertise, da qual extrairemos toda a expertise que o nome do funcionário possui
- Use a função padrão dom chamada “getElementsByTagName”
- Isso obterá todos os elementos chamados habilidade
- Declarar loop sobre cada uma das tags de habilidade
- Execute o código - ele fornecerá uma lista de quatro habilidades
Como escrever um nó XML
Podemos criar um novo atributo usando a função “createElement” e então anexar esse novo atributo ou tag às tags XML existentes. Adicionamos uma nova tag “BigData” em nosso arquivo XML.
- Você precisa codificar para adicionar o novo atributo (BigData) à tag XML existente
- Então, você deve imprimir a tag XML com novos atributos anexados à tag XML existente
- Para adicionar um novo XML e adicioná-lo ao documento, usamos o código “doc.create elements”
- Este código criará uma nova tag de habilidade para nosso novo atributo “Big data”
- Adicione esta tag de habilidade ao documento primeiro filho (funcionário)
- Execute o código – a nova tag “big data” aparecerá com a outra lista de expertise
Exemplo de analisador XML
Python 2 Exemplo
import xml.dom.minidom def main(): # use the parse() function to load and parse an XML file doc = xml.dom.minidom.parse("Myxml.xml"); # print out the document node and the name of the first child tag print doc.nodeName print doc.firstChild.tagName # get a list of XML tags from the document and print each one expertise = doc.getElementsByTagName("expertise") print "%d expertise:" % expertise.length for skill in expertise: print skill.getAttribute("name") #Write a new XML tag and add it into the document newexpertise = doc.createElement("expertise") newexpertise.setAttribute("name", "BigData") doc.firstChild.appendChild(newexpertise) print " " expertise = doc.getElementsByTagName("expertise") print "%d expertise:" % expertise.length for skill in expertise: print skill.getAttribute("name") if name == "__main__": main();
Python 3 Exemplo
import xml.dom.minidom def main(): # use the parse() function to load and parse an XML file doc = xml.dom.minidom.parse("Myxml.xml"); # print out the document node and the name of the first child tag print (doc.nodeName) print (doc.firstChild.tagName) # get a list of XML tags from the document and print each one expertise = doc.getElementsByTagName("expertise") print ("%d expertise:" % expertise.length) for skill in expertise: print (skill.getAttribute("name")) # Write a new XML tag and add it into the document newexpertise = doc.createElement("expertise") newexpertise.setAttribute("name", "BigData") doc.firstChild.appendChild(newexpertise) print (" ") expertise = doc.getElementsByTagName("expertise") print ("%d expertise:" % expertise.length) for skill in expertise: print (skill.getAttribute("name")) if __name__ == "__main__": main();
Como analisar XML usando ElementTree
ElementTree é uma API para manipulação de XML. ElementTree é a maneira fácil de processar arquivos XML.
Estamos usando o seguinte documento XML como dados de amostra:
<data> <items> <item name="expertise1">SQL</item> <item name="expertise2">Python</item> </items> </data>
Lendo XML usando ElementTree:
devemos primeiro importar o módulo xml.etree.ElementTree.
import xml.etree.ElementTree as ET
Agora vamos buscar o elemento raiz:
root = tree.getroot()
A seguir está o código completo para leitura dos dados xml acima
import xml.etree.ElementTree as ET tree = ET.parse('items.xml') root = tree.getroot() # all items data print('Expertise Data:') for elem in root: for subelem in elem: print(subelem.text)
saída:
Expertise Data: SQL Python
Resumo
Python permite analisar todo o documento XML de uma só vez e não apenas uma linha por vez. Para analisar o documento XML você precisa ter o documento inteiro na memória.
- Para analisar documento XML
- Importar xml.dom.minidom
- Use a função “parse” para analisar o documento ( doc=xml.dom.minidom.parse (nome do arquivo);
- Chame a lista de tags XML do documento XML usando o código (=doc.getElementsByTagName( “nome das tags xml”)
- Para criar e adicionar novo atributo no documento XML
- Use a função “createElement”