Neste artigo iremos abordar sobre os conceitos gerais de XML (Extensible Markup Language), que é uma linguagem de marcação universal para codificação de dados de forma legível por humanos e máquinas.
Este é um dos assuntos cobrados pela Cesgranrio no concurso da Caixa Econômica Federal, área Tecnologia da Informação. Por isso, vamos abordar os tópicos principais para concursos públicos.
Assim, estruturamos este artigo da seguinte forma:
XML é uma linguagem de marcação universal e autodescritiva que permite aos usuários definir suas próprias tags para descrever dados de maneira estruturada e legível por máquina e por humanos.
As tags são cercadas por colchetes angulares (“<” e “>”), com elementos aninhados para representar hierarquias de dados. Os documentos XML são organizados em uma estrutura de árvore que tem início na “raiz” e se estende até as “folhas”. Por exemplo:
Neste exemplo simples, temos um elemento raiz <pessoa> contendo dois filhos: <nome> e <idade>.
As regras de sintaxe são simples e lógicas, sendo fáceis de aprender e aplicar. A seguir, veremos as principais.
Os documentos XML devem iniciar com um elemento raiz que seja pai de todos os outros elementos:
Note que existem apenas um elemento “raiz”, podendo ter vários filhos.
Normalmente, em documentos XML, temos a seguinte linha:
<?xml version=”1.0″ encoding=”UTF-8″?>
Essa linha é chamada de prólogo XML e é opcional. Entretanto, se existir, deve aparecer antes do conteúdo do XML. A codificação UTF-8 é importante pois evita erros no documento caso este contenha caracteres internacionais. Por isso, o UTF-8 é a codificação de caracteres padrão para documentos XML.
Por fim, é importante salientar que o prólogo NÃO FAZ PARTE do documento XML.
Em XML, todos os elementos devem possuir uma tag de fechamento, que podem ser representadas das seguintes formas:
ou
No primeiro caso, o elemento possui conteúdo. Por outro lado, no segundo caso, o elemento não possui conteúdo, sendo possível fechá-lo apenas com />. Assim, há duas formas de fechar um elemento. O primeiro caso pode ser utilizado para elementos com conteúdo ou para elementos vazios. Já o segundo caso, é usado apenas para elementos sem conteúdos.
As tags XML diferenciam maiúsculas de minúsculas, ou seja, a tag <Mensagem> é diferente da tag <mensagem>, pois na primeira o M está maiúsculo e segunda minúsculo. Assim, tags de abertura e fechamento devem ser escritas com o mesmo caso. Vejamos dois exemplos:
Em XML, todos os elementos devem ser aninhados uns aos outros, ou seja, quando um elemento X for aberto dentro de um elemento Y, o elemento X deve fechado dentro do elemento Y.
Vejamos um exemplo:
Esse exemplo está correto, perceba que o elemento Y abre e fecha dentro de X. Portanto, estão aninhados de forma correta.
Vejamos um outro exemplo abaixo:
Nesse exemplo, os elementos estão INCORRETAMENTE aninhados, pois o elemento Y fecha depois de seu pai, o elemento X. Isso é proibido!
Os elementos XML podem conter atributos, que são compostos, obrigatoriamente,por um par de nome e valor. Isso significa que não posso ter um atributo sem valor. Os valores dos atributos devem sempre estar entre aspas “ “.
No exemplo acima, o elemento email possui um atributo data com o valor “10/04/2024”.
Leia também:
Certos caracteres, como <, >, &, ‘ e “ não podem ser usados diretamente, pois podem ser interpretados como marcações. Em vez disso, devem ser substituídos por entidades XML:
Por exemplo, ao colocar um caractere como “<” dentro de um elemento, será gerado um erro porque o analisador o interpreta como o início de um novo elemento.
Assim, o seguinte trecho gerará um erro:
Devendo ser substituído por:
Mas muita atenção: somente os caracteres < e & são estritamente ilegais em XML. Mas é uma boa prática substituir os demais caracteres também pelas referências de entidade.
A forma de escrever comentários é similar à utilizada em HTML:
Não é permitido inserir dois hífens no meio de um comentário:
Diferentemente do que ocorre no HTML, que trunca vários espaços em branco para um único espaço em branco, no XML os espaços em branco são preservados, ou seja, se você incluir vários espaços em brancos, todos serão considerados:
Os documentos XML que são elaborados em conformidade com as regras de sintaxe mostradas anteriormente são considerados “bem formados”. Isso significa que todos os elementos devem estar corretamente aninhados, todos os atributos devem estar entre aspas e todas as tags devem ser fechadas adequadamente. Um XML bem formado é essencial para que um documento possa ser processado por aplicativos.
Bom pessoal, concluímos o artigo com os conceitos iniciais de XML. Embora seja apenas uma introdução, com essas regras de sintaxe já podemos resolver a maioria das questões desse assunto. Espero que o conteúdo aqui apresentado seja útil para sua aprovação. Bons estudos!
Saiba mais: Concurso Caixa
Quer saber quais serão os próximos concursos?
Confira nossos artigos!
Consta em publicação no Diário Oficial da União desta quinta-feira, 21 de novembro, retificação do…
Atenção, Coruja! Se você gosta da área policial, saiba que essa é uma grande oportunidade!…
A Companhia de Saneamento Ambiental do Distrito Federal – CAESB teve seu edital de concurso…
Edital pode ser publicado a qualquer momento! O ICMBio (Instituto Chico Mendes de Conservação da…
O Estratégia realiza semanalmente aulas, eventos, entrevistas, simulados, revisões e maratonas dos principais concursos de…
Confira neste artigo como foi o último concurso de Taquigrafia da ALESP para o cargo…