Concurso TCU: O que são Dados estruturados e não estruturados
Saiba neste artigo o que são dados estruturados e não estruturados para o concurso do TCU (Tribunal de Contas da União).
Olá, pessoal! Tudo bem com vocês?
O concurso do TCU (Tribunal de Contas da União) finalmente teve o seu edital publicado.
São 20 vagas para o cargo de Auditor Federal de Controle Externo, com uma remuneração inicial de R$ 21.947,82. Nada mal, não é mesmo?
Um fato que pegou todos de surpresa foi o grande peso da disciplina de Análise de Dados, a qual pertence ao ramo da temida Tecnologia da Informação (TI).
Com isso, de modo a auxiliá-lo na sua preparação para o concurso do TCU, iremos realizar uma análise sobre um dos tópicos dessa disciplina, o qual está previsto no seu edital: os Dados Estruturados e Não Estruturados.
O que são dados não estruturados?
Os dados não estruturados são aqueles dados que não possuem uma organização previamente definida.
Diferentemente dos dados estruturados, os quais veremos mais adiante, os dados não estruturados, devido a sua falta de organização, não podem ser processados com facilidade por ferramentas convencionais, além disso, eles são frequentemente categorizados como qualitativos. Alguns exemplos são as imagens, vídeos, relatórios textuais, áudios, entre outros similares.
Imagine quando você está redigindo um documento no Microsoft Word. Geralmente não há nenhuma preocupação com limites ou restrições, sendo apenas inseridos textos de acordo com a vontade do usuário, bem como imagens ou gráficos, de modo não organizado. Por isso, frequentemente, documentos de textos são considerados dados não estruturados.
Como já foi cobrado em provas, em relação aos dados gerados atualmente, mais de oitenta por cento (80%) são considerados como não estruturados. Isso acontece em decorrência do rápido avanço da tecnologia, em que registros são criados a todo momento e, na maioria das vezes, de maneira desordenada.
O que são dados estruturados?
Por sua vez, os dados estruturados são aqueles dados organizados, possuindo uma estrutura rígida, previamente definida, dispostos em blocos semânticos, sendo frequentemente categorizados como quantitativos.
Um exemplo de dados estruturados são os registros presentes em tabelas organizadas em linhas e colunas de bases de dados relacionais, uma vez que elas possuem uma estrutura fixa, com o mesmo formato para todos os seus registros, definidas previamente.
Suponha-se que uma tabela possua as colunas CPF, Nome e Telefone, como podemos ver abaixo:
Veja que, na tabela acima, todas as suas linhas possuem valores padronizados, sendo cada um deles específico para cada uma das colunas. Por exemplo, em uma linha, haverá valores para as três colunas apresentadas, sendo que o CPF sempre será um número de quatro dígitos, único para cada pessoa. De maneira similar temos o telefone, o qual apenas poderá possuir seis dígitos, divididos em dois blocos de três algarismos.
Além disso, é possível exigir que os nomes possuam uma cadeia máxima de 30 caracteres, por exemplo. Desse modo, são esses tipos de características rígidas e fixas, previamente planejadas, que qualificam determinados dados como estruturados.
Ademais, é plenamente possível, caso seja necessário, o usuário inserir uma nova coluna, com uma outra característica. Porém, antes de os novos registros serem inseridos, a coluna criada deverá especificar o seu novo atributo, bem como o seu domínio para os novos valores a serem aceitos. É importante salientar que esta atualização não descaracteriza a tabela como sendo de estrutura fixa.
Uma grande vantagem destes tipos de dados é que eles podem ser manipulados e compreendidos por linguagens de máquina com certa facilidade e rapidez. Além disso, como já antecipado, é possível excluir ou inserir novos dados, além de poder ordenar, agrupar e consultar dados e tabelas facilmente.
O que são dados semiestruturados?
Por fim, os dados semiestruturados são aqueles que mesclam características dos dois tipos de dados anteriormente analisados.
Desse modo, por não serem considerados totalmente pertencentes a nenhuma das classificações citadas, ou seja, não são completamente estruturados nem totalmente não estruturados, estes tipos de dados possuem uma representação estrutural considerada heterogênea.
Uma importante característica dos dados semiestruturados é a sua a “definição à posteriori”, ou seja, a sua estrutura é geralmente definida após a existência dos dados, através da análise de seus esquemas particulares, identificando semelhanças e diferenças, já que o seu esquema, por muitas vezes, está inserido entre os próprios dados, de maneira implícita, sendo, por isso, conhecidos como autodescritivos.
Além disso, eles podem apresentar uma estrutura de dados evolucionária, já que ela pode se modificar sempre que os dados forem também modificados.
O exemplo mais comum de formato de dados semiestruturados são os dados escritos em XML (Linguagem de Marcação Extensível). Esta linguagem permite representar e manipular elementos em formato textual, de modo que ele, juntamente com os próprios dados, descreve os tipos dos dados textuais, juntamente com os próprios dados, através de elementos de marcação.
Dados Estruturados x Dados Não Estruturados x Dados Semiestruturados
De modo a finalizar este assunto, iremos agora representar, de maneira bastante didática e simples, como é a organização de cada tipo de conceito citado neste artigo:
PARA FIXAR:
DADOS NÃO ESTRUTURADOS
- Não possuem estrutura e formato previamente definidos;
- Não são de fácil interpretação por ferramentas convencionais;
- Representam a maioria dos dados corporativos gerados;
- Exemplos: relatórios, vídeos, fotos e áudios.
DADOS ESTRUTURADOS
- Estrutura e organização rígidas e previamente definidas;
- Dados organizados em relações semânticas (tabelas), com os mesmos atributos para cada registro de dados;
- Facilmente interpretados por linguagem de máquina;
- Exemplo: banco de dados.
DADOS SEMIESTRUTURADOS
- Representação Estrutural Heterogênea;
- Definição de estrutura à posteriori (estrutura é geralmente definida após a existência e análise dos dados, pois pode estar implícita entre eles, sendo autodescritivos);
- Exemplo: XML.
Dados Abertos
De modo a complementar o seu estudo para o concurso do TCU, iremos realizar algumas considerações sobre os chamados Dados Abertos.
O Decreto 8.777/2016 conceitua dados abertos como sendo os “dados acessíveis ao público, representados em meio digital, estruturados em formato aberto, processáveis por máquina, referenciados na internet e disponibilizados sob licença aberta que permita sua livre utilização, consumo ou cruzamento, limitando-se a creditar a autoria ou a fonte”
Uma outra definição para os dados abertos, a qual foi dada pela Open Knowledge Foundation – OKFn, é: “dados abertos são aqueles em que qualquer pessoa pode livremente usá-los, reutilizá-los e redistribuí-los, estando sujeito à, no máximo, exigência de creditar a sua autoria e compartilhar pela mesma licença”.
Para determinados dados serem classificados como abertos, eles precisam obedecer a três leis e a oito princípio:
Leis dos dados abertos:
- Se o dado não pode ser encontrado e indexado na Web, ele não existe;
- Se não estiver aberto e disponível em formato compreensível por máquina, ele não pode ser reaproveitado;
- Se algum dispositivo legal não permitir sua replicação, ele não é útil.
Essas “leis” são apenas testes e condições utilizadas para avaliar se um determinado dado analisado pode ser considerado como aberto. Elas foram primitivamente concebidas para avaliar os chamados Dados Abertos Governamentais, mas atualmente elas também são utilizadas para os dados abertos em geral.
Princípios dos dados abertos:
- Completos: Todos os dados públicos são disponibilizados. Dados são informações eletronicamente gravadas, incluindo, mas não se limitando a documentos, bancos de dados, transcrições e gravações audiovisuais. Dados públicos são dados que não estão sujeitos a limitações válidas de privacidade, segurança ou controle de acesso, reguladas por estatutos.
- Primários: Os dados são publicados na forma coletada na fonte, com a mais fina granularidade possível, e não de forma agregada ou transformada.
- Atuais: Os dados são disponibilizados o quão rapidamente seja necessário para preservar o seu valor.
- Acessíveis: Os dados são disponibilizados para o público mais amplo possível e para os propósitos mais variados possíveis.
- Processáveis por máquina: Os dados são razoavelmente estruturados para possibilitar o seu processamento automatizado.
- Acesso não discriminatório: Os dados estão disponíveis a todos, sem que seja necessária identificação ou registro.
- Formatos não proprietários: Os dados estão disponíveis em um formato sobre o qual nenhum ente tenha controle exclusivo.
- Livres de licenças: Os dados não estão sujeitos a regulações de direitos autorais, marcas, patentes ou segredo industrial. Restrições razoáveis de privacidade, segurança e controle de acesso podem ser permitidas na forma regulada por estatutos.
Esses princípios foram definidos por um grupo de 30 pessoas, nos Estados Unidos, também, inicialmente, para os Dados Abertos Governamentais, porém, atualmente, eles precisam ser verificados para todo e qualquer tipo de dado aberto.
Um grande exemplo de dados abertos são aqueles provenientes da administração pública, obrigatoriamente divulgados por meio da Lei de Acesso à Informação, de modo a promover a transparência governamental, a qual impõe a publicidade das informações de interesse coletivo e geral. A execução orçamentária e financeira dos recursos arrecadados pelo governo, bem como a divulgação da remuneração dos servidores, são exemplos de dados abertos, os quais precisam ser divulgados pela esfera governamental.
Finalizando
Pessoal, chegamos ao fim da nossa análise sobre Dados Estruturados e Não Estruturados para o concurso do TCU. Espero que vocês tenham gostado.
Caso queira se preparar para chegar competitivo nesta prova, invista nos cursos para o TCU do Estratégia Concursos. Lá você encontrará aulas completas e detalhadas, com os melhores professores do mercado, de todos os tópicos exigidos no edital deste concurso.
Conheça também o Sistema de Questões do Estratégia. Afinal, a única maneira de consolidar o conteúdo de maneira satisfatória é através da resolução de questões.
Bons estudos a todos e até a próxima!
Cursos e Assinaturas
Prepare-se com o melhor material e com quem mais aprova em Concursos Públicos em todo o país!