Engenharias e TI

Ciência de Dados Passo a Passo: Classificações dos Dados.

Introdução

Hoje vamos iniciar mais uma série especial de artigos na área de Tecnologia da Informação, desta vez falando um pouco sobre Ciência de Dados. Para abrir em grande estilo, o nosso tema será as classificações dos dados.

Para quem está começando os estudos agora, Ciência de Dados é uma divisão relativamente nova na Tecnologia da Informação e já está sendo alvo de cobrança pesada das principais bancas do mercado dos concursos. De fato, ela é estratégica para diversas carreiras, mesmo as não específicas de TI.  

Dessa forma, esse artigo é recomendado para concurseiros das áreas Fiscal, Controle, Tribunais, Policial, além de cargos específicos de TI, principalmente aos que farão provas das bancas FGV, Cespe/Cebraspe e FCC. Segue o nosso roteiro:

  • Definição de Dado
  • Dados Estruturados
  • Dados Não Estruturados
  • Dados Semiestruturados
  • Mapa Mental

Primeiramente, ressaltamos que não é necessário nenhum conhecimento prévio para entender os conceitos apresentados. Além do fato de o assunto envolver uma parte introdutória, vamos apresentar o conteúdo bem “mastigado”.

Atendendo a pedidos, a leitura será rápida, direta ao ponto, para não ficar cansativo e nem atrapalhar seus estudos. Assim, esperamos que você consiga aproveitar o conteúdo da melhor maneira possível. Vamos lá?    

Tempo de leitura aproximada: 5 a 10 minutos

Definição de Dado

Antes de mais nada, não podemos entrar nas classificações sem explicar o básico. Dados podem ser definidos como sucessões de fatos brutos, que não foram organizados, processados, relacionados, avaliados ou interpretados.   

Em outras palavras, dados são partes isoladas de eventos, situações ou ocorrências. Observando apenas o dado, você vai perceber que ele não faz sentido algum; entretanto, ele constitui a unidade básica para elaborar ou obter informações (que farão algum sentido posteriormente).

Ex: 57, casaco, 1.54, Rio de Janeiro etc.

Os dados podem ser classificados em estruturados, semiestruturados e não estruturados. Vamos explicar com mais detalhes as classificações nas próximas seções.

Dados Estruturados

Estes dados contêm algum tipo de organização no seu armazenamento, seguindo uma estrutura. Ademais, são contidos em fontes de fácil compreensão, o que facilita o seu processamento. Ainda assim, eles são minoria no universo dos dados.

Os principais exemplos de dados estruturados que caem nas provas de concursos são planilhas, tabelas e bancos de dados. Veja que todos eles contam com algum tipo de estrutura de padronização (linhas e colunas, relações etc.).

NomeSexoData de Nascimento
CristianeFeminino18/01/1985
DanielMasculino18/04/1981
Tabela 1 – Exemplo de dados estruturados.

Dados Não Estruturados

Por outro lado, os dados não estruturados não seguem uma organização no seu armazenamento. Por conseguinte, são mais difíceis de serem recuperados e processados, haja vista que não há uma estrutura a ser seguida.

Os dados não estruturados são maioria no universo dos dados (aproximadamente 80%), principalmente com o avanço contínuo da tecnologia. Como resultado, sua gama de exemplos é bem vasta. Podemos destacar vídeos, áudios, fotos, textos etc. 

Figura 1 – Exemplo de dados não estruturados.

Dados Semiestruturados

Optamos por deixar essa classificação por último porque acreditamos que será mais fácil o seu entendimento, após ter visto as demais. Os dados semiestruturados são intermediários entre os dados estruturados e os não estruturados.

Em outras palavras, eles seguem uma estrutura prévia, mas que apresenta um grau de flexibilidade. Os principais exemplos cobrados nas provas são linguagens de marcação e suas derivações (XML, YAML etc.).

Momento Glossário: Uma linguagem de marcação é um conjunto de códigos utilizados para formatar e estruturar arquivos na Web, podendo também promover o intercâmbio de informações e processamento por outras linguagens.

Caso o conceito de linguagem de marcação ainda esteja muito abstrato para você, não há problema. Só para ilustrar, segue um exemplo simples da linguagem XML. Veja que há uma flexibilidade na sua estrutura, inclusive na definição de tags (representadas entre os símbolos de < e >).

Figura 2 – Exemplo de dados semiestruturados.

Mapa Mental

Para fechar o entendimento, vamos disponibilizar nesta seção um mapa mental contendo um resumo dos principais conceitos relacionados à classificação dos dados. Esse tipo de recurso é extremamente útil para os alunos que já conhecem o conteúdo e desejam realizar apenas uma revisão rápida.

Portanto, nossa recomendação é que você guarde o mapa mental com carinho para futuras consultas, no meio que for mais conveniente para o seu aprendizado (físico ou digital). 

Figura 3 – Mapa mental com os principais conceitos de dados.

Conclusão

No artigo de hoje, apresentamos as principais classificações de dados exploradas pelas bancas de concursos. Acreditamos que o conteúdo fará com que você acerte muitas questões. Assim, se você entendeu bem os conceitos, o próximo passo agora será realizar muitas questões para treinar.

Alunos aprovados realizam centenas ou até milhares de questões para atingir seu objetivo. O acesso ao Sistema de Questões do Estratégia é feito pelo link: https://concursos.estrategia.com/.

Não esqueça também de retornar ao tópico periodicamente para fazer revisões. O mapa mental disponibilizado irá ajudá-lo muito na memorização do conteúdo, juntamente com o material do Estratégia Concursos.

Por fim, lembramos que o Estratégia oferece diversos cursos em pdf, videoaulas e áudios para você ouvir onde quiser.

Bons estudos e até a próxima!

Cristiane Selem Ferreira Neves é Bacharel em Ciência da Computação e Mestre em Sistemas de Informação pela Universidade Federal do Rio de Janeiro (UFRJ), além de possuir a certificação Project Management Profissional pelo Project Management Institute (PMI). Já foi aprovada nos seguintes concursos: ITERJ (2012), DATAPREV (2012), VALEC (2012), Rioprevidência (2012/2013), TJ-RJ (2022) e TCE-RJ (2022). Atualmente exerce o cargo efetivo de Especialista em Previdência Social – Ciência da Computação no Rioprevidência, além de ser colaboradora do Blog do Estratégia Concursos.

Concursos Abertos

Quer Saber Tudo de Concursos Previstos?

Confira Nossos Artigos

Concursos 2022

Concursos 2023

Cristiane Selem Ferreira Neves

Cristiane Selem Ferreira Neves é Bacharel em Ciência da Computação e Mestre em Sistemas de Informação pela Universidade Federal do Rio de Janeiro (UFRJ), além de possuir a certificação Project Management Professional pelo Project Management Institute (PMI). Já foi aprovada nos seguintes concursos: ITERJ (2012), DATAPREV (2012), VALEC (2012), Rioprevidência (2012/2013), TJ-RJ (2022), TCE-RJ (2022) e CGE-SC (2022/2023). Atualmente exerce o cargo efetivo de Auditora de Controle Externo – Tecnologia da Informação e integra o corpo docente da Escola de Contas de Gestão do TCE-RJ, além de ser produtora de conteúdo dos Blogs do Estratégia Concursos, OAB e Carreiras Jurídicas.

Posts recentes

Concurso INSS: saiu edital; 500 vagas e até R$ 14,1 mil!

Salário inicial é de mais de R$ 5 mil. Saiba todos os detalhes desse importante…

2 minutos atrás

Tipos de accountability para o concurso da CAGE RS

Olá, pessoal, tudo bem? Neste artigo estudaremos sobre os tipos de accountability para o concurso…

7 minutos atrás

As inscrições do concurso PGE CE estão abertas!

As inscrições do concurso da Procuradoria-Geral do estado do Ceará (PGE CE) podem ser feitas das 8h…

16 minutos atrás

Concurso SUSEP: descubra o salário inicial dos cargos!

Está pensando em participar do novo concurso SUSEP (Superintendência de Seguros Privados) e ainda não…

28 minutos atrás

Concurso Público: confira a programação das aulas de hoje!

O Estratégia realiza semanalmente aulas, eventos, entrevistas, simulados, revisões e maratonas dos principais concursos de…

37 minutos atrás

Concurso Cariacica Saúde: são 154 vagas; inscreva-se!

Estão abertas as inscrições para o concurso Cariacica Saúde, prefeitura localizada no estado do Espírito…

56 minutos atrás