Quais são as Técnicas de Mineração de Dados para o concurso do TCU
Saiba neste artigo quais são as Técnicas de Mineração de Dados para o concurso do TCU (Tribunal de Contas da União).
Olá, pessoal! Tudo bem com vocês?
Depois de uma longa espera, o edital do concurso do TCU (Tribunal de Contas da União) finalmente foi publicado.
São 20 vagas para o cargo de Auditor Federal de Controle Externo, com uma remuneração inicial de R$ 21.947,82.
Com um enorme peso na prova, Análise de Dados, a qual pertence ao ramo da temida Tecnologia da Informação (TI), tornou-se em uma das principais disciplinas para este certame.
Desse modo, com o intuito de auxiliá-lo na sua preparação para o concurso do TCU, iremos realizar uma análise sobre um dos tópicos dessa disciplina, o qual está previsto no seu edital: as Técnicas de Mineração de Dados.
Assim, iremos analisar os seguintes itens:
- O que é Mineração de Dados?
- Quais são as Técnicas de Mineração de Dados?
- Classificação
- Agrupamento
- Associação
O que é Mineração de Dados?
A Mineração de Dados, também conhecida como Data Mining, é um conjunto de processos, métodos e ferramentas, os quais possuem como objetivo encontrar padrões e correlações úteis e consistentes através da exploração, organização e análise de uma grande quantidade de dados.
Por meio da utilização de técnicas de inteligência artificial, aprendizado de máquina, estatística, entre outras, é possível realizar uma análise organizada de grandes volumes de dados, de modo a, por exemplo, prever resultados futuros por meio do descobrimento de padrões anteriormente desconhecidos.
Um exemplo prático da mineração de dados é a análise, por empresas de vendas, de dados pessoais de milhares de pessoas, como idade, nacionalidade, preferências e hábitos, com o intuito de traçar o perfil dos consumidores e criar estratégias de mercado.
De um modo geral, com a mineração de dados, é possível que uma empresa possa melhorar seus resultados em decorrência da utilização do Data Mining, por meio de corte de custos, aumento da lucratividade, melhora no relacionamento com os clientes, otimização de procedimentos, entre outras vantagens.
Quais são as técnicas de mineração de dados?
Vamos agora adentrar ao tema principal do nosso artigo para a prova do TCU: as Técnicas de Mineração de Dados.
As Técnicas de Mineração de Dados são as ações utilizadas para encontrar padrões em um grande volume de dados. Estes padrões podem ser explicativos, de modo a descrever as relações entre segmentos de dados, ou preditivos, os quais podem prever valores futuros baseados em dados anteriores.
As principais técnicas de mineração de dados, as quais serão apresentadas neste artigo, são a Classificação, a Associação e o Agrupamento.
A técnica de mineração de dados conhecida como Classificação possui como objetivo categorizar os dados com base em classes previamente definidas. Por sua vez, a Associação é uma técnica que procura descobrir relacionamentos entre variáveis. Já o Agrupamento é o particionamento de dados em diferentes classes, as quais possuem elementos com características semelhantes.
Aprendizado Supervisionado e Não Supervisionado
Antes de detalhar as técnicas de mineração de dados, iremos passar por dois conceitos importantes: o Aprendizado Supervisionado e o Aprendizado Não Supervisionado.
No aprendizado supervisionado há a interação humana, por meio do fornecimento de categorias de dados previamente definidas, de modo que o algoritmo irá classificar os dados novos inseridos de acordo com as classes de dados históricos fornecidas anteriormente.
Por sua vez, no aprendizado não supervisionado, não há a supervisão ou interação humana, de modo que não há a inclusão de classes de dados previamente. Com isso, o algoritmo irá apenas analisar os dados novos inseridos, sendo realizada, por si só, a categorização dos dados, sem nenhuma interferência humana ao longo do processo.
Disto isto, iremos agora analisar cada uma das técnicas de mineração apresentadas anteriormente.
Classificação
A classificação é uma técnica utilizada para realizar categorização dos dados, através da predição de informações com base em um conjunto de classes pré-definidas.
Em outras palavras, a classificação utiliza dados históricos e classes previamente inseridas, por meio de um aprendizado supervisionado, para classificar novos dados em determinadas categorias.
Vamos exemplificar. Uma empresa de vendas pode utilizar o histórico de pagamentos que ela possui dos seus clientes para classificá-los em grupos de adimplência e inadimplência. Desse modo, através dessas informações, eles podem ser classificados como maus e bons pagadores.
Agrupamento
O agrupamento, também conhecido como clusterização, é uma técnica de mineração de dados utilizada para categorizar os dados em classes, também chamadas de clusters, de acordo com as similaridades de cada item. Desse modo, ao analisar essas classes, padrões úteis de conhecimento podem ser descobertos.
É importante salientar que, no agrupamento, os elementos dentro de cada classe são semelhantes entre si, porém, são diferentes quando comparados a itens de outras classes.
Um ponto que o diferencia da “Classificação” é que as classes do “Agrupamento” não são pré-definidas, ou seja, é um aprendizado não-supervisionado.
Por exemplo, em um hospital, os pacientes de Covid-19 podem ser classificados unicamente de acordo com os sintomas apresentados.
PARA FIXAR:
Classificação: utiliza classes definidas – aprendizado supervisionado.
Agrupamento: utiliza classes não definidas – aprendizado não supervisionado.
Associação
Por fim, analisaremos a última técnica de mineração de dados deste artigo para o concurso do TCU, a associação.
A associação possui como princípio a utilização de algumas regras para encontrar relacionamentos entre variáveis, inclusive em situações em que elas, aparentemente, não possuem nenhuma relação.
Esta técnica é muito utilizada em ambientes de vendas, de modo a descobrir os hábitos de consumo dos diferentes segmentos de clientes, bem como identificar relações entre a comercialização de diferentes produtos, com o intuito de maximizar as negociações das suas mercadorias. Por este motivo, esse modelo também é chamado de Análise de Cesta de Compras.
Por exemplo, já foi identificado uma inusitada relação entre as vendas de atum e pasta de dente. Isso acontece pois quando as pessoas comem atum, eles possuem uma tendência maior em escovar os dentes logo após a refeição.
A análise também pode ser realizada entre produtos mais óbvios, em que os clientes que procuram por macarrão muito provavelmente irão também comprar molho de tomate ou creme de leite e batata palha.
Duas medidas muito utilizadas na descoberta desses padrões são o Suporte e a Confiança.
O suporte é a fração das transações totais que contém os itens analisados. Ou seja, caso sejam dois elementos analisados, será a porcentagem de transações que inclui tanto A quanto B.
A confiança é a porcentagem de relação entre os itens analisados. Ou seja, é a frequência em que o item A aparece nas transações que contêm B.
Vamos ilustrar.
Suponha-se que sejam realizadas as seguintes compras abaixo por 10 clientes:
- Qual é o valor do suporte para a associação “hambúrguer e pão”?
É a porcentagem das compras que possuem hambúrguer e pão, simultaneamente.
Nesse caso, são apenas 3 compras (1, 8 e 9). Como temos um total de 10 compras, então o suporte é de 3/10 = 30%.
- Qual é o valor da confiança para a associação “hambúrguer -> pão”?
É a frequência que aparece o pão nas compras em que estão presentes o hambúrguer.
A quantidade de compras em que o hambúrguer está presente é 6 (1, 2, 5, 8, 9 e 10). Dessas 6 compras, aparece o pão apenas em 3 (1, 8 e 9). Assim, a confiança é de 3/6 = 50%.
Desse modo, essa descoberta de padrões de associação pode ser utilizada para tomadas de decisões gerenciais.
Finalizando
Bom, pessoal! Chegamos ao fim da nossa análise sobre as Técnicas de Mineração de Dados para o concurso de Auditor Federal de Controle Externo do TCU. Espero que vocês tenham gostado.
Caso queira se preparar para chegar competitivo nesta prova, invista nos cursos para o Tribunal de Contas da União do Estratégia Concursos. Lá você encontrará aulas completas e detalhadas, com os melhores professores do mercado, de todos os tópicos exigidos no edital deste concurso.
Conheça também o Sistema de Questões do Estratégia. Afinal, a única maneira de consolidar o conteúdo de maneira satisfatória é através da resolução de questões.
Bons estudos a todos e até a próxima!
Cursos e Assinaturas
Prepare-se com o melhor material e com quem mais aprova em Concursos Públicos em todo o país!