Análise de Dados e Informações: 1 Dado, informação, conhecimento e inteligência: Conceitos e definições. Hierarquia da informação. 2 Dados estruturados e não estruturados: Características e métodos de análise. 3 Dados abertos: Conceitos e princípios de dados abertos.
Banco de Dados (Introdução)
Modelagem de Dados: Modelo entidade-relacionamento. Modelagem conceitual de dados. [Não explícito no edital]
5 Bancos de dados relacionais
SQL [Não explícito no edital]
Big Data: 1 Fundamentos. 2 Fluxo de Big Data. 3 Pipeline de Dados. 4 Processamento Distribuído. 5 Data Lake. 6 Data MArt. 7 Arquiteturas de Big Data. 3 Banco de dados NoSQL orientado a grafos: Neo4J. Armazenamento de Dados: 1 Sistemas de arquivos distribuídos: HDFS.
3 Banco de dados NoSQL orientado a grafos: Neo4J.
4 Banco de dados NoSQL orientado a documentos: MongoDB. 6 Sistemas de indexação: ElasticSearch.
3 Visão geral do guia DAMA-DMBOK: Áreas de conhecimento, elementos ambientais, atividades da gestão de dados. Governança de Dados: 1 Princípios e conceitos da governança de dados: Accountability, transparency, quality, integrity. 2 Componentes da governança de dados: Pessoas, processos, tecnologias.
5 Qualidade de Dados: Acurácia, completude, consistência, integridade, validade.
4 Visualização e Análise Exploratória de Dados.
5 Ferramentas de Criação de Dashboards (PowerBI).
Aprendizagem de Máquina: 1 Técnicas de Classificação: Naive Bayes, Regressão logística, Árvores de decisão e florestas aleatórias (random forest), Máquinas de vetores de suporte (SVM – support vector machines), K vizinhos mais próximos (KNN – K-nearest neighbours) e Redes neurais artificiais. 3 Avaliação e métricas de modelos de classificação e regressão. 4 Técnicas de Agrupamento: K-Means. 5 Técnicas de Redução de Dimensionalidade: Análise de Componentes Principais (PCA - Principal Component Analysis). Decomposição de Valor Singular (SVD - Singular Value Decomposition). 7 Sistemas de Recomendação: Filtragem Colaborativa, Filtragem Baseada em Conteúdo e Singular Value Decomposition (SVD). (Parte 1)
Aprendizagem de Máquina: 1 Técnicas de Classificação: Naive Bayes, Regressão logística, Árvores de decisão e florestas aleatórias (random forest), Máquinas de vetores de suporte (SVM – support vector machines), K vizinhos mais próximos (KNN – K-nearest neighbours) e Redes neurais artificiais. 3 Avaliação e métricas de modelos de classificação e regressão. 4 Técnicas de Agrupamento: K-Means. 5 Técnicas de Redução de Dimensionalidade: Análise de Componentes Principais (PCA - Principal Component Analysis). Decomposição de Valor Singular (SVD - Singular Value Decomposition). 7 Sistemas de Recomendação: Filtragem Colaborativa, Filtragem Baseada em Conteúdo e Singular Value Decomposition (SVD). (Parte 2)
Ingestão de Dados: 1 Ingestão de Dados: Estruturados, Semiestruturados e Não Estruturados; em Lote (Batch); Streaming; Full x Incremental; CDC (Change Data Capture) e MapReduce.
Large Language Models (LLMs): 1 Arquitetura de modelos LLMs: Transformers, BERT, GPT, T5; 2 Treinamento e Fine-tuning de LLMs. 3 Aplicações de LLMs: Geração de Texto, Resposta a Perguntas, Compreensão de Texto, Retrieval-Augmented Generation (RAG) e construção de Agentes.
8 Redes Neurais Artificiais (ANN).
Tratamento de Dados: 1 Normalização numérica: Padronização, z-score, min-max scaling. 2 Discretização. 3 Tratamento de dados ausentes. Imputation: média, mediana, KNN. Remoção de dados inconsistentes. 4 Tratamento de outliers e agregações: Detecção de outliers: IQR, boxplot. Métodos de agregação: média, mediana, quartis.