Sistemas gerenciadores de bancos de dados: conceitos básicos, Coleta e tratamento de dados, dados estruturados e não estruturados, dados abertos.
Modelo relacional, funções e visões, projeto de bancos de dados relacionais e normalização.
armazenamento físico de dados, indexação e hashing.
processamento de consultas, gerenciamento de transações, controle de concorrência, recuperação de falhas, segurança.
análise de desempenho e otimização de consultas.
Linguagem Transact-SQL, linguagem PL/pgSQL, gatilhos, procedimentos armazenados,
Administração de bancos de dados SQL Server e Postgres.
Business Intelligence: geração de relatórios, data warehouse, data lake, processos de ETL e ELT.
Modelagem multidimensional, OLAP.
Exploração de dados: conceituação e características. Noções do modelo CRISP-DM. Técnicas e tarefas de mineração de dados. Conceitos básicos em Big Data, armazenamento de dados em nuvem, frameworks para processamento paralelo e distribuído de dados.
Bancos de dados baseados em grafos, Bancos de dados espaciais, Bancos de dados NoSQL.
(Apache Hadoop, Apache Spark e Map-reduce), streaming de dados.
Classificação. Regras de associação. Análise de agrupamentos (clusterização). Detecção de anomalias. Modelagem preditiva. Kmeans. Regressão linear, regressão logística, árvores de decisão, floresta aleatória, naive bayes, máquina de vetor de suporte (SVM).
Conceitos de ML: fontes de erro em modelos preditivos, validação e avaliação de modelos preditivos, underfitting, overfitting e técnicas de regularização, otimização de hiperparâmetros, separabilidade de dados, redução da dimensionalidade, comitês.
Conceitos de PLN: semântica vetorial, redução de dimensionalidade, modelagem de tópicos latentes, classificação de textos, análise de sentimentos, representações com n-gramas.
Técnicas para tratamento e limpeza de bases de dados (valores faltantes, outliers, valores errôneos, redundância e desbalanceamento), técnicas para pré-processamento de dados (normalização, transformação, discretização e codificação de variáveis categóricas).