Conceitos básicos de banco de dados: 3 Banco de dados
3.1 Modelo entidade-relacionamento.
3.2 Mapeamento lógico relacional. 3.3 Normalização.
3.4 Linguagem de definição e manipulação de dados (SQL).
3.5 Conceitos de data warehousing e modelagem multidimensional (esquema estrela).
Big Data - 3.6 Conceitos gerais de Hadoop: HDFS, MapReduce, YARN e Spark. 3.7 Conceitos de Bancos NoSQL e Armazenamento orientado a objeto (object store).
1 Aprendizado supervisionado: Regressão e Classificação. 1.1 Métricas de avaliação. 1.2 Overfitting e underfitting de modelos. 1.3 Regularização. 1.4 Seleção de modelos: Erro de Generalização. 1.5 Validação Cruzada. 1.6 Conjuntos de Treino, Validação e Teste. 1.7 Trade off entre Variância e Viés. 1.8 Algoritmos: Regressão Linear e Regressão Logística. 1.9 Árvores de decisão e random forests. 1.10 Máquina de suporte de vetores. 1.11 Naive Bayes. 1.12 K-NN. 1.13 Ensembles. 1.14 Aprendizado supervisionado com Python scikit-learn. 1.15 Conceitos de otimização de hiperparâmetros.
2 Aprendizado não supervisionado. 2.1 Redução de dimensionalidade: PCA. 2.2 Agrupamento K-Means. 2.3 Mistura de Gaussianas. 2.4 Agrupamento Hierárquico. 2.5 Regras de associação. 2.6 Aprendizado não supervisionado com Python scikit-learn.
3 Redes neurais artificiais. 3.1 Conceitos Básicos em Redes Neurais Artificiais: Definições e Arquitetura. 3.2 Funções de Ativação. 3.3 Otimização de Redes Neurais Artificiais: método do gradiente, método do gradiente estocástico, algoritmo backpropagation, métodos de inicialização dos pesos, Vanishing Gradients. 3.4 Métodos de regularização: penalização com normas L1 e L2, Dropout e Early Stopping. 3.5 Definições básicas de Redes Neurais Convolucionais. 3.6 Definições básicas de Redes Neurais Recorrentes. 3.7 Redes neurais com Python: treino de modelos com Keras e Pytorch. 1 Machine learning aplicado. 1.1 Noções de Visão computacional com redes neurais convolucionais. 1.2 Classificação de imagens. 1.3 Detecção de objetos. 1.4 Segmentação de objetos e instâncias.
1.5 Noções de Processamento Natural de Linguagem. 1.6 Stop-words, stemização e n-grams. 1.7 TF-IDF. 1.8 Modelagem de tópicos (LDA, NMF). 1.9 Word embeddings: CBOW e Skip Gram.
1.10 Conceitos Básicos em Séries Temporais.
2 Manipulação, tratamento e visualização de dados. 2.1 Técnicas de visualização de dados (questão 1/2). 2.2 Técnicas de visualização de dados (questão 2/2). 2.3 Lidando com valores faltantes. 2.4 Lidando com dados categóricos. 2.5 Normalização numérica. 2.6 Detecção e tratamento de outliers. 2.7 Manipulação de dataframes com Python Pandas: leitura de dados tabulares, seleção de linhas e colunas, agregação de dados, preenchimento de valores faltantes, remoção de duplicados, junção de dataframes.
4 Algoritmos e estrutura de dados. 4.1 Complexidade de algoritmos e notação assintótica (Big O).
5.1 Conceitos Nuvem: IaaS, PaaS e SaaS.
5.2 Conceitos de Containers: construção, registro, execução e orquestração.
5.3 Conceitos básicos de DevOps: versionamento com git, pipeline e CI/CD.