BANCO DE DADOS Conceitos e fundamentos. Tipos de dados. Modelo de dados conceitual, lógico e físico.
Modelo e Diagrama Entidade Relacionamento. Modelo Entidade-Relacionamento Estendido (EER). Notação Crow'sfoot (Pé de Galinha). Administração de dados e metadados: gestão, organização, coleta e manutenção.
Modelo relacional, em rede, hierárquico, distribuído. Arquitetura de sistemas de banco de dados. Modelagem de banco de dados relacional. Normalização. Álgebra relacional. Projeto de banco de dados relacional: dependências funcionais, normalização, projeto lógico de banco de dados e projeto físico de banco de dados.
Processamento de transações, controle de concorrência e recuperação. Instalação, operação, tunning, manutenção, gerenciamento, backup e restore. Criação e manutenção de views, funções, stored procedures, triggers, segurança. Conexões. Processamento e otimização de consultas. (Parte 1)
Processamento de transações, controle de concorrência e recuperação. Instalação, operação, tunning, manutenção, gerenciamento, backup e restore. Criação e manutenção de views, funções, stored procedures, triggers, segurança. Conexões. Processamento e otimização de consultas. (Parte 2)
Banco de dados Distribuídos.
Segurança em bancos de dados.
Conhecimento de SGBD. Oracle
Business Intelligence. Data Warehouse, Data Mart, ODS, Data Lake, ETL e OLAP. Modelagem Dimensional de Dados: básica e avançada. Criação, implantação e manutenção de rotinas de ETL. (Parte 1)
Business Intelligence. Data Warehouse, Data Mart, ODS, Data Lake, ETL e OLAP. Modelagem Dimensional de Dados: básica e avançada. Criação, implantação e manutenção de rotinas de ETL. (Parte 2)
Data Mining. Metodologia CRISP-DM.
Fundamentos de Big Data. Bancos de dados NoSQL. Conceitos e propriedades das transações (ACID e BASE).
Conhecimento da ferramenta Pentaho.
Conhecimento das plataformas MongoDB.
Conhecimento das ferramentas Power BI.
Governança de Dados. DAMA/DMBOK 2ª edição.
APRENDIZADO DE MÁQUINA Técnicas de classificação: NaiveBayes, regressão logística e redes neurais artificiais. Redes Neurais para classificação. Árvores de decisão: algoritmos ID3, C4.5 e florestas aleatórias (randomforest). Máquinas de vetores de suporte (SVM). K vizinhos mais próximos (KNN - K-nearestneighbors). Avaliação de modelos de classificação: treinamento, teste, validação; validação cruzada; métricas de avaliação; matriz de confusão, acurácia, precisão, revocação, F1-score e curva ROC. Técnicas de regressão: regressão linear e séries temporais. Redes neurais para regressão. Árvores de decisão para regressão. Máquinas de vetores de suporte para regressão. Intervalos de confiança em regressão. Avaliação de modelos de regressão: MAE, MSE, RMSE e coeficiente de determinação (R2). Técnicas de agrupamento: por partição, por densidade e hierárquico. Técnicas de redução de dimensionalidade: seleção de características e análise de componentes principais (PCA). Técnicas de associação:
APRENDIZADO DE MÁQUINA Técnicas de classificação: NaiveBayes, regressão logística e redes neurais artificiais. Redes Neurais para classificação. Árvores de decisão: algoritmos ID3, C4.5 e florestas aleatórias (randomforest). Máquinas de vetores de suporte (SVM). K vizinhos mais próximos (KNN - K-nearestneighbors). Avaliação de modelos de classificação: treinamento, teste, validação; validação cruzada; métricas de avaliação; matriz de confusão, acurácia, precisão, revocação, F1-score e curva ROC. Técnicas de regressão: regressão linear e séries temporais. Redes neurais para regressão. Árvores de decisão para regressão. Máquinas de vetores de suporte para regressão. Intervalos de confiança em regressão. Avaliação de modelos de regressão: MAE, MSE, RMSE e coeficiente de determinação (R2). Técnicas de agrupamento: por partição, por densidade e hierárquico. Técnicas de redução de dimensionalidade: seleção de características e análise de componentes principais (PCA). Técnicas de associação:
Tratamento de dados: normalização numérica, discretização, tratamento de dados ausentes, tratamento de outliers e agregações. Diagrama boxplot.
PROCESSAMENTO DE LINGUAGEM NATURAL Conceito de processamento de linguagem natural (PLN). Conceitos básicos da morfologia. Processamento morfológico em PLN. Dataset e corpus: formação, codificação, características, anotação. Normalização textual (stop words, estemização, lematização e análise de frequência de termos). Reconhecimento de entidades nomeadas e rotulação. Extração de relações. Modelos de representação de texto: N-gramas, modelos vetoriais de palavras (CBOW, Skip-Gram e GloVe), modelos vetoriais de documentos (booleano, TF e TF-IDF, média de vetores de palavras e Paragraph Vector). Métricas de similaridade textual (similaridade do cosseno, distância euclidiana, similaridade de Jaccard, distância de Manhattan e coeficiente de Dice). Aplicações de PLN: sumarização automática de texto (abordagens extrativa e abstrativa), modelagem de tópicos em texto (algoritmos LSI, LDA e NMF), classificação de texto, agrupamento de texto, tradução automática de texto, análise de sentimentos e
Aprendizado profundo (Deep Learning): redes neurais convolucionais, redes neurais recorrentes. Redes de Hopfield. Redes Adaline. Long short-term memory (LSTM). Redes perceptron multicamadas recorrentes. Máquinas de Boltzmann. Deepbelief networks. Reconhecimento facial. Classificação de imagens. Detecção de objetos. Deeplearning para visão computacional. Pré-processamento de dados. Visão computacional. Conceitos de representação de imagens. Métodos de filtragem de imagens. Conceitos gerais de reconhecimento de padrões. Detetores de bordas. Técnicas de convolução. Métodos de segmentação. Transformações de Fourier e Wavelets. Transformações de Hough, Snakes e outros métodos de reconhecimento de objetos baseados em modelos. Operadores morfológicos.