1. Fundamentos: finalidades, níveis de abstração, modelagem de dados, modelagem funcional. modelos de dados; níveis de abstração de modelos de dados; metadados; linguagens de definição e de manipulação de dados;
2. modelos de dados; níveis de abstração de modelos de dados; metadados; linguagens de definição e de manipulação de dados; projeto de bancos de dados. (Modelagem Conceitual)
2. Normalização. 8. Álgebra relacional. (Modelo Relacional)
2.Administração de dados: fundamentos: dado, informação, conhecimento e inteligência; 1.1 Dados estruturados e não estruturados. 1.2 Dados abertos. 1.3 Coleta, tratamento, armazenamento, integração e recuperação de dados.
5. Técnicas de análise de desempenho e otimização de consultas SQL.
1.2 Técnicas de análise de desempenho e otimização de consultas (tuning). 1.3 Segurança de banco de dados.
1 BPM (business process management). 1.1 conceitos básicos. 1.2 identificação e delimitação de processos de negócio. 1.3 técnicas de mapeamento de processos (modelos as-is). 1.4 técnicas de análise e simulação de processos. 1.5 construção e mensuração de indicadores de processos. 1.6 técnicas de modelagem de processos (modelos to-be). 1.7 modelagem de processos em BPMN: notação, artefatos e atividades. 1.8 gerenciamento de processos de negócio (BPM e BPMN).
1 Conceitos, fundamentos, características, técnicas e métodos de business intelligence (BI). 2 Sistemas de suporte a decisão
3 Arquitetura e aplicações de data warehouse com ETL e OLAP. (Data Warehouse) 5 Visualização de dados: BD individuais e cubos. 6 Técnicas de modelagem e otimização de bases de dados multidimensionais. 7 Mapeamento das fontes de dados: técnicas para coleta de dados. 9 Técnicas de modelagem e otimização de bases de dados multidimensionais. 1
3 Arquitetura e aplicações de data warehouse com ETL e OLAP. 10 Mapeamento das fontes de dados: técnicas para coleta de dados. 5.9 ETL X ELT. (ETL e OLAP)
4 Mineração de dados. 4.1 Modelo de referência CRISP-DM 4.2 Técnicas para pré-processamento de dados. 4.3 Técnicas e tarefas de mineração de dados. 4.4 Classificação. 4.5 Regras de associação. 4.6 Análise de agrupamentos (clusterização). 4.7 Detecção de anomalias. 4.8 Modelagem preditiva. 4.9 Aprendizado de máquina. 4.10 Mineração de texto. 3 Técnicas de agrupamento. 3.1 Agrupamento por partição. 3.2 Agrupamento por densidade. 3.3 Agrupamento hierárquico. 4 Técnicas de redução de dimensionalidade. 4.1 Seleção de características (featureselection). 4.2 Análise de componentes principais (PCA – principal componentanalysis). 5 Técnicas de associação. 5.1 Descoberta de conjuntos frequentes. 5.2 Descoberta de regras de associação. 6 Sistemas de recomendação.
5 Big data. 5.1 Conceito, premissas e aplicação. 5.2 Tipos de dados: estruturados, semiestruturados e não estruturados. 5.3 Conceitos dos três Vs. 5.4 Fluxo de big data: ingestão, processamento e disponibilização. 5.5 Armazenamento de big data. 5.6 Pipeline de dados. 5.7 Processamento distribuído. 5.8 Conceitos de data lake. 5.10 Soluções de big data. 5.10.1 Arquitetura do ecossistema Apache Hadoop. 5.10.2 Componentes Hadoop: HBase, Kudu, Sqoop, Nifi, Hive, Impala, Spark, Spark Streaming, SOLR, Oozie, Yarn, Kafka, Flink e AirFlow. 9 Banco de dados NoSQL. 5.11 Arquiteturas de big data. 5.11.1 Arquitetura Lambda. 5.11.2 Arquitetura Kappa.
10 Visualização e análise exploratória de dados
7. Noções de Gerenciamento de Banco de Dados Oracle.
1 Técnicas de classificação. 1.1 NaiveBayes. 1.2 Regressão logística. 1.3 Redes neurais artificiais. 1.3.1 Funções de ativação: limiar, linear, ReLU, logística, softmax, maxout e gaussiana. 1.3.2 Redes Perceptron de única e múltiplas camadas. 1.4 Árvores de decisão (algoritmos ID3 e C4.5) e florestas aleatórias (randomforest). 1.5 Máquinas de vetores de suporte (SVM – support vector machines). 1.6 K vizinhos mais próximos (KNN – K-nearestneighbors). 1.7 Comitês de classificadores. 1.8 Avaliação de modelos de classificação: treinamento/teste/validação; validação cruzada; métricas de avaliação (matriz de confusão,acurácia, precisão, revocação, F1-score e curva ROC).
2 Técnicas de regressão. 2.1 Regressão linear. 2.2 Séries temporais (tendências, suavização exponencial e modelos ARIMA). 2.3 Redes neurais para regressão. 2.4 Árvores de decisão para regressão. 2.5 Máquinas de vetores de suporte para regressão. 2.6 Intervalos de confiança em regressão. 2.7 Avaliação de modelos de regressão: meanabsoluteerror (MAE), meansquareerror (MSE), root meansquareerror (RMSE) e coeficiente de determinação (R 2 ).
9 Aprendizado profundo. 9.1 Redes neurais convolucionais. 9.2 Redes neuraisrecorrentes. 9.2.1 Redes de Hopfield. 9.2.2 Long short-term memory (LSTM). 9.2.3 Redes Perceptron multicamadas recorrentes. 9.2.4 Máquinas de Boltzmann. 9.2.5 Deepbelief networks.8 Visão computacional. 8.1 Reconhecimento facial. 8.2 Classificação de imagens. 8.3 Detecção de objetos. 8.4 Deeplearning para visão computacional.
7 Processamento de linguagem natural (PLN). 7.1 Normalização textual (stop words, estemização, lematização e análise de frequência de termos). 7.2 Rotulação de partes do discurso (POS-tagging – part-of-speech tagging). 7.3 Reconhecimento de entidades (NER – namedentityrecognition) e rotulação IOB. 7.4 Modelos de representação de texto: Ngramas, modelos vetoriais de palavras (CBOW, Skip-Gram e GloVe), modelos vetoriais de documentos (booleano, TF e TF-IDF, média de vetores de palavras e Paragraph Vector). 7.5 Métricas de similaridade textual (similaridade do cosseno, distância euclidiana, similaridade de Jaccard, distância de Manhattan e coeficiente de Dice). 7.6 Aplicações de PLN: sumarização automática de texto (abordagens extrativa e abstrativa), modelagem de tópicos em texto (algoritmos LSI, LDA e NMF), classificação de texto, agrupamento de texto, tradução automática de texto, análise de sentimentos e emoções em texto, reconhecimento de voz (STT – speech totext).
5. Lei nº 12.527/2011 – Lei de Acesso à Informação Pública (LAI) - princípios, transparência ativa e passiva, prazos e instâncias recursais.