Dados estruturados e não estruturados. Dados abertos. Coleta, tratamento, armazenamento, integração e recuperação de dados.
gestão de bancos de dados;
Modelagem Conceitual (Esse tema não veio explícito no edital e não deve ser cobrado diretamente pela banca, mas a sua leitura pode ajudar no entendimento da aula seguinte. Sugiro a leitura caso tenha dificuldade no entendimento da próxima aula.)
Bancos de dados relacionais: teoria e implementação.
Uso do SQL como DDL, DML, DCL. Processamento de transações.
BI e Data Warehouse (Esse tema não veio explícito no edital e não deve ser cobrado diretamente pela banca, mas a sua leitura pode ajudar no entendimento da aula seguinte. Sugiro a leitura caso tenha dificuldade no entendimento da próxima aula.)
Exploração de dados: conceituação e características. Noções do modelo CRISP-DM. Técnicas para pré-processamento de dados. Técnicas e tarefas de mineração de dados.
Classificação. Regras de associação. Análise de agrupamentos (clusterização). Detecção de anomalias. Modelagem preditiva. Conceitos de ML: fontes de erro em modelos preditivos, validação e avaliação de modelos preditivos, underfitting, overfitting e técnicas de regularização, otimização de hiperparâmetros, separabilidade de dados, redução da dimensionalidade. Modelos lineares, árvores de decisão, redes neurais feed-forward, classificador Naive Bayes. (Aprendizado Supervisionado)
Classificação. Regras de associação. Análise de agrupamentos (clusterização). Detecção de anomalias. Modelagem preditiva. Conceitos de ML: fontes de erro em modelos preditivos, validação e avaliação de modelos preditivos, underfitting, overfitting e técnicas de regularização, otimização de hiperparâmetros, separabilidade de dados, redução da dimensionalidade. Modelos lineares, árvores de decisão, redes neurais feed-forward, classificador Naive Bayes. (Aprendizado NÃO Supervisionado)
Conceitos de PLN: semântica vetorial, redução de dimensionalidade, modelagem de tópicos latentes, classificação de textos, análise de sentimentos, representações com n-gramas.
Pareamento de dados (record linkage). Processo e etapas. Classificação. Qualidade de dados pareados. Análise de dados pareados.
Noções da Linguagem R. Sintaxe, tipos de dados, operadores, comandos de repetição, estruturas de dados, gráficos, Data frames. Tidyverse.
Gerenciamento de processos de negócio. Modelagem de processos. Técnicas de análise de processo. Desenho e melhoria de processos. Integração de processos. Business Process Model and Notation (BPMN 2.0) (Parte 1)
Gerenciamento de processos de negócio. Modelagem de processos. Técnicas de análise de processo. Desenho e melhoria de processos. Integração de processos. Business Process Model and Notation (BPMN 2.0) (Parte 2)