1 Dados estruturados e não estruturados. Dados abertos. Coleta, tratamento, armazenamento, integração e recuperação de dados. Processos de ETL
Representação de dados numéricos, textuais e estruturados; aritmética computacional. Representação de dados espaciais para georeferenciamento e geosensoriamento. Formatos e tecnologias: XML, JSON, CSV
Esse tema não veio explícito no edital e não deve ser cobrado diretamente pela banca, mas a sua leitura pode ajudar no entendimento da aula seguinte. Sugiro a leitura caso tenha dificuldade no entendimento da próxima aula.
2 Bancos de dados relacionais: teoria e implementação
Uso do SQL como DDL, DML, DCL. Processamento de transações
Esse tema não veio explícito no edital e não deve ser cobrado diretamente pela banca, mas a sua leitura pode ajudar no entendimento da aula seguinte. Sugiro a leitura caso tenha dificuldade no entendimento da próxima aula.
3 Exploração de dados: conceituação e características. Noções do modelo CRISP-DM. Técnicas para pré-processamento de dados. Técnicas e tarefas de mineração de dados. Classificação. Regras de associação. Análise de agrupamentos (clusterização). Detecção de anomalias. Modelagem preditiva
4 Conceitos de PLN: semântica vetorial, redução de dimensionalidade, modelagem de tópicos latentes, classificação de textos, análise de sentimentos, representações com n-gramas
5 Conceitos de ML: fontes de erro em modelos preditivos, validação e avaliação de modelos preditivos, underfitting, overfitting e técnicas de regularização, otimização de hiperparâmetros, separabilidade de dados, redução da dimensionalidade. Modelos lineares, árvores de decisão, redes neurais feed-forward, classificador Naive Bayes
6 Linguagem Python: sintaxe, variáveis, tipos de dados e estruturas de controle de fluxo. Estruturas de dados, funções e arquivos
Bibliotecas: NLTK, Tensor Flow, Pandas, Numpy, Arrow, Sklearn, Scipy (Prof. Diego Carvalho e Raphael Lacerda).
7 Noções da Linguagem R. Sintaxe, tipos de dados, operadores, comandos de repetição, estruturas de dados, gráficos, Data frames. Tidyverse
10 Lei de Acesso à Informação (Lei nº 12.527/2011): conceitos e aplicação
Lei 13.709/2018. Lei Geral de Proteção de Dados Pessoais (LGPD)
9 Segurança da informação: Confidencialidade, integridade, disponibilidade, autenticidade e não repúdio. Políticas de segurança. Políticas de classificação da informação. Sistemas de gestão de segurança da informação. Tratamento de incidentes de segurança da informação
8 Pareamento de dados (Record Linkage). Processo e etapas. Classificação. Qualidade de dados pareados. Análise de dados pareados