Dado, informação, conhecimento e inteligência. Dados estruturados e não estruturados. Dados abertos. Coleta, tratamento, armazenamento, integração e recuperação de dados. Metadados.
Representação de dados numéricos, textuais e estruturados; aritmética computacional. Representação de dados espaciais para georeferenciamento e geosensoriamento. Formatos e tecnologias: XML, JSON, CSV
Conceitos básicos de banco de dados.
anco de dados relacionais: conceitos básicos e características. Tabelas, visões (views) e índices. Chaves e relacionamentos.
Uso do SQL como DDL, DML, DCL. Processamento de transações
Exploração de dados: conceituação e características. Noções do modelo CRISP-DM. Técnicas para pré-processamento de dados. Técnicas e tarefas de mineração de dados. Classificação. Regras de associação. Análise de agrupamentos (clusterização). Detecção de anomalias. Modelagem preditiva
Conceitos de PLN: semântica vetorial, redução de dimensionalidade, modelagem de tópicos latentes, classificação de textos, análise de sentimentos, representações com n-grama
5 Conceitos de ML: fontes de erro em modelos preditivos, validação e avaliação de modelos preditivos, underfitting, overfitting e técnicas de regularização, otimização de hiperparâmetros, separabilidade de dados, redução da dimensionalidade. Modelos lineares, árvores de decisão, redes neurais feed-forward, classificador Naive Bayes
Linguagem Python: sintaxe, variáveis, tipos de dados e estruturas de controle de fluxo. Estruturas de dados, funções e arquivos
Bibliotecas: NLTK, Tensor Flow, Pandas, Numpy, Arrow, Sklearn, Scipy (Prof. Diego Carvalho e Raphael Lacerda).
Noções da Linguagem R. Sintaxe, tipos de dados, operadores, comandos de repetição, estruturas de dados, gráficos, Data frames. Tidyverse
Lei 13.709/2018. Lei Geral de Proteção de Dados Pessoais (LGPD)
8 Lei de Acesso a Informação (Lei nº 12.527/2011): conceitos e aplicação. (Thiago Cavalcanti)
Modelagem Multidimensional