Prova da Semana – Comentário da prova do SEDF – Tecnologia da informação – BD e BI
Abaixo comentamos as questões de banco de dados e business intelligence da prova do SEDF deste último final de semana. A primeira prova relevante de 2017!
- Ano: 2017 Banca: CESPE Órgão: SEDF Cargo: Analista de gestão educacional – Especialidade: tecnologia da informação
Julgue os próximos itens, relativos à tecnologia de bancos de dados distribuídos.
[102] Uma desvantagem dos bancos de dados distribuídos é a falta de autonomia local, visto que um banco X depende da sincronização com um banco Y para que as operações sejam bem-sucedidas.
[103] Uma relação ou uma tabela pode estar fragmentada e armazenada em pontos diferentes; nesse caso, quando se separam os registros (linhas) da tabela, tem-se uma fragmentação horizontal.
Comentário: Vamos comentar cada uma das afirmações acima.
A primeira (102) trata de uma das caraterísticas presentes em bancos de dados distribuídos. Apenas para contextualizar uma das premissas ou possibilidades destes tipos de banco de dados é manter próximo aos usuários os dados utilizados com maior frequência. Imagine uma fábrica com várias filiais, a ideia é poder armazenar em cada uma delas os dados referentes aos seus clientes, sua produção, contabilidade, etc. Vejam que esses dados podem e devem ser manipulados pelos usuários da respectiva filial sem uma interação constante com o nó coordenador desta rede. Está autonomia local é considera um ponto importante dentro do processo de implementação de bancos de dados distribuídos. Desta forma, a assertiva em questão, por afirmar o oposto do apresentado está incorreta.
Na segunda afirmação (103) temos que avaliar nosso conhecimento sobre os tipos de fragmentação dos bancos de dados distribuídos. Neste contexto temos que entender como ocorrer a fragmentação em cada uma das tabelas pertencentes ao modelo. Cada tabela pode ser fragmentada de forma horizontal, separando as diferentes linhas em diferentes nós; vertical, na qual as colunas são separadas em diferentes nós da rede. Temos ainda a possibilidade de fragmentação mista, neste caso utiliza-se em uma tabela a fragmentação vertical e horizontal ao mesmo tempo. A questão faz uma afirmação correta sobre fragmentação horizontal.
Gabarito: E C.
- Ano: 2017 Banca: CESPE Órgão: SEDF Cargo: Analista de gestão educacional – Especialidade: tecnologia da informação
Com relação aos conceitos de modelagem multidimensional de dados para inteligência computacional, julgue os seguintes itens.
[104] Diferentemente da estrutura relacional, a estrutura multidimensional oferece baixa redundância de dados e suporte a normalização até a segunda forma normal.
[105] A operação drill-across permite buscar informações que vão além do nível de granularidade existente na estrutura dimensional, desde que elas estejam unidas por dimensões compatíveis.
[106] Ao se modelar uma tabela-fato, deve-se considerar que a chave primária é composta e que a dimensão tempo sempre será parte integrante dessa chave.
Comentário: Mais uma vez vamos comentar todas as alternativas, desta que foi a primeira prova do CESPE de 2017!
Na alternativa 104 temos uma falha na definição da modelagem multidimensional. Sabemos que o modelo em estrela, mais utilizado no desenho ou projeto de bases de dados analíticas, utiliza-se de alta redundância e baixa normalização para apresentar um modelo de dados numa estrutura mais compreensiva para os usuários finais. Essa construção facilita ainda a navegação entre as diversas dimensões do modelo, facilitando a construção de relatórios. Podemos, então, concluir que q afirmação está incorreta.
A alternativa 104 foi inspirada no livro do Carlos Barbieri, BI2: Business Intelligence. Segundo o autor, o comando de DRILL-ACROSS permite o tratamento das informações que, embora correlacionadas, estão em estruturas de esquema separadas, porém unidas por algumas dimensões coerentes. Funciona como uma operação de junção dimensional, entre estruturas relacionadas. Em outras palavras o comando DRILL-ACROSS faz uma equivalência entre esquemas dimensionais quando unidos por dimensões compatíveis. Vejam que não é está a definição descrita na questão, que portanto, está incorreta. O conceito da questão está associado ao termo DRILL-THROUGH.
O conceito de DRILL-THROUGH está relacionado com a ideia de você desejar uma informação em um nível de detalhe menor do que aquele colocado na tabela fato e permitido pala sua granularidade. Seria essa operação que permite uma busca de informações além do nível de granularidade existente na estrutura dimensional.
Vamos agora comentar a última alternativa (106). A questão apresenta uma sugestão de projeto presente na literatura especializada: a criação da dimensão tempo. Outro ponto, também descrito na questão é a composição da chave primaria pela união das chaves artificiais das dimensões a ela relacionadas. Sendo assim, podemos marcar a alternativa como correta.
Gabarito: E E C
- Ano: 2017 Banca: CESPE Órgão: SEDF Cargo: Analista de gestão educacional – Especialidade: tecnologia da informação Questão: 109
Julgue os itens seguintes, a respeito de estruturas em programação e de arquiteturas de bancos de dados.
[109] O esquema do nível externo de uma arquitetura de três esquemas oculta os detalhes das estruturas de armazenamento físico e se concentra na descrição de entidades, tipos de dados, conexões, operações de usuários e restrições.
Comentário: O objetivo da arquitetura três esquemas é separar as aplicações do usuário do banco de dados físico. São três níveis:
- Nível interno: tem um esquema interno, que descreve a estrutura do armazenamento físico do banco de dados. O esquema interno usa um modelo de dados físico e descreve detalhes completos do armazenamento de dados.
- Nível conceitual: tem esquema conceitual, que descreve a estrutura do banco de dados inteiro para uma comunidade de usuários. Oculta detalhes das estruturas de armazenamento físico e se concentra na descrição das entidades, tipos de dados, relacionamentos, operações e restrições. Um modelo representativo é usado para descrever o esquema conceitual.
- Nível externo ou de visão: inclui uma série de esquemas externos ou visões do usuário. Cada esquema externo descreve a parte do banco de dados em que um grupo de usuários em particular está interessado e oculta o restante do banco. Como o nível anterior, cada esquema externo é implementado por um modelo de dados representativo.
Após analisarmos as afirmações teóricas acima, podemos concluir que a alternativa 109 da prova do SEDF está incorreta.
Gabarito: E.
- Ano: 2017 Banca: CESPE Órgão: SEDF Cargo: Analista de gestão educacional – Especialidade: tecnologia da informação Questão: 118
Com relação a data mining e data warehouse, julgue os itens que se seguem.
[118] Comparados aos bancos de dados transacionais, os data warehouses são mais voláteis porque, para que se mantenham consistentes, são atualizados em tempo real a cada atualização que ocorrer em qualquer uma das bases originais de dados que o componham.
Comentário: A característica de não volatilidade está relacionada ao fato de que o conteúdo do Data Warehouse permanece estável por longos períodos de tempo. Basicamente duas operações são efetuadas no Data Warehouse. A primeira é a transação de manutenção, onde o objetivo é a carga dos dados provenientes dos provedores de informação. A segunda é relacionada à leitura dos dados para geração de relatórios de tomadas de decisão.
Analisando as informações podemos concluir que alternativa está incorreta.
Gabarito: E.
- Ano: 2017 Banca: CESPE Órgão: SEDF Cargo: Analista de gestão educacional – Especialidade: tecnologia da informação Questão: 119
Com relação a data mining e data warehouse, julgue os itens que se seguem.
[119] Agrupar registros em grupos, de modo que os registros em um grupo sejam semelhantes entre si e diferentes dos registros em outros grupos é uma maneira de descrever conhecimento descoberto durante processos de mineração de dados.
Comentário: Se analisarmos a descrição acima temos uma definição da tarefa de agrupamento ou clustering.
A clusterização é a classificação não-supervisionada de dados, formando agrupamentos ou clusters. Ela representa uma das principais etapas do processo de análise de dados denominada análise de clusters. A análise de clusters envolve, portanto, a organização de um conjunto de padrões (usualmente representados na forma de vetores de atributos ou pontos em um espaço multidimensional – espaço de atributos) em clusters, de acordo com alguma medida de similaridade. De forma intuitiva, padrões pertencentes a um dado cluster devem ser mais “similares” entre si do que em relação a padrões pertencentes a outros clusters.
Vejam, portanto, que a alternativa está correta.
Gabarito: C.
Acho que de BD e BI é isso que temos por hoje! Vamos em frente! Um passo a cada dia na direção certa: rumo à aprovação!!
Forte abraço e bons estudos,
Thiago Cavalcanti