Vamos comentar a prova de Análise de Informações do Tribunal de Contas do Estado de Pernambuco para os cargos de Auditor de Obras Públicas e Auditor de Contas Públicas. Qualquer dúvida estou as ordens! Antes de lerem os comentário, lembre-se de curtir minha página do Facebook® e me seguir no Instagram®. ?
Acerca de aspectos diversos referentes a bancos de dados relacionais julgue o item a seguir.
[116] A chave estrangeira (foreign key) é o campo que estabelece o relacionamento entre duas tabelas de bancos distintos, sendo necessariamente chave primária na tabela de um dos bancos.
Comentário: Essa questão tem uma pegadinha que pode ter levado muita gente a marcar a questão como correta. Ela fala que a chave estrangeira relaciona tabelas de banco distintos. Se você lembrar um banco de dados é descrito por um esquema que possui uma coleção de tabelas. A chave estrangeira é utilizada para relacionar tabelas dentro do próprio banco ou esquema. Sendo assim, acredito que a alternativa esteja incorreta.
Gabarito Preliminar: E. Gabarito Oficial: E.
A respeito da modelagem dimensional, julgue os próximos itens.
[117]. Todas as tabelas de um modelo apresentam um elemento de tempo como parte da estrutura da chave.
Comentário: Essa questão nós falamos sobre ela em vários momentos do nosso curso. É sabido que a dimensão tempo, pelo contexto analítico do DW, está presente nos modelos. Contudo, é importante perceber que a dimensão tempo é apenas uma das tabelas dimensões do seu modelo. A chave primária da dimensão tempo é referenciada por uma chave estrangeira na tabela fato. Sendo assim, a alternativa está incorreta, pois, apenas a tabela de dimensão tempo e a tabela fato possuem elementos de tempo como parte da sua estrutura.
Gabarito Preliminar: E. Gabarito Oficial: C. (Acho que cabe recurso)
O Kimball definiu algumas regras de ouro para construção de um DW. A regra 3 trata especificamente da dimensão tempo.
No site, http://www.ambientelivre.com.br/tutoriais-pentaho-bi/kimball-university-as-10-regras-essenciais-para-a-modelagem-de-dados-dimensional.html, que detalha as regras e as traduz temos que:
“Regra #3: Tenha certeza de que cada tabela fato tenha uma dimensão de data associada.
Os eventos mensuráveis descritos na Regra #2 sempre tem uma data de algum tipo associada a eles, sejam eles um balancete mensal ou uma transferência de dinheiro registrada em seu centésimo de segundo. Cada tabela fato deve ter ao menos uma chave estrangeira associada a uma tabela de dimensão data, cuja granularidade é cada único dia, com os atributos de calendário e suas características não padronizadas relacionadas a data do evento, como o período fiscal ou um indicador corporativo de feriado. Às vezes múltiplas chaves estrangeiras de data estão ligadas em uma única tabela fato.”
Observem que a tabela fato está associada a dimensão tempo ou data. E essa dimensão, se estivermos tratando de um modelo estrela, é apenas uma das tabelas do esquema.
Vejamos outro site: https://litolima.com/2010/01/12/dez-regras-de-ouro-para-modelagem-dimensional/. Nele, mais uma vez, temos a Regra 3 que afirma que Todo Fato ou toda tabela fato deve ter uma Dimensão de Tempo associada.
A medição dos eventos, descritos na regra anterior, sempre tem uma data ‘carimbada’ ou alguma variedade a eles associados, podendo ser o balance mensal, ou os valores capturados por minute, etc. Todo Fato deve ter, pelo menos, uma chave estrangeira de associação a uma Dimensão de Tempo (datas), cuja granularidade seja um único dia com os atributos do calendário e características não padronizadas sobre a data da medida do evento, como, por exemplo, ano fiscal, feriados, etc. É comum termos várias datas associadas a um fato.”
Percebam que a o tempo aparece apenas na tabela fato e na sua respectiva dimensão. Isso já foi assunto, inclusive, de provas anteriores do próprio CESPE, vejamos:
Acerca de data warehousing e OLAP, julgue os itens seguintes.
[1] Na modelagem multidimensional da tabela fato, a chave da dimensão tempo deve ser sempre representada como parte da chave primária.
A questão acima está correta. Veja a presença da dimensão tempo e a sua chave primária na composição da chave da tabela fato.
Outro exemplo aparece na prova deste ano, vejamos:
Com relação aos conceitos de modelagem multidimensional de dados para inteligência computacional, julgue o seguinte item.
[1] Ao se modelar uma tabela-fato, deve-se considerar que a chave primária é composta e que a dimensão tempo sempre será parte integrante dessa chave.
Mais uma vez, a alternativa está correta, mas o texto afirma explicitamente que a dimensão tempo fará parte da tabela fato.
Sendo assim podemos confirmar que a alternativa está incorreta. Faltou explicitar a Tabela fato! Sugiro que você organize os recursos baseados nestas referências. Se você procurar qualquer outro texto na internet vai encontrar o mesmo contexto. Você pode usar o google.book (livros) ou google.schollar (artigos) para encontrar outras fontes que podem deixar seu recurso mais robusto! Qualquer dúvida estou às ordens!
A respeito da modelagem dimensional, julgue os próximos itens.
[118]. No modelo floco de neve (snow flake) todas a tabelas estão relacionadas diretamente com a tabela de fatos, e as tabelas dimensionais devem conter todas as descrições necessárias para definir uma classe neles mesmas.
Comentário: Essa alternativa nós falamos sobre ela na revisão de ontem. O modelo floco de neve possui pelo menos uma dimensão normalizada, ou seja, ao menos uma tabela não está ligada diretamente a tabela fato. Sendo assim, temos mais uma alternativa incorreta.
Gabarito Preliminar: E. Gabarito Oficial: E.
Julgue o item que se refere a CRISP-DM (Cross Industry Standard Process for Data Mining).
[119] Durante a fase de entendimento do negócio, busca-se descrever claramente o problema, fazer a identificação dos dados e verificar se as variáveis relevantes para o projeto não são interdependentes.
Comentário: Essa para mim foi a questão mais difícil da prova. Primeiramente você teria que se lembrar das fases do CRISP, a primeira fase é o entendimento do negócio e a segunda entendimento dos dados. Vejamos o que cada uma tem como objetivo:
Entendimento do negócio: deve determinar os objetivos de negócio, fazer uma análise da situação atual e estabelecer os objetivos da mineração de dados. Finalizando com um plano de projeto.
Entendimento dos dados: Nesta etapa vamos entender os dados baseados nos requisitos. Nesta etapa podemos incluir uma coleta de dados, descrição, exploração e verificação da qualidade dos mesmos. Nesta etapa temos uma característica peculiar: identificar se as variáveis do modelo são independente umas das outras. Quando as variáveis são independentes podemos concluir que elas não possuem informações sobrepostas. Em econometria ou analise matemática podemos pensar em variáveis que são linearmente independentes. Uma escolha cuidadosa de variáveis independentes pode fazer com que a execução dos algoritmos seja feita de forma mais eficiente.
Enfim, depois desta longa explicação teórica, podemos perceber que o examinador associou eventos de etapas diferentes dos CRISP a fase de entendimento do negócio. Logo, a alternativa está incorreta.
Gabarito Preliminar: E. Gabarito Oficial: E.
Com relação a Big Data, julgue o item subsequente.
[120] Além de estar relacionado à grande quantidade de informações a serem analisadas, o Big Data considera o volume, velocidade e a variedade dos dados estruturados – dos quais se conhece a estrutura de armazenamento – bem como dos não estruturado, como imagens, vídeos, áudios e documentos.
Comentário: Big Data é o termo que descreve o imenso volume de dados – estruturados e não estruturados – que impactam os negócios no dia a dia. A definição da questão está perfeitamente de acordo com o conceito, citando inclusive os 3Vs da definição inicial de Doug Laney. Sendo assim, a resposta para esta alternativa está correta.
Gabarito Preliminar: C. Gabarito Oficial: C.
Acerca de aspectos diversos referentes a bancos de dados relacionais julgue o item a seguir.
[116] Em uma relação, os nomes das colunas são únicos, as linhas são distintas entre si, e a ordem da disposição das linhas e colunas é irrelevante para o banco de dados.
Comentário:
A questão apresenta o conceito de relação. Para o modelo relacional não é relevante a ordem na qual as linhas estão armazenadas, contudo existe uma certa relevância na forma como define as colunas de uma tabela. Pense da seguinte forma, você tem uma tabela do Excel impressa. Num primeiro momento você faz um corte vertical das colunas das tabela. Perceba que, se você remontar a tabela mudando a ordem das colunas você manterá as informações consistentes. De forma análoga, se você fizer cortes horizontais na tabela, você também consegue manter as mesmas informações. Esse é o arcabouço teórico do modelo relacional. Contudo existem alguns pontos que precisam ser considerados.
Gabarito Preliminar: C. Gabarito Oficial pós-Recurso: E.
Agora temos o gabarito preliminar, o oficial e uma possibilidade de recurso.
Forte abraço e bons estudos,
Thiago Cavalcanti
O concurso do Ministério da Justiça e Segurança Pública (MJSP), atrelado ao Concurso Nacional Unificado…
O concurso do Ministério da Cultura (MinC), que faz parte do edital unificado, habilitou novos…
O concurso do Ministério do Desenvolvimento, Indústria, Comércio e Serviços (MDIC), contemplado no edital unificado, habilitou…
Novos candidatos foram habilitados para a correção da prova discursiva do concurso da Agência Nacional…
O concurso ANEEL (Agência Nacional de Energia Elétrica), integrante do Concurso Nacional Unificado, habilitará novos…
O concurso da Agência Nacional de Saúde Suplementar (ANS), contemplado no Concurso Nacional Unificado (CNU), habilitará…
Ver comentários
Pelo que estou vendo, o conteúdo programático do TCE-PE foi bastante relevante
Fala Thiago,
[116] A chave estrangeira (foreign key) é o campo que estabelece o relacionamento entre duas tabelas de bancos distintos, sendo necessariamente chave primária na tabela de um dos bancos.
Essa questão de bancos distintos me deixou com frio na barriga na hora que li, porque na hora da prova, vai saber o que o camarada quiz dizer com isso.
No final das contas, tive certeza que a questão estava errada porque ela fala que necessariamente deve ser uma chave primária, quando na verdade uma chave alternativa também pode ser utilizada.
Grande abraço
Na questao 117 o gabarito preliminar consta como CERTO no site do CESPE, nao Errado como colocou o professor acima.
Estou trabalhando nisto agora!
Boa noite professor
Saiu o gabarito preliminar do CESPE, e na questão 117 eles estão dando como certa, ao contrário da sua análise extra oficial. Cabe recurso?
Claro que cabe! Estou trabalhando nisso agora. Já já faço comentários com orientações sobre o recurso.
Professor boa noite, o seu comentário para recurso saiu como a questão 118, mas na verdade seria a 117, será que o senhor poderia nos ajudar com essa fundamentação?
Obrigada
Que loucura! Deixa eu verificar aqui!
Professor, o que significa a sigla "DW" que você colocou no início de sua explicação da questão 117, na qual cabe recurso? Seria Data Wharehouse? Pode confirmar?
comentário postado: "Essa questão nós falamos sobre ela em vários momentos do nosso curso. É sabido que a dimensão tempo, pelo contexto analítico do DW, está presente nos modelos."
Obrigado
Exatamente! DW é a sigla para data warehouse ou armazém de dados.