Artigo

PC-DF – Agente – Estatística – Recursos

E aí, galera! Esse gabarito preliminar oficial trouxe algumas surpresas, não é mesmo?! Apresento aqui comentários de algumas questões cujos gabaritos oficiais são questionáveis, no nosso ponto de vista, para aqueles que desejam apresentar recurso junto à banca.

Se você quiser dar uma olhada nos comentários de todas as questões de estatística da prova de Agente para PC-DF, dá uma olhada no meu post aqui!

Bloco de questões 103 e 104

Em uma pesquisa de campo, realizada por meio de amostragem aleatória simples, mediram-se as alturas de moradores masculinos adultos de determinado município. Os pesquisadores resolveram aproximar a distribuição de alturas por uma normal. Eles estimaram os parâmetros da normal por meio do método de máxima verossimilhança.

Considerando essa situação hipotética, julgue os itens a seguir.

Questão. A amostragem estratificada por faixas de renda familiar quando criança possibilitaria uma estimação intervalar mais precisa dos parâmetros da distribuição normal.

Comentários:

O gabarito preliminar oficial para essa questão é “CERTO” e a justificativa apresentada pela banca é: “A amostragem estratificada permite uma estimação mais precisa do que a amostragem aleatória simples”.

Inicialmente, cabe pontuar que a amostragem estratificada consiste em dividir a população em grupos (denominados estratos) e extrair uma amostra aleatória de cada estrato. Com esse procedimento, espera-se uma melhor representatividade da população (isto é, da característica sendo estudada), uma vez que haverá, na amostra extraída, elementos de todos os estratos da população. Ou seja, de fato, uma amostragem estratificada, conduzida de forma adequada, possibilita uma estimação mais precisa do que a amostragem simples.

Porém, se o critério para a estratificação da população não tiver relação com a característica sendo estudada, ela não trará melhor representatividade da população  e, consequentemente, não apresentará maior precisão à estimativa. A rigor, se a população for dividida aleatoriamente em estratos, para que seja conduzida uma amostragem estratificada, esta terá matematicamente a mesma eficiência de uma amostragem aleatória simples. 

De maneira similar, vamos supor que estejamos analisando o número médio de horas trabalhadas dos adultos e que iremos dividir a população de acordo com a altura dos seus pais. Nesse caso, também não há uma relação entre o aspecto sendo mensurado (número de horas trabalhadas) e o critério da segregação (altura dos pais). Dessa forma, a estratificação aproxima-se de uma estratificação aleatória, e a amostragem estratificada torna-se tão eficiente quanto a amostragem simples.

Entendemos que o enunciado trás esse tipo de situação, uma vez que não há relação aparente entre as alturas de moradores masculinos adultos (população) e a renda familiar quando criança (critério da estratificação), o que torna a amostragem estratificada tão eficiente quanto a amostragem aleatória simples, e não possibilita uma estimação mais precisa.

Por isso, pleiteamos pela alteração do gabarito, de “CERTO” para “ERRADO”. 

Bloco de questões 105 – 107

Um remédio para baixar a pressão arterial foi testado em pessoas com hipertensão. O referido medicamento foi comparado a outro medicamento que já estava em uso no mercado, por meio de amostragens aleatórias simples. Um teste t foi implementado para verificar se a pressão arterial dos testados baixava mais, em média, com o uso do novo remédio. Os pesquisadores escolheram um nível de significância de 0,01. Se o remédio baixasse a pressão arterial em mais que certa quantidade, p, o fabricante mudaria sua linha de produção para produzir o novo remédio. A potência do teste para detectar uma redução dessa quantidade, p, foi 0,9.

Com relação a essa situação hipotética, julgue os itens que se seguem.

Questão. Se o verdadeiro valor da redução média de pressão do novo remédio fosse igual a p, então existiria uma chance de 90% de o teste ter detectado essa diferença.

Comentários:

O gabarito preliminar oficial para essa questão é “CERTO” e a justificativa apresentada pela banca é: “A potência de um teste é a probabilidade de detectar uma dada diferença média, dado que essa diferença existe”.

Inicialmente, cabe destacar que a potência do teste (ou poder do teste) corresponde à probabilidade de rejeitar a hipótese nula sendo ela falsa e que o enunciado informou que essa probabilidade é igual a 0,9 (90%). Pelo enunciado, deduzimos que a hipótese nula é de que ambos os medicamentos possuam efeito similar e a hipótese alternativa é de que o novo medicamento seja mais eficiente. Logo, a rejeição da hipótese nula corresponde à conclusão de que o novo medicamento é, de fato, mais eficiente.

Ademais, o enunciado informa que a hipótese nula será rejeitada se o novo medicamento baixar a pressão arterial em mais que p, em média, na amostra extraída. Dessa forma, a potência para esse teste corresponde à probabilidade de o novo medicamento baixar a pressão arterial em mais que p, em média, na amostra extraída, dado que o novo medicamento é, de fato, mais eficiente que o outro (hipótese alternativa verdadeira).

Porém, o item afirma que a potência do teste corresponde à probabilidade de o teste detectar uma redução média da pressão arterial de p, dado que esse é o verdadeiro valor da redução provocada pelo novo medicamente. Ou seja, no item, houve uma aparente confusão entre o critério de rejeição da hipótese nula e o parâmetro verdadeiro (média) da população, que são conceitos distintos. 

Inclusive, ainda que a média de redução da pressão do novo medicamente seja igual a p, a probabilidade de o teste detectar exatamente essa redução na amostra é nula! Isso porque o nível de redução da pressão arterial é uma variável aleatória com distribuição contínua, em que a probabilidade de se obter exatamente determinado resultado (qualquer que seja) é nula.

Considerando a imprecisão da redação do item, entendemos que a questão deva ser anulada

Questão 108.

Determinado pesquisador reuniu dados de vários municípios brasileiros e estimou um modelo de regressão linear múltipla por mínimos quadrados ordinários. A variável dependente foi a taxa de homicídios, e as variáveis independentes incluíam variáveis, como, por exemplo, PIB per capita, média de anos de estudo, índice de Gini e outras variáveis socioeconômicas. Após a estimação, o pesquisador calculou a correlação entre os resíduos e as variáveis independentes e notou que essas correlações foram iguais a zero.

Com referência a essa situação hipotética, julgue o próximo item.

Questão. A ausência de correlação entre as variáveis independentes e os resíduos da regressão mostra que as variáveis independentes são exógenas.

Comentários:

Entendemos que o conceito de variáveis endógenas e exógenas, para tratar das relações de dependência e independência, são conceitos aplicáveis à Economia e à Econometria. Isso porque tais termos estão associados a modelos cuja finalidade é explicar o funcionamento da Economia, e não modelos puramente Estatísticos. 

Sem qualquer pretensão de esgotar a literatura sobre o assunto, apresentamos a seguir alguns livros relevantes que tratam dessa matéria:

Abel, A.B.; Bernarke, B.S.; Croushore, D. Macroeconomia. Pearson Universidades; 6ª edição; 512p; 2008.

Maia, A. G. Econometria: Conceitos e Aplicações. Editora Saint Paul, 2017.

Wooldridge, J. M. Introdução à econometria: uma abordagem moderna; tradução José Antônio Ferreira – São Paulo: Cengage Learning, 2010. Título original: Introductory econometrics: a modern approach 4.ed. norte-americana.

Verifica-se que são, de fato, livros de Economia e Econometria, e não livros voltados para a área de Estatística.

Assim, entendemos que a questão exige conhecimentos não constantes no edital do concurso, motivo pelo qual pleiteamos pela sua anulação.  

No entanto, caso a banca não acate o pedido de anulação, entendo que o gabarito deva ser alterado. Isso porque um dos pressupostos do modelo de regressão linear baseado no método de mínimos quadrados é de que o erro (também chamado de resíduo) seja totalmente não correlacionado com as variáveis explicativas (também chamadas de independentes).

Dentre os autores que elencam esse pressuposto para o método dos mínimos quadrados temos os seguintes (novamente, sem qualquer pretensão de esgotar a literatura sobre o assunto):

Figueiredo Filho, D., Nunes, F., Rocha, E.C., Santos, M.L., Batista, M., Silva Júnior, J.A. O que Fazer e o que Não Fazer com a Regressão: pressupostos e aplicações do modelo linear de Mínimos Quadrados Ordinários (MQO), Revista Política Hoje, V. 20, n.1, 2011.

KENNEDY, Peter. Sinning in the Basement: What Are the Rules? The Ten Commandments of Applied Econometrics, Journal of Economic Surveys, Wiley Blackwell, vol. 16: 569-589, 2002.

LEWIS-BECK, Michael. Applied Regression: an introduction. Series Quantitative Applications in the Social Sciences. SAGE, University Paper, 1980.

Se esse pressuposto não for atendido e uma das variáveis explicativas for correlacionada com o erro (mais precisamente, com a componente estocástica do erro), essa variável é dita endógena. Já a variável explicativa não correlacionada com o erro é dita exógena.

A banca considerou o item errado porque: “A mecânica de cálculo dos coeficientes de Mínimos Quadrados Ordinários faz que os resíduos não sejam correlacionados com as variáveis independentes. Então, esse fato de não correlação não traz informação sobre o fato de as variáveis independentes serem ou não exógenas.”

No entanto, entendemos que, embora a não correlação entre o erro e as variáveis explicativas (ou independentes) seja uma premissa do modelo de regressão, isso não garante que não haja essa correlação. Pelo contrário, essa premissa precisa ser verificada, caso contrário, não será adequado utilizar os estimadores obtidos pelo método.

Assim, pleiteamos que, caso a banca não acate o pleito de anulação da questão, por estar fora do escopo do edital, que acate o pleito de alteração do gabarito.

Deixe seu comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Veja os comentários
  • Nenhum comentário enviado.