A Copa do Mundo acontece de 4 em 4 anos e é considerada a maior festa do futebol. Ela reúne povos de todo o mundo que se juntam nos estádios para torcer por sua seleção. Em 2014, o Brasil foi a sede daquela edição. Segundo estatísticas, o país recebeu mais de 1 milhão de visitantes estrangeiros, que circularam pelas 12 cidades-sedes brasileiras: Rio de Janeiro, São Paulo, Belo Horizonte, Porto Alegre, Brasília, Curitiba, Salvador, Recife, Natal, Fortaleza, Manaus e Cuiabá.
Veja mais dados de uma determinada partida:
Antes do jogo acabar, o presidente da Confederação Brasileira de Futebol (CBF) quis saber, do total da torcida presente no estádio, quantos estavam com a camiseta da seleção brasileira. E incumbiu você dessa tarefa. Mostre qual informação você deve dar ao presidente, detalhando os passos que faria para disponibilizá-la.
Respostas
Resposta:
1) Primeiro, deve-se identificar qual é a população na ocasião, que deve ser toda a torcida presente no estádio. Este dado pode ser conseguido em sites oficiais, como, por exemplo, da CBF. Suponha-se que, ao olhar a fonte, foi identificado um público total, na ocasião, de 60 mil torcedores.
2) Em função do solicitado e como é muito difícil analisar todos os torcedores, devido ao seu tamanho, deve-se determinar uma amostra representativa e, para o caso, o tipo mais indicado seria o de uma amostragem aleatória simples. Para o cálculo dessa amostra, pode-se utilizar softwares estatísticos (pesquisar calculadora de tamanho da amostra ou calculadora amostral) ou tabelas indicativas desses quantitativos. Para isso, deve-se saber qual é o erro amostral que o solicitante deseja.
3) Após a identificação da amostra necessária para o levantamento, é feita a pesquisa, utilizando uma amostra aleatória para levantar quantos desses estariam usando a camiseta do Brasil e, assim, ter-se o percentual de torcedores que estariam usando a camiseta. Supõe-se que dos 384 torcedores levantados na pesquisa, apenas 168 usavam a camiseta do Brasil. Isso representa 43,75% da amostra.
4) Com o resultado final da pesquisa, informa-se ao presidente que, com 95% de confiança e um erro de ±5%, dos torcedores presentes ao jogo no dia, 43,75% estariam usando a camiseta da Seleção. De outra forma, com 95% de confiança, tendo-se um erro de 5%, que corresponde à 3.000 torcedores a mais ou a menos, dos 60.000 torcedores presentes, 26.250 (43,75%) estariam usando a camiseta da seleção brasileira.
Cálculo da amostra
Segundo Doane & Seward (2014, p. 330):
- Para a população infinita, a amostra é identificada pela fórmula:
n = (Z2. p . q /E2)
n = tamanho da amostra.
Z = nível de confiança expresso em desvio-padrão (os autores mostram tabela dos valores na p. 316).
E = erro amostral, que é a diferença entre o valor do resultado do cálculo estatístico e o verdadeiro valor que se deseja estimar.
p = proporção da população que pertence à categoria estudada no caso.
p = número de torcedores vestindo a camiseta do Brasil / pelo número de torcedores da amostra.
q = proporção da população que não pertence à categoria estudada, = 1 – p, no caso.
q = número de torcedores que não estão vestindo a camiseta do Brasil / número de torcedores da amostra.
Como p não é conhecido, utiliza-se a proporção amostral π no valor 0,5, pois, assim, o tamanho da amostra garantirá a precisão desejada apesar de, provavelmente, ser maior do que a necessária.
Assim, para a população infinita, utiliza-se a fórmula:
n = [Z2. π(1- π )]/E2
- Para a população finita, que é o caso em questão, deve-se usar um fator de correção que é dado por (N-n)1/2 / (N-1) 1/2
Assim, a fórmula a ser utilizada para uma população finita é:
n= [Z2 . π2. N] / [Z2 . π2+ E2 (N-1) ]
Como o presidente não definiu o grau de confiança nem o erro aceitável, vamos usar o grau de confiança de 95%, que nos dá Z = 1,96 e vamos assumir um erro de 5% (E= 0,05).
Determinando a amostra necessária para se realizar a pesquisa:
n= [1,962 x 0,52 x 60000] / [(1,962 x 0,52) + (0,052 x (60000-1) ]
n= [3,8416 x 0,25 x 60000] / [(3,8416 x 0,25) + (0,0025 x 59999)]
n= [0,9604 x 60000] / [(0,9604) + (0,0025 x 59999)]
n= [57624] / [(0,9604) + (149,9975)]
n= [57624] / [150,9579] = 381,722 = 382 torcedores devem ser pesquisados.
Atenção: É essencial definir antecipadamente qual é o nível de confiança e o erro, pois isto reflete, também, diretamente, nos custos, no tempo e em outros recursos a serem utilizados na pesquisa. Por exemplo, se o nível de segurança maior (99%) e o mesmo erro de 5%, a pesquisa teria exigido um levantamento com 659 torcedores, ao invés de 382. No entanto, se fosse considerado não apenas um nível de segurança maior (99%), mas, também, um erro menor (2%), a pesquisa teria exigido um levantamento com 3.892 torcedores.
Demais cálculos:
Caso seja utilizado um nível de confiança maior, por exemplo, 99% (Z= 2,58), considerando o mesmo erro, então:
n= [2,582 x 0,52 x 60000] / [(2,582 x 0,52) + (0,05 x 0,05 x (60000-1) ]
n= [6,6564 x 0,25 x 60000] / [(6,6564 x 0,25) + (0,0025 x 59999)]
n= [1,6641 x 60000] / [(1,6641) + (149,9975)]
n= [99846] / [151,6616] = 658,35 = 659 torcedores devem ser pesquisados.
Caso seja utilizado o mesmo nível de confiança de 95% (Z= 1,56), mas com erro de 2%, então:
n= [1,962 x 0,52 x 60000] / [(1,962 x 0,52) + (0,022 x (60000-1) ]
n= [3,8416 x 0,25 x 60000] / [(3,8416 x 0,25) + (0,0004 x 59999)]
n= [0,9604 x 60000] / [(0,9604) + (23,9996)] y
n= [57624] / [24,96] = 2.308,65 = 2.309 torcedores devem ser pesquisados.
Se a intenção é ter um erro menor (E = 2% = 0,02) com o nível de confiança de 99%, com Z = 2,58, então:
n= [2,582 x 0,52 x 60000] / [(2,582 x 0,52) + (0,022 x (60000-1) ]
n= [6,6564 x 0,25 x 60000] / [(6,6564 x 0,25) + (0,0004 x 59999)]
n= [1,6641 x 60000] / [(1,6641) + (23,9996)]
n= [99846] / [25,66] = 3.891,114 = 3.892 torcedores devem ser pesquisados.
Explicação: