Analisemos a atividade a seguir, na qual estão envolvidos os conceitos de média, mediana e desvio padrão.
A tabela a seguir apresenta as informações estatísticas de uma fábrica sobre a duração, em horas, sem apresentar defeito, de três modelos de televisão. Se você levasse em conta apenas essas informações, qual modelo você escolheria? Explique.
Para escolher o modelo de televisão apenas por meio dessas três medidas, podemos começar a análise comparando a média da duração dessas TVs: essas médias são muito similares, sendo a média do modelo C um pouquinho mais alta, bem como sua mediana, que é também a mais alta, fato bastante positivo. Por outro lado, a mediana de A é a mais baixa. Se fôssemos tomar como base apenas a média e a mediana, descartaríamos o modelo A e ficaríamos com o modelo C. Concorda?
Mas vamos analisar os dados levando em conta também o desvio padrão. O maior desvio padrão é o do modelo A, o que representa que esse modelo apresenta maior variabilidade quanto à duração e, por isso, ele deve ser mesmo descartado. Observe que o modelo C tem também grande variabilidade: seu desvio padrão é 2,5 vezes maior (1500÷600=2,5) que o modelo B. Como B tem uma mediana não tão baixa em relação a C e variabilidade significativamente menor que a de C, pode-se concluir que a opção pelo modelo B em detrimento do modelo C é mais adequada.
Dizemos, nesse caso, que a turma A teve a maior dispersão absoluta, pois seu desvio padrão é maior. Mas, nessa situação, precisamos analisar o grau de dispersão considerando também a média, pois os valores de ambas as turmas são muito diferentes.
Nesses casos, podemos estabelecer uma relação entre o desvio padrão e a média calculando o coeficiente de variação (CV), que é obtido pela razão entre o desvio padrão e a média:
Assim, medimos a dispersão relativa das turmas A e B da situação em questão da seguinte maneira:
(em porcentagem: 41,7%);
(em porcentagem: 50%).
As notas dos alunos da turma B foram, portanto, mais dispersas que as notas da turma A, apesar de a turma B apresentar menor desvio padrão.
A partir das considerações e discussões feitas até aqui, procure analisar a situação descrita abaixo.
Uma classe de 48 alunos(as) fez um simulado do ENEM com 20 questões. A tabela a seguir indica o número de acertos, já organizados em ordem crescente. Observe que há dois(duas) alunos(as) que acertaram apenas 8 questões, que quatro alunos(as) acertaram 9 questões etc. Observe também que ninguém acertou mais de 14 questões.
Digite esses 48 números em uma planilha eletrônica e depois, utilizando as funções estatísticas dessa planilha, calcule a média, a mediana, a moda e o desvio padrão populacional.
Indique o primeiro e o terceiro quartil, verifique se há outliers e construa o gráfico boxplot.
Bom trabalho!