No tópico anterior, você aprendeu os significados das medidas de tendência central de uma pesquisa: a moda, a mediana e a média. Você também analisou gráficos do tipo boxplot, que apresentam um resumo de uma distribuição de frequências envolvendo cinco números: o valor mínimo, o primeiro quartil, a mediana, o terceiro quartil e o valor máximo.
Neste tópico, você estudará outra medida que não pode ser desconsiderada na análise de um conjunto de dados: o desvio padrão. O desvio padrão mede a dispersão, ou seja, o afastamento da média em que se encontram os valores de um conjunto de dados. Você também verá que o desvio padrão está fortemente associado à curva normal.
Para compreender o que é uma curva normal e qual a sua relação com o desvio padrão, é preciso aprender a calcular esse desvio. Esse cálculo, apesar de fácil, é muito trabalhoso, sobretudo se tivermos muitos dados, mesmo com a utilização de uma calculadora. Mas não se preocupe, as planilhas eletrônicas fazem esse cálculo de forma muito eficiente, basta digitar os valores.
No entanto, é importante que você calcule o desvio padrão pelo menos uma vez utilizando uma calculadora, de modo a identificar os procedimentos envolvidos nesse cálculo.
Em primeiro lugar, devemos calcular a média, tendo em vista que o desvio padrão está relacionado com ela.
Depois, calculamos os desvios dessas notas em relação à média:
Você já verificou, no tópico anterior, que a soma dos desvios em relação à média é zero: -4-1+0+1+4=0
Para evitarmos esse valor de 0, elevamos cada diferença ao quadrado, somamos todos os resultados e calculamos a média aritmética entre eles:
Média da soma dos quadrados das diferenças:
Por fim, com a calculadora, extraímos a raiz quadrada do valor anteriormente obtido e determinamos o desvio padrão (DP) desse conjunto de valores:
Você deve observar que, quanto maior for o desvio padrão, maior é a dispersão em torno da média.
A ideia subjacente ao desvio padrão como medida de dispersão é a seguinte: os desvios x – X mostram a dispersão dos valores x, em tomo de sua média X. Alguns desses desvios serão positivos, outros serão negativos, porque se observa, no conjunto de dados, valores em ambos os lados da média. Como pudemos verificar, a soma dos desvios das observações, a contar da sua média, é sempre zero. Por isso, é conveniente elevar ao quadrado essas diferenças para torná-las positivas. Depois, determina-se a média da soma desses quadrados e extrai-se a raiz quadrada.
A média da soma dos quadrados das diferenças é denominada de variância, que, por sua vez, também é uma medida estatística. Assim, o desvio padrão é a raiz quadrada da variância.
Antes de prosseguir, propomos a você responder a questão abaixo.
Os números a seguir representam as faltas de cada um dos dez professores de uma escola no ano de 2013: 3, 4, 4, 4, 5, 6, 6, 7, 7 e 8. Utilizando uma planilha ou uma calculadora, calcule a moda, a mediana, a média e o desvio padrão das faltas dos professores.
(Obs.: o desvio padrão a ser calculado é o populacional, pois o texto parece indicar que foram incluídos todos os professores da escola).