Medidas de Dispersão

Dispersão é a disseminação de valores em torno da tendência central. Existem duas medidas comuns de dispersão, o intervalo eo desvio-padrão. O intervalo é simplesmente o maior valor menos o valor mais baixo. Em nosso exemplo, a distribuição, o alto valor é de 36 eo de baixo é de 15, então o intervalo é de 36 - 15 = 21.

O desvio padrão é uma estimativa mais precisa e detalhada de dispersão, porque um outlier pode exageram muito no intervalo (como acontecia neste exemplo onde o valor outlier única de 36 se destaca do restante dos valores). O desvio padrão mostra a relação que o conjunto de resultados tem a média da amostra. Mais uma vez vamos dar o conjunto de pontuações:

15, 20, 21, 36, 15, 25, 15

para calcular o desvio padrão, primeiro encontrar a distância entre cada valor ea média. Sabemos do alto que a média é 21. Assim, as diferenças a partir da média são:

15-21 = -6
20-21 = -1
21-21 = 0
36-21 = 15
15-21 = -6
25-21 = 4
15-21 = -6
Observe que os valores que estão abaixo da média têm diferenças e valores negativos acima dela ter pensamentos positivos. Em seguida, cada quadrado diferença:

(6) 2 = 36
(-1) 2 = 1
(+0) 2 = 0
(15) 2 = 225
(-6) 2 = 36
(+4) 2 = 16
(-6) 2 = 36
Agora, nós tomamos essas "praças" e somá-los para obter a soma dos quadrados (SS) valor. Aqui, a soma é 350. Em seguida, vamos dividir esta soma pelo número de escores menos 1. Aqui, o resultado é 350 / 6 = 58,3. Este valor é conhecido como a variância. Para obter o desvio padrão, tomamos a raiz quadrada da variância (lembre-se que os desvios ao quadrado anterior). Isso seria √ 58,3 = 7,63.

Embora este cálculo possaparecer complicado, é realmente muito simples. Em Inglês, podemos descrever o desvio-padrão como:

a raiz quadrada da soma dos desvios quadrados da média, dividida pelo número de escores menos um

O desvio padrão nos permite chegar a algumas conclusões sobre pontos específicos em nossa distribuição. Assumindo que a distribuição dos escores está perto de "normal", as seguintes conclusões podem ser alcançadas:

aproximadamente 68% dos escores na queda da amostra dentro de um desvio padrão da média
aproximadamente 95% dos escores na queda da amostra dentro de dois desvios-padrão da média
aproximadamente 99% dos escores na queda da amostra dentro de três desvios padrão da média
Por exemplo, uma vez que a média, no nosso exemplo é de 21 eo desvio padrão é de 7,63, podemos estimar a partir da afirmação acima, que aproximadamente 95% da pontuação vai cair na faixa de 21 - (2 × 7,63) para 21 + (2 × 7,63) ou entre 5,74 e 36,26. Valores além de dois desvios-padrão da média pode ser considerada "outliers". 36 é o valor único na nossa distribuição. Outliers ajudar a identificar observações para posterior análise ou possíveis problemas nas observações. Os desvios padrão também converter medidas em escalas muito diferentes, tais como altura e peso, em valores que podem ser comparados.