Medidas de dispersão

As medidas de dispersão resumem os dados a partir de um único valor que indica variabilidade. Conheça as principais medidas, aprenda a calcular e veja exemplos!

As medidas de dispersão são medidas estatísticas usadas para determinar a variabilidade em um conjunto de dados.

Existem várias medidas de dispersão, as principais são: amplitude, variância, desvio padrão e coeficiente de variação. O uso de uma ou outra medida, pode variar de acordo com cada situação.

Mas, de forma geral, quando calculamos uma medida de dispersão, obtemos um número que indica o quanto os dados estão próximos ou distantes (dispersos) uns dos outros.

Quanto mais afastados são os dados, mais altas tendem a ser as medidas de dispersão. Por outro lado, quanto mais concentrados os dados, mais baixas tendem ser as medidas.

Amplitude

A amplitude é o valor que obtemos quando subtraímos o menor valor do conjunto de dados do maior valor.

\dpi{120} \mathrm{Amplitude} =X_{\mathrm{m\acute{a}x}} - X_{\mathrm{min}}

Uma vantagem da amplitude, é que ela é uma medida muito natural e simples de ser calculada.

Já a desvantagem, é que ela considera apenas dois valores do conjunto de dados, o menor e o maior. Nesse caso, perde-se a informação sobre a variabilidade contida nos demais valores.

Exemplo: Com as comissões, os salários, em reais, de quatro funcionários dos departamentos A e B de uma empresa, são:

A: 1200, 1280, 1300, 1320.
B: 1190, 1345, 1600, 2150.

Vamos calcular a amplitude dos salários de cada departamento.

Departamento A:

\dpi{120} \mathrm{Amplitude} =1320 - 1200 = 120

Departamento B:

\dpi{120} \mathrm{Amplitude} =2150 - 1190 = 960

Esses valores indicam que há uma variação maior entre os salários dos funcionários do departamento B, onde a diferença entre o maior e o menor salário é de 960 reais.

Variância

A variância é uma medida de dispersão que considera todos os valores do conjunto de dados e a média aritmética entre eles.

A fórmula da variância é:

\dpi{120} V = \frac{\sum_{i=1}^{n}(x_i-\bar{x})^2}{n}

Em que:

  • \dpi{120} V é a variância;
  • \dpi{120} x_i é o valor da i-ésima observação;
  • \dpi{120} \bar{x} é a média das observações;
  • \dpi{120} n é o total de observações.

O somatório na fórmula indica a soma de todos os termos \dpi{120} (x_i - \bar{x})^2, para \dpi{120} i indo de 1 até \dpi{120} n, ou seja:

\dpi{120} \sum_{i=1}^{n}(x_i-\bar{x})^2 = (x_1- \bar{x})^2 + (x_2- \bar{x})^2 +...+(x_n- \bar{x})^2

Exemplo: As alturas, em metros, de três jogadoras de basquete são: 1,84; 1,88 e 1,95. Vamos calcular a variância das alturas.

Primeiro, obtemos a média das alturas:

\dpi{120} \bar{x} = \frac{1,84 + 1,88 + 1,95}{3} = 1,89

Agora, aplicamos os valores na fórmula da variância:

\dpi{120} V = \frac{(1,84 - 1,89)^2+(1,88 - 1,89)^2+(1,95 - 1,89)^2}{3}

\dpi{120} \Rightarrow V = \frac{(-0,05)^2+(-0,01)^2+(0,06)^2}{3}

\dpi{120} \Rightarrow V = \frac{0,0062}{3}

\dpi{120} \Rightarrow V = 0,002

Portanto, a variância das alturas é igual a 0,02 m².

Desvio padrão

O desvio padrão é uma das medidas de dispersão mais utilizadas. Ele corresponde a raiz quadrada da variância.

\dpi{120} DP = \sqrt[]{\mathrm{Vari\hat{a}ncia}}

Desse modo, além de levar em consideração todos os valores da amostra, o desvio padrão ainda tem a vantagem de apresentar a mesma unidade de medida dos dados, ao contrário da variância que é uma medida quadrática.

A fórmula para calcular o desvio padrão é:

\dpi{120} DP= \sqrt{\frac{\sum_{i=1}^{n}(x_i-\bar{x})^2}{n}}

Em que:

  • \dpi{120} DP é o desvio padrão;
  • \dpi{120} x_i é o valor da i-ésima observação;
  • \dpi{120} \bar{x} é a média das observações;
  • \dpi{120} n é o total de observações.

Exemplo: Vamos calcular o desvio padrão das alturas das jogadoras de basquete do exemplo anterior.

Como a variância obtida foi de 0,02 m², então:

\dpi{120} DP = \sqrt[]{0,02\, \mathrm{m}^2}

\dpi{120} DP = 0,04 \, \mathrm{m}

Portanto, o desvio padrão das alturas é igual a 0,04 m. Observe que essa medida é mais fácil de ser interpretada do que a variância.

Significa que as jogadoras têm em média 1,89 metros de altura com uma variação em torno de 0,04 metros (equivalente a 4 cm) para mais ou para menos.

Coeficiente de variação

O coeficiente de variação (CV) é uma medida de dispersão que, ao contrário de todas as medidas anteriores, é livre de qualquer unidade de medida.

O CV é definido como o quociente entre o desvio padrão e a média dos dados:

\dpi{120} CV = \frac{\mathrm{desvio \: padr\tilde{a}o}}{\mathrm{m\acute{e}dia}} \times 100

Em geral, é um valor apresentado em forma de porcentagem, por isso multiplica-se por 100 na fórmula.

O coeficiente de variação é uma medida indicada para comparar a variabilidade entre dois ou mais conjuntos de dados, já que é um valor livre de unidade de medida.

O conjunto de dados mais homogêneo é aquele que apresenta menor valor do CV.

Contudo, também podemos calcular o coeficiente de variação para analisar um único conjunto de dados. Nesse caso, a interpretação do valor do coeficiente de variação depende da natureza da variável estudada.

Exemplo: Vamos calcular o CV para os dados do exemplo das jogadoras de basquete.

Já sabemos que a média é igual a 1,89 metros e o desvio padrão é 0,04 metros.

\dpi{120} CV = \frac{0,04\cancel{m}}{1,89\cancel{m}} \times 100

\dpi{120} CV = 0,021 \times 100

\dpi{120} CV = 2,1%

Portanto, o coeficiente de variação das alturas é de aproximadamente 2%. Por se tratar de altura, indica uma baixa variação, ou seja, as alturas estão relativamente próximas à média (1,89).

Medidas de dispersão e medidas de tendência central

As medidas de tendência central, como a média, moda e mediana, também resumem um conjunto de dados a partir de um único valor.

Essas medidas indicam a centralidade dos dados, mas nada informam sobre a variabilidade entre eles.

Considere, por exemplo, que sabemos apenas a média de um conjunto de dados. Como podemos dizer de que forma os dados se concentram em torno da média? Será que estão relativamente próximos a ela ou será que se afastam muito?

Não poderemos saber somente pela média. No entanto, se tivermos uma medida de dispersão, como o desvio padrão, teremos condições de responder às perguntas anteriores, pois o desvio padrão indica justamente a variação dos dados em relação à média.

Assim, essas diferentes medidas estatísticas devem ser consideradas em conjunto, avalia-se a centralidade e a dispersão.

Você também pode se interessar:

você pode gostar também

Os comentários estão fechados, mas trackbacks E pingbacks estão abertos.