Medidas de dispersão
As medidas de dispersão resumem os dados a partir de um único valor que indica variabilidade. Conheça as principais medidas, aprenda a calcular e veja exemplos!
As medidas de dispersão são medidas estatísticas usadas para determinar a variabilidade em um conjunto de dados.
Existem várias medidas de dispersão, as principais são: amplitude, variância, desvio padrão e coeficiente de variação. O uso de uma ou outra medida, pode variar de acordo com cada situação.
Mas, de forma geral, quando calculamos uma medida de dispersão, obtemos um número que indica o quanto os dados estão próximos ou distantes (dispersos) uns dos outros.
Quanto mais afastados são os dados, mais altas tendem a ser as medidas de dispersão. Por outro lado, quanto mais concentrados os dados, mais baixas tendem ser as medidas.
Amplitude
A amplitude é o valor que obtemos quando subtraímos o menor valor do conjunto de dados do maior valor.
Uma vantagem da amplitude, é que ela é uma medida muito natural e simples de ser calculada.
Já a desvantagem, é que ela considera apenas dois valores do conjunto de dados, o menor e o maior. Nesse caso, perde-se a informação sobre a variabilidade contida nos demais valores.
Exemplo: Com as comissões, os salários, em reais, de quatro funcionários dos departamentos A e B de uma empresa, são:
A: 1200, 1280, 1300, 1320.
B: 1190, 1345, 1600, 2150.
Vamos calcular a amplitude dos salários de cada departamento.
Departamento A:
Departamento B:
Esses valores indicam que há uma variação maior entre os salários dos funcionários do departamento B, onde a diferença entre o maior e o menor salário é de 960 reais.
Variância
A variância é uma medida de dispersão que considera todos os valores do conjunto de dados e a média aritmética entre eles.
A fórmula da variância é:
Em que:
- é a variância;
- é o valor da i-ésima observação;
- é a média das observações;
- é o total de observações.
O somatório na fórmula indica a soma de todos os termos , para indo de 1 até , ou seja:
Exemplo: As alturas, em metros, de três jogadoras de basquete são: 1,84; 1,88 e 1,95. Vamos calcular a variância das alturas.
Primeiro, obtemos a média das alturas:
Agora, aplicamos os valores na fórmula da variância:
Portanto, a variância das alturas é igual a 0,02 m².
Desvio padrão
O desvio padrão é uma das medidas de dispersão mais utilizadas. Ele corresponde a raiz quadrada da variância.
Desse modo, além de levar em consideração todos os valores da amostra, o desvio padrão ainda tem a vantagem de apresentar a mesma unidade de medida dos dados, ao contrário da variância que é uma medida quadrática.
A fórmula para calcular o desvio padrão é:
Em que:
- é o desvio padrão;
- é o valor da i-ésima observação;
- é a média das observações;
- é o total de observações.
Exemplo: Vamos calcular o desvio padrão das alturas das jogadoras de basquete do exemplo anterior.
Como a variância obtida foi de 0,02 m², então:
Portanto, o desvio padrão das alturas é igual a 0,04 m. Observe que essa medida é mais fácil de ser interpretada do que a variância.
Significa que as jogadoras têm em média 1,89 metros de altura com uma variação em torno de 0,04 metros (equivalente a 4 cm) para mais ou para menos.
Coeficiente de variação
O coeficiente de variação (CV) é uma medida de dispersão que, ao contrário de todas as medidas anteriores, é livre de qualquer unidade de medida.
O CV é definido como o quociente entre o desvio padrão e a média dos dados:
Em geral, é um valor apresentado em forma de porcentagem, por isso multiplica-se por 100 na fórmula.
O coeficiente de variação é uma medida indicada para comparar a variabilidade entre dois ou mais conjuntos de dados, já que é um valor livre de unidade de medida.
O conjunto de dados mais homogêneo é aquele que apresenta menor valor do CV.
Contudo, também podemos calcular o coeficiente de variação para analisar um único conjunto de dados. Nesse caso, a interpretação do valor do coeficiente de variação depende da natureza da variável estudada.
Exemplo: Vamos calcular o CV para os dados do exemplo das jogadoras de basquete.
Já sabemos que a média é igual a 1,89 metros e o desvio padrão é 0,04 metros.
Portanto, o coeficiente de variação das alturas é de aproximadamente 2%. Por se tratar de altura, indica uma baixa variação, ou seja, as alturas estão relativamente próximas à média (1,89).
Medidas de dispersão e medidas de tendência central
As medidas de tendência central, como a média, moda e mediana, também resumem um conjunto de dados a partir de um único valor.
Essas medidas indicam a centralidade dos dados, mas nada informam sobre a variabilidade entre eles.
Considere, por exemplo, que sabemos apenas a média de um conjunto de dados. Como podemos dizer de que forma os dados se concentram em torno da média? Será que estão relativamente próximos a ela ou será que se afastam muito?
Não poderemos saber somente pela média. No entanto, se tivermos uma medida de dispersão, como o desvio padrão, teremos condições de responder às perguntas anteriores, pois o desvio padrão indica justamente a variação dos dados em relação à média.
Assim, essas diferentes medidas estatísticas devem ser consideradas em conjunto, avalia-se a centralidade e a dispersão.
Você também pode se interessar:
Os comentários estão fechados, mas trackbacks E pingbacks estão abertos.