Variância
A variância é uma medida estatística utilizada na análise de dados. Aprenda a calcular, veja o passo a passo, exemplo e como interpretar.
A variância é uma medida de dispersão que indica o quanto os valores de um conjunto de dados estão próximos ou distantes da média dos dados.
Valores mais baixos da variância indicam conjunto de dados mais homogêneos, o que significa que as observações da variável estão mais concentradas em torno da média.
Por outro lado, valores mais altos indicam a heterogeneidade dos dados, ou seja, dados mais dispersos em relação à média.
Fórmula da variância
A fórmula da variância de um conjunto de observações , de uma variável aleatória X é:
Sendo a média aritmética das observações e o número total de observações. O somatório que aparece no numerador da fórmula é calculado do seguinte modo:
Veja um passo a passo para calcular a variância:
1º passo) Calcular a média dos dados;
2º passo) Subtrair a média de cada observação;
3º passo) Elevar ao quadrado cada um dos resultados das subtrações;
4º passo) Somar todos os quadrados calculados no passo 3;
5º passo) Dividir o resultado da soma pelo total de observações.
Como calcular variância
Para mostrar como calcular variância, vamos utilizar um exemplo.
Temos e .
1º passo) Calculamos a média dos dados, somando todas as idades e dividindo por 4:
Para facilitar, substituímos as idades e a média na fórmula da variância:
2º passo) Calculamos as subtrações entre os valores, obtendo:
3º passo) Calculamos os quadrados dos valores, obtendo:
4º passo) Somamos os valores, obtendo:
5º passo) Calculamos a divisão, obtendo a variância:
Esse resultado indica que a variância das idades é igual a “1,5 ano ao quadrado”. Isso mesmo, a variância é uma medida quadrática, ela não apresenta a mesma unidade de medida dos dados.
Por isso, em termos de interpretação, é mais adequado considerar o desvio padrão.
Desvio padrão
O desvio padrão é outra medida de dispersão, ele corresponde à raiz da variância. Assim, podemos obtê-lo simplesmente aplicando a raiz quadrada na variância:
Dessa forma, o desvio padrão apresenta a mesma unidade de medida que as observações, ao contrário da variância (unidades quadráticas).
No exemplo das idades dos pacientes, o desvio padrão é dado por:
Assim, podemos interpretar que os pacientes têm em média 3 anos com um desvio, para mais ou para menos, de aproximadamente 1,22 ano (em torno de um ano, dois meses e 19 dias).
Você também pode se interessar:
- O que são medidas de centralidade?
- Agrupamento de dados em intervalos
- Lista de exercícios de gráficos
- Lista de exercícios de Estatística
Os comentários estão fechados, mas trackbacks E pingbacks estão abertos.