Variância

A variância é uma medida estatística utilizada na análise de dados. Aprenda a calcular, veja o passo a passo, exemplo e como interpretar.

A variância é uma medida de dispersão que indica o quanto os valores de um conjunto de dados estão próximos ou distantes da média dos dados.

Valores mais baixos da variância indicam conjunto de dados mais homogêneos, o que significa que as observações da variável estão mais concentradas em torno da média.

Por outro lado, valores mais altos indicam a heterogeneidade dos dados, ou seja, dados mais dispersos em relação à média.

Fórmula da variância

A fórmula da variância de um conjunto de observações \dpi{120} x_1, x_2, x_3, ..., x_n, de uma variável aleatória X é:

\dpi{120} \boldsymbol{V = \frac{\sum_{i=1}^{n}(x_i-\bar{x})^2}{n}}

Sendo \dpi{120} \bar{x} a média aritmética das observações e \dpi{120} n o número total de observações. O somatório que aparece no numerador da fórmula é calculado do seguinte modo:\dpi{120} \sum_{i=1}^{n}(xi-\bar{x})^2 = (x_1 -\bar{x})^2 +(x_2 -\bar{x})^2+ (x_3 -\bar{x})^2 + ... + (x_n -\bar{x})^2

Veja um passo a passo para calcular a variância:

1º passo) Calcular a média dos dados;
2º passo) Subtrair a média de cada observação;
3º passo) Elevar ao quadrado cada um dos resultados das subtrações;
4º passo) Somar todos os quadrados calculados no passo 3;
5º passo) Dividir o resultado da soma pelo total de observações.

Como calcular variância

Para mostrar como calcular variância, vamos utilizar um exemplo.

Exemplo: Um pediatra atendeu quatro crianças, Pedro de 3 anos, Lucas de 5 anos, Bianca de 2 anos e Vitória, também de 2 anos. Vamos calcular a variância das idades dos pacientes atendidos.

Temos \dpi{120} x_1 = 3, x_2= 5, x_3 = 2\: \mathrm{e}\: x_4 = 2 e \dpi{120} n = 4.

1º passo) Calculamos a média dos dados, somando todas as idades e dividindo por 4:

\dpi{120} \bar{x}=\frac{3 + 5 + 2 + 2}{4} = \frac{12}{4} =3

Para facilitar, substituímos as idades e a média na fórmula da variância:

\dpi{120} V = \frac{(3 - 3)^2 + (5 - 3)^2+(2 - 3)^2+(4 - 3)^2 }{4}

2º passo) Calculamos as subtrações entre os valores, obtendo:

\dpi{120} V = \frac{(0)^2 + (2)^2+(-1)^2+(1)^2 }{4}

3º passo) Calculamos os quadrados dos valores, obtendo:

\dpi{120} V = \frac{0 + 4+1+1}{4}

4º passo) Somamos os valores, obtendo:

\dpi{120} V = \frac{6}{4}

5º passo) Calculamos a divisão, obtendo a variância:

\dpi{120} V = 1,5

Esse resultado indica que a variância das idades é igual a “1,5 ano ao quadrado”. Isso mesmo, a variância é uma medida quadrática, ela não apresenta a mesma unidade de medida dos dados.

Por isso, em termos de interpretação, é mais adequado considerar o desvio padrão.

Desvio padrão

O desvio padrão é outra medida de dispersão, ele corresponde à raiz da variância. Assim, podemos obtê-lo simplesmente aplicando a raiz quadrada na variância:

\dpi{120} DP = \sqrt{V}

Dessa forma, o desvio padrão apresenta a mesma unidade de medida que as observações, ao contrário da variância (unidades quadráticas).

No exemplo das idades dos pacientes, o desvio padrão é dado por:

\dpi{120} DP = \sqrt{1,5} \approx 1,22

Assim, podemos interpretar que os pacientes têm em média 3 anos com um desvio, para mais ou para menos, de aproximadamente 1,22 ano (em torno de um ano, dois meses e 19 dias).

Você também pode se interessar:

você pode gostar também

Os comentários estão fechados, mas trackbacks E pingbacks estão abertos.