As medidas de dispersão são o Desvio (absoluto) médio, a Variância e o Desvio Padrão; o Intervalo de Variação e o Intervalo Inter-Quartis, que são medidas de distância costumam apresentar-se conjuntamente com as primeiras; o Coeficiente de Variação permite concluir da representatividade da média.
Intervalo de Variação
Calcula-se o Intervalo de Variação fazendo a diferença entre os valores máximo e mínimo da variável. Se os dados estiverem agrupados será o limite superior da última classe menos o limite inferior da primeira.
Considere-se como exemplo a seguinte tabela:
Como por definição: IV = Ponto MAX – Ponto MIN
Então, IV = 210 – 180 = 30
Portanto a maior diferença que será possível encontrar entre dois jogadores é de 30 cm.
Intervalo Inter-Quartis
O Intervalo Inter-Quartis compreende 50% das observações centrais, excluindo 25% de cada extremo.
Recordando a imagem utilizada na definição dos quartis:
Define-se o Intervalo Inter-Quartis
IQ = Q3/4 – Q1/4
Evidentemente que é necessário calcular os 1º e 3º quartis. Para o efeito, parte-se das frequências relativas acumuladas.
No exemplo apresentado o
IQ = 198,17 – 188,75 = 9,42
Após a eliminação dos 25% mais altos e dos 25% mais baixos, o intervalo no qual se situam 50% dos jogadores reduziu-se para 9,42 cm.
Desvio (absoluto) médio
Calcula-se somando as diferenças, em valor absoluto, entre os valores observados da variável e a sua média, ponderadas pelo número das observações.
Com dados agrupados:
- Calcula-se a média, coluna 7
- Calcula-se a diferença entre a marca e média, coluna 8
- Tomam-se os valores absolutos da coluna 8, coluna 9
- Multiplicam-se os valores da coluna 9 pelas respectivas frequências relativas. A soma da coluna 10 dá o desvio (absoluto) médio
Variância e Desvio Padrão
Estas duas medidas apresentam-se juntas porque o Desvio Padrão é a raiz quadrada positiva da Variância.
Como os módulos são difíceis de trabalhar matematicamente - na desvio médio - substitui-se essa operação pelo quadrado dos desvios, obtendo a Variância. Depois calcula-se o Desvio Padrão para regressar a um indicador expresso nas mesmas unidades.
Com dados agrupados:
- Calcula-se a média, coluna 7
- Calcula-se a diferença entre a marca e média, coluna 8, repetida na 11
- Elevam-se os valores da coluna 11 ao quadrado, coluna 12
- Multiplicam-se os valores da coluna 12 pelas respectivas frequências relativas. A soma da coluna 13 dá a variância. A raiz quadrada desta é o desvio padrão.
No nosso exemplo, a média dos desvios em relação à média, indicada pelo desvio-padrão é de 6,35 cm, pouco diferindo da obtida pelo desvio médio: 5,23 cm. Em qualquer dos casos a interpretação é semelhante: quanto maior for o desvio, maior é a dispersão dos dados.
Coeficiente de variação
Expressa a relação percentual entre o desvio padrão e a média, isto é:
O valor deste indicador é independente das unidades utilizadas na distribuição de frequências. Exactamente por esse motivo é particularmente útil para comparar diferentes distribuições. Um coeficiente de variação superior a 50% indica muito elevada dispersão dos valores relativamente à média, e consequentemente será reduzida a sua representatividade como medida estatística.
No exemplo apresentado, um CV de 3,28% indica que a dispersão em torno da média é reduzida.
1. Confere os cálculos apresentados construindo um ficheiro do Excel semelhante ao modelo.
2. Recalcula as medidas de dispersão considerando os novos dados:
a)
b)
3. O que é que concluis das alterações verificadas nos indicadores das medidas de dispersão.
4. Confira os cálculos que efectuou para as três distribuições, utilizando agora as seguintes funções do Excel: QUARTIL; DESV.MEDIO e DESVPADP.
5. Escreva a Fórmula de King para o cálculo da moda, partindo do ficheiro de ajuda.