quarta-feira, 20 de fevereiro de 2008

Medidas de dispersão

As medidas de dispersão são o Desvio (absoluto) médio, a Variância e o Desvio Padrão; o Intervalo de Variação e o Intervalo Inter-Quartis, que são medidas de distância costumam apresentar-se conjuntamente com as primeiras; o Coeficiente de Variação permite concluir da representatividade da média.




Intervalo de Variação

Calcula-se o Intervalo de Variação fazendo a diferença entre os valores máximo e mínimo da variável. Se os dados estiverem agrupados será o limite superior da última classe menos o limite inferior da primeira.

Considere-se como exemplo a seguinte tabela:

Como por definição: IV = Ponto MAX – Ponto MIN

Então, IV = 210 – 180 = 30

Portanto a maior diferença que será possível encontrar entre dois jogadores é de 30 cm.



Intervalo Inter-Quartis

O Intervalo Inter-Quartis compreende 50% das observações centrais, excluindo 25% de cada extremo.
Recordando a imagem utilizada na definição dos quartis:


Define-se o Intervalo Inter-Quartis

IQ = Q3/4 – Q1/4

Evidentemente que é necessário calcular os 1º e 3º quartis. Para o efeito, parte-se das frequências relativas acumuladas.




No exemplo apresentado o

IQ = 198,17 – 188,75 = 9,42

Após a eliminação dos 25% mais altos e dos 25% mais baixos, o intervalo no qual se situam 50% dos jogadores reduziu-se para 9,42 cm.



Desvio (absoluto) médio

Calcula-se somando as diferenças, em valor absoluto, entre os valores observados da variável e a sua média, ponderadas pelo número das observações.

Com dados agrupados:
- Calcula-se a média, coluna 7
- Calcula-se a diferença entre a marca e média, coluna 8
- Tomam-se os valores absolutos da coluna 8, coluna 9
- Multiplicam-se os valores da coluna 9 pelas respectivas frequências relativas. A soma da coluna 10 dá o desvio (absoluto) médio


Variância e Desvio Padrão

Estas duas medidas apresentam-se juntas porque o Desvio Padrão é a raiz quadrada positiva da Variância.

Como os módulos são difíceis de trabalhar matematicamente - na desvio médio - substitui-se essa operação pelo quadrado dos desvios, obtendo a Variância. Depois calcula-se o Desvio Padrão para regressar a um indicador expresso nas mesmas unidades.


Com dados agrupados:
- Calcula-se a média, coluna 7
- Calcula-se a diferença entre a marca e média, coluna 8, repetida na 11
- Elevam-se os valores da coluna 11 ao quadrado, coluna 12
- Multiplicam-se os valores da coluna 12 pelas respectivas frequências relativas. A soma da coluna 13 dá a variância. A raiz quadrada desta é o desvio padrão.


No nosso exemplo, a média dos desvios em relação à média, indicada pelo desvio-padrão é de 6,35 cm, pouco diferindo da obtida pelo desvio médio: 5,23 cm. Em qualquer dos casos a interpretação é semelhante: quanto maior for o desvio, maior é a dispersão dos dados.


Coeficiente de variação

Expressa a relação percentual entre o desvio padrão e a média, isto é:



O valor deste indicador é independente das unidades utilizadas na distribuição de frequências. Exactamente por esse motivo é particularmente útil para comparar diferentes distribuições. Um coeficiente de variação superior a 50% indica muito elevada dispersão dos valores relativamente à média, e consequentemente será reduzida a sua representatividade como medida estatística.

No exemplo apresentado, um CV de 3,28% indica que a dispersão em torno da média é reduzida.

1. Confere os cálculos apresentados construindo um ficheiro do Excel semelhante ao modelo.


2. Recalcula as medidas de dispersão considerando os novos dados:
a)


b)


3. O que é que concluis das alterações verificadas nos indicadores das medidas de dispersão.

4. Confira os cálculos que efectuou para as três distribuições, utilizando agora as seguintes funções do Excel: QUARTIL; DESV.MEDIO e DESVPADP.

5. Escreva a Fórmula de King para o cálculo da moda, partindo do ficheiro de ajuda.