sexta-feira, 3 de setembro de 2010

"MEDIDAS DE DISPERSÃO"

      Muitas vezes, a média não é suficiente para avaliar um conjunto de dados. Por exemplo, quando se fala em um grupo de mulheres com idade média de 18 anos. Esse dado, sozinho, não significa muito: pode ser que no grupo, muitas mulheres tenham 38 anos, e outras tantas sejam menininhas de dois!
      É importante, então, conhecer outra medida, a de que diferença (dispersão) existe entre a média e os valores do conjunto. Há dois tipos de medidas de dispersão a variância e o desvio-padrão.


VARIÂNCIA

      Na teoria da probabilidade e na estatística, a variância de uma variável aleatória é uma medida da sua dispersão estatística, indicando quão longe em geral os seus valores se encontram do valor esperado.


Variância da amostra e variância da população

      Em estatística, o conceito de variância também pode ser usado para descrever um conjunto de observações. Quando o conjunto das observações é uma população, é chamada de variância da população. Se o conjunto das observações é (apenas) uma amostra estatística, chamamos-lhe de variância amostral (ou variância da amostra).
      A variância amostral é a soma dos quadrados dividida pelo número de observações do conjunto menos uma. A variância é representada por s^2, sendo calculada pela fórmula:






Onde:

: é a média aritmética,
 n: é o número de elementos da amostra.

      O denominador “n – 1” da variância é determinado graus de liberdade. O principio dos graus de liberdade é constantemente utilizado na estatística. Considerando um conjunto de “n” observações (dados) e fixando uma média para esse grupo, existe a liberdade de escolher os valores numéricos de n-1 observações, o valor da última observação estará fixado para atender ao requisito de ser a soma dos desvios da média igual a zero. No caso especifico do cálculo da variância, diz-se que os “n” graus de liberdade originalmente disponíveis no conjunto sofreram a redução de uma unidade porque a média já foi calculada dos dados do grupo e aplicada na determinação da variância.
       Já a variância da população de uma população yi onde i = 1, 2, ...., N é dada por






onde μ é a média da população. Na prática, quando lidando com grandes populações, é quase sempre impossível achar o valor exato da variância da população, devido ao tempo, custo e outras restrições aos recursos.

Propriedades
  • Se a variância pode ser calculada, podemos concluir que ela nunca é negativa, porque os quadrados são sempre positivos ou nulos.
  • A unidade de variância é o quadrado da unidade de observação. Por exemplo, a variância de um conjunto de alturas medidas em centímetros será dada em centímetros quadrados.
  • Pode ser provado facilmente a partir da definição que a variância não depende do valor médio.


DESVIO-PADRÃO

      O desvio padrão é a medida mais comum e mais utilizada da dispersão estatística. O desvio padrão define-se como a raiz quadrada da variância. É definido desta forma de maneira a dar-nos uma medida da dispersão que:
  1. seja um número não negativo;
  2. use as mesmas unidades de medida que os nossos dados.
      Faz-se uma distinção entre o desvio padrão σ (sigma) do total de uma população ou de uma variável aleatória, e o desvio padrão s de um subconjunto em amostra.



Desvio padrão de uma população

      O desvio padrão de uma população X é definido como:




onde E(X) é o valor esperado de X.
      Nem todas as variáveis aleatórias possuem desvio padrão, porque esses valores esperados não precisam existir.


Desvio padrão amostral

      Se uma variável aleatória X toma os valores x1, ..., xn, então o desvio padrão para esta amostra de n números (ou desvio padrão amostral) pode ser calculado da seguinte forma. Primeiro calcula-se a média de X , através de:






      Depois, o desvio padrão amostral é calculado como:






Ou

s = √(var.)

      Só para se ter uma idéia melhor do que significa o desvio padrão veja o seguinte exemplo:
Notas: (9, 9, 9, 1, 1, 1)
A média será:
M = 9+9+9+1+1+1 = 5
                6

E o desvio padrão amostral será:
S = √(var.), onde variância será igual à:
s^2 = ((9-5)^2+ (9-5)^2 + (9-5)^2+ (1-5)^2+ (1-5)^2+ (1-5)^2)/(6-1) = 19,2.

obs.: s^2 = a s ao quadrado, a mesma coisa com números, exemplo: 2^2 simboliza dois ao quadrado que é quatro.

Logo s = √19,2 = 4,38.
       Note que, apesar desse aluno ter tido média 5, seu desempenho foi muito irregular (variou de 4 pontos), o que não é tão bom assim.


Como calcular desvio-padrão na HP 12C

      Há uma maneira simples e fácil de calcular o desvio-padrão utilizando a HP 12C, é só seguir os passos. Vamos utilizar como base o exemplo acima:
Notas: (9, 9, 9, 1, 1, 1)
1º passo: apertar o número 9 e logo após o símbolo do somatório mais;
2° passo: inserir o 9 e o símbolo do somatório mais;
3° passo: apertar o número 9 e logo após o símbolo do somatório mais;
4° passo: inserir o número 1 e logo após o símbolo do somatório mais;
5° passo: apertar o 1 e logo depois o símbolo do somatório mais;
6° passo: apertar o número 1 e logo após o símbolo do somatório mais;
7° passo: apertar o g e o . (ponto).
     Isso nos dará o desvio-padrão desejado. Faça na sua HP 12C e confira!


Exemplos de variância e desvio-padrão

1) Calcule a variância amostral e o desvio-padrão das amostras abaixo:
A: 6 – 6 – 6 – 6 – 6 – 6
B: 7 – 6 – 5 – 2 – 8 – 9
C: 4 – 5 – 5 – 6 – 8 – 7

Amostra A
Média = 6
s^2 = {(6 – 6)² + (6 – 6)² + (6 – 6)² + (6 – 6)² + (6 – 6)² + (6 – 6)²} / 6-1 = 0
s = √0 = 0

Amostra B
Média = 6,17

s^2 = {(7 – 6,17)² + (6 – 6,17)² + (5 – 6,17)² + (2 – 6,17)² + (8 – 6,17)² + (9 – 6,17)²} / 5 = 6,17

*Na HP 12C:
7 → ENTER → 6,17 → – → 2 → yx → + → 6 → ENTER → 6,17 → – → 2 → yx → + → 5 → ENTER → 6,17 → – → 2 → yx → + → 2 → ENTER → 6,17 → – → 2 → yx → + → 8 → ENTER → 6,17 → – → 2 → yx → + → 9 → ENTER → 6,17 → – → 2 → yx → + → 5 → /
yx = y elevado a x
/ = dividir

S = √6,17 = 2,48

*Na HP 12C
7 → somatório mais → 6 → somatório mais → 5 → somatório mais → 2 → somatório mais → 8 → somatório mais → 9 → somatório mais → g → .

Turma C
Média = 5,83

s^2 = {(4 – 5,83)² + (5 – 5,83)² + (5 – 5,83)² + (6 – 5,83)² + (8 – 5,83)² + (7 – 5,83)²} / 5 = 2,17

*Na HP 12C
4 → ENTER → 5,83 → – → 2 → yx → + → 5 → ENTER → 5,83 → – → 2 → yx → + → 5 → ENTER → 5,83 → – → 2 → yx → + → 6 → ENTER → 5,83 → – → 2 → yx → + → 8 → ENTER → 5,83 → – → 2 → yx → + → 7 → ENTER → 5,83 → – → 2 → yx → + → 5 → /

S = √2,17 = 1,47

*Na HP 12C
4 → somatório mais → 5 → somatório mais → 5 → somatório mais → 6 → somatório mais → 8 → somatório mais → 7 → somatório mais → g → .


Conclusão

Turma A: teve valor nulo, isso indica que os alunos possuem rendimentos iguais.

Turmas B e D: essas duas tiveram valores altos como resultado, isso se deve à presença de alunos com desempenhos extremos – bons ou ruins.

Turma C: obteve um valor considerado baixo, dessa forma avaliamos como uma turma na qual a diferença entre a maior e a menor nota é pequena.

2) O diretor “Dorta” recebeu os dados de produtividade (dia) de uma determinada máquina. O diretor demonstrou interesse em comprar a máquina A (mais barata). Mas, antes de tomar a decisão solicitou o seu parecer (Administrador de produção). Qual a sua sugestão de compra (máquina A ou B)? Justifique do ponto de vista estatístico.


Número de Observação
Máquina A
Máquina B
1
9
6,5
2
9
9
3
6,5
9,5
4
8,5
10
5
10
8

Ma = 9+9+6,5+8,5+10 = 8,6
                    5
Mb = 6,5+9+9,5+10+8 = 8,6
                     5
Sa = 1,29
Sb = 1,39
    
      Nota-se que a média de produtividade das duas máquinas são iguais, logo a maneira mais adequada de analisar qual é a melhor é através do cálculo do desvio-padrão. Pelo resultado apresentado a melhor máquina, estatisticamente falando, é a máquina A, pois ela possui menor dispersão (desvio-padrão) que a máquina B, prontamente ela apresentará melhor qualidade.


P.S. = quanto maior a dispersão menor será a qualidade do produto avaliado e vice-versa, quanto menor a dispersão maior será a qualidade.


Fontes:
http://pt.wikipedia.org/wiki/Vari%C3%A2ncia
http://pt.wikipedia.org/wiki/Desvio_padr%C3%A3o
http://educacao.uol.com.br/matematica/ult1705u28.jhtm

Nenhum comentário:

Postar um comentário