Biometria
Para visualizar corretamente configurar a tela para 1024 x 768 pixels


A análise da variância

(Leitura complementar ao capítulo 6)

Sumário:

Análise da variância
Dados emparelhados e análise de variância
Etapas do teste
Modelo fatorial
Modelo hierárquico
Modelo inteiramente casualizado com n igual
Modelo inteiramente casualizado com n diferente
Necessidade da análise 



Necessidade da análise

Para se comparar duas médias usa-se o teste t, como foi visto aqui.

Mas, para se comparar duas médias de várias amostras essa solução é pouco eficiente, pois, dependendo do número de amostras pode existir um grande número de pares a ser analisado.


Por exemplo, em 8 amostras há:

Número de pares = [a (a - 1)] / 2 pares possíveis, ou seja: (8 x 7) / 2 = 28 pares


Ou seja, seria necessário fazer 28 testes e depois analisar resultados que poderiam divergir.


Para resolver esse tipo de problema, Fisher, em 1924, criou a análise de variância para comparar simultaneamente amostras de variáveis contínuas com distribuição normal e cujas variâncias não diferem significativamente entre si, ou seja, que podem ser consideradas como estimativas da variância populacional s2.


Etapas do teste


Primeiramente calcula-se algumas variâncias e deve-se provar que elas são homogêneas, ou seja, pertencem à mesma população.


1. Variância Total

Simbolizada por s2T é obtida quando as a amostras são reunidas, com a.n = N elementos.

A média desse conjunto é simbolizada por xbarra e pode ser expressa por qualquer uma das seguintes fórmulas:

= x / a.n = x / N = / a em que N = a.n

Como a soma de quadrados em relação às amostras reunidas poderá ser apresentada sob forma de:
SQT = (x - xbarra )2 = (x - xbarra)2 ] / (N -1)


Considerando-se que tal soma de quadrados tem N - 1 GL, a variância total pode ser descrita como:
s2T = [ (x - xbarra )2] / N -1 = (x - xbarra )2 / (N -1)



2. Variância Entre as amostras

Simbolizada por s2E mede a variação entre todas as a amostras reunidas.

A variação observada no total das médias seria:
s2x = [ (x - xbarra )2] / (a -1)

Como s2x = s2 / n e s2 = n.s2x pode-se assumir que s2E = n.s2x, que pode ser assim expresso:

SQE = n (x - xbarra2) e s2E = n [ (x - xbarra)2] / (a -1)


3. Variância Dentro das amostras

Simbolizada por s2D mede a variação dentro das a amostras reunidas.

Considerando que, em cada amostra a variação de valores em relação à média xbarra é avaliada por meio de sua variância, ou seja:

SQD = (x - xbarra)2 / (n -1), a variação entre todas as a amostras será medida por:

s2D = (x - xbarra2 / a.(n -1) = (x - xbarra)2 / (N -a)


Hipóteses a serem testadas

Para colocar à prova a hipótese de que as amostras podem ser consideradas como pertencentes a uma mesma população, pois elas estimam a mesma média mi1, estabelece-se as seguintes hipóteses:

H0 = as médias das a amostras estimam a média , pois não há diferenças significativas entre elas
Ha = as médias das a amostras não estimam a média , pois são diferentes entre si.

O valor da fórmula geral da variância é tanto menor quanto mais semelhantes forem as médias amostrais xbarra e o inverso ocorre quando as médias forem diferentes entre si.


O teste

A razão entre as variâncias entre e dentro origina o valor F, que é verificado em uma tabela de F, ao nível de 5%, em testes bicaudais. Portanto:

F = s2E / s2D

sendo que F será tanto maior quanto mais diferirem as médias amostrais.

Critério:
Se F for menor que Fc pode-se aceitar H0 e rejeitar Ha, ou seja: conclui-se
que as médias das a amostras não diferem significativamente entre si
e as amostras pertencem à mesma população.


Análise da variância


A análise de variância tem basicamente 3 passos:

1. Teste de BARTLETT - Cálculo do Qui quadrado

No Teste de BARTLETT há duas fórmulas, para amostras com

n iguais = 2,3026 . (n -1) . (a log - log s2) GL = a - 1
n diferentes = 2,3026 . log . (n-1) - [ (n-1).log s2] GL = a - 1

Notar que = variância média.


Em ambos os casos, se obtido for menor que admite-se que as variâncias são homogêneas e passa-se à fase seguinte.

2. Cálculo das Somas de Quadrados (SQ) e C

As somas dos quadrados (SQT e SQE) e o erro (C) são dadas por:
C = ( x)2 / N
SQT =x2 - C
SQE =(x)2 / n - C


3. Preenchimento do quadro de Análise de variância e comparação de F com Fc

Fonte de Variação
G.L.
SQ
s2
F(GLE, GLD)
F(c, GLE, GLD)
Tabela 5%





Verificar o valor de F(c, GLE, GLD)

Se F < Fc admite-se que:
as médias amostrais não são diferentes e
pertencem à mesma população

Entre
a-1
= SQE
SQE/(a-1)
s2E / s2D
Dentro
N-a
SQT - SQE
SQD/(N-a)

Total
N-1
= SQT
SQT/(N-1)
.


Exemplos:


A - MODELO INTEIRAMENTE CASUALIZADO - amostras com n igual

1. Quatro amostras de escolares brasileiros foram inoculadas com tuberculina, tendo a leitura da reação de Mantoux (em mm) sido feita após 48 hs da inoculação. Obteve-se os resultados abaixo. Por à prova a hipótese de que as amostras podem ser consideradas como pertencentes a uma mesma população.

Valores
Amostra 1
Amostra 2
Amostra 3
Amostra 4

TOTAL







x
63
60
63
62
x
248
6,3
6,0
6,3
6,2
xbarra
6,20
x2
431
388
433
428
x2
1.680
( x )2 /n
396,9
360,0
396,9
384,4
[(x )2] / n
1.538,2
SQ
34,1
28,0
36,1
43,6
SQ
141,8
s2
3,79
3,11
4,01
4,84
s2
3,94
n
10
10
10
10
N
40


a. Teste de BARTLETT - Cálculo do Qui quadrado

- Verifica a homogeneidade entre as variâncias (para amostras com n iguais)

Amostra s2 log s2
1 3,79 0,579
2 3,11 0,493
3 4,01 0,603
4 4,84 0,685
Total 15,75 2,360

Calcula-se a variância média = = 15,75 / 4 = 3,94

Calcula-se o logarítmo da variância média = log = 0,595

Substitui-se os valores na fórmula para n(s) igual(s):

= 2,3026 . (n -1). (a log -log s2)
= 2,3026 . 9. (4 . 0,595 - 2,360)
= 2,3026 . 9. 0,020
Portanto, = 0,414.

Como G.L. = 3, = 7,815 e 0,90 < P < 0,95.

(Para verificar a tabela de , clique aqui).
Como obtido é menor que admite-se que as variâncias são homogêneas.

E pode-se continuar a análise.


b. Cálculo das Somas de Quadrados (SQ) e C

C = ( x)2 / N = ( x )2 / N = 2482 / 40 = 1.537,6

SQT = x2 - C = 1680 -1537,6 = 142,4

SQE = (x )2 / n - C = 1538,2 - 1537,6 = 0,6


c. Preenchimento do quadro de Análise de variância e comparação de F com Fc

Lembrando que:

Fonte de Variação
G.L.
SQ
s2
F(GLE, GLD)
F(c, GLE, GLD) Tabela F, 5%





Verificar o valor de F(c, GLE, GLD)

Se F < Fc admite-se que:
as médias amostrais não são diferentes e
pertencem à mesma população

Entre
a-1
= SQE
SQE/(a-1)
s2E / s2D
Dentro
N-a
SQT - SQE
SQD/(N-a)
.
Total
N-1
= SQT
SQT/(N-1)
.


Portanto, análise da variância aplicada aos dados acima:

Fonte de Variação
G.L.
SQ
s2
F(GLE, GLD)
F(c, GLE, GLD)






Entre
3
0,6
0,20
0,05
2,84
Dentro
36
141,8
3,94
(P > 0,05)


Total
39
142,4



(Para verificar a tabela de F (5%), clique aqui).

Conclui-se que, como F ( 0,05 ) é menor que Fc ( 2,84 ), as amostras pertencem à mesma população.


Para facilitar os cálculos utilize uma planilha especial:

Análise de Variância - Modelo inteiramente casualizado

Copie a planilha comprimida em formato livre ods

Aba "n iguais"



B - MODELO INTEIRAMENTE CASUALIZADO - amostras com n diferente

2. A concentração sérica de albumina foi medida em g% em 4 amostras de hansenianos, obtendo-se os resultados abaixo. Por à prova a hipótese de que as amostras podem ser consideradas como pertencentes a uma mesma população.

Valores
Amostra 1
Amostra 2
Amostra 3
Amostra 4

TOTAL







x
35,61
29,35
44,71
38,41
x
148,08
xbarra
3,56
3,67
3,73
4,27
xbarra
3,80







x2
130,83
109,54
170,80
166,39
x2
577,56
(x)2 / n
126,81
107,68
166,58
163,93
[(x )2] / n
565







SQ
4,02
1,86
4,22
2,46
SQ
12,56
s2
0,45
0,27
0,38
0,30
s2
0,33
n
10
8
12
9
N
39


a. Teste de BARTLETT - Cálculo do Qui quadrado

Homogeneidade entre as variâncias de amostras com n diferente)

Amostra
SQ
n - 1
s2
log s2
(n-1)log s2
1
4,02
9
0,45
-0,347
- 3,123
2
1,86
7
0,27
-0,569
- 3,983
3
4,22
11
0,38
-0,420
- 4,620
4
2,46
8
0,30
-0,523
- 4,184
Total
12,56
35


-15,910

Calcula-se a variância média
= SQ / (n-1) = 12,56 / 35 = 0,359


Calcula-se o logarítmo da variância média
log = -0,445


Substitui-se os valores na fórmula:
= 2,3026 . [log sbarra2.(n -1) - (n-1).log s2]

= 2,3026 . ( -0,445 x 35 ) - (- 15,910)

= 2,3026 . [-15,575 - - 15,910] = 2,3026 . 0,335

Portanto, = 0,717.

Como G.L. = 3, = 7,815 e 0,80 < P < 0,90

Como obtido é menor que admite-se que as variâncias são homogêneas.


b. Cálculo das Somas de Quadrados (SQ) e C

C = ( x )2 / N = 148,082 / 39 = 562,25

SQT = x2 - C = 577,56 - 562,25 = 15,31

SQE= (x)2 / n - C = 565 - 562,25 = 2,75

c. Preenchimento do quadro de Análise de variância e comparação de F com Fc

Fonte de Variação
G.L.
SQ
s2
F(GLE, GLD)
F(c, GLE, GLD)
Tabela 5%





Verificar o valor de F(c, GLE, GLD)

Se F < Fc admite-se que:
as médias amostrais não são diferentes e
pertencem à mesma população

Entre
a-1
= SQE
SQE/(a-1)
s2E / s2D
Dentro
N-a
SQT - SQE
SQD/(N-a)
.
Total
N-1
= SQT
SQT/(N-1)
.


Análise da variância aplicada aos dados acima


Fonte de Variação
G.L.
SQ
s2
F(GLE, GLd)
F(c, GLE, GLd)






Entre
3
2,75
0,92
2,56
2,84
Dentro
35
12,56
0,36

P > 0,05


Total
38
15,31



Como F (2,56) é menor que Fc (2,84) conclui-se que as amostras pertencem à mesma população.


Para facilitar os cálculos utilize uma planilha especial:

Análise de Variância - Modelo inteiramente casualizado

Copie a planilha comprimida em formato livre ods

Aba "n diferentes"



C - MODELO FATORIAL

Neste modelo, cada dado pode ser classificado conforme mais de um critério (no exemplo a seguir, segundo o grupo etário ou conforme a raça).

Exemplo
:
Suponha que indivíduos caucasóides, negróides e mongolóides foram inoculados intradermicamente com um certo antígeno, tendo a leitura da reação tardia sido feita após 4 semanas da inoculação, tomando-se o diâmetro em mm. Obteve-se os resultados abaixo. Faça a análise da variância.

grupo etário (anos) Caucasóides Negróides Mongolóides




10 - 20 4 - 3 - 5 - 8 - 2 5 - 6 - 9 - 5 - 6 7 - 4 - 6 - 4 - 4
20 - 30 5 - 6 - 3 - 5 - 6 6 - 7 - 7 - 6 - 4 2 - 4 - 5 - 4 - 8
30 - 40 6 - 6 - 6 - 4 - 3 4 - 7 - 5 - 7 - 6 3 - 8 - 4 - 3 - 5
40 - 50 4 - 3 - 4 - 5 - 6 4 - 5 - 6 - 7 - 6 5 - 3 - 4 - 4 - 8
50 - 60 5 - 6 - 3 - 6 - 6 7 - 8 - 9 - 8 - 9 4 - 3 - 5 - 5 - 6


grupo racial Valores 10 - 20 20 - 30 30 - 40 40 - 50 50 - 60
Total









CAUCASÓiDES x 22 25 25 22 26 120; (x)2/sn 576,0

xbarra 4,4 5,0 5,0 5,0 5,2 xbarra 4,80

x2 118 131 133 102 142 (x)2 / n 626

(x )2/ n 96,8 125,0 125,0 96,8 135,2 s2 578,8

SQ 5,30 1,50 2,00 1,30 1,70 n 2,08

s2 5 5 5 5 5 N 25

NEGRÓIDES x 31 30 29 28 41 159; (x)2/sn 1.011,2

xbarra 6,2 6,0 5,8 5,6 8,2 xbarra 6,36

x2 203 186 175 162 339 (x)2 / n 1065

(x )2/ n 192,2 180,0 168,2 156,8 336,2 s2 1.033,4

SQ 2,70 1,50 1,70 1,30 0,70 n 2,24

s2 5 5 5 5 5 N 25

MONGOLÓIDES x 25 23 23 24 23 120; (x)2/sn 557,0

xbarra 5,0 4,6 4,6 4,8 4,6 xbarra 4,72

x2 133 125 123 130 111 (x)2 / n 622

(x )2/ n 125,0 105,8 105,8 115,2 105,8 s2 557,6

SQ 2,00 4,80 4,30 3,70 1,30 n 2,71

s2 5 5 5 5 5 N
25
x = 397   x2 = 2.313   (x)2/N = 2.101,4 s2 = 2,86


a. Teste de BARTLETT - Cálculo do Qui quadrado - Homogeneidade entre as variâncias, quando se considera os três grupos raciais:

Chega-se a= 0,497

Como G.L. = 2, = 5,991

Como obtido é menor que admite-se que as variâncias são homogêneas.


b. Cálculo das Somas de Quadrados (SQ) e C

C = (x)2 / N = 3972 / 75 = 2.101,4

SQT = x2 - C = 2.313 - 2.101,4 = 211,6

SQE= (x )2 / n - C = 578,8 + 1.033,4 + 557,6 - 2.101,4 = 68,40


Chamando o fator raça de r e o fator idade de i, calcula-se a soma dos quadrados entre os grupos raciais e entre os grupos etários:


SQE r =(x)2 /s.n - C = 576,0 + 1.011,2 + 557,0 - 2.101,4 = 42,80

SQE i = (x)2 / a.n - C = (22 + 31 + 25)2 / 15 + ... - 2.101,4 = 10,13

SQE interação = SQE - SQEr - SQEi = 68,40 - 42,80 - 10,13 = 15,47

Para se obter os graus de liberdade opera-se de modo semelhante, chegando-se a g.l. = 8 na SQE interação.

c. Preenchimento do quadro de Análise de variância e comparação de F com Fc

Fonte de Variação G.L. SQ s2 F(GLE, GLD)
Entre grupos raciais 2 42,80 21,40 F(2,60) = 8,95; P < 0,05
Entre faixas etárias 4 10,13 2,53 F(4,60) = 1,06; P > 0,05
Interação 8 15,47 1,93 F(8, 60) = 0,81; P > 0,05





Entre 14 68,40 4,89 F(14, 60) = 2,05; P < 0,05
Resíduo 60 143,20 2,39
Total 74 211,60



Conclusão
:
Há um efeito significativo dos grupos raciais sobre a resposta do antígeno em estudo (F(2,60) = 8,95; P < 0,05), o mesmo não ocorrendo em relação à idade (F(4,60) = 1,06; P > 0,05). Conclui-se, também, que não há interação entre grupos raciais e idade (F(8, 60) = 0,81; P > 0,05).


Copie uma planilha comprimida com esse exemplo de modelo fatorial
em formato livre ods



D - MODELO HIERÁRQUICO

Neste modelo, cada dado pode ser classificado conforme MAIS DE UM CRITÉRIO, mas não pode ser reduzido a uma tabela de contingência (como no modelo fatorial).

Exemplo
:

Um pesquisador coletou dados em 2 estados brasileiros (A e B) a respeito do peso de recém-nascidos de sexo masculino e que, em cada um desses estados esteve em duas cidades: A1, A2, B1 e B2. Portanto, o peso pode ser classificado conforme 2 critérios: o estado (A ou B) ou a cidade: A1, A2, B1 ou B2. Os dados não podem ser reduzidos a uma tabela de contingência, pois as cidades não são independentes do e estado. Admite-se, pois o ENCADEAMENTO DE EFEITOS, um contendo o outro, de tal modo que se distingue uma hierarquia de efeitos.

Estado valores Cidade 1 Cidade 2 Valores Total

x 5.175,000 4.725,000 9900; (x)2/sn 32.670,000

xbarra 3,450 3,150 xbarra 3,300
a x2 18.399,386 15.405,402 (x)2 33.804,788

(x )2/ n 17.853,750 14.883,750 (x)2 / n 32.737,500

s2 0,364 0,348 s2 0,378

n 1.500 1.500 n 3.000







x 5.130,000 4.785,000 9915;x) 2/sn 32.769,075
B xbarra 3,420 3,190 xbarra 3,305

x2 18.069,250 15.818,780 (x)2 33.888,030

(x )2/ n 17.544,600 15.264,150 (x)2 / n 32.808,750

s2 0,350 0,370 s2 0,373

n 1.500 1.500 n 3.000


a = 2 (2 amostras = estados), s = 2 (2 subamostras = cidades) e N = total de indivíduos (6.000)


a. Teste de BARTLETT - Cálculo do Qui quadrado - Homogeneidade entre as variâncias (para amostras com n iguais)

Chega-se a = 3,452

Como G.L. = 3, = 7,815 e 0,30 < P < 0,50

Como obtido é menor que admite-se que as variâncias são homogêneas.


b. Cálculo das Somas de Quadrados (SQ) e C

C = (x)2 / N = 19.8152 / 6.000 = 65.439,04

SQT =x2 - C = 67.692,818 - 65.439,04 = 2.253,78

Como N - 1 = 6.000 - 1 = 5.999 g.l.

O componente que mede o efeito entre as amostras, ou seja, entre os estados, é calculado a partir de:

SQEa = [(x) 2 / sn] - C = 65.439,07 - 65.439,04 = 0,03; tendo a-1 = 2-1 = 1 g.l.

O componente que mede o efeito entre as s sub-amostras dentro de cada amostra (SQes) é obtido assim:

SQE = [(x)2 / n] - C = 65.546,25 - 65.439,04 = 107,21; tendo as-1 = 4-1 = 3 g.l.

Como SQE = SQEa + SQEs:

SQEs = 107,21 - 0,03 = 107,18; tendo a (s-1) = 2 (2-1) = 2 g.l.

A soma de quadrados do resíduo é obtida por:

SQD = SQT - SQE = SQT - SQEa - SQEs = 2.253,78 - 107,21 = 2.146,57

tendo a.s.(n -1) = 2 . 2 . 1499 = 5.996 g.l.

c. Preenchimento do quadro de Análise de variância e comparação de F com Fc

Fonte de Variação G.L. SQ s2 F(GLE, GLD)
Entre estados 1 0,03 0,03 F(1,2 = 0,0006; P > 0,05
Entre cidades nos estados 2 107,18 53,59 F(2, i) = 148,86; P < 0,05





Resíduo 5996 2146,57 0,36 i = infinito
Total 5999 2253,78


Não há diferenças significativas entre as médias dos estados A e B, mas há diferenças entre as cidades dentro de cada estado.

Pode-se reanalisar os dados levando em consideração apenas um critério: estado de origem, (como se o modelo fosse inteiramente casualizado). Monta-se a seguinte tabela:

Reanálise da variância aplicada aos dados acima:

Fonte de Variação G.L. SQ s2 F(GLE, GLD).
Entre estados 1 0,03 0,03 F(1, i) = 0,08; P < 0,05
Dentro 5998 2253,75 0,38
Total 5999 2253,78
i = infinito


Como F é menor que Fc __________-se que haja diferenças significativas entre as médias dos estados A e B.


E - DADOS EMPARELHADOS E ANÁLISE DE VARIÂNCIA

Estudou-se o índice palmar (linha T) em 68 pares de gêmeos, com 34 MZ (17 de cada sexo) e 34 DZ (17 de cada sexo). Foram calculadas as diferenças intrapar. Obteve-se:

Tipo Valores
MM
FF
Total
Tipo Valores MM FF Total

d
1,105
1,487
2,592

d 1,492 2,263 3,755

d
0,065
0,087
0,076

d 0,088 0,133 0,110
MZ d2
0,118
0,293
0,411
DZ d2 0,203 0,436 0,639

(d)2 / n
0,072
0,0130
0,202

(d)2 / n 0,131 0,301 0,432

s2
0,003
0,010
0,006

s2 0,005 0,008 0,007

n
17
17
34

n 17 17 34


a = 2 (no. de amostras), s = 2 (no. de subamostras em cada amostra a) e N = total de indivíduos (6.000)


a. Teste de BARTLETT - Cálculo do Qui quadrado - Homogeneidade entre variâncias (amostras com n iguais)

Portanto, = 6,359.

Como G.L. = 3, = 7,815 e 0,10 < P < 0,20

Como obtido é menor que admite-se que as variâncias são homogêneas.


b. Cálculo das Somas de Quadrados (SQ) e C

C = ( d)2 / N = 6,3472 / 68 = 0,592

SQT =d2 - C = 1,050 - 0,592 = 0,458

SQE =(d)2 / n - C = 0,202 + 0,432 - 0,592 = 0,042

SQEa =(d)2 / sn - C = (2,592)2 / 34 + (3,755)2 / 34 - 0,592 = 0,020

SQEb =(d)2/an - C = (1,105 + 1,492) 2 / 34 + (1,487 + 2,263) 2 / 34 - 0,592 = 0,020


c. Preenchimento do quadro de Análise de variância e comparação de F com Fc

Fonte de Variação
G.L.
SQ
s2
F(GLE, GLD).
Entre tipos de gêmeos
1
0,020
0,0200
F(1, 64) = 3,08; P > 0,05
Entre sexos
1
0,020
0,0200
F(1, 64) = 3,08; P > 0,05
Interação
1
0,002
0,0020
F(3, 64) = 0,31; P > 0,05





Entre
3
0,042
0,0140
F(3, 64) = 2,15; P > 0,05
Dentro
64
0,416
0,0065

Total
67
0,458



Como F é ___ que Fc __________-se que as diferenças intrapar em relação ao índice da linha T independem do tipo de gêmeos ou do sexo.



Copie esse texto em formato pdf
clicando no link ao lado com o botão direito do mouse.


Depois, clique em"Salvar destino como" (ou algo semelhante )
Escolha o local onde salvar e clique em OK.
Copiar aqui



Este "site", destinado prioritariamente aos alunos de Fátima Conti,
está disponível sob FDL (Free Documentation Licence),
pretende auxiliar quem se interessa por Bioestatística,
estando em permanente construção.
Sugestões e comentários são bem vindos.
Se desejar colaborar clique aqui. Agradeço antecipadamente.



Deseja enviar essa página?


Se você usa um programa de correio eletrônico devidamente configurado para
um e-mail pop3, clique em "Enviar página" (abaixo) para abrir o programa.
Preencha o endereço do destinatário da mensagem.
E pode acrescentar o que quiser.
(Se não der certo, clique aqui para saber mais).

Enviar página


Se você usa webmail copie o endereço abaixo


http://www.cultura.ufpa.br/dicas/biome/biovar.htm

Acesse a página do seu provedor. Abra uma nova mensagem.
Cole o endereço no campo de texto.
Preencha o endereço do destinatário.
E também pode acrescentar o que quiser.

Última alteração: 7 abr 2011