(Leitura complementar ao capítulo 3)
O
papel principal da análise estatística
é
estabelecer se os resultados obtidos têm significância
estatística, de acordo com limites
pré-estabelecidos.
Quando se formula uma hipótese
em relação a uma determinada
característica de
uma população, a amostra dela retirada pode
pertencer
à população de origem, portanto as
diferenças observadas são decorrentes de
flutuações
biológicas normais ou
não
pertencer a essa população e as
diferenças
encontradas representam um efeito real,
não podendo ser
atribuídas ao acaso.
No primeiro caso, diz-se que os
valores encontrados "não são
estatisticamente
significativos" e no segundo "são
estatisticamente significativos".
É
importante notar que essas expressões são
empregadas
sempre tendo em vista "níveis de significância"
previamente escolhidos. (topo)
É o limite
que se
toma como base para afirmar que um certo desvio
é
decorrente do acaso ou não.
São
aceitos como estatisticamente significativos os níveis P =
0,05 e P = 0,01, ou seja, 5% e 1%
respectivamente.
A partir de
um nível de significância convencionado ( alfa )
os
desvios são devidos à lei do acaso e o resultado
é
considerado não significativo.
Assim, se alfa =
5%, os resultados podem ser:
Na prática,
considera-se
satisfatório o limite de 5% de
probabilidade de erro,
não
sendo significativas as diferenças que tiverem uma
probabilidade acima desse limite.
O nível de
significância deve ser estabelecido antes
do
experimento ser realizado e corresponde ao risco
que se corre de
rejeitar
uma hipótese verdadeira ou aceitar uma hipótese
falsa.
A significância de um resultado também
é
denominada de valor p (p-value). (topo)
É o número de classes de resultados menos o número de informações da amostra que é necessário para o cálculo dos valores esperados em cada classe.
Exemplo: Supondo um caso de herança onde há duas características, uma dominante outra recessiva.
O número de graus de liberdade é,
nesse caso: 2 – 1 = 1, pois GL
= n - 1, em
que n = número de classes
Paralelamente, no caso de
lançamento
de um dado seriam 5 os graus de liberdade, já que n = 6,
pois
há seis faces no dado.
Entretanto, se os dados
estiverem tabelados, evidentemente, deve-se
considerar apenas a área dos dados. O valor de GL
é assim
calculado:
GL
= (número
de linhas -1) x (número de colunas -1)
Exemplos:
(2-1) x (2-1) GL = 1 |
(2-1) x (3-1) GL = 2 |
GL = 2 |
GL = 4 |
Para se testar algo
é
necessário estabelecer uma hipótese nula e uma
alternativa, sendo ambas antagônicas.
A
hipótese nula é uma
hipótese tida como
verdadeira até que provas estatísticas indiquem o
contrário. É comumente designada por H0.
Pode
ser uma afirmação quanto a um parâmetro
que é
propriedade de uma população ( Ex:
média,
variância,
desvio
padrão).
E, como é
impossível
observar toda a população, o teste é
baseado na
observação de uma amostra aleatória
dela
retirada.
Também é frequente que a
hipótese
nula consista em afirmar que os parâmetros ou
características
matemáticas de duas ou mais populações
são
idênticos.
Por exemplo, se desejarmos comparar valores
obtidos para a variável altura entre indivíduos
de amostras de duas cidades, A e B, a hipótese nula
poderia ser:
"A
média das alturas da cidade A é igual
à da
cidade B".
A hipótese alternativa deve
ser contrária, oposta, antagônica
à
hipótese
nula. É comumente designada por H1
ou Ha.
Note-se que, como as
hipóteses são contraditórias, elas não
poderão ser simultaneamente verdadeiras.
Assim,
quando se aceita H0 também rejeita-se
H1
e
vice-versa.
Nesse exemplo a hipótese alternativa
seria:
"A média das alturas da cidade A é
diferente
da encontrada na cidade B".
Entretanto, evidentemente deve-se expressar
as hipóteses de modo numérico. Por exemplo:
O
teste de lançamento da moeda pode ser feito para verificar
se
ela é viciada ou não.
Lembrando que p =
probabilidade de cair cara = ½ e q = probabilidade de cair
coroa = ½, pode-se estabelecer duas
hipóteses:
Hipótese
nula:
Portanto, se p for igual a q,
pode-se concluir que a moeda não
é
viciada.
Hipótese
alternativa: .
Nesse caso, se p for diferente de q,
pode-se concluir que a
moeda é viciada. (topo)
Há cinco passos que devem ser
seguidos para realizar um teste de hipóteses:
1.
Identificar o teste estatístico
apropriado para os dados que se deseja analisar.
Deve-se lembrar que o teste produz um valor numérico, uma quantidade calculada a partir dos valores dos próprios dados que serão testados (Ex: médias, correlações, frequências, tendências,...).
Assim, depois de estabelecido o nível de
significância,
escolhe-se o teste apropriado, o que
exige conhecimento de
estatística.
Essa escolha depende de:
Tipo de dados: nominais, ordinais ou intervalares
- Nominais:
estudo de
proporções. Teste de
Qui-quadrado,
- Ordinais:
estudo
de
proporções, medianas,
quartis,
moda.
Testes:
Qui-quadrado,
Kruskal-Wallis, regressão
logística
e outros
testes não paramétricos.
- Intervalares:
estudo
de
proporções, medianas,
quartis,
moda.
Testes: Qui-quadrado,
Kruskal-Wallis.
Também se pode
estudar
as
médias,
desvios-padrão, efetuar análise
de variância,
a
correlação e regressão linear
e
outros
testes não paramétricos.
Há emparelhamento dos dados ou não?
Qual é a distribuição dos dados?
A amostra é pequena ou grande?
Amostra é isolada? Há duas amostras ou mais de dois grupos?
2. Definir a hipótese
nula (H0).
É comum escolher
como hipótese nula aquela que se deseja rejeitar e provar o
contrário. Por exemplo, a correlação
entre duas
características (altura e idade dos indivíduos de
uma amostra) é igual a zero.
3. Definir a
hipótese alternativa (H1).
Frequentemente essa hipótese
é simples: “H0
não é
verdadeira”.
4. Obter a distribuição
nula, que é simplesmente a
distribuição
amostral do teste estatístico supondo que a
hipótese
nula seja verdadeira.
A distribuição nula pode
ser uma distribuição
cujos parâmetros
são conhecidos (por exemplo, uma
distribuição normal,
com
média
e desvio padrão, uma distribuição
t-student,
ou
uma distribuição empírica obtida pela
reamostragem dos dados.
5. Comparar a
estatística observada com a
distribuição
nula.
Se o valor obtido estiver em uma região
suficientemente
improvável da distribuição nula,
então H0
é rejeitada como improvável de ser verdadeira.
Se,
por outro lado, o valor obtido estiver em uma
região
provável
da distribuição nula, então H0
não pode ser rejeitada.
É importante notar que
aceitar H0
não significa que a
hipótese nula seja verdadeira, mas, apenas que
não
existe evidência suficiente para
rejeitá-la.
Ao tomar uma
decisão a favor
ou contra uma hipótese há apenas dois
tipos de erro
estatísticos que se pode cometer.
Erro do
tipo 1: rejeita-se H0,
quando H0 é
verdadeira
Erro do tipo 2: aceita-se H0,
quando H0 é falsa
O valor máximo que estabelecemos para ocorrência do erro do Tipo I é que estabelece se aceitamos ou rejeitamos a Hipótese Nula (H0) e deve ser escolhido antes da realização do teste. O valor mais frequentemente usado é o 0.05.
Assim, se p for menor do que o valor escolhido rejeitamos H0, Em caso contrário a aceitamos.
Resumindo, para aplicar um teste de significância, cria-se uma hipótese que, geralmente, é a de igualdade (hipótese nula). O teste é feito para tentar refutar esta hipótese. Mas, por erros amostrais (flutuações) pode-se incorrer em erros de tomada de decisão.
|
Se a hipótese nula for verdadeira |
Se a hipótese nula for falsa |
Aceita-se a hipótese nula |
Corretamente, aceita-se a hipótese verdadeira |
Erro do tipo II (beta): |
Rejeita-se a hipótese nula |
Erro do tipo I (alfa): |
Corretamente, rejeita-se a hipótese falsa |
A probabilidade p de se rejeitar H0
quando ela é verdadeira corresponde ao nível de
significância ( alfa ). (topo)
Copie
esse texto em formato
pdf Depois, clique em"Salvar destino como" (ou algo semelhante ) Escolha o local onde salvar e clique em OK. |
|
Este
"site",
destinado prioritariamente aos alunos de Fátima Conti,
está
disponível sob FDL (Free Documentation Licence),
pretende auxiliar quem se interessa por Bioestatística,
estando em permanente construção.
Sugestões
e comentários são bem vindos.
Se desejar colaborar
clique aqui.
Agradeço
antecipadamente.
Deseja enviar
essa página?
Se você usa um
programa de correio eletrônico devidamente configurado para
um
e-mail
pop3,
clique em "Enviar página" (abaixo) para abrir o
programa.
Preencha o endereço do destinatário da
mensagem.
E pode acrescentar o que quiser.
(Se não der
certo, clique aqui
para saber mais).
Se
você usa webmail
copie o endereço
abaixo
http://www.cultura.ufpa.br/dicas/biome/biotestes.htm
Acesse
a página do seu provedor. Abra uma nova mensagem.
Cole o
endereço no campo de texto.
Preencha o endereço do
destinatário.
E também pode acrescentar o que quiser.
Última alteração: 12 mar 2011