Biometria - EDAP

Teste de hipóteses e significância

(Leitura complementar ao capítulo 3)


Sumário:
Elementos do teste de hipóteses
Erros estatísticos
Graus de liberdade
Nível de significância
Significância
Teste de hipóteses


Significância


O papel principal da análise estatística é estabelecer se os resultados obtidos têm significância estatística, de acordo com limites pré-estabelecidos.

Quando se formula uma hipótese em relação a uma determinada característica de uma população, a amostra dela retirada pode

pertencer à população de origem, portanto as diferenças observadas são decorrentes de flutuações biológicas normais ou

não pertencer a essa população e as diferenças encontradas representam um efeito real, não podendo ser atribuídas ao acaso.


No primeiro caso, diz-se que os valores encontrados "não são estatisticamente significativos" e no segundo "são estatisticamente significativos".

É importante notar que essas expressões são empregadas sempre tendo em vista "níveis de significância" previamente escolhidos. (topo)



Nível de significância

É o limite que se toma como base para afirmar que um certo desvio é decorrente do acaso ou não.

São aceitos como estatisticamente significativos os níveis P = 0,05 e P = 0,01, ou seja, 5% e 1% respectivamente.

A partir de um nível de significância convencionado ( alfa ) os desvios são devidos à lei do acaso e o resultado é considerado não significativo.

Assim, se alfa = 5%, os resultados podem ser:


Na prática, considera-se satisfatório o limite de 5% de probabilidade de erro, não sendo significativas as diferenças que tiverem uma probabilidade acima desse limite.

O nível de significância deve ser estabelecido antes do experimento ser realizado e corresponde ao risco que se corre de rejeitar uma hipótese verdadeira ou aceitar uma hipótese falsa.

A significância de um resultado também é denominada de valor p (p-value). (topo)


Graus de liberdade

É o número de classes de resultados menos o número de informações da amostra que é necessário para o cálculo dos valores esperados em cada classe.


Ou seja, o número de graus de liberdade pode ser calculado como o número de classes menos 1.

Exemplo: Supondo um caso de herança onde há duas características, uma dominante outra recessiva.


O número de graus de liberdade é, nesse caso: 2 – 1 = 1, pois GL = n - 1, em que n = número de classes


Paralelamente, no caso de lançamento de um dado seriam 5 os graus de liberdade, já que n = 6, pois há seis faces no dado.

Entretanto, se os dados estiverem tabelados, evidentemente, deve-se considerar apenas a área dos dados. O valor de GL é assim calculado:


GL = (número de linhas -1) x (número de colunas -1)

Exemplos:


. .
. .

(2-1) x (2-1)

GL = 1
. . .
. . .

(2-1) x (3-1)

GL = 2
. .
. .
. .
(3-1) x (2-1)

GL = 2
. . .
. . .
. . .
(3-1) x (3-1)

GL = 4
(topo)


Teste de hipóteses


Para se testar algo é necessário estabelecer uma hipótese nula e uma alternativa, sendo ambas antagônicas.

A hipótese nula é uma hipótese tida como verdadeira até que provas estatísticas indiquem o contrário. É comumente designada por H0.

Pode ser uma afirmação quanto a um parâmetro que é propriedade de uma população ( Ex: média, variância, desvio padrão).

E, como é impossível observar toda a população, o teste é baseado na observação de uma amostra aleatória dela retirada.

Também é frequente que a hipótese nula consista em afirmar que os parâmetros ou características matemáticas de duas ou mais populações são idênticos.

Por exemplo, se desejarmos comparar valores obtidos para a variável altura entre indivíduos de amostras de duas cidades, A e B, a hipótese nula poderia ser:

"A média das alturas da cidade A é igual à da cidade B".



A hipótese alternativa deve ser contrária, oposta, antagônica à hipótese nula. É comumente designada por H1 ou Ha.

Note-se que, como as hipóteses são contraditórias, elas não poderão ser simultaneamente verdadeiras.

Assim, quando se aceita H0 também rejeita-se H1 e vice-versa.

Nesse exemplo a hipótese alternativa seria:

"A média das alturas da cidade A é diferente da encontrada na cidade B".

Entretanto, evidentemente deve-se expressar as hipóteses de modo numérico. Por exemplo:

O teste de lançamento da moeda pode ser feito para verificar se ela é viciada ou não.

Lembrando que p = probabilidade de cair cara = ½ e q = probabilidade de cair coroa = ½, pode-se estabelecer duas hipóteses:

Hipótese nula:

Portanto, se p for igual a q, pode-se concluir que a moeda não é viciada.

Hipótese alternativa: .

Nesse caso, se p for diferente de q, pode-se concluir que a moeda é viciada. (topo)



Elementos do teste de hipóteses


cinco passos que devem ser seguidos para realizar um teste de hipóteses:

1. Identificar o teste estatístico apropriado para os dados que se deseja analisar.


Deve-se lembrar que o teste produz um valor numérico, uma quantidade calculada a partir dos valores dos próprios dados que serão testados (Ex: médias, correlações, frequências, tendências,...).


Assim, depois de estabelecido o nível de significância, escolhe-se o teste apropriado, o que exige conhecimento de estatística.

Essa escolha depende de:

Tipo de dados: nominais, ordinais ou intervalares


vazio1.gif - Nominais: estudo de proporções. Teste de Qui-quadrado,
vazio1.gif - Ordinais: estudo de proporções, medianas, quartis, moda. Testes: Qui-quadrado, Kruskal-Wallis, regressão logística
vazio1.gifvazio1.gif e outros testes não paramétricos.

vazio1.gif - Intervalares: estudo de proporções, medianas, quartis, moda. Testes: Qui-quadrado, Kruskal-Wallis.
vazio1.gifvazio1.gif Também se pode estudar as médias, desvios-padrão, efetuar análise de variância, a correlação e regressão linear
vazio1.gifvazio1.gif e outros testes não paramétricos.

emparelhamento dos dados ou não?


Qual é a distribuição dos dados?


A amostra é pequena ou grande?


Amostra é isolada? Há duas amostras ou mais de dois grupos?



Em testes paramétricos usa-se uma distribuição teórica.

Por exemplo, diremos que a média amostral obtida em uma amostra, segue uma certa distribuição cujas características são previamente conhecidas. ( Ex.: a média de alturas de uma população segue a distribuição normal). Aqui é importante lembrar que as distribuições normal e binomial são particularmente frequentes em dados biológicos.

Já, se o teste for não paramétrico, não se assume nenhuma distribuição conhecida.

Quando se compara dois grupos de dados, o teste de significância determina a probabilidade de eles se originarem ou não da mesma população. Já, quando se compara mais de dois grupos deve-se usar análise de variância.


2. Definir a hipótese nula (H0). É comum escolher como hipótese nula aquela que se deseja rejeitar e provar o contrário. Por exemplo, a correlação entre duas características (altura e idade dos indivíduos de uma amostra) é igual a zero.

3. Definir a hipótese alternativa (H1). Frequentemente essa hipótese é simples: “H0 não é verdadeira”.

4.
Obter a distribuição nula, que é simplesmente a distribuição amostral do teste estatístico supondo que a hipótese nula seja verdadeira.

A distribuição nula pode ser uma distribuição cujos parâmetros são conhecidos (por exemplo, uma distribuição normal, com média e desvio padrão, uma distribuição t-student, ou uma distribuição empírica obtida pela reamostragem dos dados.


5.
Comparar a estatística observada com a distribuição nula.

Se o valor obtido estiver em uma região suficientemente improvável da distribuição nula, então H0 é rejeitada como improvável de ser verdadeira.

Se, por outro lado, o valor obtido estiver em uma região provável da distribuição nula, então H0 não pode ser rejeitada.

É importante notar que aceitar H0 não significa que a hipótese nula seja verdadeira, mas, apenas que não existe evidência suficiente para rejeitá-la. 


Erros estatísticos

Ao tomar uma decisão a favor ou contra uma hipótese há apenas dois tipos de erro estatísticos que se pode cometer.

Erro do tipo 1:
rejeita-se H0, quando H0 é verdadeira

Erro do tipo 2: aceita-se H0, quando H0 é falsa


O valor máximo que estabelecemos para ocorrência do erro do Tipo I é que estabelece se aceitamos ou rejeitamos a Hipótese Nula (H0) e deve ser escolhido antes da realização do teste. O valor mais frequentemente usado é o 0.05.

Assim, se p for menor do que o valor escolhido rejeitamos H0, Em caso contrário a aceitamos.

Resumindo, para aplicar um teste de significância, cria-se uma hipótese que, geralmente, é a de igualdade (hipótese nula). O teste é feito para tentar refutar esta hipótese. Mas, por erros amostrais (flutuações) pode-se incorrer em erros de tomada de decisão.



Se a hipótese nula for verdadeira

Se a hipótese nula for falsa

Aceita-se a hipótese nula

Corretamente, aceita-se a hipótese verdadeira

Erro do tipo II (beta):
Aceita-se uma hipótese nula que é falsa

Rejeita-se a hipótese nula

Erro do tipo I (alfa):
Rejeita-se uma hipótese nula que é verdadeira

Corretamente, rejeita-se a hipótese falsa


A probabilidade p de se rejeitar H0 quando ela é verdadeira corresponde ao nível de significância ( alfa ). (topo)


Copie esse texto em formato pdf
clicando no link ao lado com o botão direito do mouse.


Depois, clique em"Salvar destino como" (ou algo semelhante )
Escolha o local onde salvar e clique em OK.
Copiar aqui


Este "site", destinado prioritariamente aos alunos de Fátima Conti,
está disponível sob FDL (Free Documentation Licence),
pretende auxiliar quem se interessa por Bioestatística,
estando em permanente construção.
Sugestões e comentários são bem vindos.
Se desejar colaborar clique aqui. Agradeço antecipadamente.



Deseja enviar essa página?


Se você usa um programa de correio eletrônico devidamente configurado para
um e-mail pop3, clique em "Enviar página" (abaixo) para abrir o programa.
Preencha o endereço do destinatário da mensagem.
E pode acrescentar o que quiser.
(Se não der certo, clique aqui para saber mais).

Enviar página


Se você usa webmail copie o endereço abaixo

http://www.cultura.ufpa.br/dicas/biome/biotestes.htm

Acesse a página do seu provedor. Abra uma nova mensagem.
Cole o endereço no campo de texto.
Preencha o endereço do destinatário.
E também pode acrescentar o que quiser.

Última alteração: 12 mar 2011