De maneira geral, existem duas grandes áreas na inferência Estatística: a estimação de parâmetros (Para mais informações sobre estimação, verifique nosso post sobre função de Verossimilhança), e o teste de hipóteses. Em particular, o teste de hipoteses consiste em avaliar uma afirmação a respeito de um parâmetro (média, variância, proporção, etc.) ou um conjunto de parâmetros. Tal afirmação recebe o nome de Hipótese Nula (Denotado por
Para deixar essa ideia um pouco mais clara, suponha que queremos saber se uma determinada marca de blusa A, possui um tempo médio de duração (Denotado por
Para realizar o teste, assumimos que é possível obter uma amostra aleatória de blusas da marca A,
Tambem é necessário definir a estatística de teste
Um teste pode ser tanto aleatório quanto não aleatório. O exemplo anterior, por exemplo, é um ótimo exemplo de teste não aleatório. Já um teste aleatório poderia ser "jogue uma moeda para o alto, caso cara rejeite a hipótese nula".
Tão importante quanto conhecer os tipos de teste é a verificação da "qualidade" de um teste, ou o quão correto estamos ao rejeitar uma hipótese. Podemos analisar esses resultados observando a função poder bem como os tipos de erros que podemos cometer dentro de um procedimento de testes de hipóteses
Para cada teste aplicado sobre uma amostra obtida de uma distribuição
Se
para todo
Sendo a função poder, a probabilidade de rejeitar a hipótese nula dado os possíveis valores do parâmetro em estudo
Retomando o exemplo inicial onde rejeitamos a hipótese nula para
onde
Perceba que, para os valores de
Ao considerar como possível escolha, rejeição ou não rejeição da hipótese nula, testamos uma hipótese contra a outra. Dentro deste cenário encontramos dois tipos de erros, os chamados:
-
Erro do Tipo I: rejeitar a hipótese nula quando a mesma é verdadeira. Para o exemplo em questão, assumir que a marca A dura em média menos que 5 anos, quando o tempo é superior a 5 anos.
-
Erro do Tipo II: aceitar a hipótese nula quando a mesma é falsa. Assumindo por exemplo que o tempo de duração é superior ou igual a 5 anos quando na verdade o tempo é inferior.
É possível indicar a probabilidade de ocorrência de cada erro, para o exemplo trabalhado na sessão, por meio da seguinte notação para o Erro do Tipo I:
e para o Erro do Tipo II:
Dado que
É relacionado para cada regra de rejeição, ou valor crítico de
As hipóteses de um teste podem ser da forma simples ou composta. Uma hipótese simples, é aquela onde o espaço de possíveis valores de
Suponha que temos uma amostra aleatória
Obtendo o teste de razão de verossimilhança,
Que pode ser reescrito como
Ou seja, rejeitamos
Para cada
Antes de falar sobre os testes mais poderosos, uma definição deve ser esclarecida: o tamanho do teste. Vamos admitir um teste
Esclarecida essa definição, daremos prosseguimento ao assunto. Assim como já comentado, queremos um teste
Teste Mais Poderoso: Um teste
i.
ii.
Ou seja, podemos considerar um teste
O lemma a seguir é muito útil para encontrar testes mais poderosos.
-
Lemma Neyman-Pearson: seja
$X_1,...,X_n$ uma amostra aleatória de uma distribuição com densidade$f(x;\theta)$ , onde$\theta$ pode assumir os valores$\theta_1$ ou$\theta_0$ e 0 <$\alpha$ < 1. Considere$k*$ uma constante positiva e C* um subconjunto do espaço de valores para$X_i$ . Assim,
e
Então, considerando um teste de hipóteses simples, temos que o teste para essa região de rejeição é o teste mais poderoso. Vamos mostrar um exemplo para melhor compreensão.
Seja
Rejeitamos
Conforme incrementamos o valor do somatório, diminuimos o valor de
Perceba porém, que ao trabalharmos com uma variável de contagem ($\sum X_i \sim Binomial(n,\theta)$), não se torna tão simples assim fixar o valor de
k = 1 | k = 2 | k = 3 | k = 4 | k = 5 | k = 6 | k = 7 | |
---|---|---|---|---|---|---|---|
Valores de |
0.851 | 0.617 | 0.35 | 0.15 | 0.047 | 0.011 | 0.002 |
Ou seja, o teste mais poderoso de tamanho
Note que o teste mais poderoso de tamanho
Generalizaremo, agora, para os teste de hipóteses compostas. O método mais geral para testar hipóteses, que, geralmente não é o que fornece resultados mais precisos, mas é aplicável em todo tipo de situação, é o Teste de Razão de Verossimilhança Generalizado. Considere
-
Teste de Razão de Verossimilhança Generalizado: suponha
$L(\theta;X_1,...,X_n)$ a função de verossimilhança para a amostra$X_1,...,X_n$ . O teste de razão de verossimilhança generalizada, denotado por$\lambda$ , é definido como:
Onde
-
Testes Uniformemente Mais Poderosos (UMP): um teste
$\delta*$ do tipo$H_0: \theta \in \Theta_0$ contra$H_1: \theta \in \Theta_1 = \theta - \Theta_0$ é definido como UMP de tamanho$\alpha$ se e somente se
(i)
(ii)
para todo
Suponha o exemplo onde testamos
Substituindo pelos valores propostos no problema então obtemos que
Na literatura, podemos encontrar formas diferentes de testar hipóteses das vistas neste tutorial, mas elas fogem do escopo deste post e por isso não foram abordadas. Ainda assim, fomos capazes de aprender alguns dos métodos para testar hipóteses estatísticas mais utilizados, além de métodos para achar o melhor tipo de teste. Espero que o texto tenha sido esclarecedor e de ajuda ao leitor. Para mais informações ou dúvidas, escreva-nos em : [email protected]{.email}