A teoria da amostragem estuda as relaç˜oes existentes entre uma populaç˜ao e as amostras extraıdas dessa populaç˜ao. É útil para avaliaç˜ao de grandezas desconhecidas da populaç˜ao, ou para determinar se as diferenças observadas entre duas amostras s˜ao devidas ao acaso ou se s˜ao verdadeiramente signi- ficativas.
A finalidade da amostragem é fazer generalizações sobre um universo ou uma população grandes sem precisar examinar todos os componentes do grupo. Os elementos de um grupo, de um universo ou uma população são qualquer coisa que possa ser mensurada, contada ou ordenada segundo posições.
Definição: Unidade na qual são observadas e medidas as características quantitativas e qualitativas da população. A amostra é composta pelo conjunto de unidades amostrais. Cada unidade amostral gera uma única observação da variável de interesse.
O erro amostral pode ser contrastado com o erro não amostral. O erro não amostral é um termo abrangente para os desvios em relação ao valor real que não são uma função da amostra escolhida, incluindo vários erros sistemáticos e quaisquer erros aleatórios que não sejam causados pela amostragem.
Tomando–se qualquer amostra particular, o parâmetro populacional desconhecido pode ou não pode estar no intervalo de confiança observado. O nível de confiança é a frequência com a qual o intervalo observado contém o parâmetro real de interesse quando o experimento é repetido várias vezes.
Não podemos evitar a ocorrência do ERRO AMOSTRAL, porém podemos limitar seu valor através da escolha de uma amostra de tamanho adequado. Obviamente, o ERRO AMOSTRAL e o TAMANHO DA AMOSTRA seguem sentidos contrários (Figura 1). Quanto maior o tamanho da amostra, menor o erro cometido e vice-versa.
Como calcular a margem de erro
Tamanho da amostra = [z2 * p(1-p)] / e2 / 1 + [z2 * p(1-p)] / e2 * N]. N = tamanho da população. z = escore z. e = margem de erro.
A margem de erro é metade da largura do intervalo de confiança. Isto pode ser calculado como um múltiplo do erro padrão, com o fator dependendo do nível de confiança desejado.
Como você sabe, o erro padrão = desvio padrão / raiz quadrada do número total de amostras, portanto, podemos traduzi-lo para a fórmula do Excel como Erro padrão = STDEV (intervalo de amostragem) / SQRT (COUNT (intervalo de amostragem)).
Exemplo de cálculo de porcentagem de erro
Para interpretar o intervalo de confiança da média, assumimos que os valores foram amostrados de forma independente e aleatória de um população com distribuição normal com média μ e variância σ2. Dado que estas suposições são válidas, temos 95% de "chance" do intervalo conter o verdadeiro valor da média populacional.