Na publicação anterior da série "Amostragem", vimos o que significa o conceito e quais vantagens a amostragem nos oferece quando queremos estudar uma população. Hoje iremos estudar duas grandes famílias de técnicas amostrais existentes. Primeiramente, vamos definir o conceito de marco amostral.
Marco amostral
Um marco amostral é uma lista de elementos que compõe o universo que queremos estudar e também representa de onde a amostra é retirada. Os elementos pesquisados podem ser indivíduos, mas também podem ser lares familiares, instituições ou qualquer outro segmento que possa ser pesquisado. Cada um desses elementos presentes no marco amostral é conhecido como unidade de amostragem.
Vejamos um exemplo. Suponhamos que queremos medir a satisfação dos clientes de uma empresa. Para gerar um marco amostral, iremos acessar o sistema informático da empresa e extrair uma lista de todas as pessoas que tenham comprado algum produto no ano passado. Cada pessoa dessa lista representa uma unidade amostral. A seleção de um conjunto de clientes representa uma amostra.
A proporção existente entre o tamanho da amostra e do tamanho do marco amostral é conhecida como fração de amostragem. A fração de amostragem junto com o tamanho do marco amostral definem a precisão dos resultados obtidos ao iniciar uma pesquisa dentro da amostra.
Amostragem probabilística
Devemos considerar uma amostragem probabilística sempre que as condições abaixo sejam cumpridas:
- (1) Todos os elementos da minha população apresentam uma probabilidade maior que zero para ser selecionados na amostra.
- (2) Conhecer precisamente a probabilidade para cada elemento, também chamado de probabilidade de inclusão.
O cumprimento destes dois critérios é o que torna possível obter resultados não tendenciosos quando se estuda a amostra. Às vezes, estes resultados não tendenciosos requerem usar técnicas de ponderação (weighting), mas esta ponderação é possível precisamente porque sabemos qual probabilidade tenho de cada indivíduo selecionado na minha amostra. As amostras geradas nestas condições também são conhecidas como amostras probabilísticas.
A definição anterior nos leva a concluir que só podemos descobrir a amostragem probabilística se eu disponho de um marco amostral. O censo de um país, o conjunto de endereços de casas numa população ou uma lista de clientes de uma empresa são exemplos de marco amostral que permitem realizar uma amostragem probabilística. Em cada um desses casos, o universo para ser estudado é diferente: habitantes de um país, lares de uma população e clientes de uma empresa, respectivamente.
Uma vez que eu tenho um marco amostral, a maneira exata que eu uso para selecionar a minha amostra define as diferentes técnicas de amostragem probabilística: amostragem aleatória simples, amostragem sistemática, amostragem estratificada, amostragem por conglomerados, amostragem desproporcional...
Amostragem não probabilística
No entanto, não é fácil cumprir os requisitos impostos pela amostram probabilística:
- Ter um marco amostral representa algo relativamente pouco habitual em estudos de mercado.
- Garantir que todos os indivíduos da população tenham uma probabilidade não-nula de serem selecionados (é um requisito exigente), para conhecer a probabilidade exata de inclusão de cada unidade da amostral. Todos os indivíduos que não podem ser selecionados em uma amostra normalmente são considerados como unidades fora de cobertura.
Por todas estas razões e por temas de custos, diversas vezes os pesquisadores recorrem a outras técnicas de amostragem, agrupadas dentro do que é conhecido como amostragem não probabilística. Nestas técnicas alternativas, é comum selecionar elementos para a amostra com base em premissas em relação à população de interesse, conhecido como critério de seleção. Por exemplo, selecionar uma amostra buscando por indivíduos na rua, onde metade precisam ser homens e a outra metade, mulheres (coincidindo com a distribuição assumida na população), isso representa um critério de amostra não probabilística.
Neste caso, quando a seleção de unidades amostrais não é aleatória, e falamos de amostragem não probabilística, não devemos falar sobre estimativas de erro. Em outras palavras, uma amostra não-probabilística nos informa como é um universo, mas não permite saber com que precisão: não é possível estabelecer uma margem de erro e níveis de confiança. Algumas técnicas de amostragem deste tipo são: amostragem por conveniência, amostragem sequencial, amostragem por cotas, amostragem discrecional e amostragem bola de neve.
Erro de amostragem
Não é possível saber a margem de erro que vamos obter num estudo (por exemplo, os resultados de uma pesquisa) quando usamos a amostragem não probabilística. Isso inclui pesquisas realizadas através de seleção de pessoas na rua, entrevistas face to face ou realizando chamadas telefônicas aleatórias obtidas através de um painel online. Em nenhum desses casos são cumpridos os critérios exigidos pela amostragem probabilística: ter um marco amostral com unidades que eu possa calcular a probabilidade da minha amostra em ser selecionada. Em pesquisas face to face realizadas na rua, não existe uma lista de indivíduos que compõem o universo. Em pesquisas por telefone, mesmo se você tiver uma lista de telefones, nem todos os indivíduos têm um telefone fixo ou aparecem em listas públicas. No caso de um painel online, as pessoas que não acessam a Internet não pode ser selecionadas e tem uma probabilidade de inclusão nula.
No entanto, é comum encontrar estudos feitos com essas técnicas que indicam a margem de erro e o nível de confiança. É uma prática formalmente incorreta mas normalmente os pesquisadores a utilizam com o objetivo de indicar a influência que tem o tamanho da amostra usada na precisão dos resultados. Deveria ser considerado como "se a amostra fosse probabilística, ofereceria uma margem de erro X".
A respeito desse tema, existem diferentes opiniões sobre a gentileza de indicar a margem de erro nestas circunstâncias. No próximo post iremos realizar um debate sobre essa prática, estudando cada uma das técnicas de amostragem: como são, para que são utilizadas e quais os resultados oferecidos de cada uma delas. Esperamos por você!
ÍNDICE: Série "Amostragem"
- Amostragem: O que é e por quê funciona
- Amostragem probabilística e não probabilística
- Amostragem probabilística: Amostar aleatória simples
- Amostragem probabilística: Amostra estratificada
- Amostragem probabilística: Amostra sistemática
- Amostragem probabilística: Amostra por conglomerados
- Amostragem não probabilística: Amostra por conveniência
- Amostragem não probabilística: Amostra por quotas
- Amostragem não probabilística: Amostra por bola de neve