O post de hoje é dedicado a técnica de amostragem conhecida como: amostra por quotas. Essa técnica é frequentemente usada em pesquisas online através de painéis. Podemos encontra a amostragem por quotas como a versão não probabilística da amostra estratificada. Essa amostra é composta por três fases:
1- Segmentação
Em primeiro lugar, dividimos a população do estudo em grupos de forma exaustiva (todos os indivíduos estão em um grupo) mutuamente exclusivos (um indivíduo só pode estar em um único grupo), semelhante à divisão em camadas usadas na amostragem estratificada. Normalmente, esta segmentação é feita através de alguma variável sócio-demográfica, como: sexo, idade, classe social ou região.
2- Definindo o tamanho das quotas
Estabelecemos a meta de indivíduos a serem entrevistados para cada um desses grupos. Normalmente definimos estes objetivos de forma proporcional ao tamanho do grupo populacional. Por exemplo, se nós definimos segmentos por sexo numa população em que há 60% das mulheres e 40% homens, e queremos obter uma amostra de 1.000 pessoas, definimos uma meta de 600 mulheres e 400 homens. Estes objetivos são conhecidos como quotas. Neste exemplo, teríamos uma quota de gênero de 600 mulheres e 400 homens. Em algumas ocasiões, se definem quotas não proporcionais à população, para poder aprofundar a análise de um grupo específico.
3- Seleção de participantes e comprovação de quotas
Para finalizar, buscam-se por participantes para cobrir todas as quotas definidas. Este ponto é onde nos afastamos da amostra probabilística: Na amostragem por quotas é permitido que a seleção de indivíduos não seja aleatória, ou seja, os indivíduos podem ser selecionados através da amostra por conveniência. Por exemplo, em um estudo no qual nós definimos uma quota de 100 pessoas com menos de 25 anos e 100 pessoas com idades entre 25 anos ou mais, caso não conseguimos atingir 100% da quota prometida, poderíamos sair nas ruas e abordar pessoas, entrevistando aquelas que cumprem as idades restantes para fechar a quota referente a nossa meta.
De acordo com a descrição acima, a diferença entre a amostra estratificada e amostra por quotas está na forma como selecionamos os participantes. Na amostra estratificada, disponibilizamos de uma lista de possíveis entrevistados, todos com uma certa probabilidade (conhecida) de serem selecionados. Na amostra por quotas não. A medida que vou obtendo candidatos para fazer parte da amostra, comprovo se são válidos para o meu estudo (ou seja, ele pode fazer parte dos participantes ou exceder as quotas). Quando, eventualmente, eu descarto um participante (preciso de 100 mulheres, e já temos 101 mulheres), falamos que este indivíduo foi descartado por quota-full.
Seleção de variáveis
"Quais variáveis eu devo escolher numa amostragem por quotas? Como segmento a população?" Esta pergunta é um fator chave para esta técnica.
O uso de quotas precisa garantir que a amostra seja o mais representativa possível dentro do universo estudado. Quando definimos quotas de sexo e idade em uma amostra, independente do método de seleção de indivíduos, garantimos que a amostra apresentará proporções idênticas do universo quanto ao sexo e a idade.
Para definir as variáveis, precisamos definir quotas que cumpram duas condições: (1) A população pode ser alterada devido ao processo de seleção não aleatório que aplicamos, (2) Pode influenciar no dado que queremos medir.
Vamos analisar os critérios citados anteriormente através de um exemplo concreto: uma amostra obtida através de um painel online. Suponhamos que queremos medir a % de fumantes de uma população extraída a partir de um painel online. Quais variáveis devemos definir por quotas?
Inicialmente, aquelas variáveis que parecem distorcidas numa seleção amostral de um painel online a respeito da população: por exemplo, a idade (geralmente os painéis online apresentam uma maior proporção de jovens na população) e classe social (os painéis têm dificuldades em atrair as pessoas de classes mais baixas, especialmente na América Latina).
Podemos definir as quotas por região. Normalmente os painéis online não são segmentados para uma determinada região, mas estão acessíveis a partir de qualquer local. O interessante é analisar as diferenças regionais a partir das diferenças socioeconômicas. Se a região que queremos estudar não apresenta grandes diferenças socioeconômicas, não terá nenhum benefício usar uma quota deste tipo.
Se atendemos ao segundo critério (quotas que podem afetar o resultado medido) , podemos optar por adicionar uma quota por sexo: normalmente o hábito de fumar varia entre homens e mulheres e, ao menos que trabalhemos com um painel em garanta que a composição dos sexos é perfeita em comparação com a população, é aconselhável verificar esta quota também.
Amostra por quotas e representatividade
A utilização de quotas em uma amostragem não probabilística não nos permitirá transformá-la em probabilística. Não é possível calcular a margem de erro e nível de confiança dos resultados. Ou seja, o uso de quotas não permite medir a precisão dos resultados.
Que significa usar ou não usar quotas? A amostra por conveniência é equivalente a amostra por quotas? A resposta é NÃO!
O uso de quotas oferece certos controles aos vieses que podem ocorrer pelo método de seleção usado, nos garante que em uma série de variáveis-chave, vamos reproduzir a composição da população em nossa amostra. O problema é que, embora seja uma prática muito comum entre os pesquisadores, não podemos afirmar a representatividade da amostra. As quotas melhoram a representatividade, mas não sabemos quanto.
A amostra por quotas é um dos métodos de amostragem mais populares e, praticamente, o único método viável quando realizamos pesquisas online (exceto quando temos um painel probabilístico). Usar quotas é um sistema efetivo e econômico de obter amostras que proporcionam informação relevante.
Vantagens e inconvenientes
A principal vantagem da amostra por quotas é que ela oferece resultados extremamente úteis a um custo baixo e, se as variáveis foram escolhidas de forma correta, os resultados serão totalmente confiáveis.
Este método apresenta dois inconvenientes: (1) a impossibilidade de limitar o erro neste tipo de amostragem e (2) evitar o risco de uma parte significativa do estudo. Por exemplo, se num estudo eleitoral não existia uma quota por regiões, provavelmente irá existir tendências de voto diferentes em algumas regiões, distorcendo fortemente os resultados globais do estudo.
Erros frequentes ao usar quotas na Internet
A amostra por quotas é muito popular. A maior parte dos estudos telefônicos e pessoais, na ausência de um quadro de amostragem preciso (como um censo população) usam quotas para garantir um nível aceitável de representação. Essa técnica também é dominante nos estudos online através de painéis. No entanto, o meio online tem suas peculiaridades e, frequentemente, alguns pesquisadores desconhecem algumas técnicas online, se limitando a trabalhar somente com as técnicas offline. Esta prática pode produzir resultados de menor qualidade e, em alguns casos, custos mais elevados.
Alguns exemplos:
Quotas geográficas
No offline: A região do respondente é uma variável-chave para controlar quando realizamos pesquisas pessoais, por razões óbvias. Se os pesquisadores estão em uma cidade, todos os entrevistados serão dessa cidade. É por isso que a região é uma parte chave. Também é comum para limitar a amostra somente para as cidades mais importantes, reduzindo o custo.
No online: A região não é tão importante, é fácil encontrar pessoas de diferentes cidades. Não tem nenhum custo para pesquisar pessoas de uma ou dez cidades. Portanto, se o fator geográfico é fundamental, não poderíamos controlar as quotas geográficas. Se é importante, podemos definir quotas de respostas em todas as regiões, não de algumas cidades. Desta forma, obtemos melhores dados a um custo menor, já que podemos usar todo o painel de resultados.
Quotas por classe social
No offline: Geralmente a classe social não é considerada uma parte chave nos países da Europa e América do Norte, pelo menos não em todos os estudos. As diferenças existem entre as classes sociais, mas não são tão profundas como em outras regiões, como na América Latina. A coleta de dados através de entrevista pessoal na América Latina resulta ser mais difícil acessar as classes mais altas, enquanto as classes mais baixas são mais fáceis de obter.
No online: A classe social é mais relevante que no offline, especialmente em países com uma penetração média ou baixa da Internet. Curiosamente, nesses países a situação é inversa ao offline: na América Latina é mais fácil ter acesso a classes altas através da Internet do que as classes baixas.
Quotas por sexo e idade
No offline: Sexo e idade são variáveis controladas mediante a quotas. Normalmente não ocorrem nenhum problema, porém no campo telefônico é mais fácil captar mulheres do que homens e a pessoas mais velhas do que jovens. Com o aparecimento do celular, os jovens praticamente só utilizam o telefone fixo.
No online: Ambas variáveis devem ser controladas, como no offline. Os painéis online alcançam com maior facilidade ao público jovem, especialmente na faixa dos 20 a 35 anos. Também é habitual que os painéis recrutem mais mulheres do que homens, reflexo das demandas dos estudos de mercado, por isso torna-se necessário controlar a variável de sexo.
Nosso próximo post vamos falar sobre a técnica de amostragem por bola de neve.
ÍNDICE: Série "Amostragem"
- Amostragem: O que é e por quê funciona
- Amostragem probabilística e não probabilística
- Amostragem probabilística: Amostar aleatória simples
- Amostragem probabilística: Amostra estratificada
- Amostragem probabilística: Amostra sistemática
- Amostragem probabilística: Amostra por conglomerados
- Amostragem não probabilística: Amostra por conveniência
- Amostragem não probabilística: Amostra por quotas
- Amostragem não probabilística: Amostra por bola de neve