A resposta que você quer para aquela pergunta, ou o problema que você quer resolver, irão determinar quais tipos de dados você precisará e o tipo de análise que realizará naqueles dados. Nesse contexto, você pode usar dados existentes ou juntar os dados por si mesmo.
Quem, o quê, quando e onde?
Pense a respeito:
- Quem ou o quê – é o sujeito dos dados? Exemplo: um grupo de pessoas, comidas, animais etc;
- Onde – a localização é importante? Exemplo: local ou internacional, um subúrbio particular etc;
- Quando – qual é o período de tempo apropriado para averiguar?
Deve haver um conjunto de dados existente que você possa analisar para responder a sua pergunta. De outro modo, você pode usar métodos para juntar seus próprios dados.
Dados abertos
Dados abertos são disponíveis publicamente para serem reutilizados. Os dados abertos podem ser acessados por diversas fontes. Dados de alta qualidade podem ser encontrados em sites governamentais e repositórios institucionais:
- Portal Brasileiro de Dados Abertos – é a ferramenta disponibilizada pelo governo para que todos possam encontrar e utilizar os dados e as informações públicas;
- Busca integrada da Biblioteca Brasiliana Guita e José Mindlin (BBM-USP) – ferramenta de busca nos recursos informacionais que a BBM atualmente disponibiliza;
- Biblioteca Nacional – o site da Biblioteca Nacional possui uma ferramenta para buscar em seu acervo;
- Biblioteca Digital de Teses e Dissertações – integração dos sistemas de informação de teses e dissertações existentes nas instituições de ensino e pesquisa do Brasil;
- Repositório da Produção USP – o repositório para pesquisa de publicações e conjuntos de dados da USP;
- Portal de Periódicos CAPES/MEC – biblioteca virtual que reúne e disponibiliza a instituições de ensino e pesquisa no Brasil o melhor da produção científica internacional;
- Pesquisa Google de Conjuntos de Dados – o Google disponibilizou uma pesquisa de conjunto de dados que permite a pesquisa através de múltiplos repositórios. Ainda não está totalmente pronto, por estar em fase beta;
- Dados textuais – da University of Queensland (em inglês), esse guia lista uma variedade de fontes para dados textuais abertos
Além destes, o Instituto Brasileiro de Geografia e Estatística – IBGE tem como objetivo prover dados e informações sobre os mais variados setores, assim atendendo as necessidades dos órgãos das esferas governamentais federal, estadual e municipal.
Qualidade do conjunto de dados
Avalie a qualidade do conjunto de dados, assim como você avaliaria qualquer informação que encontrasse, antes de usá-lo em seus trabalhos ou projetos. Quando estiver acessando a qualidade do conjunto de dados, considere:
- Autoridade – Quem coletou os dados? Foi uma educação institucional, o governo ou uma organização bem reputada? Caso um indivíduo tenha produzido o conjunto de dados, eles estão associados com uma boa organização ou são bem conhecidos em seu campo?
- Cobertura – houve amostras suficientes para serem representativas da população total ou do grupo pesquisado? O período de tempo é relevante ou atualizado?
- Propósito – Por que os dados foram coletados? Houve algum viés no método de coleta? Qual era o público–alvo?
- Precisão – O conjunto de dados está completo, ou faltam respostas ou há algum outro erro?
- Termos de uso – as condições para o uso aceitável dos dados estão claramente estabelecidas e adequadas para suas necessidades?
Os metadados ou a descrição dos dados devem incluir informações para te ajudar a avaliar o conjunto de dados.
Coletando dados
Você pode precisar coletar seus próprios dados para responder à pergunta de sua pesquisa, caso dados existentes não estejam disponíveis ou não sejam adequados.
Armazenando dados
Se você coletar seus próprios dados, também precisará pensar onde armazená-lo.
Se estiver coletando dados para um pequeno projeto ou tarefa, usar um armazenamento online ou local, como o Google Drive ou OneDrive, pode ser adequado, desde que você não tenha nenhum dado pessoal identificável. O módulo Trabalhando com arquivos dá um panorama das opções de armazenamento local e online e de como fazer o backup dos seus arquivos.
Tamanho da amostra
Você precisará decidir quantas respostas ou observações serão necessárias para se ter uma boa amostra. Amostras maiores te permitem, com maior probabilidade, tirar conclusões mais precisas do que amostras menores.
Métodos para coleta de dados
Observação
Através desse método, processos, atividades e comportamentos são observados. Os sujeitos em observação podem ou não estar cientes de que estão sendo observados. Assim, a descrição do que ocorre, ou uma lista buscando um evento particular, é usada para registrar a observação.
Pesquisas ou enquetes
Uma pesquisa é um método de coleta de dados sobre comportamentos, atitudes e opiniões. Planeje as questões da sua pesquisa cuidadosamente para que a informação que você consiga dos participantes seja útil para responder à questão do seu estudo. Já uma enquete é um tipo de pesquisa, mas geralmente bem curta. Enquetes frequentemente têm uma única questão de múltipla escolha.
Você pode conduzir suas pesquisas ou enquetes presencialmente ou através de ferramentas online.
Ferramenta | Conta gratuita | Guias |
Google Forms | Sim | Introdução ao Google Forms |
Survey Monkey | Sim | Centro de ajuda |
Entrevistas ou grupos focais
Uma entrevista geralmente envolve fazer perguntas estruturadas ou não-estruturadas para um único participante. Normalmente uma entrevista será aberta para permitir uma compreensão mais aprofundada de um tópico do que uma pesquisa pode dar.
Um grupo focal envolve um grupo de pessoas selecionadas (geralmente de 6 a 12 indivíduos) participando de uma entrevista em grupo, guiada por um moderador. É um ótimo jeito de se obter um contexto social a respeito do tópico.
Em ambas as técnicas você pode precisar de um gravador de áudio ou vídeo para registrar a discussão, ou ter um observador registrando os detalhes.
Scraping (raspagem de dados)
O scraping é um método para conseguir textos e imagens de sites e redes sociais. A prática pode ser problemática, dependendo do uso pretendido e da reprodução. Apesar de os pesquisadores poderem usar métodos automatizados para acessar qualquer informação pública disponível na web, quando estiverem especificamente engajados em pesquisas e estudos legítimos que façam uso dos dados, e desde que não publiquem posteriormente o material, em todas as circunstâncias eles devem consultar a Lei de Direitos Autorais.
Ferramentas para scraping de dados
API – Application Programming Interface (Interface de Programação de Aplicativos) – é um conjunto de padrões de programação que permite a construção de aplicativos, que pode ser utilizada para solicitar dados de um site usando uma URL. Geralmente, alguns conhecimentos de programação são necessários para utilizar as APIs.
Ferramenta | Disponível gratuitamente | Disponível nos computadores da FEA/USP | Tutoriais |
Python | Sim | Baixando páginas com o Python | |
Scrapy | Sim | Documentação do Scrapy | |
Reaper (para redes sociais) | Sim | Informações de ajuda estão disponíveis no site da Reaper | |
NCapture (uma extensão do Chrome usada com NVivo) | Sim | O que é o NCapture? (descubra mais sobre o NVivo na próxima seção) | |
RStudio | Sim | FEA-5 | Curso de R (Labtrop-IB-USP) |
Saiba mais visitando esses conteúdos: