As fontes dos dados

As fontes dos dados

A resposta que você quer para aquela pergunta, ou o problema que você quer resolver, irão determinar quais tipos de dados você precisará e o tipo de análise que realizará naqueles dados. Nesse contexto, você pode usar dados existentes ou juntar os dados por si mesmo.

Quem, o quê, quando e onde?

Pense a respeito:

  • Quem ou o quê – é o sujeito dos dados? Exemplo: um grupo de pessoas, comidas, animais etc;
  • Onde – a localização é importante? Exemplo: local ou internacional, um subúrbio particular etc;
  • Quando – qual é o período de tempo apropriado para averiguar?

Deve haver um conjunto de dados existente que você possa analisar para responder a sua pergunta. De outro modo, você pode usar métodos para juntar seus próprios dados.

 

Dados abertos

Dados abertos são disponíveis publicamente para serem reutilizados. Os dados abertos podem ser acessados por diversas fontes. Dados de alta qualidade podem ser encontrados em sites governamentais e repositórios institucionais:

Além destes, o Instituto Brasileiro de Geografia e Estatística – IBGE tem como objetivo prover dados e informações sobre os mais variados setores, assim atendendo as necessidades dos órgãos das esferas governamentais federal, estadual e municipal.

 

Qualidade do conjunto de dados

Avalie a qualidade do conjunto de dados, assim como você avaliaria qualquer informação que encontrasse, antes de usá-lo em seus trabalhos ou projetos. Quando estiver acessando a qualidade do conjunto de dados, considere:

  • Autoridade – Quem coletou os dados? Foi uma educação institucional, o governo ou uma organização bem reputada? Caso um indivíduo tenha produzido o conjunto de dados, eles estão associados com uma boa organização ou são bem conhecidos em seu campo?
  • Cobertura – houve amostras suficientes para serem representativas da população total ou do grupo pesquisado? O período de tempo é relevante ou atualizado?
  • Propósito – Por que os dados foram coletados? Houve algum viés no método de coleta? Qual era o públicoalvo?
  • Precisão – O conjunto de dados está completo, ou faltam respostas ou há algum outro erro?
  • Termos de uso – as condições para o uso aceitável dos dados estão claramente estabelecidas e adequadas para suas necessidades?

Os metadados ou a descrição dos dados devem incluir informações para te ajudar a avaliar o conjunto de dados.

 

Coletando dados

Você pode precisar coletar seus próprios dados para responder à pergunta de sua pesquisa, caso dados existentes não estejam disponíveis ou não sejam adequados.

Armazenando dados

Se você coletar seus próprios dados, também precisará pensar onde armazená-lo.

Se estiver coletando dados para um pequeno projeto ou tarefa, usar um armazenamento online ou local, como o Google Drive ou OneDrive, pode ser adequado, desde que você não tenha nenhum dado pessoal identificável. O módulo Trabalhando com arquivos dá um panorama das opções de armazenamento local e online e de como fazer o backup dos seus arquivos.

Tamanho da amostra

Você precisará decidir quantas respostas ou observações serão necessárias para se ter uma boa amostra. Amostras maiores te permitem, com maior probabilidade, tirar conclusões mais precisas do que amostras menores.

 

Métodos para coleta de dados

Observação

Através desse método, processos, atividades e comportamentos são observados. Os sujeitos em observação podem ou não estar cientes de que estão sendo observados. Assim, a descrição do que ocorre, ou uma lista buscando um evento particular, é usada para registrar a observação.

Pesquisas ou enquetes

Uma pesquisa é um método de coleta de dados sobre comportamentos, atitudes e opiniões. Planeje as questões da sua pesquisa cuidadosamente para que a informação que você consiga dos participantes seja útil para responder à questão do seu estudo. Já uma enquete é um tipo de pesquisa, mas geralmente bem curta. Enquetes frequentemente têm uma única questão de múltipla escolha.

Você pode conduzir suas pesquisas ou enquetes presencialmente ou através de ferramentas online.

Ferramenta Conta gratuita Guias
Google Forms Sim Introdução ao Google Forms
Survey Monkey Sim Centro de ajuda

 

Entrevistas ou grupos focais

Uma entrevista geralmente envolve fazer perguntas estruturadas ou não-estruturadas para um único participante. Normalmente uma entrevista será aberta para permitir uma compreensão mais aprofundada de um tópico do que uma pesquisa pode dar.

Um grupo focal envolve um grupo de pessoas selecionadas (geralmente de 6 a 12 indivíduos) participando de uma entrevista em grupo, guiada por um moderador. É um ótimo jeito de se obter um contexto social a respeito do tópico.

Em ambas as técnicas você pode precisar de um gravador de áudio ou vídeo para registrar a discussão, ou ter um observador registrando os detalhes.

 

Scraping (raspagem de dados)

O scraping é um método para conseguir textos e imagens de sites e redes sociais. A prática pode ser problemática, dependendo do uso pretendido e da reprodução. Apesar de os pesquisadores poderem usar métodos automatizados para acessar qualquer informação pública disponível na web, quando estiverem especificamente engajados em pesquisas e estudos legítimos que façam uso dos dados, e desde que não publiquem posteriormente o material, em todas as circunstâncias eles devem consultar a Lei de Direitos Autorais.

 

Ferramentas para scraping de dados

API – Application Programming Interface (Interface de Programação de Aplicativos) – é um conjunto de padrões de programação que permite a construção de aplicativos, que pode ser utilizada para solicitar dados de um site usando uma URL. Geralmente, alguns conhecimentos de programação são necessários para utilizar as APIs.

Ferramenta Disponível gratuitamente Disponível nos computadores da  FEA/USP Tutoriais
Python Sim   Baixando páginas com o Python
Scrapy Sim   Documentação do Scrapy
Reaper (para redes sociais) Sim   Informações de ajuda estão disponíveis no site da Reaper
NCapture (uma extensão do Chrome usada com NVivo) Sim   O que é o NCapture? (descubra mais sobre o NVivo na próxima seção)
RStudio Sim FEA-5 Curso de R (Labtrop-IB-USP)

 

Saiba mais visitando esses conteúdos:

Literacias Digitais

LAE (DTI - FEA - USP)