Repositório da oficina de Introdução à Estatística - Modus UFMG (Setembro, 2021)
Instrutor: Lucas Gelape
O objetivo da oficina é oferecer uma introdução à análise estatística básica (univariada e bivariada) com destaque a tópicos diretamente relevantes para a compreensão da análise de regressão.
O conteúdo inclui, mas não se limita a, medidas de tendência central e dispersão, distribuição normal, teste t de média, teste t de diferença de médias. Recomenda-se que alunas interessadas tenham noções básicas do software R.
- Local: Zoom
- Período: 27/09/2021 a 01/10/2021
- Horário: 09:00 às 12:00
O R é uma linguagem de programação e um software de código-aberto (portanto, gratuito), cuja utilização está em crescimento nas ciências sociais brasileiras. Uma boa ferramenta para sua utilização é o software R Studio.
Como o curso será a distância, peço que todas comecem a primeira aula com o R e o RStudio instalados. Para a instalação, sigam esse tutorial do Curso-R. Caso alguma aluna use Linux, peço que entre em contato comigo.
Não temam o código! Todos os scripts para os exercícios de aula e de casa serão disponibilizados. Em caso de qualquer dúvida, não hesitem em interromper a aula ou enviar um e-mail.
Como material de apoio, indico os seguintes livros/cursos/tutoriais sobre o uso do R:
-
Damiani, Athos et. al. Ciência de Dados em R. Curso-R. 2021. Disponível em: https://livro.curso-r.com/index.html
-
Phillips, Jonathan. Análise de Dados para Ciências Sociais. Disciplina oferecida no Programa de Pós-Graduação em Ciência Política da USP, 2021. Disponível em: https://jonnyphillips.github.io/Ciencia_de_Dados/
-
Grolemund, Garrett. Hands-On Programming with R. Disponível em: https://rstudio-education.github.io/hopr/
-
Meireles, Fernando e Denisson Silva. Usando R: Um Guia para Cientistas Políticos. 2018. Disponível em: http://electionsbr.com/livro/
-
Oliveira, Paulo Felipe de; Saulo Guerra e Robert McDonell. Ciência de dados com R: Introdução. Brasília: Editora IBPAD, 2018. Disponível em: https://cdr.ibpad.com.br/cdr-intro.pdf
A atividade final está disponível. Ela deve ser enviada por-email, em um arquivo R-Script (.R) ou Word (.docx).
Teremos um pequeno exercício de fixação a ser realizado todos os dias após a aula (tarefas de casa). As alunas que desejarem feedback em suas respostas devem salvá-las numa pasta com seu nome na pasta compartilhada da oficina no Google Drive, em um documento de Word ou R-script, até as 23h59 de domingo, dia 09/outubro. Recomendo que não deixem os exercícios acumularem ao longo da semana. O gabarito já está disponível na pasta de Exercícios.
Caso alguma aluna precise de atendimento fora do horário de aula para resolução de dúvidas, peço que envie um e-mail para que possamos marcar um horário.
Conhecendo os dados: análise descritiva:
- Tipos de variáveis
- Descrição de variáveis categóricas
- Descrição de variáveis numéricas/quantitativas
Probabilidade e Inferência Estatística:
- População e Amostra
- Teoria da Probabilidade
- Cálculo de Probabilidade
- Teorema do Limite Central
- Distribuição Normal
Inferência Estatística:
- Estimação de Parâmetros
- Intervalo de Confiança
- Proporções e Médias
Testes de Hipótese:
- Estatística de Teste
- Distribuição de Referência
- Valor esperado (ou valor médio)
- Valor p
- Nível de Significância
- Tipos de Erro nos testes
- Teste t
- Teste Qui-quadrado
Uma versão inicial deste curso foi preparada em conjunto com Raquel D'Albuquerque, a quem agradeço pela troca de ideias e compartilhamento dos materiais de aula. Uma versão de um curso de introdução ao R que lecionei com Fernando Meireles, a quem agradeço pelo auxílio, foi a base do Tutorial 1 deste curso. Agradeço também os alunos da versão de 2019 do curso, que contribuíram para melhorias nessa nova edição.