Ambiente de laboratório para aulas de estatística e ciência de dados via Jupyter Notebook
Este repositório fornece um ambiente de desenvolvimento para estatística e ciência de dados usando Jupyter Notebook com suporte ao R, ao Python e SGBD ClickHouse no VS Code através do GitHub Codespaces.
- Clique no botão Code (verde) no topo deste repositório
- Selecione a aba Codespaces
- Clique em Create codespace on main (ou no branch desejado)
- Aguarde a criação do ambiente (pode levar alguns minutos na primeira vez)
- O ambiente será configurado automaticamente com:
- Python e Jupyter Notebook
- R e IRkernel (kernel R para Jupyter)
- Pacotes R comuns para estatística (ggplot2, dplyr, tidyr, etc.)
- Extensões do VS Code para Jupyter e R
Se preferir trabalhar localmente, você precisará ter o Docker instalado:
-
Clone este repositório:
git clone https://github.com/FGV-Fundacao-Getulio-Vargas/Stats-In-Codespace.git cd Stats-In-Codespace -
Abra no VS Code:
code . -
O VS Code detectará o arquivo
.devcontainere perguntará se deseja reabrir no container -
Clique em Reopen in Container
- Abra ou crie um arquivo
.ipynb - Clique em Select Kernel no canto superior direito
- Escolha o kernel conectando-se ao ambiente codespace (se estiver no codespace)
- Abra os exemplos indicados pelo professor, compreenda e atualize conforme a sua evolução
Você também pode iniciar o Jupyter Notebook ou JupyterLab via terminal:
# Jupyter Notebook
jupyter notebook
# JupyterLab (interface moderna)
jupyter labUm notebook de exemplo está incluído: exemplo_estatistica.ipynb
Este exemplo demonstra:
- Carregamento de bibliotecas R
- Criação de dados
- Estatísticas descritivas
- Visualização de dados com ggplot2
- Análise por grupos com dplyr
Os seguintes pacotes R estão pré-instalados:
- IRkernel: Kernel R para Jupyter
- ggplot2: Visualização de dados
- dplyr: Manipulação de dados
- tidyr: Organização de dados
- readr: Leitura de dados
- tibble: Data frames modernos
- stringr: Manipulação de strings
- forcats: Trabalho com fatores
- purrr: Programação funcional
Para instalar pacotes R adicionais, use o terminal:
R -e "install.packages('nome_do_pacote', repos='https://cloud.r-project.org/')"Ou dentro de um notebook:
install.packages("nome_do_pacote")- Jupyter: Suporte completo para notebooks Jupyter
- Python: Suporte para Python
- R: Suporte para linguagem R
- R LSP: Language Server Protocol para R (autocompletar, linting)
- Fávero, L. P.; Belfiore, P. Manual de Análise de Dados. 1ª Edição. Rio de Janeiro: Elsevier, 2017.
- Book, Velleman, De Veaux; Stats: Modeling the World. Pearson, 2016.
- Statistics: the art and science of learning from data; Agresti, Franklin, Klingenberg; 2007.
- The Art of Statistics: How to Learn from Data; David Spiegelhalter.
- Inteligência Computacional: Fundamentos e Aplicações; Alexandre Evsukoff; 2020.
Contribuições são bem-vindas! Sinta-se à vontade para abrir issues ou pull requests.
Este projeto é de código aberto e está disponível para uso educacional.