Pré-requisitos • Recursos • Objetivos de Aprendizagem • Estrutura
Note
Pronto para começar? Acesse o diretório do workshop para instruções completas de setup e exercícios.
-
Para quem é isso: Engenheiros de Software, Engenheiros de Dados, Cientistas de Dados e qualquer profissional que trabalhe com Python e análise de dados. Ideal para quem quer dominar o uso produtivo do GitHub Copilot em projetos reais de dados.
-
O que você vai aprender: Você usará recursos avançados do GitHub Copilot (comandos de barra, chat inline,
/explain,/fix, agentes@workspace) aplicados a 5 áreas essenciais: SQL, Pandas, EDA, Visualização e Boas Práticas. Aprenderá a gerar código, corrigir bugs, criar visualizações e refatorar projetos usando IA. -
O que você vai construir: Um projeto completo de análise de dados, desde queries SQL complexas até visualizações profissionais, passando por transformações de DataFrames, análise exploratória e código modular seguindo boas práticas de engenharia.
- 5 Módulos Independentes: SQL (30min), Pandas (45min), EDA (40min), Visualização (35min), Boas Práticas (40min)
- Estrutura Modular: Cada módulo é auto-contido e pode ser executado em qualquer ordem
- Sistema de Validação Avançado: Feedback detalhado com hints progressivos para cada exercício
- Datasets Reais: 32.780 registros de vinhos + 15 regiões geográficas + amostra estratificada de 1.000 registros
- Ambiente Pronto: GitHub Codespaces pré-configurado com Python 3.13, Jupyter, e todas as dependências
Neste workshop, você vai:
- Dominar GitHub Copilot para Dados: Usar comandos de barra (
/explain,/fix,/doc), chat inline, agentes@workspacee sugestões contextuais - Gerar Queries SQL Complexas: Criar consultas com agregações, JOINs e subqueries a partir de linguagem natural
- Manipular DataFrames Eficientemente: Aplicar transformações, groupby, merge e pivot tables com Pandas usando assistência de IA
- Realizar EDA Assistida por IA: Gerar estatísticas descritivas, detectar outliers, calcular correlações e criar features automaticamente
workshop/
├── sql_module/ # Módulo 1: Geração de Queries SQL (30min)
├── pandas_module/ # Módulo 2: Manipulação de DataFrames (45min)
├── eda_module/ # Módulo 3: Análise Exploratória de Dados (40min)
├── viz_module/ # Módulo 4: Visualização de Dados (35min)
├── best_practices_module/ # Módulo 5: Boas Práticas de Código (40min)
├── data/ # Datasets centralizados (train.csv, regions.csv)
├── check.py # Sistema de validação modular com feedback detalhado
└── README.md # Guia completo do workshop
Cada módulo contém:
- README.md: Teoria, exercícios progressivos e cheatsheets com soluções
- Arquivos Python: Código inicial para prática e implementação
- Prompts sugeridos: Exemplos de como usar o Copilot eficientemente
- Conta GitHub: Pessoal ou organizacional com acesso ao GitHub Copilot
- Licença GitHub Copilot: Ativa (individual, business ou enterprise)
- Navegador Web: Edge, Firefox ou Chrome atualizado
Todos os recursos, dependências, datasets e ambiente de desenvolvimento estão incluídos no repositório via GitHub Codespaces.
- Crie um repositório a partir deste template no GitHub
- Inicie um Codespace (ambiente pré-configurado com Python 3.13, Jupyter, pandas, matplotlib, seaborn, sqlalchemy)
- Navegue até
/workshope siga o README do workshop - Escolha seu módulo (podem ser feitos em qualquer ordem ou seguir a sequência sugerida)
- Valide seu progresso usando
python check.py --module <nome_modulo>
Para workshops de 1h, consulte o Guia de Adaptação de Tempo no README do workshop.
Aprenda mais sobre GitHub Copilot e desenvolvimento com IA:
- Codifique com GitHub Codespaces
- Usando recursos avançados do GitHub Copilot
- Documentação oficial do GitHub Copilot
- Pandas Documentation
- Matplotlib Gallery
- Seaborn Tutorial
Contribuições são bem-vindas:
- Reporte bugs ou erros de documentação via Issues
- Sugira novos exercícios ou módulos via Pull Requests
- Melhore traduções e prompts
- Adicione visualizações ou exemplos