Skip to content

Data + GitHub Copilot para soluções avançadas de dados

License

Notifications You must be signed in to change notification settings

dev-pods/data-with-copilot

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

38 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Data + GitHub Copilot para soluções avançadas de dados

Pré-requisitosRecursosObjetivos de AprendizagemEstrutura

Note

Pronto para começar? Acesse o diretório do workshop para instruções completas de setup e exercícios.

Visão Geral

  • Para quem é isso: Engenheiros de Software, Engenheiros de Dados, Cientistas de Dados e qualquer profissional que trabalhe com Python e análise de dados. Ideal para quem quer dominar o uso produtivo do GitHub Copilot em projetos reais de dados.

  • O que você vai aprender: Você usará recursos avançados do GitHub Copilot (comandos de barra, chat inline, /explain, /fix, agentes @workspace) aplicados a 5 áreas essenciais: SQL, Pandas, EDA, Visualização e Boas Práticas. Aprenderá a gerar código, corrigir bugs, criar visualizações e refatorar projetos usando IA.

  • O que você vai construir: Um projeto completo de análise de dados, desde queries SQL complexas até visualizações profissionais, passando por transformações de DataFrames, análise exploratória e código modular seguindo boas práticas de engenharia.

Destaques do Workshop

  • 5 Módulos Independentes: SQL (30min), Pandas (45min), EDA (40min), Visualização (35min), Boas Práticas (40min)
  • Estrutura Modular: Cada módulo é auto-contido e pode ser executado em qualquer ordem
  • Sistema de Validação Avançado: Feedback detalhado com hints progressivos para cada exercício
  • Datasets Reais: 32.780 registros de vinhos + 15 regiões geográficas + amostra estratificada de 1.000 registros
  • Ambiente Pronto: GitHub Codespaces pré-configurado com Python 3.13, Jupyter, e todas as dependências

Objetivos de Aprendizagem

Neste workshop, você vai:

  • Dominar GitHub Copilot para Dados: Usar comandos de barra (/explain, /fix, /doc), chat inline, agentes @workspace e sugestões contextuais
  • Gerar Queries SQL Complexas: Criar consultas com agregações, JOINs e subqueries a partir de linguagem natural
  • Manipular DataFrames Eficientemente: Aplicar transformações, groupby, merge e pivot tables com Pandas usando assistência de IA
  • Realizar EDA Assistida por IA: Gerar estatísticas descritivas, detectar outliers, calcular correlações e criar features automaticamente

Estrutura do Workshop

workshop/
├── sql_module/          # Módulo 1: Geração de Queries SQL (30min)
├── pandas_module/       # Módulo 2: Manipulação de DataFrames (45min)
├── eda_module/          # Módulo 3: Análise Exploratória de Dados (40min)
├── viz_module/          # Módulo 4: Visualização de Dados (35min)
├── best_practices_module/ # Módulo 5: Boas Práticas de Código (40min)
├── data/                # Datasets centralizados (train.csv, regions.csv)
├── check.py             # Sistema de validação modular com feedback detalhado
└── README.md            # Guia completo do workshop

Cada módulo contém:

  • README.md: Teoria, exercícios progressivos e cheatsheets com soluções
  • Arquivos Python: Código inicial para prática e implementação
  • Prompts sugeridos: Exemplos de como usar o Copilot eficientemente

Pré-requisitos

  • Conta GitHub: Pessoal ou organizacional com acesso ao GitHub Copilot
  • Licença GitHub Copilot: Ativa (individual, business ou enterprise)
  • Navegador Web: Edge, Firefox ou Chrome atualizado

Todos os recursos, dependências, datasets e ambiente de desenvolvimento estão incluídos no repositório via GitHub Codespaces.

Como Começar

  1. Crie um repositório a partir deste template no GitHub
  2. Inicie um Codespace (ambiente pré-configurado com Python 3.13, Jupyter, pandas, matplotlib, seaborn, sqlalchemy)
  3. Navegue até /workshop e siga o README do workshop
  4. Escolha seu módulo (podem ser feitos em qualquer ordem ou seguir a sequência sugerida)
  5. Valide seu progresso usando python check.py --module <nome_modulo>

Para workshops de 1h, consulte o Guia de Adaptação de Tempo no README do workshop.

Recursos Adicionais

Aprenda mais sobre GitHub Copilot e desenvolvimento com IA:

Contribuindo

Contribuições são bem-vindas:

  • Reporte bugs ou erros de documentação via Issues
  • Sugira novos exercícios ou módulos via Pull Requests
  • Melhore traduções e prompts
  • Adicione visualizações ou exemplos

About

Data + GitHub Copilot para soluções avançadas de dados

Resources

License

Code of conduct

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Python 82.3%
  • Dockerfile 17.7%