Introdução à Ciência de Dados com Python e SQL
Sérgio de Souza Barbosa Fontes
Quinta-feira: 6145-2F N2-N4
Sexta-feira: 6145-2F N3-N4
Quinta-feira: 6145-2F N2-N4
Sexta-feira: 6145-2F N3-N4
RESUMO
Este curso de dois dias oferece uma introdução prática à ciência de dados utilizando o DuckDB, um banco de dados leve e eficiente para análise.
Dia 1: Fundamentos e Exploração de Dados
Inicia-se com conceitos de ciência de dados aplicada, explorando casos reais em educação, saúde e políticas públicas. Em seguida, os participantes configuram o ambiente técnico usando venv e requirements.txt, e aprendem comandos SQL essenciais (SELECT, WHERE, ORDER BY, LIMIT) para manipulação inicial de dados. A etapa prática aborda o carregamento de CSVs, técnicas de limpeza (ajuste de colunas, tipos de dados e tratamento de valores nulos), além de filtros e consultas básicas. O dia conclui com exercícios aplicados a dados de pesquisas reais.
Dia 2: Análise e Exportação de Resultados
Foca em operações avançadas: integração de fontes diversas (como Censo e IBGE) através de JOINs, e agregações (GROUP BY, COUNT, SUM, AVG) para gerar tabelas resumo (médias por região, ano ou escolaridade). Finalmente, ensina a exportar resultados tratados para formatos como CSV ou Parquet, permitindo a utilização dos dados em outras ferramentas ou relatórios.
Objetivo Final:
Capacitar os participantes a realizar análises de dados completas — desde a importação e limpeza até cruzamento de fontes, sumarização e exportação de resultados — usando tecnologias ágeis e acessíveis.
REQUISITOS
- Conhecimento básico de Python (tipos, loops, funções simples)
EMENTA
Dia 1 Fundamentos e Exploração de Dados
Introdução
O que é ciência de dados aplicada?
Exemplo de uso com dados reais (educação, saúde, políticas públicas)
Ambiente e primeiros comandos
Apresentação do DuckDB
Setup do ambiente (venv, requirements.txt)
Executando comandos SQL com DuckDB
SELECT, WHERE, ORDER BY, LIMIT
Explorando dados abertos
Carregamento de CSVs com DuckDB
Limpeza básica: colunas, tipos, valores nulos
Filtros e consultas simples
Prática guiada
Exercícios com dados reais de pesquisa
Dia 2 Análise e Exportação de Resultados
Integração de dados e cruzamento de fontes
Junções (JOINs) entre tabelas de pesquisa (ex.: Censo + IBGE)
Agregações e exportação
GROUP BY, COUNT, SUM, AVG
Tabelas resumo por categoria (ex.: média por região, ano, escolaridade)
Exportando dados tratados para CSV ou Parquet
SOBRE O AUTOR
Aluno de Bacharelado em Ciência da Compuitação no IME/UERJ, engenheiro de dados e pesquisador na área de Inteligência Artificial.
Inscrições
https://www.even3.com.br/viii-encontro-ppg-compmat-594355/
Após a inscrição no Encontro, acesse "Inscrição em atividades" logo abaixo e se inscreva no respectivo minicurso.