|
|
|
||||
|
|
|
Apresentação do curso e Introdução a R e Python | Notas de Aula: Capítulos 1 e 2 | Instalação de um conjunto das ferramentas para atividades práticas: Python e Jupyter ou R e RStudio Para praticar: os propostos para R nos Capítulos 2, 4, 6 e 8 em Wickham (ou nos Capítulos 4, 6 e 8 correspondentes para Python em Hathaway). Vale conferir os exercícios propostos nos Capítulos 1, 2 e 3 em Irizarry_I para R, e os dos Capítulos 1, 2 e 3 em McKinney para Python. Não deixem de tomar contato com a linguagem de marcação Markdown que tanto R quanto Python utilizam para criar documentos que integram códigos com textos: exercícios nos Capítulos 26-30 em Wickham (1a. ed.) (ou nos Capítulos 26-30 correspondentes em Hathaway para Python). |
Formule uma pergunta cuja resposta você pretende descobrir através da exploração de um conjunto de dados brutos, ou seja, um conjunto de dados que não foram limpos e podem conter erros, valores ausentes, informações inconsistentes ou em formatos inadequados para análise. Você deve selecionar um conjunto de dados apropriado para responder à pergunta e utilizar os pacotes, mas não limitados a, dplyr, tidyr e ggplot2 (para R)/pandas, scikit-learn e plotnine(para Python) para limpar, visualizar, explorar os dados do dataset escolhido. Todo o procedimento de verificação dos dados brutos, limpeza dos dados e exploração dos dados limpos deve ser registrado no notebook utilizando o formato Markdown. O notebook deve ser convertido para um documento PDF antes de submetê-lo junto com o notebook no Moodle. Sugestões de fontes de dados: Portal de Dados Abertos do Governo Federal, Portal de Dados Abertos do Governo Americano, Portal de Dados Abertos da União Européia, Kaggle, Base dos Dados, UC Irvine Machine Learning Repository. Critérios de Avaliação: Seleção de fontes de dados; Rigor técnico na aplicação de técnicas de limpeza; Rigor técnico na exploração de técnicas de visualização; Clareza na apresentação dos resultados e coerência com as conclusões; Qualidade da apresentação oral. |
|
|
|
Princípios de Design de Visualização | Notas de Aula: Capítulo 3 | Para praticar: os exercícios propostos no Capítulo 1 e 9 em Wickham (ou no Capítulo 3 correspondente em Hathaway). Os exercícios propostos no Capítulo 8 em Irizarry_I, bem como os exercícios no Capítulo 2 em Ismay, são úteis para aprofundar o conhecimento em ggplot2 (R). Os exercícios no Capítulo 9 em McKinney exploram a biblioteca de visualização matplotlib sobre a qual é implementada plotnine (Python). | |
|
|
|
Percepção e Cognição | Notas de Aula: Capítulo 4 Visual Perception Theory |
Para praticar: os exercícios em R propostos nos Capítulos 9 e 10 em Irizarry_I | |
|
|
|
Importação e Formatação de Dados | Notas de Aula: Capítulo 5 |
Para praticar: refazer os exemplos apresentados nos Capítulos 5 e 6 em McKinney e fazer os exercícios propostos no Capítulo 11 em Hathaway. Embora os exemplos e exercícios sejam em R, alguns conceitos sobre importação de dados introduzidos nos Capítulos 20-24 em Wickham são genéricos. Um outro conceito relevante são tidy data explicado no Capítulo 5 em Wickham e no Capítulo 4 em Ismay. | |
|
|
|
Estatística Descritiva | Notas de Aula: Capítulo 6 | Para praticar: os exercícios propostos nos Capítulos 4 e 7 em Irizarry_I e nos Capítulos 1 e 2 em Irizarry_II. | |
|
|
|
Pré-processamento de Dados (Wrangling = Importing, Clearing and Preparation; Munging = Importing, Clearing) | Notas de Aula: Capítulo 7 | Para praticar: refazer os exemplos apresentados nos Capítulos 7, 8 e 10 em McKinney, fazer os exercícios propostos no Capítulo 12-16 em em Hathaway. Embora os exemplos e exercícios sejam em R, as técnicas de data wrangling discutidas nos Capítulos 12-19 em Wickham, nos Capítulos 11-17 em Irizarry_1 e no Capítulo 3 em Ismay são genéricas. | |
|
|
|
Probabilidade | Notas de Aula: Capítulo 8 | Para praticar: os exercícios propostos nos Capítulos 3, 4 e 5 em Irizarry_II. Recomendo a leitura e prática do procedimento apresentado no Capítulo 7 em Ismay.Os dois livros contêm exemplos e exercícios em R. | |
|
|
|
Seminário: Apresentação do projeto individual sobre visualização exploratória de dados (EDA). | |||
|
|
|
||||
|
|
|
Estatística de Inferência (Estimativa Pontual e intervalar) | Notas de Aula: Capítulo 9 | Para praticar: os exercícios propostos no Capítulo 8 em Ismay e nos Capítulos 6, 7, 8 e 10 em Irizarry_II | Desenvolvimento de um projeto de inferência/modelagem, em grupo de até 2 pessoas, para responder uma pergunta do projeto de pesquisa ou um tema de interesse do grupo. O grupo deve identificar e coletar os dados necessários, aplicar técnicas apropriadas para limpeza e visualização exploratória de dados e construir um modelo de regressão que responda à pergunta formulada ou explore o tema de pesquisa. Faça uma avaliação da qualidade do ajuste do modelo aos dados e sua capacidade de generalização e sua relevância para o problema. O grupo deve documentar todo o processo de desenvolvimento do projeto, desde a escolha do tema/pergunta até a avaliação e interpretação do modelo, no notebook utilizando o formato Markdown. O notebook deve ser convertido para um documento PDF antes de submetê-lo junto com o notebook e um artigo, de 6 a 8 páginas no template da conferência SIBGRAPI, no Moodle. Confiram os temas dos estudos de casos apresentados nos Capítulo 14, Capítulo 15 e Capítulo 18 da parte II de Irizarry e no Capítulo 11 em Ismay. Critérios de avaliação: Qualidade da escolha do tema/pergunta: Adequação dos dados e das técnicas utilizadas; Qualidade do modelo construído; Clareza da documentação e da apresentação; Capacidade do grupo de responder a perguntas sobre o projeto. |
|
|
|
Estatística de Inferência (Teste de Hipóteses) | Notas de Aula: Capítulo 10 | Para praticar: os exercícios propostos no Capítulo 9 em Ismay, e nos Capítulos 9 e 11 em Irizarry_II | |
|
|
|
Estatística de Inferência (Regressão) | Notas de Aula: Capítulo 11 | Para praticar: refazer os exemplos apresentados no Capítulo 12 em McKinney e fazer os exercícios propostos nos Capítulos 5 e 6 em Ismay, e nos Capítulos 14, 15, 16, 17 e 18 em Irizarry_II. | |
|
|
|
Modelagem de Dados | Notas de Aula: Capítulo 12 | Para praticar: os exercícios propostos no Capítulo 10 em Ismay. | |
|
|
|
||||
|
|
|
Apresentação do projeto, em grupo de até 2 pessoas, sobre visualização explicativa de dados. | |||