IA376M/EA099M -
Tópicos em Engenharia de Computação VII
Tópico: Análise Visual em Ciência de Dados (Visual Analytics)
Primeiro Semestre de 2025
Profa. Wu,
Shin - Ting
DCA/
FEEC/ UNICAMP
[Objetivo]
[Horário]
[Tópicos]
[Material de Apoio]
[Dinâmica das Aulas]
[Calendário de atividades]
[Critério de Avaliação]
Objetivo
Este tópico tem como objetivo fornecer uma introdução à Análise Visual de Dados, uma área emergente que se destaca pela integração do processamento numérico das máquinas com a capacidade cognitiva dos especialistas humanos na resolução de problemas complexos. Com uma abordagem prática e fundamentada em teoria, todos os conceitos são colocados em prática por meio de atividades utilizando R ou Python.
Local e Período Letivo
- Aulas: sextas 14-18h (PE-33)
- Início das aulas: 24/fevereiro/2025
- Término das aulas: 05/julho/2025
- Calendário de Atividades
Tópicos
- Introdução a R e Python: Gramática de Gráficos
- Princípios de Design de Visualização
- Percepção e Cognição
- Estatística Descritiva
- Pré-Processamento de Dados (Data Wrangling/Munging)
- Probabilidade
- Estatística de Inferência
- Modelagem das Relações
Material de Apoio
Textos de Apoio
- Notas de aula
- Data Wrangling and Visualization with R e Statistics and Prediction Algorithms Through Case Studies
Autor: Rafael A. Irizarry
Plataforma de publicação de livros: Leanpub
Parte da primeira edição traduzida para português por Benilton S Carvalho, Diego Mariano, Guilherme Ludwig, Larissa Ávila, Pedro Baldoni,
Samara F Kiihl e Tatiana Benaglia
- Statistical Inference via Data Science - A ModernDive into R and the Tidyverse
Autores: Chester Ismay e Albert Y. Kim
- R for Data Science (2e)
Autores: Hadley Wickham, Mine Çetinkaya-Rundel e Garrett Grolemund
Segunda Edição, 2023
ISBN: 9781492097402
- Python for Data Analysis (3e)
Autor: Wes McKinney
Terceira Edição, 2022
ISBN: 978-1098104030
- Py for Data Science
(Versão da primeira edição de R for Data Science em Python)
Autores: J. Hathaway e Katie Larson
Dados
- Repositório RDatasets: uma coleção com um grande número de conjuntos de dados, originalmente distribuídos juntamente com o R e seus pacotes. Esses conjuntos de dados são amplamente usados como exemplos em diversos livros e materiais didáticos sobre a linguagem R e análise de dados.
- Conjuntos de dados usados em Ismay.
Ecossistemas para Análise de Dados
Embora R seja a ferramenta usada em muitos exemplos dos textos de apoio recomendados, a preferência para análise de dados é por Python devido à sua versatilidade e crescente popularidade na área. Por padrão, utilizaremos como ecossistemas para análise de dados o Jupyter Notebook ou o Google Colab. Em casos excepcionais, o ecossistema RStudio pode ser usado para análise de dados.
O Jupyter Notebook é um aplicativo que pode ser instalado para uso offline, enquanto o Google Colab é um serviço online fornecido pelo Google. Ambos trabalham com arquivos de extensão .ipynb. O Jupyter Notebook permite exportar os notebooks como documentos PDF via Latex. O Google Colab permite baixar os arquivos com extensão .ipynb que podem ser convertidos, com uso de nbconvert, para documentos PDF, desde que as dependências necessárias (Latex e Pandoc no Linux, Miktex e Pandoc no Windows e XeLaTex e Pandoc no MacOS) estejam instaladas.
Dinâmica das Aulas
As aulas seguirão uma estrutura simples: uma rápida revisão da nota de aula, seguida por uma breve apresentação do tópico. Em seguida, reservaremos um tempo para esclarecer quaisquer dúvidas que surjam. O restante da aula será dedicado à prática dos exercícios dirigidos sob supervisão. É importante que os alunos tragam seus próprios laptops para a aula e participem efetivamente nas discussões sobre os exercícios dirigidos. Esperamos que todos pratiquem bastante as técnicas aprendidas, tanto dentro quanto fora da sala de aula, para estarem preparados para responder perguntas com base em dados de forma eficaz.
Avaliações
- Exercícios Dirigidos (15%) (até 5 tentativas no Moodle).
- Tarefas de programação (25%).
- 11/04 e 25/04: Seminário com apresentação individual (30%).
- 27/0: Projeto final (30%), em grupo de 2 pessoas.
Serão aprovados os alunos que satisfizerem as três condições:
- conclusão no prazo de todas as tarefas designadas,
-
M = 0.15 E + 0.25 T + 0.3 S + 0.3 P >= 5.0 .
- uma frequência superior ou igual a 75%.
O conceito final dos alunos será determinado conforme a seguinte escala: A para notas no intervalo de 10.0 a 8.5, B para notas entre 8.4 e 7.0, C para notas entre 6.9 e 5.0, e D para notas abaixo de 5.0.
Sex Fev 21 08:24:48 -03 2025
"Esta página, assim como todas as páginas sob esta
mesma árvore, não é uma publicação oficial da UNICAMP, seu conteúdo
não foi examinado e/ou editado por esta instituição. A
responsabilidade por seu conteúdo é exclusivamente do
autor."
"This page, as well as all pages
under this same tree, is not an official publication from UNICAMP;
its content has not been verified and/or edited by this
institution. The author is solely responsible by its
contents."