Este repositório contém o script utilizado para a aula de analise exploratória de disponibilizado no YouTube.
Vídeo 1: Neste vídeo, é feita uma breve introdução do que será feito ao longo da aula, além de apresentar e explicar o conjunto de dados. Também apresento o ambiente de Python no Google Colab, que é a plataforma que será utilizada para realizar a análise.
Vídeo 2: Neste vídeo eu importo as principais bibliotecas que utilizo ao longo de todos os vídeos. Também damos uma primeira olhada nos dados, e então eu divido o conjunto de dados em 2 grupos. O primeiro grupo será utilizado ao longo dessa série de vídeos, e o segundo grupo ficará como uma simulação de uma nova aquisição de dados, para validação externa.
Vídeo 3: Neste vídeo colocamos a mão na massa, e analisamos todos os dados diferentes espécies da flor de íris. Estudamos as principais métricas básicas (média e desvio padrão, por exemplo), os boxplots e os histogramas. Vamos um pouco mais a fundo na avaliação dos histogramas ao avaliar os dados quanto a distribuição dos dados.
Vídeo 4: Neste vídeo analisamos os dados de cada espécie, obtendo as métricas básicas, os boxplots, os histogramas e também verificando se a distribuição de cada características segue ou não a distribuição Normal.
Vídeo 5: Nesse vídeo procuramos por relações entre as diferentes características aos pares, através dos gráficos de dispersão e do ajuste do modelo linear aos dados.
Vídeo Extra: Nesse vídeo eu mostro como criar data frames a partir de arquivos .xlsx e importar eles para o Python do ambiente do Google Colab, utilizando a biblioteca Pandas.
- Vídeo 1: https://youtu.be/JDX4Xn2PTiE
- Vídeo 2: https://youtu.be/U8m9N5xCZFw
- Vídeo 3: https://youtu.be/vfI42W17GCE
- Vídeo 4: https://youtu.be/1lpefzcwWvk
- Vídeo 5: https://youtu.be/LbCx2onN0gg
- Vídeo extra: https://youtu.be/jmEyxKKtWfw
Creative Commons Zero v1.0 Universal