Skip to content

andersonmdcanteli/iris_data_set_youtube

Repository files navigation

Analise exploratória de dados (Iris dataset)

Este repositório contém o script utilizado para a aula de analise exploratória de disponibilizado no YouTube.

cover image

Vídeo 1: Neste vídeo, é feita uma breve introdução do que será feito ao longo da aula, além de apresentar e explicar o conjunto de dados. Também apresento o ambiente de Python no Google Colab, que é a plataforma que será utilizada para realizar a análise.

Vídeo 2: Neste vídeo eu importo as principais bibliotecas que utilizo ao longo de todos os vídeos. Também damos uma primeira olhada nos dados, e então eu divido o conjunto de dados em 2 grupos. O primeiro grupo será utilizado ao longo dessa série de vídeos, e o segundo grupo ficará como uma simulação de uma nova aquisição de dados, para validação externa.

Vídeo 3: Neste vídeo colocamos a mão na massa, e analisamos todos os dados diferentes espécies da flor de íris. Estudamos as principais métricas básicas (média e desvio padrão, por exemplo), os boxplots e os histogramas. Vamos um pouco mais a fundo na avaliação dos histogramas ao avaliar os dados quanto a distribuição dos dados.

Vídeo 4: Neste vídeo analisamos os dados de cada espécie, obtendo as métricas básicas, os boxplots, os histogramas e também verificando se a distribuição de cada características segue ou não a distribuição Normal.

Vídeo 5: Nesse vídeo procuramos por relações entre as diferentes características aos pares, através dos gráficos de dispersão e do ajuste do modelo linear aos dados.

Vídeo Extra: Nesse vídeo eu mostro como criar data frames a partir de arquivos .xlsx e importar eles para o Python do ambiente do Google Colab, utilizando a biblioteca Pandas.

Links

Licença

Creative Commons Zero v1.0 Universal

About

Notebooks developed for Iris exploratory data analysis

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published