Introdução
Este laboratório demonstra como imputar dados ausentes em um conjunto de dados usando diferentes técnicas no scikit-learn. Os conjuntos de dados usados aqui são o conjunto de dados de diabetes com 10 recursos e o conjunto de dados de habitação da Califórnia com 8 recursos. Os valores ausentes podem ser substituídos pela média, mediana ou valor mais frequente usando SimpleImputer. Este laboratório investigará diferentes técnicas de imputação, como imputação por valor constante, imputação pelo valor médio de cada recurso combinado com uma variável auxiliar de indicador de ausência, imputação pelo k vizinho mais próximo e imputação iterativa.
Dicas da Máquina Virtual
Após o término da inicialização da máquina virtual, clique no canto superior esquerdo para mudar para a aba Notebook para acessar o Jupyter Notebook para praticar.
Às vezes, pode ser necessário aguardar alguns segundos para que o Jupyter Notebook termine de carregar. A validação das operações não pode ser automatizada devido a limitações no Jupyter Notebook.
Se você enfrentar problemas durante o aprendizado, sinta-se à vontade para perguntar ao Labby. Forneça feedback após a sessão e resolveremos prontamente o problema para você.