Introdução
Este laboratório ilustra como aplicar diferentes pipelines de pré-processamento e extração de características a diferentes subconjuntos de características, utilizando ColumnTransformer. Isto é particularmente útil para conjuntos de dados que contêm tipos de dados heterogéneos, uma vez que podemos querer escalar as características numéricas e codificar em one-hot as características categóricas.
Neste laboratório, utilizaremos o conjunto de dados Titanic do OpenML para construir um pipeline que pré-processa dados categóricos e numéricos utilizando ColumnTransformer e utilizá-lo para treinar um modelo de regressão logística.
Dicas da VM
Após o arranque da VM, clique no canto superior esquerdo para mudar para a aba Notebook para aceder ao Jupyter Notebook para a prática.
Por vezes, pode ser necessário esperar alguns segundos para o Jupyter Notebook terminar de carregar. A validação das operações não pode ser automatizada devido a limitações no Jupyter Notebook.
Se tiver problemas durante a aprendizagem, não hesite em contactar o Labby. Forneça feedback após a sessão e resolveremos prontamente o problema para si.