Gráfico de Interpretación Causal

Machine LearningMachine LearningBeginner
Practicar Ahora

This tutorial is from open-source community. Access the source code

💡 Este tutorial está traducido por IA desde la versión en inglés. Para ver la versión original, puedes hacer clic aquí

Introducción

Esta práctica demuestra que los modelos de Machine Learning son excelentes para medir asociaciones estadísticas, pero son incapaces de inferir efectos causales sin hacer fuertes suposiciones sobre los datos. Simularemos una situación en la que intentamos responder a una de las preguntas más importantes de la economía de la educación: ¿cuál es el efecto causal de obtener un título universitario en los salarios por hora? Aunque la respuesta a esta pregunta es crucial para los responsables de la política, los vieses por variables omitidas nos impiden identificar ese efecto causal.

Consejos sobre la VM

Una vez finalizada la inicialización de la VM, haga clic en la esquina superior izquierda para cambiar a la pestaña Cuaderno y acceder a Jupyter Notebook para practicar.

A veces, es posible que tenga que esperar unos segundos a que Jupyter Notebook termine de cargarse. La validación de las operaciones no se puede automatizar debido a las limitaciones de Jupyter Notebook.

Si tiene problemas durante el aprendizaje, no dude en preguntar a Labby. Deje sus comentarios después de la sesión y lo resolveremos rápidamente para usted.


Skills Graph

%%%%{init: {'theme':'neutral'}}%%%% flowchart RL ml(("Machine Learning")) -.-> ml/FrameworkandSoftwareGroup(["Framework and Software"]) ml/FrameworkandSoftwareGroup -.-> ml/sklearn("scikit-learn") subgraph Lab Skills ml/sklearn -.-> lab-49076{{"Gráfico de Interpretación Causal"}} end

Generar el conjunto de datos

Generamos un conjunto de datos simulado de salarios por hora, experiencia laboral, habilidad, salarios por hora de los padres y títulos universitarios. La experiencia laboral en años y una medida de habilidad se extraen de distribuciones Normales. El salario por hora de uno de los padres se extrae de una distribución Beta. Creamos un indicador de título universitario que está positivamente influenciado por la habilidad y el salario por hora de los padres. Finalmente, modelamos los salarios por hora como una función lineal de todas las variables anteriores y un componente aleatorio.

Entrenar modelos predictivos con variables completamente observables

Entrenamos un modelo predictivo, un modelo de Regresión Lineal, asumiendo que todas las variables utilizadas por el verdadero modelo generativo están disponibles. Predecimos los salarios por hora utilizando características como la experiencia, el salario por hora de los padres, el título universitario y la habilidad. También graficamos los coeficientes del modelo para mostrar que recuperamos exactamente los valores del verdadero modelo generativo.

Entrenar modelos predictivos con observaciones parciales

Entrenamos un modelo predictivo nuevamente, pero esta vez omitimos la característica de habilidad, que no se observa o solo se estima a partir de proxy que inadvertidamente miden la educación también (por ejemplo, mediante pruebas de IQ). Predecimos los salarios por hora nuevamente utilizando características como la experiencia, el salario por hora de los padres y el título universitario. Luego verificamos si los coeficientes del modelo son diferentes del verdadero modelo generativo. Para compensar la variable omitida, el modelo infla el coeficiente de la característica de título universitario. Por lo tanto, interpretar este valor de coeficiente como un efecto causal del verdadero modelo generativo es incorrecto.

Lecciones aprendidas

Los modelos de machine learning no están diseñados para la estimación de efectos causales. Aunque lo mostramos con un modelo lineal, el Vieses por Variables Omitidas (OVB) puede afectar cualquier tipo de modelo. Siempre que se interprete un coeficiente o un cambio en las predicciones causado por un cambio en una de las características, es importante tener en cuenta las variables potencialmente no observables que podrían estar correlacionadas tanto con la característica en cuestión como con la variable objetivo. Tales variables se llaman Variables Confundidoras. Con el fin de seguir estimando el efecto causal en presencia de confusión, los investigadores por lo general realizan experimentos en los que la variable de tratamiento (por ejemplo, título universitario) es aleatorizada. Cuando un experimento es prohibitivamente costoso o no ético, los investigadores a veces pueden utilizar otras técnicas de inferencia causal como las estimaciones de Variables Instrumentales (IV).

Resumen

Esta práctica demuestra que los modelos de Machine Learning no están diseñados para la estimación de efectos causales. Los Vieses por Variables Omitidas (OVB) nos impiden identificar el verdadero efecto causal de una característica sobre la variable objetivo. Siempre que se interprete un coeficiente o un cambio en las predicciones, es importante tener en cuenta las variables potencialmente no observables que podrían estar correlacionadas tanto con la característica en cuestión como con la variable objetivo.