Построение причинной интерпретации

Machine LearningMachine LearningBeginner
Практиковаться сейчас

This tutorial is from open-source community. Access the source code

💡 Этот учебник переведен с английского с помощью ИИ. Чтобы просмотреть оригинал, вы можете перейти на английский оригинал

Введение

Этот практикум показывает, что модели машинного обучения хорошо подходят для измерения статистических связей, но не могут выводить причинные эффекты без сильных предположений относительно данных. Мы моделируем ситуацию, в которой пытаемся ответить на один из самых важных вопросов экономики образования: какой является причинный эффект получения высшего образования на почасовую заработную плату? Хотя ответ на этот вопрос важен для принятия решений в области политики, искажения, обусловленные пропущенными переменными, препятствуют определению этого причинного эффекта.

Советы по использованию ВМ

После запуска ВМ перейдите в левый верхний угол и переключитесь на вкладку Ноутбук, чтобы приступить к практике с использованием Jupyter Notebook.

Иногда может потребоваться подождать несколько секунд, пока Jupyter Notebook полностью загрузится. Проверка операций не может быть автоматизирована из-за ограничений Jupyter Notebook.

Если вы сталкиваетесь с проблемами во время обучения, не стесняйтесь обращаться к Labby. Оставьте отзыв после занятия, и мы оперативно решим проблему для вас.


Skills Graph

%%%%{init: {'theme':'neutral'}}%%%% flowchart RL ml(("Machine Learning")) -.-> ml/FrameworkandSoftwareGroup(["Framework and Software"]) ml/FrameworkandSoftwareGroup -.-> ml/sklearn("scikit-learn") subgraph Lab Skills ml/sklearn -.-> lab-49076{{"Построение причинной интерпретации"}} end

Создание набора данных

Мы создаем имитационный набор данных почасовой заработной платы, трудового стажа, способности, почасовой заработной платы родителей и наличия высшего образования. Трудовой стаж в годах и мера способности генерируются из нормальных распределений. Почасовая заработная плата одного из родителей генерируется из бета-распределения. Мы создаем индикатор наличия высшего образования, который положительно зависит от способности и почасовой заработной платы родителей. Наконец, мы моделируем почасовую заработную плату в виде линейной функции всех предыдущих переменных и случайной составляющей.

Обучение прогнosticательных моделей с полностью наблюдаемыми переменными

Мы обучаем прогнosticательную модель, линейную регрессионную модель, предполагая, что все переменные, используемые истинной генеративной моделью, доступны. Мы предсказываем почасовую заработную плату с использованием таких характеристик, как опыт, почасовая заработная плата родителя, наличие высшего образования и способность. Мы также строим график коэффициентов модели, чтобы показать, что мы точно восстанавливаем значения истинной генеративной модели.

Обучение прогнosticательных моделей с частичными наблюдениями

Мы снова обучаем прогнosticательную модель, но на этот раз мы опускаем характеристику способности, которая не наблюдается или оценивается только по показателям, которые инadvertентно также измеряют образование (например, по IQ-тестам). Мы снова предсказываем почасовую заработную плату с использованием таких характеристик, как опыт, почасовая заработная плата родителя и наличие высшего образования. Затем мы проверяем, отличаются ли коэффициенты модели от истинной генеративной модели. Чтобы компенсировать пропущенную переменную, модель увеличивает коэффициент характеристики наличия высшего образования. Поэтому интерпретация этого значения коэффициента как причинный эффект истинной генеративной модели является неправильной.

Уроки, выученные

Модели машинного обучения не предназначены для оценки причинных эффектов. Хотя мы продемонстрировали это на примере линейной модели, искажение, обусловленное пропущенными переменными (OVB), может повлиять на любую тип модели. В любом случае, при интерпретации коэффициента или изменения прогнозов, вызванного изменением одной из характеристик, важно иметь в виду потенциально не наблюдаемые переменные, которые могут быть коррелированы как с исследуемой характеристикой, так и с целевой переменной. Такие переменные называются переменными-совмешителями. Чтобы по-прежнему оценить причинный эффект в присутствии смешанных факторов, исследователи обычно проводят эксперименты, в которых переменная воздействия (например, наличие высшего образования) выбирается случайным образом. Когда эксперимент чрезвычайно дорог или неэтичный, исследователи иногда могут использовать другие методы вывода причинных связей, такие как методы instrumental variables (IV) оценки.

Резюме

Этот практикум показывает, что модели машинного обучения не предназначены для оценки причинных эффектов. Искажения, обусловленные пропущенными переменными, препятствуют идентификации истинного причинного эффекта характеристики на целевую переменную. При интерпретации коэффициента или изменения прогнозов важно иметь в виду потенциально не наблюдаемые переменные, которые могут быть коррелированы с исследуемой характеристикой и целевой переменной.