ЗАМЕТКИ

Концепции причинно-следственного вывода

Причинно-следственная связь определяется как цепочка причинно-следственных зависимостей. Ассоциация — это закономерно возникающая связь между отдельными предметами, явлениями, фактами, отраженными в сознании и закрепленными в памяти. Причинно-следственные ассоциации — это ассоциации, в которых предметы являются причиной и следствие друг друга. Примеры причинно-следственных ассоциаций: лампочка — свет, гроза — дождь, яд — смерть.

Если вы решили не пить четвертый бокал вина, вы правильно подумали о том, что возможно он испортит Вам настроение на следующий день. Вы опираетесь на прошлый опыт, на то время когда Вы выпивали четыре и более бокалов вина, а потом просыпались с головной болью. Вы поняли, что между выпивкой и похмельем есть связь — причинно-следственная связь. Причинно-следственный вывод — это наука о выводе причинно-следственных связей из ассоциаций и понимании того, когда и почему они различаются. Причинно-следственный вывод может быть сделан с единственной целью — понять реальность.

Judea Pearl предложил метамодель, состояющую из трех ступеней сложности вопросов к прогнозным моделям, которую он назвал лестницей каузальности (или лестницей причинно-следственной связи). Каждый следующий шаг вверх по лестнице означает большую сложность решаемой задач и требует большее понимание процессов, генерирующих данные.

Объектом анализа в исследовании причинно-следственных связей обычно является то, на что вы хотите воздействовать. Приведенный пример ниже из практики производства электролитного никеля (обзорная статья): единицей анализа является оптимальный режим эксплуатации основных средств (анодные ячейки) при заданных ограничениях (сокращение количества основных средств выводимых из эксплуатации).

Исходные данные

  • Объем производства товарной продукции (Ni) — 150 тыс. т/год
  • Количество ванн для производства товарной продукции — 456 шт.
  • Количество анодных ячеек в одной ванне — 66 шт.
  • Количество единиц основных средств (анодные ячейки) для производства продукции — 30 200 шт.
  • Режим эксплуатации — 35 кА (каждая ванна имеет свою независимую систему электропитания)
  • Производительность одной ванны — 300 т/год
  • Обслуживание анодной ячейки 1 (один) раз в 2 (два) месяца — 6 раз в год
  • Эксплуатационной срок службы анодной ячейки — 5 лет

Метод T-Learner

T-Learner (Two-model learner) метод включает в себя обучение двух отдельных независимых моделей ML: одна для обработанной группы и одна для контрольной группы. Затем разница в прогнозах этих двух моделей используется для оценки (The Conditional Average Treatment Effect, CATE), который показывает, как изменится результат в зависимости от применения или не применения воздействия.

Модель:

\[\eta_{t}(x) \]

потенциальный результат от воздействия:

\[\eta_{0}(x) = E[Y|T = 0,X]\] \[\eta_{1}(x) = E[Y|T = 1,X]\]

Теперь можно делать контрфактические прогнозы для каждого воздействия и получать следующие результаты:

\[\hat{\tau}(x)_i = \hat{\eta_{1}}(X_i) — \hat{\eta_{0}}(X_i)\]


Диаграмма T-Learner — оценка разницы в прогнозах для двух моделей. X/T — модель с признаком воздействия T (treatment), с выборкой данных X (dataset) и определенным результатом (y*). Метод подразумевает построение двух независимых моделей: обработанную и контрольной. При прогнозе прогоняем обе модели на выборке данных X (dataset). Результат (CATE) — разница между обработанной (M1) и контрольной моделью (М0).

Минус такого метода заключается в том, что две модели независимы, и при вычислении разницы между моделями, ошибка суммируется (возможна ошибка при построении первой и второй модели).

Метод S-Learner

S-Learner (Single-model learner) метод включает в себя обучение единой модели ML для оценки воздействия на основе выборки данных, включая информацию о том, подвергался ли объект воздействию или нет. Это достигается путем добавления переменной воздействия как дополнительного признака в выборку данных.

Единая модель и потенциальный результат от воздействия:

\[\mu(x) = E[Y|T,X]\]

Данный метод позволяет получать результаты при разных режимах воздействия. Если режим воздействия бинарный (да/нет или 1/0), тогда оценкой CATE будет разница в прогнозах между тестом и контролем:

\[\hat{\tau}(x)_i = M_s(X_i, T = 1) — M_s(X_i, T = 0)\]


Диаграмма S-Learner — оценка разницы в прогнозах для единой модели. X/T — модель с бинарным признаком воздействия T (treatment) с выборкой данных X (dataset) и результатами y*. Результат (CATE) — разница между обработанной и контрольной выборкой данных.