о регрессиях и международных массивах данных: пример

Допустим, мы изучаем гендерную специфику посещения пивных в городах А и Б. В городе А мужчины значительно чаще женщин посещают пивные. А в городе Б по каким-то причианам только женщины ходят в пивные, а мужчины дома пьют молоко. В среднем получается, что частота посещения пивных в обоих городах одинакова. Если мы на совмещенном массиве сделаем регрессию и одноврменно включим в модель признаки "город проживания" и "пол", то коэффициенты в обоих случаях будут незначимы. "Город" будет незначим, поскольку частота посещения в обоих городах одинакова. "Пол" будет незначим, поскольку в одном городе вектор зависимости направлен в одну сторону, а в другом - в противоположную, и, таким образом, они компенсируют друг друга. Единственный способ найти истину в таком случае - разделить массив на два подмассива - по одному на каждый город - только в таком случае можно уловить существующую тенденцию.

Оставить комментарий

Комментарии: 0