Wednesday, August 6, 2014

Пример использования функции glm() в R

Arthur Charpentier - автор Freakonometrics в своей статье Coffee and Productivity приводит простой пример использования функции glm() в языке программирования R из библиотеки stats.

В этом примере используются данные из двух источников:

  • Данные о потреблении кофе по странам с сайта http://backreaction.blogspot.fr,
  • Данные о ВВП по странам из Википедии, которые в данном примере рассматриваются как некий общий показатель продуктивности страны.


Безусловно результаты выполнения данных вычислений не стоит воспринимать слишком серьезно, потому что при таком виде регрессии, основанной на агрегированных данных, можно сказать практически все что угодно, так как достаточно очевидно, что в данном случае они коррелируют из-за присутствия некоего общего скрытого фактора. К примеру, с таким же подходом можно рассмотреть еще один пример из следующей статьи автора, в котором можно увидеть, что предполагаемая предположительность жизни при рождении растет по мере увеличения среднего потребления сигарет в стране, если рассматривать продолжительность жизни как функцию от количества потребляемых сигарет. То есть в данном примере потребление сигарет является независимой переменной, а продолжительность жизни зависимой. Скрытой переменной, из-за которой получаются такие, казалось бы, странные на первый взгляд результаты, может быть, например, благосостояние страны.

No comments:

Post a Comment