ЗАДАНИЕ
Федеральной службой государственной статистики РФ ежеквартально проводятся
бюджетные обследования домашних хозяйств по всем регионам России об условиях проживания и уровне благосостояния населения. Необходимо проанализировать данные обследования
о расходах и доходах домохозяйств по заданному территориальному округу (переменная ТЕРРИТОРИЯ) и типу населенного пункта (город/село, переменная ТИПНАС). Выбор задания по вариантам осуществляется в соответствии с файлом с данными (см. лист «Выбор вариантов»).
В рамках работы считается, что домохозяйства описываются следующими показателями:
1) расходы на продукты питания (переменная ПРОДПИТ, y1);
2) расходы на непродовольственные товары (переменная НЕПРОД, y2);
3) расходы на оплату услуг (переменная УСЛУГИ, y3);
4) расходы на покупку алкогольной продукции (переменная АЛКО, x0);
5) доходы домохозяйства (переменная ДОХОД, x1);
6) сбережения домохозяйства (переменная СБЕРЕЖ, x2);
7) число людей в домохозяйстве (ЧИСЛОЛЮД, x3);
8) число детей в домохозяйстве (ЧИСЛОДЕТ, x4).
Необходимо построить и проинтерпретировать модель, описывающую изменение значения отклика (y) в зависимости от значений объясняющих переменных (x0, x1, x2, x3 и x4) в пределах указанной территории и типа населенного пункта.
ПОРЯДОК ВЫПОЛНЕНИЯ РАБОТЫ
1. Построить корреляционные поля по данным о значениях отклика (выбираемого по вариантам, номер означает соответствующую переменную y) и каждом объясняющем показателе (x0, x1, x2, x3 и х4). Сделать предварительное заключение о наличии (отсутствии) связи между этими факторами, о ее виде и форме, а также о наличии аномальных наблюдений (выбросов).
2. Провести проверку данных на наличие выбросов с удалением всех наблюдений , для которых выполняется соотношение , где X – матрица, составленная из значений переменных x1 и x2. На основе оставшихся наблюдений провести первичный эконометрический анализ, включающий расчет основных выборочных характеристик и построение гистограмм. Сделать выводы, проинтерпретировать полученные результаты.
3. Рассчитать выборочные парные коэффициенты корреляции для всех возможных пар пе-ременных (для порядковых переменных x3 и x4 использовать коэффициенты ранговой корреляции Спирмена), проверить их на значимость, сделать выводы о связи между признаками.
4. Построить линейную модель множественной регрессии для отклика, определенного по варианту задания, и входных переменных, характеризующих доход, сбережения, число людей и число детей в домохозяйстве. С помощью анализа корреляционной матрицы изучить модель на предмет наличия мультиколлинеарности на основе критериев Бартлетта и Лоули. Если необходимо, исключить один из входных факторов, ответственный за мультиколлинеарность.
5. Оценить полученную модель при помощи МНК отдельно для семей с нулевыми (пере-менная x0 = 0) и ненулевыми (x0 ≠ 0) расходами на алкогольную продукцию, проверить параметры обеих моделей на значимость. Сравнить полученные результаты, сделать выводы.
6. Проранжировать входные факторы по степени влияния на отклик двумя методами: при помощи коэффициентов эластичности и на основе коэффициентов частной корреляции. Оце-нить качество построенных моделей на основе критерия Фишера. Сравнить полученные результаты, сделать выводы.
7. Построить частные уравнения регрессии для наиболее часто встречающихся в данных значениях факторов, измеряемых в ранговой шкале, а также при медианных значениях пере-менных x0 и x2. Построить и изобразить линии обеих регрессий и 95%-й доверительные интер-валы для них на всем диапазоне исходных данных. Проанализировать результаты.
8. Сделать общие выводы по проделанной работе в терминах исходных показателей.