Abstract: The model of multiple regression is obtained. It shows the relationship between the price of the laptop and its technical characteristics.
Keywords: Econometrics, correlation, laptops, multiple regression
Сегодня практически никто из нас не может представить свою жизнь без использования всевозможных гаджетов, поэтому с уверенностью можно говорить о том, что XXI век – это век технологий, основой которого являются разнообразные технические устройства, а в качестве одного из основных видов товаров выступает различного рода информация. Глобализация современного общества ведет к повышению степени мобильности населения, что является основной причиной роста популярности ноутбуков. Достаточно сложно оспорить тот факт, что в наше время ноутбук – это далеко не роскошь, а необходимый для работы инструмент, такой же, как и шариковая ручка, блокнот и т.п. Рынок компьютерной техники сегодня обеспечивает широкий выбор гаджетов с техническими характеристиками «на любой вкус», поэтому выбор подходящего устройства зачастую бывает весьма сложным. Чтобы облегчить данный выбор необходимо понимать, от каких технических характеристик в большей степени зависит цена нового ноутбука и на что в первую очередь следует обращать внимание при его выборе. Этим обусловлена актуальность данной работы.
Объектом данной работы является рыночная цена нового ноутбука.
В качестве предмета данного исследования выступает анализ корреляционной зависимости цены нового ноутбука и его различных технических характеристик.
Цель данного исследования предполагает разработку оптимальной модели множественной регрессии, отражающей взаимосвязь между ценой нового ноутбука и его техническими характеристиками.
Для достижения поставленной цели необходимо выполнение ряда задач, таких как построение и анализ регрессионной модели, а также экономическая интерпретация различных ее элементов.
Цена любого наукоемкого изделия, коим, несомненно, является ноутбук, определяется, в первую очередь, его техническими характеристиками. В данной работе рассматриваются такие технические параметры ноутбука, как размер оперативной память (Гб), частота процессора (ГГц) и диагональ экрана (дюймы). Однако нельзя не учитывать, что немалое влияние на цену продукции оказывает «имя» фирмы-производителя, поэтому регрессионная модель, по нашему мнению, должна строиться с учетом бренда изготовителя ноутбука. Таким образом, в качестве исходных данных имеем массив, включающий значения трех количественных и одной качественной переменной, которая преобразуется в фиктивную переменную (см. Табл.1).
Таблица 1
Исходные данные для эконометрического анализа, 2017 г[1].
№ п/п | Y | X1 | X1 f | X2 | X3 | X4 |
1 | 8999 | Irbis | 1 | 2 | 1,33 | 10,1 |
2 | 10999 | Irbis | 1 | 2 | 1,333 | 11,6 |
3 | 11999 | Irbis | 1 | 2 | 1,33 | 14 |
4 | 11999 | DEXP | 1 | 2 | 2,16 | 11,6 |
5 | 14999 | DEXP | 1 | 2 | 1,6 | 11,6 |
6 | 15999 | DEXP | 1 | 2 | 1,5 | 15,6 |
7 | 14499 | DELL | 1 | 2 | 1,6 | 11,6 |
8 | 17799 | DELL | 1 | 2 | 1,6 | 11,6 |
9 | 20999 | DELL | 1 | 4 | 1,6 | 15,6 |
10 | 141999 | Aorus | 0 | 16 | 2,4 | 14 |
11 | 172999 | Aorus | 0 | 16 | 2,4 | 17,3 |
12 | 91999 | Alienware | 0 | 8 | 2,9 | 15,6 |
13 | 116999 | Alienware | 0 | 16 | 2,6 | 15,6 |
14 | 124999 | Alienware | 0 | 8 | 2,6 | 17,3 |
15 | 15499 | HP | 1 | 2 | 1,6 | 15,6 |
16 | 17999 | HP | 1 | 2 | 1,6 | 15,6 |
17 | 20999 | HP | 1 | 2 | 1,6 | 15,6 |
18 | 15999 | Asus | 1 | 2 | 1,5 | 15,6 |
19 | 17299 | Asus | 1 | 2 | 1,6 | 15,6 |
20 | 24999 | Asus | 1 | 4 | 1,6 | 17,3 |
21 | 14999 | Lenovo | 1 | 2 | 2,16 | 15,6 |
22 | 17299 | Lenovo | 1 | 2 | 1,35 | 15,6 |
23 | 20999 | Lenovo | 1 | 2 | 1,4 | 13,3 |
24 | 15299 | Acer | 1 | 2 | 1,6 | 11,6 |
25 | 17299 | Acer | 1 | 2 | 1,6 | 15,6 |
26 | 23427 | Acer | 1 | 2 | 1,6 | 11,6 |
27 | 64999 | Apple | 0 | 4 | 1,6 | 11,6 |
28 | 79999 | Apple | 0 | 4 | 2,2 | 11,6 |
29 | 91999 | Apple | 0 | 8 | 2,7 | 11,6 |
30 | 162999 | Apple | 0 | 16 | 2,4 | 13,3 |
Исходный массив содержит данные о цене Y тридцати ноутбуков с указанием названия фирмы-производителя (X1), размера оперативной памяти (X2), частоты процессора (X3), диагонали экрана (X4). Введенная фиктивная переменная имеет два значения – 1 и 0. Цифрой 1 обозначается бренд «средней» ценовой категории (такие марки, как «Irbis», «DEXP», «DELL», «HP», «Asus», «Lenovo», «Acer»), а цифрой 0 – бренд более высокой ценовой категории (такие марки, как «Aorus», «Alienware», «Apple»).
Построение регрессионной модели целесообразно начать с определения парных коэффициентов корреляции, характеризующих взаимосвязь между тем или иным объясняющим фактором и объясняемой переменной. Воспользовавшись встроенными возможностями «Microsoft Office Excel», получили следующие значения парных коэффициентов корреляции (см. Табл.2).
Таблица 2
Парные коэффициенты корреляции
rX1fY | rX2Y | rX3Y | rX4Y |
-0,91886 | 0,944895 | 0,804023 | 0,217299 |
Значения парного коэффициента корреляции могут быть интерпретированы следующим образом[2]:
- если |r|<0,3,то связь между переменными практически отсутствует;
- если 0,3≤|r|≤0,7, то связь средняя;
- если 0,7≤|r|≤0,9, то связь сильная;
- если 0,9≤|r|≤0,99, то связь весьма сильная.
Как видно из приведенной таблицы, между каждым из факторных и результативным признаками существует корреляционная зависимость разной степени интенсивности.
Далее рассчитаем множественный коэффициент детерминации и множественный коэффициент корреляции . Множественный коэффициент детерминации составляет 0,98 (или 98%), следовательно, множественный коэффициент корреляции равен 0,99 (или 99%). Таким образом, вариация цены нового ноутбука на 98% зависит от вариации значений вышеуказанных технических параметров и на 2% — от вариации иных, неучтенных факторов (цвет корпуса, материал и пр.).
Для определения наличия в модели мультиколлинеарности воспользуемся матрицей парных коэффициентов корреляции (см. Табл. 3).
Таблица 3
Матрица парных коэффициентов корреляции
Y | X1 f | X2 | X3 | X4 | |
Y | 1 | ||||
X1 f | -0,91886 | 1 | |||
X2 | 0,944895 | -0,81355 | 1 | ||
X3 | 0,804023 | -0,8263 | 0,749286 | 1 | |
X4 | 0,217299 | -0,06667 | 0,243388 | 0,190884 | 1 |
Как показывает таблица, наиболее сильное влияние на цену нового ноутбука оказывает фактор X2 – размер оперативной памяти (Гб), затем следует X1f – бренд изготовителя, далее X3 – частота процессора (ГГц), наименьшее влияние оказывает фактор X4 – диагональ экрана (дюймы).
Среди коэффициентов 3,4,5,6 столбцов наблюдаются такие, значение модуля которых превышает 0,7, следовательно, можно сделать вывод о наличии в модели мультиколлинеарных факторов. Явление мультиколлинеарности имеет ряд негативных последствий, а именно:
- увеличение дисперсий оценок параметров, в результате чего снижается точность оценок;
- статистическая неустойчивость МНК-оценок.
Наиболее известным и широко применяемым способом устранения мультиколлинеарности является исключение тех или иных переменных из модели, однако подобное решение, вероятнее всего, повлечет за собой ошибки спецификации модели, что ведет к получению смещенных оценок и, что более важно, к появлению необоснованных выводов. Другим методом устранения мультиколлинеарности в модели является гребневая или ридж-регрессия. Сущность данного метода заключается в добавлении к диагональным элементам матрицы небольшое число τ такое, что 0 ≤τ≤1, которое называется коэффициентом регуляризации. Рекомендуемое значение данного параметра находится в интервале от 0,1 до 0,4[3]. Недостаток данного метода состоит в том, что по мере увеличения τ оценки «ухудшаются», становятся все более смещенными. Однако доказано, что при добавлении числа τ оценки становятся более эффективными по сравнению с МНК-оценками. Для нахождения гребневых оценок применяется следующая формула: , где I – единичная матрица.
При помощи метода ридж-регрессии были найдены следующие оценки параметров X1f, X2, X3 и X4 (см. Табл.4).
Таблица 4
Гребневые оценки параметров модели
τ | (X1f) | (X2) | (X3) | (X4) | |
0,1 | 26993,467 | -45577,363 | 5990,272 | 2481,879 | 1326,205 |
0,2 | 19431,441 | -41770,997 | 6130,341 | 4728,188 | 1331,355 |
0,3 | 14816,000 | -39017,860 | 6253,090 | 6072,800 | 1304,250 |
0,4 | 11737,846 | -36851,759 | 6363,874 | 6943,778 | 1263,552 |
0,5 | 9559,103 | -35057,190 | 6465,446 | 7535,614 | 1217,293 |
0,6 | 7949,531 | -33519,282 | 6559,469 | 7949,527 | 1169,314 |
0,7 | 6721,364 | -32170,256 | 6647,073 | 8243,431 | 1121,570 |
0,8 | 5760,171 | -30966,927 | 6729,083 | 8452,885 | 1075,082 |
0,9 | 4992,385 | -29880,073 | 6806,141 | 8600,935 | 1030,370 |
Для выбора оптимальных гребневых оценок необходимо найти коэффициенты детерминации, соответствующие тому или иному вектору найденных оценок. Значения найденных коэффициентов детерминации представлены в таблице (см. Табл.5).
Таблица 5
Коэффициенты детерминации гребневых оценок
τ | 0,1 | 0,2 | 0,3 | 0,4 | 0,5 | 0,6 | 0,7 | 0,8 | 0,9 |
0,957 | 0,953 | 0,949 | 0,946 | 0,943 | 0,941 | 0,938 | 0,936 | 0,934 |
Как видно из таблицы, по мере увеличения значения τ величина коэффициента детерминации уменьшается, однако остается достаточно большой, что говорит о высокой степени взаимосвязи между объясняющими и результативным факторами. Наибольший коэффициент детерминации соответствует значению τ=0,1, следовательно, гребневые оценки, рассчитанные при заданной величине коэффициента регуляризации, являются наилучшими среди всех рассчитанных. Таким образом, уравнение регрессии примет следующий вид:
- общее уравнение: ;
- уравнение для ноутбука средней ценовой категории: ;
- уравнение для ноутбука более высокой ценовой категории: .
Для проверки значимости построенной модели воспользуемся F-тестом и проверим гипотезы о значимости коэффициента детерминации. Наблюдаемое значение F для построенной модели составляет 619,634, а критическое – 2,759. Так как , гипотеза отвергается, справедлива конкурирующая гипотеза , следовательно, модель значима с достоверностью 95%.
Построенная модель множественной регрессии может быть использована для прогнозирования рыночной цены нового ноутбука, обладающего определенными техническими характеристиками. Для построения прогноза целесообразно использовать регрессионную модель, найденную при условии τ=0,5, так как в данном случае оценки становятся более стабильными. Так, прогнозное значение цены нового ноутбука марки «Acer» с объемом оперативной памяти 32 Гб, частотой процессора 2,7 ГГц, диагональю экрана 17,3 дюйма составит от 172353,26 до 273249,9 руб. с достоверностью 95%. Цена данного ноутбука в 2017 г. составила 241999 руб., что свидетельствует о достаточной точности прогнозируемых значений.
Таким образом, при помощи эконометрических методов мы получили достаточно точную модель множественной регрессии, характеризующую зависимость между ценой нового ноутбука и его техническими характеристиками. На основании проведенного исследования можно сделать вывод о том, что эконометрические методы являются важным инструментом исследования экономических процессов и явлений, происходящих на рынке, которые позволяют не только анализировать текущую ситуацию, но и прогнозировать возможные тенденции развития.
[1] DNS – интернет магазин цифровой и бытовой техники по доступным ценам, 2017. – Режим доступа: https://www.dns-shop.ru/, свободный;
[2] Мультиколлинеарность. Последствия и признаки мультиколлинеарности. – Режим доступа: https://math.semestr.ru/regress/multicollinearity.php, свободный.
[3] Мультиколлинеарность и методы борьбы с нею. Ридж – регрессии и метод главных компонент. – Режим доступа: https://lektsia.com/2xa7e.html, свободный.
Библиографический список
1. DNS – интернет магазин цифровой и бытовой техники по доступным ценам, 2017. – Режим доступа: https://www.dns-shop.ru/, свободный;2. Мультиколлинеарность и методы борьбы с нею. Ридж – регрессии и метод главных компонент. – Режим доступа: https://lektsia.com/2xa7e.html, свободный;
3. Мультиколлинеарность. Последствия и признаки мультиколлинеарности. – Режим доступа: https://math.semestr.ru/regress/multicollinearity.php, свободный.