Индекс УДК 33
Дата публикации: 25.12.2017

Анализ корреляционной зависимости цены ноутбука и его технических характеристик

Analysis of the correlation between the price of a laptop and its technical characteristics

Любимова Мария Максимовна, Дырдасова Анастасия Сергеевна
Научный руководитель - Иванов Дмитрий Владимирович

1. студентка кафедры « Мировой экономики »,
Самарский государственный экономический университет
2. студентка кафедры « Мировой экономики»,
Самарский государственный экономический университет
3. кандидат физико-математических наук, доцент кафедры "Высшая математика и экономико-математические методы"
Самарский государственный экономический университет

Lyubimova Maria Maksimovna, Dyrdasova Anastasia Sergeyevna
Scientific adviser - Ivanov Dmitry Vladimirovich,

1. student of department of "World economy",
Samara state economic university
2. student of department of "World economy",
Samara state economic university
3. candidate of physical and mathematical sciences, associate professor of the department "Higher mathematics and economic-mathematical methods"
Samara State University of Economics
Аннотация: Получена модель множественной регрессии, показывающая зависимость между ценой ноутбука и его техническими характеристиками.

Abstract: The model of multiple regression is obtained. It shows the relationship between the price of the laptop and its technical characteristics.
Ключевые слова: эконометрика, корреляция, ноутбуки, множественная регрессия

Keywords: Econometrics, correlation, laptops, multiple regression


Сегодня практически никто из нас не может представить свою жизнь без использования всевозможных гаджетов, поэтому с уверенностью можно говорить о том, что XXI век – это век технологий, основой которого являются разнообразные технические устройства, а в качестве одного из основных видов товаров выступает различного рода информация. Глобализация современного общества ведет к повышению степени мобильности населения, что является основной причиной роста популярности ноутбуков. Достаточно сложно оспорить тот факт, что в наше время  ноутбук – это далеко не роскошь, а необходимый для работы инструмент, такой же, как и шариковая ручка, блокнот и т.п. Рынок компьютерной техники сегодня обеспечивает широкий выбор гаджетов с техническими характеристиками «на любой вкус», поэтому выбор подходящего устройства зачастую бывает весьма сложным. Чтобы облегчить данный выбор необходимо понимать, от каких технических характеристик в большей степени зависит цена нового ноутбука и на что в первую очередь следует обращать внимание при его выборе. Этим обусловлена актуальность данной работы.

Объектом данной работы является рыночная цена нового ноутбука.

В качестве предмета данного исследования выступает анализ корреляционной зависимости цены нового ноутбука и его различных технических характеристик.

Цель данного исследования предполагает разработку оптимальной модели множественной регрессии, отражающей взаимосвязь между ценой нового ноутбука и его техническими характеристиками.

Для достижения поставленной цели необходимо выполнение ряда задач, таких как построение и анализ регрессионной модели, а также экономическая интерпретация различных ее элементов.

Цена любого наукоемкого изделия, коим, несомненно, является  ноутбук, определяется, в первую очередь, его техническими характеристиками. В данной работе рассматриваются такие технические параметры ноутбука, как размер оперативной память (Гб), частота процессора (ГГц) и диагональ экрана (дюймы). Однако нельзя не учитывать, что немалое влияние на цену продукции оказывает «имя» фирмы-производителя, поэтому регрессионная модель, по нашему мнению,  должна строиться с учетом бренда изготовителя ноутбука. Таким образом, в качестве исходных данных имеем массив, включающий значения трех количественных и одной качественной переменной, которая преобразуется в фиктивную переменную (см. Табл.1).

Таблица 1

Исходные данные для эконометрического анализа, 2017 г[1].

№ п/пYX1X1 fX2X3X4
18999Irbis121,3310,1
210999Irbis121,33311,6
311999Irbis121,3314
411999DEXP122,1611,6
514999DEXP121,611,6
615999DEXP121,515,6
714499DELL121,611,6
817799DELL121,611,6
920999DELL141,615,6
10141999Aorus0162,414
11172999Aorus0162,417,3
1291999Alienware082,915,6
13116999Alienware0162,615,6
14124999Alienware082,617,3
1515499HP121,615,6
1617999HP121,615,6
1720999HP121,615,6
1815999Asus121,515,6
1917299Asus121,615,6
2024999Asus141,617,3
2114999Lenovo122,1615,6
2217299Lenovo121,3515,6
2320999Lenovo121,413,3
2415299Acer121,611,6
2517299Acer121,615,6
2623427Acer121,611,6
2764999Apple041,611,6
2879999Apple042,211,6
2991999Apple082,711,6
30162999Apple0162,413,3

Исходный массив содержит данные о цене Y тридцати ноутбуков с указанием названия фирмы-производителя (X1), размера оперативной памяти (X2), частоты процессора (X3), диагонали экрана (X4). Введенная фиктивная переменная имеет два значения – 1 и 0. Цифрой 1 обозначается бренд «средней» ценовой категории (такие марки, как «Irbis», «DEXP», «DELL», «HP», «Asus», «Lenovo», «Acer»), а цифрой 0 – бренд более высокой ценовой категории (такие марки, как «Aorus», «Alienware», «Apple»).

Построение регрессионной модели целесообразно начать с определения парных коэффициентов корреляции, характеризующих взаимосвязь между тем или иным объясняющим фактором и объясняемой переменной. Воспользовавшись встроенными возможностями «Microsoft Office Excel», получили следующие значения парных коэффициентов корреляции (см. Табл.2).

Таблица 2

Парные коэффициенты корреляции

rX1fYrX2YrX3YrX4Y
-0,918860,9448950,8040230,217299

 

Значения парного коэффициента корреляции могут быть интерпретированы следующим образом[2]:

  • если |r|<0,3,то связь между переменными практически отсутствует;
  • если 0,3≤|r|≤0,7, то связь средняя;
  • если 0,7≤|r|≤0,9, то связь сильная;
  • если 0,9≤|r|≤0,99, то связь весьма сильная.

Как видно из приведенной таблицы, между каждым из факторных и результативным признаками существует корреляционная зависимость разной степени интенсивности.

Далее рассчитаем множественный коэффициент детерминации   и множественный коэффициент корреляции . Множественный коэффициент детерминации составляет 0,98 (или 98%), следовательно, множественный коэффициент корреляции  равен 0,99 (или 99%). Таким образом, вариация цены нового ноутбука на 98% зависит от вариации значений вышеуказанных технических параметров и на 2% — от вариации иных, неучтенных факторов (цвет корпуса, материал и пр.).

Для определения наличия в модели мультиколлинеарности воспользуемся матрицей парных коэффициентов корреляции (см. Табл. 3).

Таблица 3

Матрица парных коэффициентов корреляции

 YX1 fX2X3X4
Y1    
X1 f-0,918861   
X20,944895-0,813551  
X30,804023-0,82630,7492861 
X40,217299-0,066670,2433880,1908841

 

Как показывает таблица, наиболее сильное влияние на цену нового ноутбука оказывает фактор X2 – размер оперативной памяти (Гб), затем следует X1f – бренд изготовителя, далее X3 – частота процессора (ГГц), наименьшее влияние оказывает фактор X4 – диагональ экрана (дюймы).

Среди коэффициентов 3,4,5,6 столбцов наблюдаются такие, значение модуля которых превышает 0,7, следовательно, можно сделать вывод о наличии в модели мультиколлинеарных факторов. Явление мультиколлинеарности имеет ряд негативных последствий, а именно:

  1. увеличение дисперсий оценок параметров, в результате чего снижается точность оценок;
  2. статистическая неустойчивость МНК-оценок.

Наиболее известным и широко применяемым способом устранения мультиколлинеарности является исключение тех или иных переменных из модели, однако подобное решение, вероятнее всего, повлечет за собой ошибки спецификации модели, что ведет к получению смещенных оценок и, что более важно, к появлению необоснованных выводов. Другим методом устранения мультиколлинеарности в модели является гребневая или ридж-регрессия. Сущность данного метода заключается в добавлении к диагональным элементам матрицы   небольшое число τ такое, что 0 ≤τ≤1, которое называется коэффициентом регуляризации. Рекомендуемое значение данного параметра находится в интервале от 0,1 до 0,4[3]. Недостаток данного метода состоит  в том, что по мере увеличения τ оценки «ухудшаются», становятся все более смещенными. Однако доказано, что при добавлении числа τ оценки становятся более эффективными по сравнению с МНК-оценками. Для нахождения гребневых оценок применяется следующая формула: , где I – единичная матрица.

При помощи метода ридж-регрессии были найдены следующие оценки параметров X1f, X2, X3 и X4 (см. Табл.4).

Таблица 4

Гребневые оценки параметров модели

τ  (X1f) (X2) (X3) (X4)
0,126993,467-45577,3635990,2722481,8791326,205
0,219431,441-41770,9976130,3414728,1881331,355
0,314816,000-39017,8606253,0906072,8001304,250
0,411737,846-36851,7596363,8746943,7781263,552
0,59559,103-35057,1906465,4467535,6141217,293
0,67949,531-33519,2826559,4697949,5271169,314
0,76721,364-32170,2566647,0738243,4311121,570
0,85760,171-30966,9276729,0838452,8851075,082
0,94992,385-29880,0736806,1418600,9351030,370

 

Для выбора оптимальных гребневых оценок необходимо найти коэффициенты детерминации, соответствующие тому или иному вектору найденных оценок. Значения найденных коэффициентов детерминации представлены в таблице (см. Табл.5).

 

Таблица 5

Коэффициенты детерминации гребневых оценок

τ0,10,20,30,40,50,60,70,80,9
0,9570,9530,9490,9460,9430,9410,9380,9360,934

 

Как видно из таблицы, по мере увеличения значения τ величина коэффициента детерминации уменьшается, однако остается достаточно большой, что говорит о высокой степени взаимосвязи между объясняющими и результативным факторами. Наибольший коэффициент детерминации соответствует значению τ=0,1, следовательно, гребневые оценки, рассчитанные при заданной величине коэффициента регуляризации, являются наилучшими среди всех рассчитанных. Таким образом, уравнение регрессии примет следующий вид:

  • общее уравнение: ;
  • уравнение для ноутбука средней ценовой категории: ;
  • уравнение для ноутбука более высокой ценовой категории: .

Для проверки значимости построенной модели воспользуемся F-тестом и  проверим гипотезы о значимости коэффициента детерминации. Наблюдаемое значение F для построенной модели составляет 619,634, а критическое – 2,759. Так как ,  гипотеза  отвергается, справедлива конкурирующая гипотеза , следовательно, модель значима с достоверностью 95%.

Построенная модель множественной регрессии может быть использована для прогнозирования рыночной цены нового ноутбука, обладающего определенными техническими характеристиками. Для построения прогноза целесообразно использовать регрессионную модель, найденную при условии τ=0,5, так как в данном случае оценки становятся более стабильными. Так, прогнозное значение цены нового ноутбука марки «Acer» с объемом оперативной памяти 32 Гб, частотой процессора 2,7 ГГц, диагональю экрана 17,3 дюйма составит от 172353,26 до 273249,9 руб. с достоверностью 95%. Цена данного ноутбука в 2017 г. составила 241999 руб., что свидетельствует о достаточной точности прогнозируемых значений.

Таким образом, при помощи эконометрических методов мы получили достаточно точную модель множественной регрессии, характеризующую зависимость между ценой нового ноутбука и его техническими характеристиками. На основании проведенного исследования можно сделать вывод о том, что эконометрические методы являются важным инструментом исследования экономических процессов и явлений, происходящих на рынке, которые позволяют не только анализировать текущую ситуацию, но и прогнозировать возможные тенденции развития.

[1] DNS – интернет магазин цифровой и бытовой техники по доступным ценам, 2017. – Режим доступа: https://www.dns-shop.ru/, свободный;

[2] Мультиколлинеарность. Последствия и признаки мультиколлинеарности. – Режим доступа: https://math.semestr.ru/regress/multicollinearity.php, свободный.

[3] Мультиколлинеарность и методы борьбы с нею. Ридж – регрессии и метод главных компонент. – Режим доступа: https://lektsia.com/2xa7e.html, свободный.

Библиографический список

1. DNS – интернет магазин цифровой и бытовой техники по доступным ценам, 2017. – Режим доступа: https://www.dns-shop.ru/, свободный;
2. Мультиколлинеарность и методы борьбы с нею. Ридж – регрессии и метод главных компонент. – Режим доступа: https://lektsia.com/2xa7e.html, свободный;
3. Мультиколлинеарность. Последствия и признаки мультиколлинеарности. – Режим доступа: https://math.semestr.ru/regress/multicollinearity.php, свободный.