Индекс УДК 519.25
Дата публикации: 27.06.2018

Статистическое исследование потребления продуктов питания населением разных стран

Statistical research of food consumption by the population of the different countries

Каменева Светлана Владимировна
Пермский государственный университет, ПГНИУ, г. Пермь,

Kameneva Svetlana Vladimirovna
Perm State University, Perm
Аннотация: Исследование направлено на использование статистических методов и статистической обработки социально-экономических данных с использованием статистических пакетов программ Excel, Statistica, SPSS. В ходе исследования изучались тенденции потребления продуктов питания в разных странах мира. Использовались различные статистические методы: описательная статистика, корреляция, тесты Фишера-Стьюдента, дисперсионный анализ, прогнозирование с помощью анализа временных рядов.

Abstract: The research is directed to use of statistical methods and statistical processing of social and economic data with use of statistical software Excel, Statistica, SPSS. During the research tendencies of consumption of food in the different countries of the world were studied. Various statistical methods were used: descriptive statistics, correlation, Fisher-Student's tests, ANOVA analysis, forecasting by means of the analysis of temporary ranks.
Ключевые слова: статистические исследования, пакеты прикладных программ, описательная статистика, корреляция, потребление продуктов питания населением.

Keywords: statistical researches, packages of application programs, descriptive statistics, correlation, consumption of food by the population.


Потребление продуктов питания населением является важным показателем уровня жизни населения и его благосостояния. Поэтому сбор и анализ статистической информации об уровне потребления продуктов питания необходимый пункт для оценки качества жизни в стране.

Объектом исследования является потребление продуктов питания населением в разных странах. Проводится сравнительный анализ потребления продуктов питания по выборке из 10 развитых стран с разных континентов: Россия, Австралия, Австрия, Германия, Италия, Нидерланды, Польша, США, Франция, Япония.

Целью работы является поиск зависимости потребления продуктов питания от уровня жизни, культурных и географических особенностей страны.

В общем объеме потребления основных продуктов питания учитываются соответственно:

Столбец 1 — Мясо и мясопродукты в пересчете на мясо (без сала и субпродуктов)

Столбец 2 — Молоко и молочные продукты (включая масло животное) в перерасчете на молоко

Столбец 3 — Животное масло

Столбец 4 — Яйца куриные (в перерасчёте 50 г за штуку)

Столбец 5 — Сахар

Столбец 6 — Растительное масло

Столбец 7 — Картофель

Столбец 8 — Овощи и бахчевые

Столбец 9 — Фрукты и ягоды

Столбец 10 — Хлебные продукты (хлеб и макаронные изделия в перерасчете на муку).

Статистическая информация взята с сайта Федеральной службы государственной статистики [1] .

 Таблица 1

Потребление продуктов питания  (на душу населения в год килограммов)

СтранаОсновные продукты питания 
12345678910
Россия732393,813,453913,611211161118
Австралия1212303,86,554724509610396
Австрия983865,411,734225911515279
Германия884365,911,653315789387103
Италия872602,210,65292839145149129
Нидерланды733490,414,254614948416792
Польша703034,27,75441310110447106
Франция892507,911,3538215510411485
США1182762,513,1559315611399112
Япония49890,615,25191321925389

Статистический анализ представленных данных проводился в несколько этапов, используя различные статистические пакеты обработки данных. Первичный анализ проводился с помощью инструментария пакета Exel, далее для анализа вида распределений и проверки гипотез использовался пакет Statistica и на заключительном этапе для многомерного статистического анализа применялся пакет SPSS.

Традиционно статистический анализ данных начинается с методов описательной статистики. К методам описательной статистики относятся методы первичного статистического анализа данных, описывающие выборки с помощью различных показателей и графиков. Полезность данных методов заключается в том, что несколько простых и довольно информативных статистических показателей способны избавить исследователя от просмотра сотен, а порой и тысяч значений выборки.

Показатели, описывающие выборку, можно разбить на несколько групп:

1) показатели положения описывают положение данных на числовой оси. Примеры таких показателей – минимальный и максимальный элементы выборки (первый и последний члены вариационного ряда), верхний и нижний квартили (они ограничивают зону, в которую попадают 50% центральных элементов выборки). Сведения о середине совокупности дают выборочное среднее и выборочная медиана;

2) показатели разброса описывают степень разброса данных относительно своего центра. К ним в первую очередь относятся: дисперсия выборки, стандартное отклонение, размах выборки, межквартильный размах (разность между верхней и нижней квартилью), коэффициент эксцесса. Эти показатели отображают, насколько тесно основная масса данных группируется около центра;

3) показатели асимметрии. Эта группа показателей отвечает на вопрос о симметрии распределения данных около своего центра. К ней можно отнести: коэффициент асимметрии, положение выборочной медианы относительно выборочного среднего и относительно выборочных квартилей, гистограмму;

4) показатели, описывающие закон распределения. Эти показатели дают представление о законе распределения данных. Сюда относятся гистограммы, графики эмпирической функции распределения, таблицы частот.

 Таблица 2

Описательная статистика. Анализ по столбцам:

Показатель Ст.1Ст.2 Ст.3Ст.4Ст.5Ст.6Ст.7 Ст.8Ст.9Ст.10
Среднее86,6281,83,6711,57538,819,4666,5105,7 103,2100,9
Медиана87,52683,811,67538,51857,5104 10199,5
Мода73#Н/Д3,8#Н/Д#Н/Д13#Н/Д104 #Н/Д #Н/Д
Ст. отклонен22,0395,922,352,7411,056,6928,9617,1042,6915,68
Дисперсия485,169200,845,547,50122,1844,78838,50292,461822,84245,88
Эксцесс-0,141,07-0,32-0,050,62-1,13-0,842,52-1,30-0,56
Асимметрия0,14-0,360,25-0,710,030,590,201,290,160,42

Согласно среднему, во всех странах больше всего потребляют молока и молочных продуктов — 281,8 кг, меньше всего животного масла — 3.67 кг. Стандартное отклонение для этих величин составляет по таблице 34% и 64% соответственно. Это говорит о значительно отличающемся количестве потребления продуктов в разных странах. Особенно выделяется потребление молока в Японии, где традиционно низкий уровень потребления молочных продуктов из-за высокого уровня непереносимости лактозы у местного населения. Далее сравним значения моды и медианы. Только в четырех столбцах присутствует мода, и 2/4 из них совпадают со значением медианы, что говорит двух самых стабильных по потреблению группах продуктов: овощах и растительном масле. По имеющимся значениям коэффициентов эксцесса и асимметрии можно предположить наличие нормальной закономерности у большей части показателей.

 Таблица 3

Описательная статистика. Анализ по строкам:

 Странасреднеемедиана модаст.отклонениедисперсияэксцессасимметрия
Россия78,3967#Н/Д71,045046,582,001,26
Австралия77,74739667,904610,781,891,18
Австрия96,2169#Н/Д112,4912654,825,512,19
Германия95,0682,5#Н/Д125,5615764,567,672,64
Италия87,8963#Н/Д82,376784,730,520,98
Нидерланды93,3778,5#Н/Д102,5910524,444,451,95
Польша80,0058,5#Н/Д87,797706,865,062,04
Франция77,5370#Н/Д71,855162,003,381,62
США87,9779#Н/Д78,596176,973,381,55
Япония44,09358935,411253,89-1,660,40

Максимальное среднее значение потребления продуктов питания у Австрии — 96,21 кг, не отстают от нее другие немецкие страны: Германия и Нидерланды — 95,06 и 93,37. Далее идут США и Италия — около 88 кг. Славянские страны Россия и Польша имеют близкое среднее потребление с отличием в 2%. Сравнимый уровень потребления наблюдается у Франции и Австралии, у которых значительно выше, средний доход граждан. Аномально низкое среднее потребление продуктов в Японии можно объяснить отсутствием статистики по потреблению морепродуктов — традиционной японской еды. Мода есть только в двух строках, она сильно отличается от медианы, что говорит об отсутствии устойчивости данных. Большие значения эксцесса и асимметрии говорят об отсутствии нормального закона распределения у разных стран.

Рассмотрим Россию и Польшу, как наиболее экономически, культурно и территориально близкие страны из представленных.

Рисунок 1.

Рисунок 2.

Анализируя диаграммы можно сделать вывод, что только потребление молока и животного масла отличается  на 19-25%, все остальные показатели практические идентичные.

Рисунок 3.

Рисунок 4.

Данные графики наглядно показывают рацион питания населения в каждой из стран. Наибольшее потребление мяса наблюдается у англоговорящих стран — США и Австралии. Наибольшее потребление растительной пищи у Италии, Японии и России. Французы, голландцы, итальянцы и австрийцы больше остальных любят фрукты, а россияне и поляки — картофель. Также примечательно, что почти половину рациона немцев составляют молочные продукты, тогда как у остальных эта цифра ближе к 30-40%.

 Таблица 4

Корреляция. Анализ по видам продуктов питания:

Мясо и мясопродуктыМолоко и мол-е продуктыЖивотное маслоЯйца (в перерасчете 50 г за шт.)СахарРаст. маслоКартофельОвощи и бахчевыеФрукты и ягодыХлебные продукты
Мясо и мясопродукты1
Молоко и молочные продукты0,3111
Животное масло0,3200,3931
Яйца (в перерасчете 50 г  шт.)-0,478-0,163-0,4061
Сахар0,6410,2830,031-0,2721
Растительное масло0,7930,0050,063-0,2270,3791
Картофель-0,1490,4910,144-0,0640,412-0,4951
Овощи и бахчевые0,224-0,0280,071-0,160-0,1050,621-0,2201
Фрукты и ягоды0,3500,430-0,0640,0720,1100,444-0,1530,2411
Хлебные продукты0,051-0,059-0,255-0,0980,1380,2630,1990,608 -0,1681

В таблице 4 есть отрицательные значения, значит можно говорить об обратной зависимости между элементами. По имеющимся данным можно сказать, что наибольшая коррелируемость наблюдается у мяса и растительного масла, а наименьшая у растительного масла и картофеля (выделено зеленым). В целом из этой таблицы сложно найти зависимость, т.к. несочетаемые на первый взгляд продукты имеют высокий уровень коррелируемости, а сочетаемые отрицательный. За исключением яйца, которое имеет отрицательную коррелируемость почти со всеми видами продуктов кроме фруктов.

Таблица 5

Корреляция. Анализ по странам:

 РоссияАвстралияАвстрияГерманияИталияНидерландыПольшаФранцияСШАЯпония
Россия1
Австралия0,8981
Австрия0,8860,9491
Германия0,9250,9220,9731
Италия0,8740,9480,9330,8781
Нидерланды0,8940,9240,9810,9560,9141
Польша0,9810,9030,9250,9730,8600,9171
Франция0,9170,9800,9870,9550,9690,9690,9291
США0,9270,9910,9620,9540,9480,9330,9430,9841
Япония0,7820,8000,6910,6540,8870,6570,7100,7830,8021

Так как все значения в таблице 5 положительные, то мы можем говорить о прямой зависимости между элементами. Практически одинаковые тенденции по потреблению одних и тех же видов продуктов наблюдаются по всем странам. Их близость составляет порядка 85-95% у всех стран, кроме Японии, что говорит о специфике культуры восточной страны.

Тесты Фишера и Стьюдента используются для проверки гипотезы об однородности данных при малых объемах выборок. Проанализируем с помощью этих методов однородность двух наиболее популярных во всех странах видов продуктов питания: мясо и картофель.

Таблица 6

Так как F > F (крит. одностороннее), то верна конкурирующая гипотеза К. Это означает, что присутствуют значимые различия в дисперсиях сравниваемых данных. По тесту Стьюдента получаем что, t (стат.) < t (крит. двустороннее) – верна гипотеза H. Данные продукты имеют приблизительно равное усредненное потребление, однако в целом потребление этих продуктов нельзя считать равными.

Далее проанализируем однородность потребления всех продуктов питания в двух странах: Россия и Польша. Эти страны выбраны не случайно, так как они относятся к одной славянской культуре, то есть возможность предположить, что и предпочтения в потреблении продуктов питания у жителей обоих стан будут схожими.

Таблица 7

При анализе по строкам F > F (критическое одностороннее), верна конкурирующая гипотеза К — усредненные по двум странам не совпадают. А по тесту Стьюдента t=|-0,224| < t (крит. двустороннее)=2,262, следовательно верна гипотеза Н. Ситуация аналогичная предыдущей, однородности не установлено. Уровень потребления продуктов питания в двух странах нельзя считать однозначно равным.

Статистический анализ имеет дело с данными, подверженными случайной изменчивости. Их поведение может характеризоваться законом распределения вероятностей, если данные являются выборкой, или более сложными моделями, если данные неоднородны. Эти законы распределения вероятностей и модели, как правило, содержат неизвестные параметры – среднее, дисперсию, вклады факторов. Исследователя обычно интересуют либо сами эти параметры, либо некоторые заранее известные функции от них. Однако в силу случайной изменчивости наблюдаемых данных, нельзя только основываясь на них указать совершенно точное значение параметров. И здесь на помощь приходят методы дисперсионного анализа, которые позволяют в процентном соотношении установить влияние фактора и случайности на изменчивость признака.

Таблица 8

Дисперсионный анализ по столбцам
Источник вариацииSSdfMSFP-ЗначениеF критическое
Между группами584222,3964913,5949,682564,06657E-311,985594964
Внутри групп117591901306,567
Итого701813,399

 

Процент влияния фактора «продукт питания» равен: 584222,3/701813,99*100%= 83,2446%

Таблица 9

Дисперсионный анализ по строкам
Источник вариацииSSdfMSFP-ЗначениеF критическое
Между группами20642,6492293,6270,3030470,9720381261,985594964
Внутри групп681170,7907568,563
Итого701813,399

 

Процент влияния фактора «страна»  равен: 20642,64/701818,3*100%=2,9413%

 Вывод: фактор «страна» практически не влияет на уровень потребления продуктов, а фактор «продукт питания» является определяющим.

Подробнее хотелось бы остановиться на методах прогноза. Так как построение прогноза – одно из наиболее приоритетных направлений в статистическом и экономическом исследованиях. Для большей точности используем два метода прогноза “Экспоненциальное сглаживание” и “Скользящее среднее” и определим, какой метод для имеющихся данных лучше.

Скользящее среднее по столбцам:

Рисунок 5.

Экспоненциальное сглаживание по столбцам:

Рисунок 6.

Как видно из графиков, ближе расположены точки (фактическое наблюдение и прогноз) на графике скользящее среднее. Таким образом, этот метод прогноза является лучшим в данном случае.

Скользящее среднее по строкам:

Рисунок 7.

Экспоненциальное сглаживание по строкам:

Рисунок 8.

Для строк, так же как и для столбцов, предпочтительнее оказался метод скользящего среднего.

В целом при анализе статистических данных можно сделать вывод, что  потребление продуктов в развитых странах достаточно одинаково, а основные различия для западных стран заключаются в культурных особенностях, а не в уровне доходов населения или размера территории.

Так же некоторые выводы, сделанные в ходе работы:

  • Жители Центральной Европы едят больше остальных; поляки, русские и французы имеют много общего в потреблении продуктов питания, а статистика японцев не показательна, так как не учтены морепродукты в общем объеме потребления продуктов.
  • Молоко и молочные продукты в среднем потребляют почти в 3 раза больше, чем другие продукты, за исключением японцев из-за физиологических особенностей народа. Так же много потребляют хлеба, овощей, фруктов и мяса, меньше картофеля. Для России и Польши характерно высокое потребление картофеля, но низкое фруктов. А зажиточные американцы и австралийцы едят мяса на 20-40% больше остальных.
  • Все страны кроме Японии имеют высокую коррелируемость уровня потребления продуктов.
  • Фактор «продукт» больше всего влияет на уровень потребления продуктов у населения — 83%, в то время как фактор «страна» имеет очень низкое влияние — 3%. Таким образом, можно сказать, что во всех странах выбирают одинаковые продукты в схожих пропорциях: есть как можно больше мяса, овощей и поменьше жиров, сахара.

Библиографический список

1. http://www.gks.ru/bgd/regl/b16_13/IssWWW.exe/Stg/d04/27-16.doc [5.04.2018]
2. Каменева С.В. Статистическое исследование динамики изменения среднемесячной номинальной заработной платы работников организаций отдельных муниципальных образований Пермского края/ Сборник научных трудов “Математические и инструментальные методы экономики” I международной научно-практической конференции 31 мая 2016 г. Нижний Новгород. С.5-15.
3. Каменева С.В. Статистические методы в политических науках. – Пермь: изд-во Пушка. 2004. – 164 с.
4. Каменева С.В. О некоторых задачах проверки гипотез и групповой классификации. Случай дискретных распределений. LAP LAMBERT. 2016. – 104 c.
5. Тюрин Ю.Н., Макаров А.А. Анализ данных на компьютере. – М.: Инфра-М.2003. -544 с.
6. Бююль А., Цефель П. SPSS: искусство обработки информации. – М.: DiaSoft. 2002. – 602 c.