Московский экономический журнал 7/2022

image_pdfimage_print

PDF-файл статьи

Научная статья

Original article

УДК 519.23

doi: 10.55186/2413046X_2022_7_7_406

 РЕГРЕССИОННАЯ МОДЕЛЬ ИССЛЕДОВАНИЯ СВЯЗИ ЗАБОЛЕВАЕМОСТИ НАСЕЛЕНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ И УРОВНЕМ ЕГО ЖИЗНИ

REGRESSION MODEL FOR STUDYING THE INCIDENCE OF THE POPULATION OF THE RUSSIAN FEDERATION AND ITS STANDARD OF LIVING

Воробьева Елена Юрьевна, старший преподаватель кафедры прикладной математики, Пермский национальный исследовательский политехнический университет, E-mail: lena-vorobey@yandex.ru

Пермякова Карина Александровна, кафедра прикладной математики, Пермский национальный исследовательский политехнический университет,  E-mail: permka2000@mail.ru

Пепеляева Татьяна Федоровна, к.т.н, доцент кафедры прикладной математики , Пермский национальный исследовательский политехнический университет, E-mail: tania4072@gmail.com

Vorobyova Elena Urevna, senior lecturer department of applied mathematics, Perm national research polytechnic university

Permyakova Karina Aleksandrovna, of the department of applied mathematics, Perm national research polytechnic university

Pepelyaeva Tatiana Fedorovna, associate professor of the department of applied mathematics, Perm national research polytechnic university

Аннотация. В статье приведены результаты исследования влияния системы социально-экономических показателей  на заболеваемость онкологией населения Российской Федерации. Для установления тесноты связи между показателями (влияющими признаками) и решения вопроса о включении признаков в уравнение регрессии был проведен корреляционный анализ системы показателей,  результаты которого представлены в матрице корреляции. Информационной базой для проведения анализа послужили официальные данные Федеральной службы государственной статистики РФ всех регионов Российской Федерации за 2019 год. Обработка информации проводилась при использовании пакетов прикладных программ. Проведено исследование этой системы методами  корреляционно-регрессионного анализа, построена  модель зависимости заболеваемости от выбранной наиболее значимой системы показателей. Построено уравнение прогноза онкологических заболеваний, позволяющее оценить степень влияния социально-экономических факторов на заболевания  в различных регионах Российской Федерации.

Abstract. The article presents the results of a study of the influence of the system of socio-economic indicators on the incidence of oncology in the population of the Russian Federation. To establish the tightness of the relationship between indicators (influencing features) and to address the issue of including features in the regression equation, a correlation analysis of the system of indicators was carried out, the results of which are presented in the correlation matrix. The information base for the analysis was the official data of the Federal State Statistics Service of the Russian Federation of all regions of the Russia Federation for 2019. Information processing was carried out using application software packages. A study of this system by the methods of correlation-regression analysis was carried out, a model of the dependence of the incidence on the selected most significant system of indicators was built. An equation for the prediction of oncological diseases has been constructed, which makes it possible to assess the degree of influence of P on diseases of the system of socio-economic factors in various regions of the Russian Federation.

Ключевые слова: корреляционно-регрессионный анализ, онкологические заболевания, пакеты прикладных программ, влияющие признаки, социально-экономические факторы, регионы Российской Федерации

Keywords:  correlation-regression analysis, oncological diseases, application packages, infiuencing singns, socio-economic factors, regions of Russian Federation

Проблема заболеваемости онкологией стоит крайне остро в наше время, поскольку она является второй причиной смертности как в России, так и во всем мире. Актуальность исследования определяется тем, что онкологические заболевания влекут за собой серьезные социально-экономические последствия [1, 2]. В статье приведены исследования по выявлению прямых и косвенных причин заболеваемости населения в регионах РФ.

Заболеваемость онкологией будем рассматривать как статистическую многомерную величину Y, зависящую от различных социально-экономических показателей в регионах РФ. Реализована методика определения показателей жизни людей, влияющих на заболеваемость онкологией.

Для получения комплексной оценки и выявления факторов, влияющих на заболеваемость, введем систему  социально-экономических показателей [2]. Информационной базой для проведения анализа служат официальные данные Федеральной службы государственной статистики РФ [3, 4, 5], показатели всех 85 регионов Российской Федерации за 2019 год. Обработка информации проводилась при использовании пакетов прикладных программ STATISTICA 10 и Microsoft Office Excel 2007.

Для исследования выбраны 14 показателей:

x1 – «Среднедушевые денежные доходы населения» (руб.);

x2 – «Среднемесячная номинальная начисленная заработная плата работников» (руб.);

x3 – «Изменение реальной начисленной заработной платы» (в % к соответствующему периоду предыдущего года);

x4 – «Численность населения с денежными доходами ниже величины прожиточного минимума» (тыс. чел.);

x5 – «Величина прожиточного минимума» (руб.);

x6 – «Доля граждан, ведущих здоровый образ жизни» (%);

x7 – «Доля граждан, систематически занимающихся физической культурой и спортом» (%);

x8 – «Качество окружающей среды»;

x9 – «Потребление табака» (%);

x10 – «Потребление алкоголя» (л./чел);

x11 – «Средний размер начисленных пенсий» (руб.);

x12 – «Выбросы загрязняющих веществ в атмосферный воздух, отходящих от стационарных источников» (тыс. тонн);

x13 – «Потребление мяса и мясопродуктов» (кг/чел);

x14 – «Уровень медицины».

Значение показателя «Качество окружающей среды» рассчитано с учетом двух составляющих – качества воздуха и воды:

Показатель «Уровень медицины» определяется по формуле:

где K1– Число больничных коек (всего, ед.) на конец года;

K2– Численность медицинских кадров, имеющих высшую и первую квалификационные категории» (всего врачей, чел.);

K3 – Число посещений врачей (всего, ед.) на конец года.

a1,a2,a3 – коэффициенты, которые определяются формулой:

Для установления тесноты связи между показателями (влияющими признаками) и решении вопроса о включении признаков в уравнение регрессии был проведен корреляционный анализ [6] системы показателей {x1,x2,…,x14},  результаты которого представлены в матрице корреляций (Таблица 1).

Выявлена сильная корреляционная зависимость между отдельными показателями, например, x1, x2, x5 и x11 (r > 0,75), поэтому некоторые из них были исключены, например, x5 (величина прожиточного минимума) и x11 (средний размер начисленных пенсий). У показателей x1 и x2 наблюдаются сильные связи с другими переменными, но они сохранены для дальнейшего анализа. Рассчитаны парные коэффициенты корреляции rxi [7] между каждым из факторов xi и результативным признаком Y ( Таблица 2).

Выявлено 8 признаков, коэффициенты корреляции которых значимы на уровне p=0.05 [7]. Выбор линейного вида модели регрессионной зависимости основан на графическом подходе, поскольку модели зависимостей и диаграммы рассеяния заболеваемости от важных с нашей точки зрения показателей, имеют линейный вид [8], (Рисунки 1, 2).

Модель была построена в программе STATISTICA с использованием пошаговой регрессии, которая позволяет отобрать наиболее значимые показатели для корректного описания исходных данных (Таблица 3). На каждом шаге процедуры в уравнение добавляется один из показателей. Результатом пошаговой регрессии является регрессионная модель, содержащая только независимые переменные с величинами t-статистики Стьюдента, значимыми на указанном уровне [8].

В соответствии со значениями безразмерных коэффициентов, уравнение регрессии имеет следующий вид:

Уравнение регрессионной модели значимо на уровне p < 0,00001 Адекватность построенной линейной модели проверена с учетом скорректированного коэффициента детерминации (R2=0,97). Коэффициенты регрессионной модели характеризуют среднее изменение показателя заболеваемости онкологией с изменением соответствующего показателя на единицу при фиксированном среднем значении других показателей. В уравнение регрессии включено десять показателей, из которых пять имеют высокую значимость. Статистически значимыми на уровне p=0.05 являются коэффициенты  β2 = -0,223, β7 = -0,055, β10 = 0,167, β13 = 0,058, β14 = 0,854, следовательно, наибольшее влияние на рейтинговую оценку главы региона оказывают показатели x2, x7, x10, x13, x14.

Выделим показатели, влияющие на Y–заболеваемость:

Наиболее сильное влияние на Y показывает признак с коэффициентом регрессии 0,854. При этом, самые низкие значения этого показателя и уровня заболеваемости наблюдаются в Чукотском автономном округе и Ненецком автономном округе (Архангельская область), а самые высокие – в таких крупных регионах, как Москва, Московская область и Санкт-Петербург.

Следующим по значимости признаком является x10-«Потребление алкоголя». В регионах с высоким употреблением алкогольных напитков, в большинстве случаев, наблюдается высокая степень заболеваемости.

Третий значимый признак x2 – «Среднемесячная номинальная начисленная заработная плата работников», коэффициент при котором β2 = -0,223. Отрицательный знак указывает на то, что уровень заболеваемости повышается в том случае, когда среднемесячная номинальная з/п уменьшается.

Четвертый значимый признак это x13 – «Потребление мяса и мясопродуктов». Можем заметить, что в основной части регионов потребление мясных продуктов оказывает влияние на число заболевших. Меньше всего едят мясопродукты и, соответственно, болеют раком в Чукотском автономном округе. При высоком показателе x13 мало болеют в Ненецком автономном округе, на Алтае и в Калмыкии.

И последний по значимости признак x7 – «Доля граждан, систематически занимающихся физической культурой и спортом» с коэффициентом β7 = -0,055, показывающим обратно-пропорциональную связь. Т.е. можем утверждать, что при уменьшении числа граждан, занимающихся спортом, происходит увеличение числа граждан, у которых были выявлены различные виды раковых заболеваний, что абсолютно логично, ведь активный образ жизни это один из важнейших аспектов поддержания и укрепления своего здоровья и иммунитета.

Остальные коэффициенты x1, x3, x4, x6, x9, x12 уравнения регрессии также включены в модель (исследование проводилось на уровне p=0.05), но они оказались менее значимыми. Поскольку при построении мы использовали пошаговую регрессию с включением, мы предполагаем, что эти показатели слабо, но оказывают влияние на Y-заболеваемость.

Получено уравнение прогноза по размерным коэффициентам регрессии:

Уравнение позволяет определить значение уровня заболеваемости онкологией от новых значений показателей в краткосрочном периоде.

Таким образом, анализ показывает влияние достаточно большого количества объективных показателей на заболеваемость онкологией в регионах нашей страны.

В результате исследования предложена система 14 социально-экономических показателей, выбранных в качестве оценки заболеваемости населения онкологией, проведен анализ этой системы методами теории корреляции. Построена регрессионная линейная модель зависимости заболеваемости онкологией от предложенной системы показателей методами регрессионного анализа. Выявлены факторы, которые особенно сильно влияют  на  онкологические заболевания. Построено уравнение регрессии, описывающее степень влияния социально-экономических показателей на заболеваемость населения онкологией в различных регионах Российской Федерации.

Список  источников

  1. Современные научные достижения в онкологии // РакФонд [электронный ресурс]. – URL. – https://www.rakfond.org/2019/08/31/scientific-advances-in-modern-oncology-article_ru
  2. Пастухова Е.Я., Морозова Е.А., Челомбитко А.Н. Взаимосвязь социально-экономических факторов и различных причин смертности населения региона // Фундаментальные исследования. – 2019. – № 6. – С. 121-125.
  3. Федеральная служба государственной статистики. [Электронный ресурс] URL: http://www.gks.ru
  4. База данных “Здоровье для всех” (HFA-DB) // Всемирная организация здравоохранения URL: https://gateway.euro.who.int/ru
  5. Статистика смертности населения https://aae.su/statistika-smertnosti-naseleniya.htm
  6. Айвазян С. А., Мхитарян В. С. Прикладная статистика и основы эконометрики. // М.: Юнити, 1998.
  7. Дубров А. М., Мхитарян В. С., Трошин Л. И. Многомерные статистические методы. // М.: Финансы и статистика, 1998.
  8. Сошникова Л.А. Многомерный статистический анализ в экономике. Учеб. Пособие для студ. Вузов / Л.А. Сошникова, В.Н. Тамашевич. – М.:ЮНИТИ, 1999. – 598 с.

References

  1. Sovremennye nauchnye dostizheniya v onkologii // RakFond [elektronny resurs]. -URL.- https://www.rakfond.org/2019/08/31/scientific-advances-in-modern-oncology-article_ru
  2. Pastuhova E.Ya., Morozova E.A., Chelombitko A.N. Vzaimosvyaz socialno-ekonomicheskix faktorof i razlichnyh prichin smertnosti naseleniya regiona // Fundamentalnye issledovaniya. – 2019. – №6. – s.121-125.
  3. Federalnaya sluzhba gosudarstvennoi statistiki. [ElektronnyZi resurs] URL: http://www.gks.ru
  4. Baza dannyx “Zdorovie dlya vsex” (HFA-DB) // Vsemirnaya organizaciya zdravjoxraneniya URL: https://gateway.euro.who.int/ru
  5. Statistika smertnosti naseleniya https://aae.su/statistika-smertnosti- naseleniya.htm
  6. Aivazyan S.A., Mxitaryan V.S. Prikladnaya statistika I osnovy ekonometriki. // M.: Yuniti, 1998.
  7. Dubov A. M., Mxitaryan V.S., Troshin L. I. Mnogomernye statisticheskie metody. // M.: Finansy I statistika, 1998.
  8. Soshnikova L. A. . Mnogomernyj statisticheskij analiz v ekonomike. Ucheb. Posobie dlya stud. Vuzov / L. A. Soshnikova, V. N. Tamashevich. – M.: YuNITI, 1999. – 598 s.

Для цитирования: Воробьева Е.Ю., Пермякова К.А., Пепеляева Т.Ф. Регрессионная модель исследования связи заболеваемости населения Российской Федерации и уровнем его жизни  // Московский экономический журнал. 2022 . №7. URL: https://qje.su/ekonomicheskaya-teoriya/moskovskij-ekonomicheskij-zhurnal-7-2022-16/

© Воробьева Е.Ю., Пермякова К.А., Пепеляева Т.Ф., 2022.  Московский экономический журнал. 2022 . №7.