Московский экономический журнал 3/2020

image_pdfimage_print

УДК: 338.517.2

DOI 10.24411/2413-046Х-2020-10155

Прогноз заполняемости гостиницы и максимизация прибыли

The occupancy of the hotel and maximize profits

Володарский Константин Эдуардович, Финансовый университет при Правительстве РФ, г. Москва, Россия, E-mail: volodarskiyk@mail.ru

Volodarskiy Konstantin Eduardovich,Financial University under the Government of the Russian Federation, Moscow, Russia, E-mail: volodarskiyk@mail.ru

Аннотация. В данной статье предложен алгоритм динамического ценообразования, не используемый еще в сфере гостиничного бизнеса достаточно широко. Описана актуальность проблемы и методы ее решения, путем использования математико-статистического аппарата. Данный алгоритм на основе открытых данных определяет модель, оценивающую заполняемость гостиницы в том или ином месяце и формирующую прогнозные значения загрузки в будущем. Выдвинуто предложение о формировании на основе таких данных ценовой политики отеля. Для формирования функции определены переменные и рассмотрены способы сбора эмпирических данных на основе открытых источников данных. Рассмотрены варианты обучения алгоритма по выборкам для формирования функции с подходящими коэффициентами и весами переменных. Предложено использование стандартной регрессионной модели, созданной на основе методе наименьших квадратов Гаусса, а также приведены тесты, при помощи которых можно определить, удовлетворяет ли тем или иным требованиям построенная модель, является ли она объективной и достаточно ли точно она описывает изучаемое явление. Кроме того, приводится теоретический пример использования данной системы при управлении тарифами гостиниц, то есть когда отельер устанавливает цену на проживание для определенного периода, и описан метод максимизации прибыли на основе предложенного метода. Предложено формирование системы взаимосвязанных показателей (заполняемость гостиницы и прибыль организации, зависящая от загрузки), при решении которой достигается максимизация дохода конкретного временного средства размещения (гостиницы). Рассмотрена экономическая составляющая, влияющая на поведение потребителя, определяющаяся взаимосвязью предложения, ценой и спросом.

Summary. This article proposes an algorithm for dynamic pricing that has not been widely used in the hotel business. The article describes the relevance of the problem and methods of its solution by using mathematical and statistical apparatus. This algorithm uses open data to determine a model that estimates hotel occupancy in a given month and generates forecasted load values in the future. A proposal has been put forward to form a hotel pricing policy based on such data. To form the function, variables are defined and methods for collecting empirical data based on open data sources are considered. Options for learning the algorithm from samples to form a function with suitable coefficients and weights of variables are considered. The use of a standard regression model based on the Gauss least squares method is proposed, as well as tests that can be used to determine whether the constructed model meets certain requirements, whether it is objective, and whether it accurately describes the phenomenon under study. In addition, a theoretical example of using this system for managing hotel rates is given, that is, when the hotelier sets the price for accommodation for a certain period, and a method for maximizing profit based on the proposed method is described. It is proposed to form a system of interrelated indicators (hotel occupancy and organization profit, depending on the load), which maximizes the income of a particular temporary accommodation facility (hotel). We consider the economic component that affects consumer behavior, which is determined by the relationship between supply, price and demand.

Ключевые слова: регрессионный анализ, метод наименьших квадратов, прогноз заполняемости, проверка адекватности модели, максимизация прибыли.

Key words: regression analysis, least squares method, the forecast of occupancy, verification of the adequacy of the model, profit maximization.

Введение

Одной из современных тенденций управления ценовой политикой организации является динамическое ценообразование. Сейчас оно активно применяется в сферах паркинга, авиаперелетов и прочих, но еще совсем не распространено в отельном бизнесе. Суть динамического ценообразования заключается в определении паритета между объемом продаж и ценой продаж для максимизации прибыли.

В данной статье на основе открытых данных предлагается построить модель, которая будет оценивать заполняемость гостиницы в том или ином месяце. Такой алгоритм необходимо обучить на выборке для формирования функции с корректными коэффициентами и весами переменных. Суть такова, что программа будет формировать предположение о заполняемости гостиницы на основе регрессионного анализа, а потом будет сравнивать свой прогноз и полученные эмпирические данные. Также программа могла бы добавлять и убирать факторы, считав их незначительными.

Целью исследования является прогнозирование спроса на гостиничные услуги. Но у такой задачи есть одна особенность, которая влияет на принятие решения клиента. Т.к. бронирование всегда происходит заранее, то происходит временной лаг между тем когда услуга будет оказана и когда она была забронирована.

Поэтому алгоритм должен анализировать не только ближайшие несколько дней, а брать для анализа период. Дальность прогноза определяется степенью ошибки функции и по нашим оценка будет в рамках одного месяца. Такая модель сможет прогнозировать и годичный показатель загруженность, но его точность будет уступать помесячному планированию.

Как раз наиболее верным решением было бы сделать прогноз на месяц, т.к. данный прогноз операционной деятельности необходим для определения потребностей предприятия в материальных средствах, которые рассчитываются исходя из нормы загрузки отеля. Для таких целей получается, что часть прогноза является уже решенной, т.е. часть номеров в гостинице уже забронирована и алгоритм должен определить лишь размер “спонтанно” прибывающих в течение месяца постояльцев в гостиницу.

Наличие частичной информации о будущих значениях (с корректировкой на среднее число незаездов/отмен) помогает алгоритму выдавать значения с повышение степени вероятности.

Также можно предложить способ постепенного обучения алгоритма, который заключался в том, что программа делаете сначала прогноз на день вперед. Меняя наличие переменных и их веса (коэффициенты), оставляет ряд функций, удовлетворяющих условиям адекватности модели. Затем происходит прогноз на 2 дня и т.д. Такую модель теоретически можно построить при наличии большого количества независимых факторов, влияющих на целевую функцию [3].

Определение переменных

Для определения функции важно определить факторы, влияющие на изменение заполняемости и спроса на гостиницу. В наше время бронирование гостиниц в большинстве случаев проходил через интернет, и информация, которую видит клиент, вся общедоступна, поэтому для определения спроса предлагается выделить следующие факторы:

  • Цена. Для получения данных о ценах надо сделать алгоритм, который отслеживал бы изменения цен для определенных отелей, которые будут входить в выборку. Информация о ценах можно взять на таких сайтах-агрегаторах как booking.com, 101hotel.ru, trivago.ru, kayak.ru и другие. Данные о цене могут формироваться по каждой категории, либо можно брать среднее число стоимости проживания за одни сутки.
  • Удобства. Данные об удобствах предполагают наличие или отсутствие таких удобств как балкон, телевизор, телефон, сейф, утюг, гладильные принадлежности, гостиный уголок, вентилятор, гардеробная, доступность смежных номеров,  диван, плиточный/мраморный пол, сушильная машина, шкаф или гардероб, душ, фен, халат, бесплатные туалетные принадлежности, туалет, тапочки, биде, туалетная бумага, кофеварка/чайник, мини-бар, холодильник, электрический чайник, кофемашина, услуга «звонок-будильник», полотенца/постельное белье за дополнительную плату,  полотенца, настольные игры и/или пазлы, детские книги, музыка или фильмы и др.

Безусловно, не все такие условия проживания являются значимыми и далеко не у всех гостинец есть весь перечень удобств, а также не всегда весь реальный перечень удобств гостиницы описан на сайте. Но поскольку программа должна анализировать информацию, на основе которой принимает решение потенциальный гость, то этот недостаток неважен. Для услуг, которые определяются наличием или отсутствием, можно для модели использовать бинарную переменную, т.е. значение 0 или 1.

  • Наличие и близость к достопримечательностям. Информация о достопримечательностях и их удаленности от отеля можно собирать из данных онлайн-карт Google maps, Яндекс.карты или иногда на сайтах-агрегаторах по типу booking.com указывается такая информация.
  • Средняя оценка отзывов. Используя упомянутые выше агрегаторы гостинец, можно собирать среднюю оценку отзывов.
  • Последние отзывы (оценки) не старше года. Также при выборе отеля люди смотрят оценки пользователей, которые были поставлены примерно за последний год. Эти данные собираются также, как и данные о средней оценке.
  • Наличие мероприятий в городе. К сожалению, сервисов, которые в полной мере отображали бы наличие мероприятий в каждом городе нет, но есть такие сервисы как, например, Афиша, которые предоставляют информацию о самых ключевых событиях в больших городах. Проблемой является сложность в оценке степени существенности таких мероприятий. Но их можно оценить по спросу на билеты и по количеству посещаемости страницы с этим мероприятием.

Дополнительные факторы, которые зависят от того является ли отели курортным или городским. Для курортного отеля важным является удаленность от моря. Для городского – близость к деловому центу.

Такой алгоритм сможет с некой долей вероятности (70-ти процентную вероятность мы считаем успешной) предсказывать количество проживающих только на основе открытых данных. Но если интегрировать данный алгоритм в программу управления гостиницей, то мы получим доступ к дополнительным переменным, которые непосредственно будут влиять на заполняемость анализируемого объекта. Например, важным будет являться показатель количества вернувшихся гостей, которые уже останавливались в данной гостинице.

Чтобы собрать данные о выбранных для выборки отелей потребуется некоторое время, которое оценивается в несколько месяцев, чтобы захватить месяцы “летнего” сезона, который длится с мая по октябрь, и месяцы “зимнего” – все остальные месяцы. При наилучшем моменте начала сбора информации потребуется минимум 3 месяца.

Построение уравнения регрессии

При реализации анализа факторов, влияющих на цены, будет использован регрессионный анализ, основанный на методе наименьших квадратов. Для построения модели необходимо провести спецификацию. Строиться график эмпирических данных и определяется зависимость. В нашем случае, скорее всего, зависимость будет носить линейный характер, поскольку связь между показателями является условно прямой [2]. Для определения функции надо применить метод наименьших квадратов, который предполагает построение линии регрессии так, чтобы минимизировать квадраты отклонений этой функции от наблюдаемых значений. Для наглядности изобразим на графике условные эмпирические значения точками, тогда прямая линия будет характеризовать функцию регрессии (см. рисунок 1). Условный пример может описывать только двухмерную плоскость. В нашей работе будет использоваться многомерная модель.

В итоге, должна получиться модель:

где а – свободный член;

bi – коэффициент переменной;

Xi – значение переменной.

Тест модели

После постройки модели необходимо определить ее адекватность. Нужно проанализировать значение коэффициента детерминации. Он показывает процент результатов, которые объясняет наша модель. При прочих равных чем больше это показатель, тем лучше.

Затем надо переделить значимость коэффициентов уравнения регрессии и проверка выполнимости предпосылок МНК.

Для определения значимость коэффициентов уравнения регрессии определяется F-статистика — характеристика точности уравнения регрессии, которая представляет собой отношение той части дисперсии зависимой переменной, которая объяснена уравнением регрессии к необъясненной (остаточной) части дисперсии [1]. Уравнение для определения -статистики в случае многомерной регрессии имеет вид:

— объясненная дисперсия — часть дисперсии зависимой переменной Y которая объяснена уравнением регрессии;

— остаточная дисперсия — часть дисперсии зависимой переменной Y которая не объяснена уравнением регрессии, ее наличие является следствием действия случайной составляющей;

n — число точек в выборке;

m — число переменных в уравнении регрессии.

Если по итогам данного теста какие-либо переменные не является значимыми для модели, то их необходимо исключить.

Также необходимо проанализировать остатки путем применения теста Дарбина—Уотсона.

Тест Дарбина—Уотсона помогает определить автокорреляцию, подчиняющуюся авторегрессионному процессу 1-го порядка. Предполагается, что величина остатков еt в каждом t-м наблюдении не зависит от его значений во всех других наблюдениях [2].

Если в модели не хватает переменных, то это может показать тест Рамсея. Для его проведения надо оценить первоначальную модель и получить предсказанные (теоретические) значения, вычислить их значение во второй и третьей степени и считать их новыми факторами, которые будут включены в модель. Затем оценить новую модель и статистическую значимость коэффициентов перед новыми переменными. Если хотя бы один из коэффициентов статистически значим, то необходимо искать и включить в модель дополнительную объясняющую переменную. В противном случае оставляем модель без изменения.

Для определения однородности выборки и степени прогнозируемости можно применить тест Голдфелда-Квандта. Он определяет гетероскедастичность случайных ошибок регрессионной модели. Обычно этот тест применяется, когда стандартное отклонение ошибок может быть пропорционально какой-то переменной. Либо для определения гетероскедастичности можно использовать тест Парка.

Непосредственная адекватность модели оценивается на основе известных данных, которые модель должна предсказать. Модель считается адекватной, если предсказанные значения лежат в интервале рассчитанной ошибки.

В результате проведения эконометрического анализа построенной модели необходимо получит функцию, предсказывающую с определенной вероятностью процент заполняемости гостиницы в том или ином месяце.

Управление тарифами

Кроме использования данной информации для формирования бюджета на предстоящие периоды на основе данных заполнения данных собственной гостиницы и конкурентных организаций можно определять тарифы, которые будут применяться в тот или иной период. Тарифы представляют собой стоимость проживания в номере какой-либо категории за ночь. Поскольку гостиничный бизнес является сезонным, то тарифы носят динамический характер, т.е. изменяются в зависимости от сезона. Особенно это характерно для курортных отелей.

Определение тарифов на основе прогноза заполняемости является экономически обоснованным, т.к. на данном монополистическом рынке цена на предложение является производной от спроса потребителя [6]. Иными словами, если поставить слишком высокие цены, то ваши номера будет простаивать и, даже если понизить цены вслед за конкурентами, то время, в течение которого номера стояли по высоким ценам, будет потеряно и поток клиентов снизится. Также, поскольку бронирование осуществляется заранее, надо цену ставить уже “сейчас” и надо на чем-то основываться при ее определении на будущий период, чем и призван заниматься предложенный алгоритм.

Определение тарифов можно провести, составив функцию с параметрами, которые будут включать цены, т.е. использовать выше описанную функцию. Мы исходим из допущения, что в краткосрочном периоде, равном одному месяцу, не происходит изменения параметров номера таких как удобства, удаленность и наличие достопримечательностей/моря и т.п. Таким образом, существенным является изменение только цены

Ситуация при использовании зависимости только от цены:

Со стороны микроэкономики данная ситуация заключается в том, что “объем производства”, т.е. то, сколько номеров может отель предложить на определенную дату, связано с ценой. Т.е. чем меньше цена номера, тем больше спрос на него и тем самым меньше предложение (рис.2).

Принято считать, что цена устанавливается на сезон заранее, а, следовательно, она постоянная в краткосрочном периоде. Если мы считаем, что на спрос влияет только цена, то он также будет постоянным. Таким образом, количество свободных/занятых номеров будет являться следствием установленной цены.

Определив функцию заполняемости конкретного отеля, зависимую от цены, можно найти максимальное значение заполняемости. Для этого надо дифференцировать, чтобы найти максимум заполняемости при определенной цене.

Логично, что если значимость параметра цены будет высокой (т.е. коэффициент существенный), то при цене равной нулю, заполняемость будет максимальной. Для ограничения необходимо ввести условие минимальной цены в виде неравенства, которое будет задавать область определения функции. Минимальной ценой может задаваться точка безубыточности или определенная доходность. Определив производственную функцию, можно задать доходность модели, чтобы получить максимальную заполняемости.

Ситуация при использовании зависимости от нескольких факторов:

Если в функцию добавить другие переменные кроме цены, то мы получим многомерную модель. К таким переменным можно отнести, например, мероприятия в городе или другие существенные параметры, которые были определены при спецификации уравнения регрессии. По аналогии с функцией от цены надо найти экстремумы функции для определения максимальной заполняемости, не забыв описать условие минимальной цены.

Построив еще одну функцию зависимости прибыли от объема продаж, можно максимизировать прибыль. В функции прибыли не рассматриваются другие факторы, включенные в функцию прогноза заполняемости, потому что они немонетарные и не меняются со временем. Безусловно, их значимость в модели может меняться, но для этого необходимо проводить периодическую переоценку значимости параметров

Таким образом, необходимо решить систему уравнений с двумя функциями: заполняемости гостиницы и прибыль гостиницы. Надо максимизировать прибыль, изменяя тарифы на номера или другие параметры, на которые может влиять собственник гостиницы.

Список использованной литературы

  1. Регрессионный анализ — М. Г. Назарова.-М.: ОМЕГА- 2010
  2. Экономико-математические методы в примерах и задачах: Учеб. пос. / А.Н. Гармаш, И.В. Орлова, Н.В. Концевая и др.; Под ред. А.Н. Гармаша — М.: Вузовский учебник: НИЦ ИНФРА-М, 2014 — 416с.
  3. Орлова И.В., Филонова Е.С. Выбор экзогенных факторов в модель регрессии при мультиколлинеарности данных // Международный журнал прикладных и фундаментальных исследований. 2015. № 5-1. С. 108–116.
  4. Грибанова Е.Б., Соломенцева Е.С. МОДЕЛИ ПРОГНОЗИРОВАНИЯ ВЫРУЧКИ РЕСТОРАНА БЫСТРОГО ПИТАНИЯ // Экономический анализ: теория и практика. 2018. №4 (475). URL: https://cyberleninka.ru/article/n/modeli-prognozirovaniya-vyruchki-restorana-bystrogo-pitaniya (дата обращения: 10.12.2019).
  5. Таскин А.С., Миркес Е.М. Линейная регрессия с кластеризацией по признаку на данных с действительными величинами // Сибирский журнал науки и технологий. 2012. №3 (43). URL: https://cyberleninka.ru/article/n/lineynaya-regressiya-s-klasterizatsiey-po-priznaku-na-dannyh-s-deystvitelnymi-velichinami (дата обращения: 18.12.2019).
  6. Зеленова Т.С. Дифференциация продукции как ключевой критерий монополистической конкуренции // Economics. 2018. №5 (37). (дата обращения: 24.12.2019).