Московский экономический журнал 5/2017

image_pdfimage_print

УДК 330.88

Bezymyannyj-12

BIG DATA: ИСПОЛЬЗОВАНИЕ ВОЗМОЖНОСТЕЙ ОПЕРАЦИОННОЙ АНАЛИТИКИ В ПРОЦЕССЕ ОЦЕНКИ БАНКОВСКИХ РИСКОВ

Реутов Р.В., начальник юридического отдела Екатеринбургского филиала ПАО Банк «ФК Открытие», магистрант кафедры финансовых рынков и банковского дела Уральского государственного экономического университета, Куваева Ю.В., к.э.н., доцент кафедры финансовых рынков и банковского дела Уральского государственного экономического университета, Серебренникова А.И., к.э.н., доцент кафедры финансовых рынков и банковского дела Уральского государственного экономического университета

Аннотация: данная статья посвящена описанию возможностей применения инструментов, технологий и навыков использования больших данных в банковской сфере, в частности при выполнении такой базовой функции банка, как оценка кредитоспособности клиентов при решении вопросов об их кредитовании. Описаны основные характеристики Big Data и принципы работы кредитных организаций с большими объемами данных, сделана попытка определения принципов прикладного применения данной технологии в банке.

Ключевые слова: big data, большие данные, традиционная аналитика, операционная аналитика, банковские риски.

Объемы информации, накапливаемой в мире, постоянно увеличиваются и в 2020 году составят, по оценкам Gartner, ведущей мировой исследовательской и консультационной компанией, и IDC, 44 зеттабайта данных (44 трлн. гигабайт). Для сравнения представим, что весь объем данных, подлежащих хранению сотовыми операторами по «закону Яровой», достигает 157,5 эксабайта [1], что составляет 0,1575 зеттабайта. При этом, проведенное провайдером инфраструктурных решений ЕМС и Institute for the Future исследование Information Generation показало: 52% компаний из разных стран и отраслей признают, что-либо не используют доступные им данные эффективно, либо тонут в объемах информации [2].

В  наиболее общем виде термин «big data» определяют в современном мире  как  совокупность подходов, инструментов и методов обработки структурированных и неструктурированных данных  огромных объемов и значительного многообразия для получения восприимчивых человеком результатов, эффективных в условиях непрерывного прироста, распределения по многочисленным узлам вычислительной сети, сформировавшихся в конце 2000-х годов, альтернативных традиционным системам управления базами данных и решениями класса Business Intelligence [3]. В более ранних публикациях авторы уже предлагали несколько модифицировать указанное определение и рассматривать «big data» как различные инструменты, подходы, методы обработки и использования данных, которые позволяют автоматизировать и масштабировать процессы в разных отраслях человеческой деятельности, увеличивая их скорость в пределах «времени принятия решений». В еще более упрощенном варианте можно рассматривать Big Data как совокупность инструментов, методов обработки структурированных и неструктурированных данных значительного объема для получения воспринимаемых человеком результатов [4, с. 63].

При определении понятия Big Data принято говорить о четырех V: Volume (большой объем данных, который постоянно увеличивается; Variety (разнообразность хранимых и обрабатываемых данных, наличие или отсутствие их структуры); Velocity (скорость работы с подобными данными, т.е. скорость их поступления и обработки); Value (ценность информации). Также, возможно дополнить данный перечень такой характеристикой, как Veracity (неопределенность данных) [5]. Таким образом, большие данные часто представляют собой особый тип данных с принципиально иной структурой, и такая структура требует применения специальных способов обработки для включения их в аналитический процесс. В этом контексте суть концепции Big Data, по мнению авторов, сводится к анализу неоднородной и быстро поступающей информации с использованием не только классической, описательной, но прогностической аналитики. Если в классической бизнес- аналитике внимание сосредотачивается на анализе произошедшего с описательной точки зрения, например, определение объема продаж по каждому региону, доли своевременных поставок… то цель прогностической аналитики, наоборот, состоит в предсказании того, что произойдет в будущем. Как увеличить долю своевременных поставок? При этом, новые аналитические процессы должны быть автоматизированы, существенно масштабированы и осуществляться с молниеносной скоростью [6, с. 39-40]. Все это, по мнению авторов, следует относить к особенностям операционной аналитики больших данных. В данном случае сам анализ данных позволяет увидеть определённые и незаметные закономерности, которые не может увидеть человек. Это позволяет оптимизировать все сферы нашей жизни – от государственного управления до производства и телекоммуникаций [7].

Признавая важность этих отраслей экономики, особый интерес вызывает применение концепции больших данных в банковской сфере. Любой банк в своей деятельности сталкивается с огромным количеством рисков, необходимостью их минимизации и диверсификации.  В этой связи — управление рисками – это одна из благодатных сфер применения больших данных в банковском деле. Управление любым видом рисков – операционных, рыночных, кредитных, правовых – зависит от полноты, объективности и своевременности оценки информации, которую получают риск-менеджеры. Инструменты и технологии big data помогут нарисовать всеобъемлющую картину на любом уровне, будь то благонадежность заемщика или экономическая ситуация в отдельном регионе страны [8].

До сих пор банки оценивали риски, исходя из текущих данных, как правило, предоставляемых самими клиентами и применяя при этом традиционную аналитику. Операционная же аналитика сосредоточена на обработке данных и принятии решений в режиме реального времени, и как правило, применяется к конкретному клиенту именно в тот момент, когда это необходимо. По этой причине, система оценки рисков, основанная на операционном подходе применительно к анализу больших данных, расскажет о клиенте (действующем или потенциальном) куда больше и сделает это гораздо объективнее. Такая система оценки учитывает не только кредитную историю клиента, но и активность в соцсетях, тональность его комментариев, предпочтения в покупках и, если надо, поведение в сетевых играх [8]. На основе анализа больших данных банк также может корректировать свою инвестиционную стратегию в зависимости от выявления и оценки рисков в конкретной отрасли и регионе.

Справедливости ради следует отметить, что внедрение отдельных элементов Big Data в оценке рисков достаточно давно происходит в банковской среде. Так, в отношении частных заемщиков используется «скорринг-система», которая представляет собой компьютерную программу, использующую разные математические и статистические приемы обработки ответов заемщика в заявке на кредит, которую он предоставляет в банк [9]. В данном случае анализируются анкетные и паспортные данные, поведенческие данные, которыми обладают банки в силу тех услуг, которые они оказывают. Также могут использоваться  открытые данные, прежде всего из социальных сетей. В отношении корпоративных клиентов ситуация немного иная. Применение программных методов оценки кредитоспособности осложняется ее сложностью и многоаспектностью.

По общему правилу, в американской и в отечественной практике используется метод балльной оценки ссудозаемщиков, основанный на «правиле пяти си» [10, с. 178-179]:

С – Capacity – финансовая способность вернуть долг;

С – Character – репутация заемщика (честность, порядочность, прилежание);

С – Capital – капитал или имущество;

С – Collateral – наличие обеспечения, залога;

С – Conditions – экономическая конъюнктура и ее перспективы.

Методика пяти «С» дополняется анализом системы финансовых коэффициентов и денежного потока. Система финансовых коэффициентов включает в себя 5 групп коэффициентов: ликвидность, эффективность (оборачиваемость), финансовый рычаг (леверидж), прибыльность, обслуживание долга. Бальная оценка проводится кредитными экспертами (аналитиками) на основании полученных от клиентов информации, отчетов кредитных агентств, фактических отчетных данных баланса и других финансовых отчетов с использованием данных за ряд последних лет. Проблематика такого анализа состоит в том, что присутствует определенная доля субъективизма в восприятии и анализе информации сотрудником банка, существует вероятность ошибки как человеческий фактор, а также зачастую возникают проблемы с достоверностью предоставляемых клиентами сведений и информации.

Специфической чертой такого анализа является недооценка макроэкономических показателей состояния отрасли и региона, конкурентоспособности клиента, его положения в указанной отрасли, занимаемой доли рынка, состоянию конкурентов и партнеров анализируемой компании. В целом, ввиду недостаточности информации у кредитного эксперта, этим аспектам уделяется мало внимания, хотя общепризнана необходимость исследования и анализа данных факторов при оценке кредитоспособности клиента. Также, в рамках применения традиционной, пакетной аналитики, при оценке банковских рисков наблюдается явный перекос в сторону финансового анализа, который, как уже говорилось выше, может проводиться как на основе системы финансовых коэффициентов (показателей), так и путем анализа денежных потоков, т.е. сопоставления притока и оттока денежных средств предприятия-заемщика (исследование портфеля контрактов и динамики кредиторской / дебиторской задолженности). Реализация на практике концепции Big Data с применением операционной аналитики в деятельности банков позволит, по мнению авторов, существенно повысить результативность использования соответствующей информации в интересах банка.

Оценку ответственности руководства компании (Character), качества управления (менеджмента), деловой репутации руководителей потенциального заемщика можно провести на основе данных, полученных из социальных сетей. Анализируя профиль поведения руководителя / менеджера (то, какую информацию он о себе публикует и в какой форме, как он общается, как выглядит круг его контактов), можно сделать достаточно много ценных выводов и комплексных оценок различных показателей [5]. Также выявлению и анализу подлежит информация об участии руководителей компании в различных конференциях, профессиональных симпозиумах, выступлениях в СМИ, публикациях, интервью, обсуждениях компании на различных форумах в соцсетях и т.д. Также через социальные сети, используя специальные инструменты, технологии и навыки, можно выявить часто скрываемую информацию о конечных бенефициарах («истинных» владельцах) и контролирующих лицах компании. Данный алгоритм может включать сбор и анализ частоты, периода времени общения в соцсетях лиц, связанных с компанией, фактов присутствия в офисе, недалеко от офиса (через камеры видеонаблюдения), фактов обращения лица на сайт компании, информации на других ресурсах, где клиент мог бы оставить свои актуальные данные. Например, выявленный в сети факт поздравления лица с днем рождения компании, либо выражения благодарности лицу, не являющемуся партнером компании или его сотрудником, может свидетельствовать об «особых» отношениях лица и анализируемого предприятия.

При анализе элемента Capacity (финансовая способность вернуть долг) кредитоспособности клиента прежде всего анализируется способность компании производить и реализовывать продукцию, а также информация о соблюдении компанией обязательств перед контрагентами. В данном случае, используя инструменты и технологии анализа больших данных, по аналогии с маркетинговыми исследованиями соцсетей, эффективности рекламных компаний, сведений о продажах, отзывов и критики услуг / товаров потребителями, публикациях в СМИ, банк может оценить спрос и удовлетворенность клиентов продукцией компании – заемщика, рынок сбыта, а также прогнозировать изменение спроса ввиду сезонности, моды и иных предпочтений.

Наибольшая эффективность применения технологии Big Data может быть достигнута при анализе Conditions (экономическая конъюнктура и ее перспективы), т.е. в процессе изучения макроэкономических условий в стране, определяющих деловой климат в отрасли и регионе присутствия заемщика и его контрагентов, особенностей развития бизнеса в различных секторах и регионах, оказывающих влияние на банк и заемщика. Это достаточно объемный пласт как структурированной, так и не структурированной информации, включающей в себя статистическую информацию, данные из новостной ленты, биржевых сводок, интервью и публикаций на сайтах учебных заведений, информацию из зарубежных источников и т.д. В рамках традиционной аналитики этому блоку так же уделяется недостаточно внимания, тогда как модели и методы операционной аналитики позволяют создавать и использовать особые критериальные модели, разрабатываемые под определенного клиента и желательно в режиме реального времени. В указанные модели включаются разнообразные критерии, такие как отрасль, срок функционирования фирмы, категория товара, макроэкономическая ситуация в регионе присутствия клиента и его контрагентов, является ли регион донором или дотационным, состояние конкурентной среды, транспортная доступность, состояние дорог, расходы на логистику и т.д. Поэтому, чем большее количество переменных будет включено в модель, тем достовернее будет полученный на выходе результат.

Основное внимание в кредитной аналитике уделяется коэффициентному анализу и исследованию обоснованности запрашиваемой потенциальным заемщиком суммы кредита; характеру кредитуемой сделки, проводимому в основном на основании представленных клиентом документов бухгалтерской и аналитической отчетности. И в этом случае инструменты и технологии анализа больших данных могут прийти на помощь банковскому работнику. Анализируя огромный массив данных по определенным критериям, система может выявить компании – аналоги со схожей бизнес – моделью, а также аналогичные инвестиционный проекты (не обязательно связанные с кредитованием, но с аналогичным риском, доходностью, схожими денежными потоками). При этом выявленная информация анализируется на предмет выявления определенных закономерностей и статистических подтверждений, формируется некоторая математическая / регрессионная модель на основе этих данных, которая экстраполируется на анализируемую компанию.

При использовании Big Data, действует общепринятый принцип: чем больше данных – тем больше точность анализа. Представляется интересным использование для анализа информации банков о расчетах (движении денежных средств) клиентов, а также данных о количестве, стоимости и сроках поставки / выполнения работ (услуг) компаний реального сектора экономики. Предположим, что данная информация в каком – либо виде размещается банками и компаниями в сети, при этом не возникает проблем с нарушением принципов банковской и коммерческой тайны, так как информация об операциях и поставках не привязана к конкретному плательщику, получателю средств, номеру счета, поставщику и покупателю, иными словами – обезличена. Персональные данные просто исключаются из размещаемой информации, так как для Big Data совершенно не важно, кто получатель, плательщик или покупатель, важной является информация об общих суммах платежей и поставок, какой товар поставляется, какой оплачивается, сроки и периодичность оплаты / поставки, в какие регионы осуществляются платежи и поставки, назначение платежа в платежных документах. Представляется, что данная информация была бы крайне важной для создания определенной модели и оценивания с ее помощью потенциального клиента банка.

Учитывая, что концепция Big Data и ее применение в банковских технологиях еще находится в стадии формирования, сложно рассчитать экономический эффект для банка от ее использования. Но в любом случае, снижение ошибок при анализе кредитоспособности клиента, минимизация банковских рисков будут непосредственно влиять на качество кредитного портфеля банка и делать его более «здоровым».

В заключении следует отметить, что условием полезного использования больших данных в деятельности банка является поддержка его руководством новых технологий анализа и обработки больших данных, наличие сильной команды аналитиков-рисковиков, а также отсутствие ярко выраженного желания быстрого подтверждения бизнес-эффекта для кредитной организации. Грамотное использование концепции Big Data в текущей деятельности банка (не только в области анализа кредитных рисков) станет существенным конкурентным его преимуществом и будет способствовать внедрению инновационных подходов и новых коммерческих направлений в банке.

Список литературы:

  1. Мне не очень понятна необходимость хранения одних и тех же данных разными операторами // Коммерсант.ru [Электронный ресурс]. URL: https://www.kommersant.ru/doc/3385427 (дата обращения: 08.12.2017).
  2. Big Data в деле // РБК [Электронный ресурс]. URL: http://www.rbcplus.ru/news/555e7b397a8aa97cb615f209 (дата обращения: 08.12.2017).
  3. ВикипедиЯ Свободная энциклопедия // Wikipedia [Электронный ресурс]. URL: https://ru.wikipedia.org/ (дата обращения 09.11.2017).
  4. Гобарева Я.Л., Городецкая О.Ю., Кочанова Е.Р. Возможности и технологии BIGDATA для повышения качества эксплуатации CRM-систем // Транспортное дело России. 2015. №5. С.62-63.
  5. Big Data: внимание банков к соцсетям продолжает расти. Методы анализа информации в социальных сетях // Плас Журнал Pru [Электронный ресурс]. URL: http://www.plusworld.ru/journal/section_1168/section_153395/art153371/ (дата обращения: 08.12.2017).
  6. Фрэнкс Б. Революция в аналитике. Как в эпоху BIG DATA улучшить бизнес с помощью операционной аналитики. [Текст] / Билл Фрэнкс; Пер. с англ. – М.: Альпина Паблишер, 2017. – 316 с.
  7. Что такое Big data: собрали всё самое важное о больших данных // RUSBASE [Электронный ресурс]. URL: https://rb.ru/howto/chto-takoe-big-data/ (дата обращения: 08.12.2017).
  8. Волшебная палочка: зачем банкам big data // Bru [Электронный ресурс]. URL: http://www.banki.ru/news/daytheme/?id=9949915 (дата обращения: 08.12.2017).
  9. Что такое скоринг и как он работает? // Home Credit People [Электронный ресурс]. URL: http://hcpeople.ru/credit_scoring/ (дата обращения: 08.12.2017).
  10. Банковское дело. Организация деятельности коммерческого банка: учебник и практикум для академического бакалавриата / Г. Н. Белоглазова [и др.]; под ред. Г. Н. Белоглазовой, Л. П. Кроливецкой. – 3-е изд., перераб. и доп. – М.: Издательство Юрайт, 2015. – 545 с.