Статья опубликована в рамках: Научного журнала «Студенческий» № 9(221)
Рубрика журнала: Экономика
Скачать книгу(-и): скачать журнал часть 1, скачать журнал часть 2, скачать журнал часть 3
ПРИМЕНЕНИЕ МЕТОДА КЛАСТЕРНОГО АНАЛИЗА ДЛЯ ВЫДЕЛЕНИЯ ГРУПП БАНКОВ, ИМЕЮЩИХ РАЗЛИЧНОЕ ВЛИЯНИЕ ПОКАЗАТЕЛЕЙ НА ОБЪЕМ КАПИТАЛА БАНКОВ
APPLICATION OF THE CLUSTER ANALYSIS METHOD TO IDENTIFY GROUPS OF BANKS THAT HAVE A DIFFERENT IMPACT OF INDICATORS ON THE AMOUNT OF CAPITAL OF BANKS
Regina Sadovaya
student, Department of Information Systems in Economics, Volga State University of Technology,
Russia, Yoshkar-Ola
Lyudmila Bakumenko
scientific supervisor, Doctor of Sciences in Economics, Professor, Volga State University of Technology,
Russia, Yoshkar-Ola
АННОТАЦИЯ
В данной научной статье произведен кластерный анализ по 85 банкам Российской Федерации. Выполнено разделение банков на классы, каждый из которых имеет различное влияние выбранных показателей на объем капитала банков.
ABSTRACT
In this scientific article, a cluster analysis was performed for 85 banks of the Russian Federation. Banks are divided into classes, each of which has a different impact of the selected indicators on banks.
Ключевые слова: кластер, метод К-средних, банки, показатель, гистограмма.
Keywords: cluster, K-means method, banks, indicator, histogram.
В статистическом моделировании кластерный анализ (cluster analysis) – совокупность многомерных статистических методов классификации объектов по характеризующим их признакам, разделение совокупности объектов на однородные группы, близкие по определяющим критериям, выделение объектов определенной группы.
Целью данного исследования является разделение банков на классы, каждый из которых соответствует определенной группе.
Для проведения анализа были отобраны следующие показатели: Y - Объем капитала (млрд. руб.); X1 - Прирост вкладов за 12 месяцев (%); X2- Итого пассивов по балансу (млрд. руб.); X3- Доля вкладов в балансовых пассивах (%); X4 - Объем активов (млрд. руб.); X5 - Рентабельность активов-нетто (%); X6- Рентабельность капитала (%); X7 - Объем кредитного портфеля (млрд. руб.); X8 - Просроченная задолженность в кредитном портфеле (млрд. руб.).
Построение кластерного анализа осуществляется при помощи программы «Statistica», в ней реализованы классические методы кластерного анализа, включая методы k-средних, иерархической кластеризации и двухвходового объединения.
На первом этапе необходимо выяснить, формируют ли показатели "естественные" кластеры, которые могут быть осмыслены.
Метод полной связи определяет расстояние между кластерами как наибольшее расстояние между любыми двумя объектами в различных кластерах (т.е. "наиболее удаленными соседями"). Наиболее важным результатом, получаемым в результате древовидной кластеризации, является иерархическое дерево, рисунок 1.
Рисунок 1. Вертикальная дендрограмма
Каждый узел диаграммы, приведенной выше, представляет объединение двух или более кластеров, положение узлов на вертикальной оси определяет расстояние, на которое были объединены соответствующие кластеры. Далее необходимо выполнить кластеризация методом К-средних.
Исходя из визуального представления результатов, можно сделать предположение, что показатели образуют 3 естественных кластера. Необходимо проверить данное предположение, разбив исходные данные методом К-средних на 3 кластера, и проверить значимость различия между полученными группами.
Метод К-средних заключается в следующем: вычисления начинаются с k случайно выбранных наблюдений (в нашем случае k=3), которые становятся центрами групп, после чего объектный состав кластеров меняется с целью минимизации изменчивости внутри кластеров и максимизации изменчивости между кластерами.
Каждое следующее наблюдение (K+1) относится к той группе, мера сходства с центром тяжести которого минимальна. После изменения состава кластера вычисляется новый центр тяжести, чаще всего как вектор средних по каждому параметру. Алгоритм продолжается до тех пор, пока состав кластеров не перестанет меняться.
Когда результаты классификации получены, можно рассчитать среднее значение показателей по каждому кластеру, чтобы оценить, насколько они различаются между собой. Необходимо выполнить «Дисперсионный анализ» для определения значимости различия между полученными кластерами.
Рисунок 2. Дисперсионный анализ
Итак, значение p показателей Х2 и Х7>0.05, а в остальных показателях значение p <0.05, что говорит о значимом различии. Следует построить график средних и доверительных интервалов для переменных в каждом кластере.
Рисунок 3. График средних
При нажатии кнопки «Элементы кластера u расстояния» можно просмотреть наблюдения, входящие в каждый из кластеров. Опция также позволяет отобразить евклидовы расстояния объектов от центров (средних значений) соответствующих им кластеров.
В кластер 1 вошло 13 банков, можно сказать, что данный класс наименее благоприятный. В данном кластере показатель У отрицательный, но при этом высокий показатель «Прирост вкладов за 12мес. (%)» (Х1). Как известно в основном вклады делаются с целью получения дополнительной прибыли, т.к. во вкладах начисляются проценты. Так же он имеет отрицательное итого пассивов по балансу, по сравнению с другими двумя кластерами, из чего можно сделать вывод что отрицательный показатель Х2 так же отрицательно влияет на объем капитала.
Про кластер 2, можно сказать, что данный класс наиболее благоприятный, в него вошло 36 банков. В данном кластере самый высокий уровень объема капитала при отрицательном показателе Х1 «Прирост вкладов за 12 мес. (%)».
Кластер 3, так же 36 банков, данный класс имеет средние показатели. В данном кластере положительный уровень объема капитала и самый низкий уровень прироста вкладов, но имеет положительный уровень показателя Х8 «Просроченная задолженность в кредитном портфеле (млрд. руб.)», что отрицательно сказывается на У.
Таким образом, 85 банков можно разделить на 3 кластера, каждый из которых отличается определенным влиянием показателей, на объем капитала банка. Наиболее благоприятным является кластер 2, с самым большим уровнем объема капитала.
Список литературы:
- Буреева Н.Н. Многомерный статистический анализ с использованием ППП “STATISTICA”. Учебно-методический материал. – НН, 2007. – 112 с.
- Федеральная служба государственной статистики [Электронный ресурс] — Режим доступа. — URL: https://rosstat.gov.ru/ (дата обращения 10.01.2023)
- Яковлев В.Б. Эконометрика в Excel и Statistica : Учебное пособие – Москва : КНОРУС, 2022. – 382 с.
Оставить комментарий