ПОСТРОЕНИЕ МОДЕЛЕЙ ПРОГНОЗИРОВАНИЯ БАНКРОТСТВА ПРЕДПРИЯТИЙ С ПРИМЕНЕНИЕМ МЕТОДОВ DATA MINING
|
ВВЕДЕНИЕ 3
1 Особенности банкротства предприятия 5
1.1 Понятие, признаки, виды банкротства предприятий 5
1.2 Причины банкротства предприятий 14
2 Современные модели прогнозирования банкротства предприятий, основанные на
методах data mining 19
2.1 Модели бинарного выбора 19
2.2 Модели опорных векторов и k-ближайших соседей 21
2.3 Дерево решений и случайный лес 23
2.4 Нейронные сети 28
3 Построение моделей data mining для прогнозирования банкротства российских
предприятий 33
3.1 Подготовка данных для анализа и выбор предикторов 33
3.2 Построение моделей прогнозирования банкротства и оценка их прогнозной
силы 39
3.3 Сравнительный анализ построенных моделей 47
ЗАКЛЮЧЕНИЕ 54
ЛИТЕРАТУРА 56
1 Особенности банкротства предприятия 5
1.1 Понятие, признаки, виды банкротства предприятий 5
1.2 Причины банкротства предприятий 14
2 Современные модели прогнозирования банкротства предприятий, основанные на
методах data mining 19
2.1 Модели бинарного выбора 19
2.2 Модели опорных векторов и k-ближайших соседей 21
2.3 Дерево решений и случайный лес 23
2.4 Нейронные сети 28
3 Построение моделей data mining для прогнозирования банкротства российских
предприятий 33
3.1 Подготовка данных для анализа и выбор предикторов 33
3.2 Построение моделей прогнозирования банкротства и оценка их прогнозной
силы 39
3.3 Сравнительный анализ построенных моделей 47
ЗАКЛЮЧЕНИЕ 54
ЛИТЕРАТУРА 56
Одной из актуальных проблем, возникающих при анализе деятельности предприятий, является как можно более ранняя диагностика риска банкротства. Важность максимально ранней диагностики состоит в том, чтобы иметь достаточный промежуток времени для принятия управленческих решений, позволяющих уменьшить риск, либо наиболее безболезненно пройти процедуру банкротства. Перед более детальным анализом хозяйственного риска предприятия, который требует значительных трудовых и финансовых затрат, представляется разумным провести предварительный анализ, что позволит оценить вероятность банкротства и даст возможность сосредоточиться на самых проблемных показателях. Для этих целей в финансово и политически устойчивых странах с начала 1970-х годов используются различные модели дискриминантного анализа, которые в настоящий момент можно считать классическими. В то же время применение этих моделей к странам с так называемой переходной экономикой (к которым в определённой степени можно отнести и Россию) не даёт объективной картины и не позволяет получить заслуживающие доверие результатов. Информационные возможности современной техники позволяют применить подход, в корне отличающийся от применявшихся ранее. Данным примером могут послужить методы бизнес-аналитики, которые позволяют строить модели, имеющие более сложную структуру в отличие от классических моделей.
Целью данной работы является построение моделей прогнозирования банкротства российских компаний. Предлагаемые модели призваны повысить эффективность принятия управленческих решений предприятий. Для достижения поставленной цели необходимо решить следующие задачи:
1) проанализировать существующие западные и отечественные работы, посвященные прогнозированию банкротства, а также выделить их достоинства и недостатки;
2) сформировать выборку по отраслям, очистить ее от резких выбросов и пустых значений в строках баланса компаний;
3) рассмотреть разные модели прогнозирования банкротства компаний и получить их спецификации;
4) оценить предсказательную силу построенных моделей и провести их сравнительный анализ.
Практическая значимость данной работы обуславливается тем, что полученные модели прогнозирования банкротства могут применяться в качестве дополнительного инструмента анализа финансового состояния компаний. Кроме того, данные модели могут использоваться инвесторами для оценки привлекательности вложений в конкретную фирму, а также для кредитных организаций с целью оценки кредитоспособности организации.
Объектом исследования являются предприятия из секторов российской экономики: строительство, оптовая и розничная торговля, операции с недвижимым имуществом и обрабатывающие производства.
Предмет исследования - оценка вероятности банкротства предприятий с использованием методов data mining.
Данная работа состоит из трех глав. В первой главе работы будет дано определение понятию банкротства, рассмотрена процедура его признания, выявлены основные факторы, которые оказывают влияние на несостоятельность предприятий в современных условиях. Во второй главе будут рассмотрены модели по прогнозированию банкротства предприятий. В третьей главе будут произведены расчеты моделей по прогнозированию банкротства и сравнительная характеристика моделей для нахождения модели с лучшей прогнозной силой.
Целью данной работы является построение моделей прогнозирования банкротства российских компаний. Предлагаемые модели призваны повысить эффективность принятия управленческих решений предприятий. Для достижения поставленной цели необходимо решить следующие задачи:
1) проанализировать существующие западные и отечественные работы, посвященные прогнозированию банкротства, а также выделить их достоинства и недостатки;
2) сформировать выборку по отраслям, очистить ее от резких выбросов и пустых значений в строках баланса компаний;
3) рассмотреть разные модели прогнозирования банкротства компаний и получить их спецификации;
4) оценить предсказательную силу построенных моделей и провести их сравнительный анализ.
Практическая значимость данной работы обуславливается тем, что полученные модели прогнозирования банкротства могут применяться в качестве дополнительного инструмента анализа финансового состояния компаний. Кроме того, данные модели могут использоваться инвесторами для оценки привлекательности вложений в конкретную фирму, а также для кредитных организаций с целью оценки кредитоспособности организации.
Объектом исследования являются предприятия из секторов российской экономики: строительство, оптовая и розничная торговля, операции с недвижимым имуществом и обрабатывающие производства.
Предмет исследования - оценка вероятности банкротства предприятий с использованием методов data mining.
Данная работа состоит из трех глав. В первой главе работы будет дано определение понятию банкротства, рассмотрена процедура его признания, выявлены основные факторы, которые оказывают влияние на несостоятельность предприятий в современных условиях. Во второй главе будут рассмотрены модели по прогнозированию банкротства предприятий. В третьей главе будут произведены расчеты моделей по прогнозированию банкротства и сравнительная характеристика моделей для нахождения модели с лучшей прогнозной силой.
Работа посвящена проблеме оценки риска банкротства предприятий и поиску наиболее эффективных моделей прогнозирования вероятности банкротства в условиях современной экономической реальности. Прогноз вероятности банкротства полезен не только владельцам бизнеса и менеджменту компании, он необходим инвесторам и кредиторам для принятия инвестиционных и кредитных решений, партнерам предприятия для выстраивания взаимоотношений и реализации совместных проектов, органам власти для выявления проблемных предприятий и секторов экономики, разработки и реализации программ поддержки бизнеса. Существует огромное количество методов прогнозирования банкротства, начиная с классических моделей, основанных на методе дискриминантного анализа, и заканчивая более современными моделями, основанными на машинном обучении. Несмотря на многообразие классических моделей, большинство из них не учитывают особенности отдельной отрасли, страны или отдельно региона. В связи с этим возникает необходимость в построении новых более гибких моделей, основанных на методах data mining, что обуславливает актуальность и практическую значимость работы.
Исследование основано на реальных данных из годовых финансовых отчетов о деятельности предприятий за 2019 год по четырём секторам экономики: обрабатывающие производства, строительство, торговля оптовая и розничная, деятельность по операциям с недвижимым имуществом. Выборка сформирована с помощью информационной системы СПАРК, которая содержит информацию по финансовой отчетности российских компаний. На основе полученной выборки предприятий было рассчитано четырнадцать показателей, которые составили лонг-лист предикторов для построения моделей. При анализе рассчитанных предикторов была выявлена высокая корреляция между несколькими факторами и резкие выбросы. Первая проблема решалась путем удаления этих предикторов, а вторая - путем взятия квантиля выборки на уровне значимости 0,05. Итоговое количество предикторов составило от 6 до 11, в зависимости от отрасли.
Для прогноза были выбраны следующие модели: логистическая регрессия, деревья решений, случайные леса, методы опорных векторов, k-ближайших соседей и нейронные сети. Горизонт прогнозирования - один год. Качество построенных моделей определялось на основании метрики точности. Для этого была построена матрица классификации размером 2*2, где указывалось количество верноположительных и верноотрицательных ответов. Все расчеты и моделирование были выполнены на языке программирования Python 3.5.
Сравнительный анализ моделей позволил сделать следующие выводы:
1. Наилучшую прогнозную силу показали случайные леса, k-ближайших соседей и нейронные сети.
2. Случайные леса и метод опорных векторов лучше подходят для отрасли обрабатывающего производства, однако последняя модель имеет высокое стандартное отклонение, что говорит об ее узкой специализации на определённой отрасли;
3. Лучшие модели содержат в себе шесть и одиннадцать предикторов;
4. Возраст компании оказал значимое влияние на прогнозную силу только в
традиционных секторах: обрабатывающие производства и строительство;
5. В целом модели показали высокий результат прогнозной силы.
Все поставленные задачи выполнены, цель исследования достигнута.
Предложенные в работе модели могут быть использованы в качестве инструмента диагностики риска банкротства компаний из рассматриваемых секторов экономики РФ. Исследование может быть продолжено далее с целью построения аналогичных моделей для предприятий других секторов российской экономики. В прогнозные модели можно ввести динамику финансовых и нефинансовых показателей деятельности предприятия за несколько лет, факторы внешней среды и некоторые качественные характеристики бизнеса.
Исследование основано на реальных данных из годовых финансовых отчетов о деятельности предприятий за 2019 год по четырём секторам экономики: обрабатывающие производства, строительство, торговля оптовая и розничная, деятельность по операциям с недвижимым имуществом. Выборка сформирована с помощью информационной системы СПАРК, которая содержит информацию по финансовой отчетности российских компаний. На основе полученной выборки предприятий было рассчитано четырнадцать показателей, которые составили лонг-лист предикторов для построения моделей. При анализе рассчитанных предикторов была выявлена высокая корреляция между несколькими факторами и резкие выбросы. Первая проблема решалась путем удаления этих предикторов, а вторая - путем взятия квантиля выборки на уровне значимости 0,05. Итоговое количество предикторов составило от 6 до 11, в зависимости от отрасли.
Для прогноза были выбраны следующие модели: логистическая регрессия, деревья решений, случайные леса, методы опорных векторов, k-ближайших соседей и нейронные сети. Горизонт прогнозирования - один год. Качество построенных моделей определялось на основании метрики точности. Для этого была построена матрица классификации размером 2*2, где указывалось количество верноположительных и верноотрицательных ответов. Все расчеты и моделирование были выполнены на языке программирования Python 3.5.
Сравнительный анализ моделей позволил сделать следующие выводы:
1. Наилучшую прогнозную силу показали случайные леса, k-ближайших соседей и нейронные сети.
2. Случайные леса и метод опорных векторов лучше подходят для отрасли обрабатывающего производства, однако последняя модель имеет высокое стандартное отклонение, что говорит об ее узкой специализации на определённой отрасли;
3. Лучшие модели содержат в себе шесть и одиннадцать предикторов;
4. Возраст компании оказал значимое влияние на прогнозную силу только в
традиционных секторах: обрабатывающие производства и строительство;
5. В целом модели показали высокий результат прогнозной силы.
Все поставленные задачи выполнены, цель исследования достигнута.
Предложенные в работе модели могут быть использованы в качестве инструмента диагностики риска банкротства компаний из рассматриваемых секторов экономики РФ. Исследование может быть продолжено далее с целью построения аналогичных моделей для предприятий других секторов российской экономики. В прогнозные модели можно ввести динамику финансовых и нефинансовых показателей деятельности предприятия за несколько лет, факторы внешней среды и некоторые качественные характеристики бизнеса.
Подобные работы
- АНАЛИЗ И ПРОГНОЗИРОВАНИЕ ФИНАНСОВОЙ НЕСОСТОЯТЕЛЬНОСТИ ФИРМ
Магистерская диссертация, экономика. Язык работы: Русский. Цена: 4985 р. Год сдачи: 2023 - Аналитические алгоритмы формирования оптимальной системы расчетов с дебиторами и ее влияние на финансовое состояние организации
Магистерская диссертация, экономика. Язык работы: Русский. Цена: 4960 р. Год сдачи: 2016



