2.6.1. Содержание и возможности использования нейронных сетей при оценке кредитоспособности заемщика

Первые попытки искусственно воспроизвести функции биологических нейронов были предприняты в 40-е годы XX в. Успехи, достигнутые в 50—60-е годы при моделировании решения задач распознавания образов с помощью простейших НС — однослойных персептронов, стимулировали попытки использовать их в самых разнообразных практических приложениях. Однако на рубеже 70-х годов XX в. стало ясно, что однослойные персептроны не в состоянии воспроизвести решение некоторых простейших задач. Вследствие этого до середины 80-х годов в основном шло теоретическое изучение искусственных НС. Новый и гораздо более мощный всплеск практического интереса к НС, наблюдаемый в последние годы, связан с разработкой алгоритмов создания и обучения многослойных НС, а также с появлением элементной базы, позволяющей конструировать аппаратные модели таких сетей.

Довольно длительное время основной областью приложений НС был военно-промышленный комплекс. Однако широкие возможности решения банковских и финансовых задач привели к тому, что ряд крупных разработчиков НС занялся созданием систем, нацеленных на решение исключительно банковских проблем. Применительно к банковской сфере можно выделить следующие основные группы задач, решаемых посредством НС:

прогнозирование временных рядов (курсов акций, валютных курсов и т.д.);

анализ и выявление аномалий в поведении объекта (обнаружение злоупотреблений в сфере пластиковых карт);

распознавание подписи клиента;

классификация заемщиков в зависимости от значения кредитного риска.

Мы уже говорили, что основным показателем кредитоспособности заемщика является его кредитный рейтинг. Процесс присвоения кредитного рейтинга заключается в переходе от группы показателей, в основном финансовых, к единственному интегрированному значению — рейтингу. Инструментом такого перехода в большинстве случаев служит уравнение линейной зависимости. При этом веса показателей, участвующих в расчете рейтинга, устанавливаются банками на субъективной основе. Такая практика, как уже отмечалось, искажает результаты анализа и чрезвычайно рискованна. Именно неудовлетворенность возможностями традиционных методов статистики и неплохие результаты, полученные в данной области с помощью НС, позво-ляют сделать вывод о появлении нового инструмента оценки кредитоспособности заемщика. Некоторые считают, что мы переживаем период перехода от сравнительно слабого использования научных методов в банковской сфере к такому положению дел, когда научные методы будут определять сам характер банковского дела. При этом ключевая роль отводится использованию НС.

В 1993 г. в Европе для изучения возможностей применения НС при оценке кредитного риска была создана организация «Equifax Europe New Technology Club». Анализ существующих программных продуктов по НС показал, что некоторые из них позволяют добиться гораздо более высоких результатов, чем в случае применения традиционных методов анализа.

В российской банковской практике НС почти не используются, а мировой опыт сосредоточен в области оценки кредитного риска по заемщикам — физическим лицам.

Идея НС родилась в ходе исследований в области искусственного интеллекта, а именно в результате попыток воспроизвести способность биологических нервных систем обучаться и исправлять ошибки, моделируя структуру человеческого мозга. Мозг состоит из очень большого числа нейронов, соединенных многочисленными связями. Нейроны — специальные клетки, способные распространять электрохимические сигналы.

Нейрон имеет разветвленную структуру ввода информации (ден- дриты), ядро и разветвляющийся выход (аксон) (рис. 2.4). Аксоны клетки соединяются с дендритами других клеток с помощью синапсов. При активации нейрон посылает электрохимический сигнал по своему аксону. Через синапсы этот сигнал достигает других нейронов, которые могут в свою очередь активироваться. Нейрон активируется тогда, когда суммарный уровень сигналов, пришедших в его ядро из дендритов, превысит определенный уровень (порог активации). Интенсивность сигнала, получаемого нейроном, и, следовательно, возможность его активации зависят от активности синапсов.

Таким образом, будучи построен из очень большого числа простых элементов (каждый из которых берет взвешенную сумму входных сигналов и в случае если суммарный вход превышает определенный уровень, передает сигнал дальше), мозг способен решать чрезвычайно сложные задачи.

Алгоритм работы искусственных НС практически копирует сущность биологических нейронных систем. Искусственный нейрон получает сигналы через несколько входных каналов. Каждый входной сигнал проходит через соединение (синапс), имеющее определенную интенсивность (вес). Текущее состояние нейрона определяется как взвешенная сумма его входов:

Совокупность нейронов, соединенных таким образом, что выходной сигнал одного нейрона служит входной информацией другого нейрона, представляет собой многослойную НС.

Как правило, НС используется тогда, когда между известными входными значениями и неизвестными выходами существует связь, но не известен точный тип связи. Особенность НС состоит в том, что зависимость между входом и выходом находится в процессе обучения сети. Для обучения НС применяют алгоритмы двух типов: управляемое (обучение с учителем) и неуправляемое (обучение без учителя). Для управляемого обучения сети нужно подготовить набор обучающих данных. Эти данные представляют собой наборы входных данных и соответствующих им выходов. НС учится устанавливать связь между первыми и вторыми. Обычно обучающие данные берутся из исторических сведений. В качестве инструмента обучения может быть использован один из нескольких алгоритмов. Если сеть обучена хорошо, она приобретает способность моделировать неизвестную функцию, связывающую значения входных и выходных переменных, и впоследствии такая НС используется для прогнозирования ситуации, когда выходные значения не известны.

Задача обучения заключается в эмпирическом нахождении нели-нейной зависимости между исходными показателями и результатом, т.е. нахождении такого типа функции у = ?(5), которая максимально точно отражала бы взаимосвязь рассматриваемых показателей. Переменная 5 в данном случае представляет собой значение нейрона, которое, как показано ранее, определяется произведением величины входа X (исходные показатели обучения) и веса нейрона т. Другими словами, в процессе обучения анализируется уравнение У = где X,- и У — переменные, значения которых известны, а значения подлежат определению. Обучение НС происходит с помощью так называемых наблюдений. В процессе первого наблюдения НС, обладая способностью обнаруживать зависимости, самостоятельно устанавливает первоначальные значения ъох. Эти значения подставляются в формулу ^ЕХуа;,), и полученная в результате функция определяет величину результирующего показателя У. Рассчитанная величина У сравнивается с реальной величиной показателя выхода из обучающего набора данных, и вычисляется отклонение между этими показателями. Если отклонение велико, то проводится еще одно аналогичное наблюдение, т.е. сначала корректировка веса тю, потом расчет функции ^ЕХ,^,), затем определение нового значения У и его сравнение с реальным показателем. Наблюдения повторяются до тех пор, пока ошибка расчета У не станет близка к нулю. Считается, что по мере проведения наблюдений НС все ближе и ближе приближается к нахождению нужного типа связи.

Применительно к анализу кредитоспособности заемщика обучение НС происходит следующим образом: имеется совокупность пред-приятий с уже присвоенными кредитными рейтингами. Этим рейтингам соответствуют значения количественных и качественных показателей, содержащиеся в кредитном досье. В процессе наблюдений НС вычисляет вес каждого показателя, учитывающегося при расчете кредитного рейтинга. Полученные значения весов корректируются до тех пор, пока рассчитываемые с помощью этих весов кредитные рейтинги всей исходной совокупности заемщиков не совпадут с заданными значениями. В этом случае ошибка обучения будет сведена к нулю, а НС воспроизведет точный тип связи между показателями деятельности заемщика и его кредитным рейтингом.

Процесс решения задачи с помощью НС начинается со сбора данных для обучения. Обучающий набор данных представляет собой уже известную информацию, для которой указаны значения входящих и выходящих переменных. Выбор переменных, по крайней мере пер-воначальный, может осуществляться интуитивно. На первом этапе рас-сматривается вся совокупность переменных, которые способны оказывать влияние на результат. Затем это множество сокращается.

Ранее мы показали, что оценка кредитоспособности проводится на основе всестороннего анализа деятельности заемщика. Это, например, и расчет финансовых коэффициентов, и определение величины денежного потока, и учет отраслевых особенностей деятельности, макроэкономического положения в стране. Совокупность такой информации о деятельности заемщика и представляет собой набор входящих переменных. Такому набору данных соответствуют уже рассчитанные значения кредитных рейтингов, т.е. выходящие переменные.

НС работают с числовыми данными без ограничений. Более трудной задачей является работа с данными нечислового характера. Чаще всего нечисловые данные бывают представлены в виде номинальных переменных типа Пол = (Мужской, Женский). В таком случае номинальные переменные преобразуются в числовую форму. Это позволяет НС учитывать факторы, которые не поддаются описанию другими статистическими методами.

Вопрос о том, какие данные взять в качестве входных для НС,— один из самых сложных. Это объясняется несколькими причинами. Во-первых, при решении реальных задач часто неизвестно, как прогнозируемый показатель связан с имеющимися данными. Поэтому собираются разнообразные данные в больших объемах; среди этих данных предположительно есть и важные, и такие, ценность которых не известна и сомнительна. Во-вторых, в задачах нелинейной природы среди параметров могут быть взаимозависимые и избыточные. Например, каждый из двух параметров может сам по себе ничего не значить, но вместе они несут чрезвычайно важную информацию. Поэтому попытки ранжировать параметры по степени значимости могут оказаться неправильными. И наконец, иногда лучше просто убрать некоторые переменные, в том числе несущие значимую информацию, чтобы уменьшить число входных переменных, а значит, и сложность задачи, и размеры сети.

Проблема значительного усложнения расчетов за счет незначительного увеличения числа входящих переменных получила название «проклятие размерности».

Единственный способ получить гарантию того, что входящие данные выбраны наилучшим образом,— перепробовать все возможные варианты входных наборов и выбрать наилучший. На практике сделать это невозможно из-за огромного количества вариантов. Одно из действенных средств решения вопроса — генетический алгоритм отбора входных данных. Этот алгоритм выполняет большое число экспериментов с различными комбинациями входных данных, строит для каждой из них вероятностную сеть, оценивает ее результаты и использует их в дальнейшем поиске наилучшего варианта.

Поскольку процесс понимания работы генетического алгоритма очень важен, обратимся к эволюционной теории естественного отбора, служащей начальной точкой отсчета в данном вопросе. Суть естественного отбора состоит в том, что наиболее приспособленные особи лучше выживают, чем менее приспособленные, причем признаки и свойства следующего поколения наследуются от предыдущего. Основной носитель наследственной информации — хромосома, состоящая из определенного числа генов. Каждый отдельный ген отвечает за определенное свойство. Процесс появления новых хромосом носит название «кроссовер». При кроссовере нити хромосом разрываются в нескольких случайных местах и затем обмениваются частями. Таким образом изменяется состав генов, входящих в хромосому. Второй важный фактор, влияющий на наследственность,— мутации, которые выражаются в изменении некоторых участков хромосом. Мутации также случайны и могут быть вызваны разными факторами.

Итак, естественный отбор гарантирует, что наиболее приспособленные особи дадут достаточно большое потомство, а благодаря генетическому наследованию часть этого потомства не только сохранит высокую приспособленность родителей, но и будет обладать некоторыми новыми свойствами. Если эти новые свойства окажутся полезными, то с большой вероятностью они перейдут и в следующее поколение. Таким образом происходят накопление полезных качеств и постепенное повышение приспособляемости биологического вида в целом. Зная, как решается задача оптимизации видов в природе, можно применить данный метод при решении реальных задач.

Ранее было показано, что нейронные сети изучают функцию Х2,Хп), где XI — совокупность входящих параметров явления. В генетическом алгоритме хромосома — это совокупность параметров одного наблюдения, т.е. некоторый числовой вектор, а набор хромосом определяет решение задачи. Какие именно векторы следует рассматривать при решении конкретной задачи, определяет пользователь. Далее работа генетического алгоритма заключается в том, что посредством операций кроссовера и мутации модифицируются параметры, составляющие вектор наблюдения. В простейшем случае кроссовер в генетическом алгоритме реализуется так же, как в биологии. Как мы говорили, хромосомы разрываются в случайной точке и обмениваются частями. Так, если хромосомы (а, Ь, с, (1, ё) и (0, 0, 0, 0, 0) разрезать между третьим и четвертым генами и обменять их части, то получится следующее поколение: (я, Ь} с, 0, 0) и (0, 0, 0, (1, ё). В генетическом алгоритме сохраняется основной принцип естественного отбора: чем информативнее значение вектора (хромосомы), тем с большей вероятностью он будет участвовать в кроссовере. Мутация вектора состоит в случайном изменении одного из его показателей. Затем старая популяция частично или полностью уничтожается и рассматривается следующее поколение. Популяция следующего поколения содержит столько же хромосом, но в силу отбора их информативность становится выше. В каждом новом поколении наблюдается возникновение совершенно новых решений поставленной задачи и число «хороших» решений будет возрастать.

Вопрос о том, сколько наблюдений нужно иметь для достоверного обучения сети, часто оказывается непростым. Известен ряд правил, увязывающих число необходимых наблюдений с размерами сети. Простейшее правило гласит, что число наблюдений должно быть в 10 раз больше числа связей в сети. На самом деле это число зависит также от сложности отображения, которое НС стремится воспроизвести. С ростом количества переменных количество требуемых наблюдений возрастает нелинейно, так что уже при довольно небольшом числе переменных, например 50, может потребоваться огромное число наблюдений. Для большей части реальных задач, как правило, достаточно несколько сотен наблюдений. Если есть меньший набор данных, то полученной информации будет недостаточно для правильного обучения сети. В любом случае количество наблюдений определяется для каждой НС индивидуально на основе величины ошибки рассчитанного и заданного выходящего показателя.

Большое значение для эффективного использования НС имеет выбор архитектуры сети. Многослойная НС (многослойный персеп- трон), описанная в начале параграфа, используется наиболее часто.

Каждый элемент такой сети строит взвешенную сумму своих входов, затем пропускает эту величину активации через передаточную функцию, и таким образом получается выходное значение этого элемента. Элементы организованы послойно с прямой передачей сигнала. Такую сеть легко интерпретировать как модель «вход — выход», в которой свободными параметрами являются веса и пороговые значения. Сеть подобной структуры может моделировать функцию практически любой степени сложности, причем число слоев и число элементов в каждом слое определяют сложность функции.

После того как определено число слоев и элементов НС, нужно найти значения для весов и порогов сети, которые бы минимизировали ошибку прогноза, выдаваемого сетью. Именно для этой цели служат алгоритмы обучения. С помощью собранных исторических данных веса и пороговые значения автоматически корректируются с целью минимизировать ошибку. В упрощенном виде этот процесс представляет собой подгонку модели НС к имеющимся обучающим данным. Ошибка для конкретной конфигурации сети определяется путем прогона через сеть всех имеющихся наблюдений и сравнения реально выдаваемых выходных значений с целевыми. Такие разности суммируются в функцию ошибки, значение которой и есть ошибка сети. Чаще всего для построения функции ошибки все ошибки выходных элементов для всех наблюдений возводятся в квадрат и затем суммируются. Самый известный способ обучения НС — алгоритм обратного распространения.

По завершении процесса обучения сети можно сделать вывод о том, что НС установила существующие зависимости между переменными. Тогда на вход сети подаются данные наблюдения, сущность которого нужно оценить. В задаче классификации сеть относит каждое новое наблюдение к одному из нескольких классов.

Высокие результаты работы НС объясняются следующими свойствами нейросети:

способностью к полной обработке информации. Большая часть известных задач решается при помощи НС. Это достигается за счет ассоциативности сети, способности к классификации, обобщению и абстрагированию;

самоорганизацией. В процессе работы НС самостоятельно или под воздействием внешней среды обучается решению разнообразных задач. Нейросеть формирует алгоритм своей деятельности, уточняя и усложняя его в течение времени;

обучаемостью. В процессе обучения НС выявляет нелинейные зависимости между переменными, и на основе такого знания строит свой прогноз;

¦ параллельностью обработки информации. Каждый нейрон формирует свой выход только на основе своих входов и собственного внутреннего состояния под воздействием некоторой функции активации.

Таким образом, теоретические разработки в области нейронных сетей показали возможность использования НС в качестве надежного и действенного инструмента анализа и прогнозирования социально- экономических явлений, в том числе в сфере расчета кредитных рисков индивидуальных заемщиков — физических лиц.

Как уже было показано, процесс анализа кредитоспособности заемщика, другими словами, присвоение кредитного рейтинга, заключается в переходе от нескольких показателей к интегрированному значению — кредитному рейтингу. В течение последних 50 лет в литературе по данной тематике, а также в банковской практике сложилось устойчивое представление о существовании линейной зависимости между кредитным рейтингом и показателями, характеризующими деятельность заемщика. Такое положение приводит к тому, что методики, используемые коммерческими банками при оценке кредитоспособности заемщика, субъективны, не отражают достоверно и в полной мере экономическое положение анализируемого предприятия. Гипотезы о нелинейной зависимости показателей долгое время не могли быть рассмотрены на практике в связи с отсутствием необходимого инструментария. Появление нейронных сетей позволяет открыть новые перспективы в этой области. В данном параграфе речь идет о возможности использования механизма НС для эффективной оценки кредитоспособности заемщика.

При определении кредитного рейтинга предприятия воспользуемся многослойной нейронной сетью. На этапе обучения на вход НС будем подавать информацию, характеризующую экономическую деятельность заемщика. Такая информация может быть основана на уже существующих кредитных досье коммерческого банка. В качестве выходящей информации, необходимой для обучения НС, используются уже рассчитанные на основании входящих показателей кредитные рейтинги. В процессе обучения НС выявляет нелинейные зависимости между показателями и рейтингом. Обучение НС происходит по методу обратного распространения ошибки. Цель обучения состоит в минимизации ошибок при присвоении кредитных рейтингов заданной совокупности предприятий. Обучение идет до тех пор, пока веса показателей, а следовательно, и функция связи показатели — рейтинг не «научится правильно» классифицировать предприятия, т.е. пока рассчитанные НС рейтинги не будут совпадать с заданными. После завершения обучения на вход НС будем подавать информацию ана-логичного формата, по которой необходимо определить значение кре-дитного рейтинга.

Свои расчеты мы делаем с использованием компьютерной программы «STATISTICA Neural Networks». Алгоритм работы НС, как уже отмечалось, состоит из двух этапов:

обучение НС на основании уже имеющейся совокупности показателей и присвоенных кредитных рейтингов;

использование обученной НС с найденной функцией зависимости «показатели — кредитный рейтинг» для рейтинговой оценки будущих заемщиков.

<< | >>
Источник: О.И. Лаврушин, О.Н. Афанасьева, С.Л. Корниенко. БАНКОВСКОЕ ДЕЛО: СОВРЕМЕННАЯ СИСТЕМА КРЕДИТОВАНИЯ.. 2007

Еще по теме 2.6.1. Содержание и возможности использования нейронных сетей при оценке кредитоспособности заемщика:

  1. 2.6 НЕЙРОННАЯ СЕТЬ КАК ИНСТРУМЕНТ ОЦЕНКИ КРЕДИТОСПОСОБНОСТИ ЗАЕМЩИКА
  2. 2.6.3. Использование обученной нейррнной сети для оценки кредитоспособности заемщика
  3. 2.5.2. Перспективы использования внутренней рейтинговой системы (IRВ) для оценки кредитного риска и кредитоспособности заемщика в России
  4. 2.5.1. Перспективы использования стандартизированного метода оценки кредитного риска и кредитоспособности заемщика в России
  5. 2.2 СОВРЕМЕННЫЕ МЕТОДЫ ОЦЕНКИ КРЕДИТОСПОСОБНОСТИ ЗАЕМЩИКА
  6. 4.4.1 ОЦЕНКА КРЕДИТОСПОСОБНОСТИ ПОТЕНЦИАЛЬНОГО ЗАЕМЩИКА
  7. 10.4. Оценка кредитоспособности банковских заемщиков
  8. 2.1 КРИТЕРИИ И ПОКАЗАТЕЛИ ОЦЕНКИ КРЕДИТОСПОСОБНОСТИ ЗАЕМЩИКА В СИСТЕМЕ МИНИМИЗАЦИИ КРЕДИТНОГО РИСКА
  9. 2.5 ОЦЕНКА КРЕДИТОСПОСОБНОСТИ ЗАЕМЩИКА В КОНТЕКСТЕ НОВЫХ ТРЕБОВАНИЙ БАЗЕЛЬСКОГО КОМИТЕТА ПО БАНКОВСКОМУ НАДЗОРУ
  10. 9.2.2. Анализ денежного потока как способ оценки кредитоспособности заемщика
  11. 2.1.3. Современные тенденции использования кредитного рейтинга как основного показателя кредитоспособности заемщика
  12. 2.2.4. Анализ денежного потока как инструмент оценки кредитоспособности заемщика
  13. 20.5. Оценка финансовой состоятельности и кредитоспособности заемщика
  14. 10.4.1. Оценка кредитоспособности банковских заемщиков на основе финансовых коэффициентов
  15. ГЛАВА 2 СОВРЕМЕННАЯ ПРАКТИКА И НОВЫЕ ЯВЛЕНИЯ В ОЦЕНКЕ КРЕДИТОСПОСОБНОСТИ ЗАЕМЩИКА