Библиотека управления

Оценка времени наступления дефолта

Груздев Артем ВладимировичДиректор Исследовательского Центра «Гевисста», специалист по прогнозированию кредитных рисков

Анализ выживаемости Каплана-Мейера — это процедура, позволяющая исследовать время до наступления события. В банковской кредитной практике обычно в качестве такого события рассматривается дефолт клиента.

Руководство банка пытается определить характеристики 700 заемщиков, которые в наибольшей степени влияют на их кредитоспособность. Особый интерес здесь представляет время, когда у клиента начинаются существенные проблемы в погашении кредита, и как оно варьирует, например, от такого фактора, как доход заемщика. Большее время до наступления дефолта рассматривается как лучший показатель.

Мы используем анализ Каплана-Мейера для того, чтобы исследовать «время наступления дефолта» и сравнить надежность заемщиков, сгруппированных по уровню дохода.

Для проведения анализа выбрано стандартное программное обеспечение для проведения исследований — IBM SPSS Statistics 19.0.

Чтобы запустить процедуру Каплан-Мейер:

► Выберите в меню Analyze

Survival

Kaplan-Meier

► Поместите переменную [Время наступления дефолта] в поле Time.

► Поместите переменную [Факт долга] в поле Status.

► Щелкните Define Event.

► Выберите в меню Анализ

Анализ выживаемости или Дожитие

Каплан-Мейер

► Поместите переменную [Время наступления дефолта] в поле Время.

► Поместите переменную [Факт долга] в поле Статус.

► Щелкните Задать событие.

► Введите 1 в качестве значения, указывающего на то, что препарат подействовал.

► Щелкните Continue.

► Введите 1 в качестве значения, указывающего на то, что препарат подействовал.

► Щелкните Продолжить.

► Поместите переменную [Доход] в поле Factor.

► Щелкните Compare Factor.

► Поместите переменную [Доход] в поле Фактор.

► Щелкните Сравнить уровни фактора.

► Выберите Log rank, Breslow и Tarone-Ware.

► Щелкните Continue.

► Щелкните Options в диалоговом окне Kaplan-Meier.

► Выберите Лог-ранг, Бреслоу и Тарон-Вар.

► Щелкните Продолжить.

► Щелкните Параметры в диалоговом окне Каплан-Мейер.

► Выберите Quartiles в поле Statistics.

► Выберите Survival в поле Plots.

► Щелкните Continue.

► Щелкните OK в диалоговом окне Kaplan-Meier.

► Выберите Квартили в поле Статистики.

► Выберите Выживаемость в поле Графики.

► Щелкните Продолжить.

► Щелкните OK в диалоговом окне Каплан-Мейер.

Кривые выживаемости дают визуальное представление о распределении времени дефолта в группах заемщиков.

Кривые выживаемости

Горизонтальная ось показывает время до наступления события. На нашем графике ступеньки кривой выживаемости появляются всякий раз, когда происходит дефолт клиента.

Вертикальная ось показывает вероятность выживаемости.

Таким образом, каждая точка на кривой выживаемости показывает вероятность того, что пациент с данным уровнем дохода, не потерпит дефолт в данном отрезке времени.

Кривая для клиентов с доходом ниже 20 тыс. преимущественно находится ниже всех остальных кривых. Это позволяет предположить, что в данной группе клиентов дефолт происходит быстрее, чем в остальных. Чтобы ответить, являются ли эти различия случайными, взглянем на таблицы сравнений.

Таблица 1. Сравнение средних и медиан времени дефолта в группах

Доход заемщика

Среднее

Медиана

Оценка

Ст. ошибка

95% доверительный интервал

Оценка

Ст. ошибка

95%

доверительный интервал

Нижняя граница

Верхняя граница

Нижняя граница

Верхняя граница

до 20

11,668

1,586

8,559

14,777

11,000

2,448

6,201

15,799

от 21 до 50

19,443

0,986

17,510

21,377

21,000

2,239

16,611

25,389

от 51 до 100

23,719

1,153

21,459

25,980

29,000

4,302

20,569

37,431

свыше 100

27,511

1,970

23,650

31,371

.

.

.

.

Всего

21,267

0,881

19,539

22,994

26,000

2,423

21,251

30,749

Табл. 1 предлагает нам быстро сравнить «типичное» время наступления дефолта для каждой группы клиентов. Для клиентов с доходами от 51 до 100 тыс. и с доходами свыше 100 тыс. границы доверительных интервалов в значительной мере перекрываются и это позволяет нам сказать: маловероятно, что между этими группами существует существенная разница между «средними» значениями времени дефолта. В то же время они не попадают в границы доверительных интервалов для клиентов с доходами до 20 тыс. и с доходами от 21 до 50 тыс.

При этом заметим, что для клиентов с доходами до 20 тыс. и с доходами от 21 до 50 тыс. границы доверительных интервалов вообще не совпадают между собой, таким образом, время наступления дефолта у них совершенно различное.

Таблица 2. Общие сравнения времени дефолта в группах

 

Хи-квадрат

Степени свободы

Значимость

Лог-ранг (Мантель-Кокс)

60,932

3

0,000

Бреслоу (Обобщенный критерий Уилкоксона)

70,983

3

0,000

Тарон-Вар

69,280

3

0,000

В табл. 2 приводятся тесты, в которых проверяется гипотеза, является ли время наступления дефолта в группах одинаковым. Поскольку уровни значимости во всех этих тестах меньше, чем 0.10, мы можем с уверенностью провести различие между кривыми выживаемости.

Выводы

Используя анализ выживаемости Каплана-Мейера, мы исследовали время наступления дефолта для клиентов с различным уровнем дохода. Тесты сравнений показали, что между ними есть статистически значимое различие. При этом, принимая во внимание результаты таблицы сравнений, для проведения дальнейшего анализа можно рекомендовать объединение групп клиентов с доходами от 51 до 100 и свыше 100 в одну «клиенты с доходами свыше 50 тыс.» и более детально оценить кредитоспособность заемщиков с доходом от 21 до 50 тыс., провести альтернативную градацию клиентов с доходом до 50 тыс1.


1 Для самостоятельного проведения анализа можно использовать данные настоящего исследования http://www.sendspace.com/file/5koze9