Оценка времени наступления дефолта
Анализ выживаемости Каплана-Мейера — это процедура, позволяющая исследовать время до наступления события. В банковской кредитной практике обычно в качестве такого события рассматривается дефолт клиента.
Руководство банка пытается определить характеристики 700 заемщиков, которые в наибольшей степени влияют на их кредитоспособность. Особый интерес здесь представляет время, когда у клиента начинаются существенные проблемы в погашении кредита, и как оно варьирует, например, от такого фактора, как доход заемщика. Большее время до наступления дефолта рассматривается как лучший показатель.
Мы используем анализ Каплана-Мейера для того, чтобы исследовать «время наступления дефолта» и сравнить надежность заемщиков, сгруппированных по уровню дохода.
Для проведения анализа выбрано стандартное программное обеспечение для проведения исследований — IBM SPSS Statistics 19.0.
Чтобы запустить процедуру Каплан-Мейер:
► Выберите в меню Analyze ► Survival ► Kaplan-Meier ► Поместите переменную [Время наступления дефолта] в поле Time. ► Поместите переменную [Факт долга] в поле Status. ► Щелкните Define Event. |
► Выберите в меню Анализ ► Анализ выживаемости или Дожитие ► Каплан-Мейер ► Поместите переменную [Время наступления дефолта] в поле Время. ► Поместите переменную [Факт долга] в поле Статус. ► Щелкните Задать событие. |
► Введите 1 в качестве значения, указывающего на то, что препарат подействовал. ► Щелкните Continue. |
► Введите 1 в качестве значения, указывающего на то, что препарат подействовал. ► Щелкните Продолжить. |
► Поместите переменную [Доход] в поле Factor. ► Щелкните Compare Factor. |
► Поместите переменную [Доход] в поле Фактор. ► Щелкните Сравнить уровни фактора. |
► Выберите Log rank, Breslow и Tarone-Ware. ► Щелкните Continue. ► Щелкните Options в диалоговом окне Kaplan-Meier. |
► Выберите Лог-ранг, Бреслоу и Тарон-Вар. ► Щелкните Продолжить. ► Щелкните Параметры в диалоговом окне Каплан-Мейер. |
► Выберите Quartiles в поле Statistics. ► Выберите Survival в поле Plots. ► Щелкните Continue. ► Щелкните OK в диалоговом окне Kaplan-Meier. |
► Выберите Квартили в поле Статистики. ► Выберите Выживаемость в поле Графики. ► Щелкните Продолжить. ► Щелкните OK в диалоговом окне Каплан-Мейер. |
Кривые выживаемости дают визуальное представление о распределении времени дефолта в группах заемщиков.
Кривые выживаемости
Горизонтальная ось показывает время до наступления события. На нашем графике ступеньки кривой выживаемости появляются всякий раз, когда происходит дефолт клиента.
Вертикальная ось показывает вероятность выживаемости.
Таким образом, каждая точка на кривой выживаемости показывает вероятность того, что пациент с данным уровнем дохода, не потерпит дефолт в данном отрезке времени.
Кривая для клиентов с доходом ниже 20 тыс. преимущественно находится ниже всех остальных кривых. Это позволяет предположить, что в данной группе клиентов дефолт происходит быстрее, чем в остальных. Чтобы ответить, являются ли эти различия случайными, взглянем на таблицы сравнений.
Таблица 1. Сравнение средних и медиан времени дефолта в группах
Доход заемщика |
Среднее |
Медиана | ||||||
Оценка |
Ст. ошибка |
95% доверительный интервал |
Оценка |
Ст. ошибка |
95% доверительный интервал | |||
Нижняя граница |
Верхняя граница |
Нижняя граница |
Верхняя граница | |||||
до 20 |
11,668 |
1,586 |
8,559 |
14,777 |
11,000 |
2,448 |
6,201 |
15,799 |
от 21 до 50 |
19,443 |
0,986 |
17,510 |
21,377 |
21,000 |
2,239 |
16,611 |
25,389 |
от 51 до 100 |
23,719 |
1,153 |
21,459 |
25,980 |
29,000 |
4,302 |
20,569 |
37,431 |
свыше 100 |
27,511 |
1,970 |
23,650 |
31,371 |
. |
. |
. |
. |
Всего |
21,267 |
0,881 |
19,539 |
22,994 |
26,000 |
2,423 |
21,251 |
30,749 |
Табл. 1 предлагает нам быстро сравнить «типичное» время наступления дефолта для каждой группы клиентов. Для клиентов с доходами от 51 до 100 тыс. и с доходами свыше 100 тыс. границы доверительных интервалов в значительной мере перекрываются и это позволяет нам сказать: маловероятно, что между этими группами существует существенная разница между «средними» значениями времени дефолта. В то же время они не попадают в границы доверительных интервалов для клиентов с доходами до 20 тыс. и с доходами от 21 до 50 тыс.
При этом заметим, что для клиентов с доходами до 20 тыс. и с доходами от 21 до 50 тыс. границы доверительных интервалов вообще не совпадают между собой, таким образом, время наступления дефолта у них совершенно различное.
Таблица 2. Общие сравнения времени дефолта в группах
|
Хи-квадрат |
Степени свободы |
Значимость |
Лог-ранг (Мантель-Кокс) |
60,932 |
3 |
0,000 |
Бреслоу (Обобщенный критерий Уилкоксона) |
70,983 |
3 |
0,000 |
Тарон-Вар |
69,280 |
3 |
0,000 |
В табл. 2 приводятся тесты, в которых проверяется гипотеза, является ли время наступления дефолта в группах одинаковым. Поскольку уровни значимости во всех этих тестах меньше, чем 0.10, мы можем с уверенностью провести различие между кривыми выживаемости.
Выводы
Используя анализ выживаемости Каплана-Мейера, мы исследовали время наступления дефолта для клиентов с различным уровнем дохода. Тесты сравнений показали, что между ними есть статистически значимое различие. При этом, принимая во внимание результаты таблицы сравнений, для проведения дальнейшего анализа можно рекомендовать объединение групп клиентов с доходами от 51 до 100 и свыше 100 в одну «клиенты с доходами свыше 50 тыс.» и более детально оценить кредитоспособность заемщиков с доходом от 21 до 50 тыс., провести альтернативную градацию клиентов с доходом до 50 тыс1.
1 Для самостоятельного проведения анализа можно использовать данные настоящего исследования http://www.sendspace.com/file/5koze9