Системы искусственного интеллекта в разработке корпоративных маркетинговых стратегий
В последние несколько лет наблюдается взрыв интереса к нейронным сетям, и они находят успешное применение в самых различных областях - бизнесе, медицине, технике, геологии, физике.
Нейросети представляют собой математическую структуру, имитирующую некоторые аспекты работы человеческого мозга и демонстрирующие такие его возможности, как способность к неформальному обучению, способность к обобщению и кластеризации неклассифицированной информации, способность самостоятельно строить прогнозы на основе уже предъявленных временных рядов. Самым главным отличием от других методов, например таких, как экспертные системы, является то, что нейросети в принципе не нуждаются в заранее известной модели, а строят ее сами только на основе предъявляемой информации. Именно поэтому нейронные сети и генетические алгоритмы вошли в практику везде, где нужно решать задачи прогнозирования, классификации, управления, иными словами, в области человеческой деятельности, где есть плохо алгоритмизуемые задачи, для решения которых необходима либо постоянная работа группы квалифицированных экспертов, либо адаптивные системы автоматизации, каковыми являются нейронные сети.
На практике нейросети используются в двух видах – как программные продукты, выполняемые на обычных компьютерах, и как специализированные аппаратно-программные комплексы. Основная задача нейрокомпьютеров - обработка образов, основанная на обучении - та же, что и у биологических нейросистем. Подобно биологическим, искусственные нейросети нацелены на параллельную обработку широкополосных образов. В новой схемотехнике, как и в мозгу, отсутствуют общие шины, нет разделения на активный процессор и пассивную память. Вычисления, как и обучение, распределены по всем активным элементам - нейронам, каждый из которых есть элементарный процессор образов, так как производит хотя и простейшую операцию, но сразу над большим количеством входов. Как вычисления, так и обучение полностью параллельны
В случае использования нейросетей в виде программных продуктов встроенный параллелизм нейросетевых алгоритмов не используется. Для многих задач при анализе и обобщении баз данных, особенного быстродействия и не требуется: для них вполне хватает производительности современных универсальных процессоров. В этих приложениях используется исключительно способность нейросетей к обучению, к извлечению скрытых в больших массивах информации закономерностей. Для второй группы приложений – обработки сигналов в реальном времени, параллелизм нейро-вычислений является критическим фактором. В этом сила природных нейрокомпьютеров.
Методы нейронных сетей могут использоваться независимо или же служить прекрасным дополнением к традиционным методам статистического анализа, большинство из которых связано с построением моделей, основанных на тех или иных предположениях и теоретических выводах (например, что искомая зависимость является линейной или что некоторая переменная имеет нормальное распределение). Нейросетевой подход не связан с такими предположениями, он одинаково годится для линейных и сложных нелинейных зависимостей, и особенно эффективен в разведочном анализе данных, когда ставится цель выяснить, имеются ли зависимости между данными переменными. При этом данные могут быть неполными, противоречивыми и даже заведомо искаженными. Если между входными и выходными данными существует какая-то связь, даже не обнаруживаемая традиционными корреляционными методами, то нейронная сеть способна автоматически настроиться на нее с заданной степенью точности. Кроме того, современные нейронные сети обладают дополнительными возможностями: они позволяют оценивать сравнительную важность различных видов входной информации, уменьшать ее объем без потери существенных данных, распознавать симптомы приближения критических ситуаций и т.д.
Иными словами, отличительными свойствами нейросистем являются следующие:
- Любой процесс можно описать в категориях “больше-меньше”, “лучше - хуже” и т.д.;
- Над нечетко заданными переменными можно производить вычисления и получать ответ с заданной степенью точности;
- По сравнению с классическими инструментами данный метод сильно сокращает количество промежуточных вычислений, что существенно, когда принятие решения ограничено жесткими временными рамками;
- При нечетком описании процесса предоставляется возможность не только количественного, но и качественного анализа данных.
Системы, реализующие механизмы нечеткой логики, в коммерческом применении появились сравнительно недавно, но быстро нашли применение в задачах управления и планирования. Так, за последнее время Центром информационных технологий в экономике Российской экономической академии имени Г.В.Плеханова проведен целый ряд работ с использованием нейросетевых технологий в области маркетинга для крупных известных на российском рынке услуг корпоративных структур. В результате получены интересные результаты, отработаны новые корпоративные методики.
Целью одной из работ являлось проведение анализа, оптимизация структуры и содержания анкеты для опроса клиентов, разработанной специалистами крупной компании, работающей на рынке услуг по предоставлению информации. По результатам опроса была проведена сегментация клиентов компании при помощи нейросетевого программного обеспечения.
Ежегодно Компания производит опрос своих клиентов, рассылая им анкеты по почте для самостоятельного заполнения. В текущем году было опрошено более 60% клиентов из всех регионов, с которыми работает компания. Это крупные российские города, столицы стран СНГ.
Перед опросом стояли следующие цели:
- изучение мнений и предпочтений клиентов компании относительно ее продуктов и предоставляемых услуг, особое внимание при этом уделяя постоянным клиентам;
- определение уровня удовлетворения клиентов работой компании и выявление путей и способов совершенствования ее работы;
- установление не удовлетворенных компанией нужд клиентов;
- сравнение продуктов и услуг компании с продуктами и услугами конкурентов;
- определение сильных и слабых сторон компании по сравнению с ее конкурентами;
- определение комплекса мер по совершенствованию работы компании.
Опрос клиентов велся по 12 блокам, содержащим от 2 до 15 групп вопросов каждый, внутри вопросов предлагалось до 28 подвопросов. То есть компанией применялся секционный подход, заключавшийся в том, что последовательно рассматривались вопросы по отдельным темам, до их полного исчерпания с очень высокой степенью детализации.
Тематика блоков вопросов следующая:
- Информация о заполняющем анкету (сфера деятельности и занимаемая должность).
- Использование услуг компании.
- Продукты компании.
- Продажи и установка оборудования.
- Обучение.
- Поддержка.
- Счета и документооборот.
- Группа по работе с источниками информации.
- Общие вопросы.
- Наиболее важные показатели работы компании.
- Сравнение компании с ее конкурентами.
- Замечания и предложения по улучшению качества услуг компании.
Как видно из тематики блоков, вопросы анкеты касались как непосредственных потребителей продуктов и услуг компании (специалистов), так и управленческий персонал организаций - клиентов компании и финансовых структур (счета и документооборот). Анкеты же заполняли, в основном, специалисты. То есть, в анкете не соблюдалось одно из правил составления опросных листов: опрашиваемый должен обладать информацией, о которой его спрашивают.
Вследствие разноплановости и перегруженности анкеты вопросами, специалистами ЦИТЭ РЭА им.Г.В.Плеханова было предложено либо разделить анкету на две, что могло бы затруднить сбор заполненных анкет, но повысить качество заполнения, либо разделить анкету на два блока, заполняемых двумя специалистами из разных подразделений (пользователь продукта или услуги и администратор среднего или высшего уровня, владеющий информацией организационного и финансового характера) с четким разграничением блоков, заполняемых каждым из них в соответствии с имеющимися у них служебными полномочиями.
Вся работа по анализу содержания и оптимизации структуры анкеты была проведена в два этапа: на первом этапе был осуществлен анализ всей анкеты полностью с использованием системы искусственного интеллекта, на втором этапе анкета анализировалась по двум блокам отдельно. В заключение была произведена кластеризация клиентов компании по их отношению к работе компании по различным сферам ее деятельности.
В работе использованы такие возможности нейросетей, как способность их к неформальному обучению, к обобщению и кластеризации неклассифицированной информации, а также отличие их от других методов (экспертных систем, например), которое заключается в том, что нейросети в принципе не нуждаются в заранее известной модели, а строят ее сами только на основе предъявляемой информации. Было использовано так называемое обучение без учителя (или самообучение), когда сеть самостоятельно формирует свои выходы, адаптируясь к поступающим на ее входы сигналам. Способность нейронных сетей самостоятельно выделять наиболее значимые признаки в потоках информации, обучаясь по очень простым локальным правилам, важна не только с общенаучной, но и с практической точки зрения. Для подобных нашему исследованию целей существуют хорошо известные алгоритмы стандартного статистического анализа. В частности, анализ главных компонент также выделяет основные признаки, осуществляя оптимальное линейное сжатие информации. Более того, можно показать, что сжатие информации нейросетями эквивалентно анализу главных компонент. Это и не удивительно, поскольку оба метода оптимальны при одних и тех же ограничениях. Однако стандартный анализ главных компонент дает решение в явном виде, через последовательность матричных операций, а не итерационно, как в случае нейросетевых алгоритмов. Так что при отсутствии высокопараллельных нейроускорителей на практике удобнее пользоваться матричными методами, а не обучать нейросети. Какой же практический смысл применения нами именно нейросетевого алгоритма? Главное - нейроалгоритмы легко обобщаются в случае нелинейного сжатия информации, когда явных решений не существует. С минимальными видоизменениями нейроалгоритмы будут работать, находя оптимальное сжатие при наложенных ограничениях.
Таким образом, нейроалгоритмы были нами использованы как удобный инструмент нелинейного анализа, позволяющий находить способы глубокого сжатия информации и выделения нетривиальных признаков.
В нашем исследовании нейротехнологии позволили выделить из множества вопросов, задаваемых в анкетах, наиболее существенные. После чего стало возможным удалить малозначительные, дублированные и сильно коррелированные между собой вопросы, тем самым упростить анкету и облегчить (а значит, и повысить точность) процесс заполнения анкеты клиентом.
Рис.1 Удаление малозначимых вопросов
На первом этапе основное внимание при проведении нами оценки структуры и содержания анкеты с целью их оптимизации, уделялось значимости каждого вопроса в уровне информативности анкеты в целом, выявление сильно коррелированных между собой вопросов с целью исключения дублирования получения информации. При помощи программного обеспечения Statistica Neural Networks нами проводилась оценка каждого вопроса как носителя информации с точки зрения его вклада в общий объем информации, полученной при заполнении всей анкеты.
Особенно важным достижением проделанной работы являлось выделение наиболее значимых в плане несения информации вопросов, являющихся критериальными определителями работы компании, по которым она должна выбирать направления своего развития и совершенствования текущей работы.
Таким образом, исходя из степени значимости каждого вопроса (данного по четырех бальной системе) в анкете в целом, были даны рекомендации по оставлению и исключению каждого отдельного вопроса в анкете.
Рекомендации по исключению вопроса из анкеты давались лишь в том случае, когда при удалении данного вопроса из анкеты качество и объем полученной информации в результате опроса менялся незначительно, или в случае, когда существует сильная корреляция с другим вопросом и данная информация уже получена.
На втором этапе, приняв за основу результаты проделанной работы по анализу содержания анкеты и выработанные специалистами Центра информационных технологий в экономике РЭА им. Г.В. Плеханова практические рекомендации, были продолжены исследования по оптимизации структуры и содержания анкеты, позволившие выработать новый алгоритм выбора оптимального набора вопросов (из желаемого, предложенного экспертами самой компании), по которому может быть получена вся необходимая для совершенствования практической работы компании с клиентами информации с нахождением минимальной допущенной ошибки и встроенным логическим алгоритмом проверки проделанной работы. Другими словами, нами проверены на практике результаты работы первого этапа, выполнены рекомендации первого этапа и предлагается сжатый комплекс вопросов с минимальной потерей информации при исключении целого перечня вопросов, позволяющий максимально повысить эффективность опроса для поставленных перед ним целей и проверить на практике логику процесса.
Вся работа по второму этапу включала несколько итераций, суть работы заключалась в следующем:
- Учитывая перегруженность анкеты как результат ее большого объема и в соответствии с рекомендациями первого этапа, вся анкета была разделена на два блока вопросов, подлежащих заполнению двумя различными сотрудниками организации - партнера нашей компании, а именно:
I. Блок вопросов, касающихся организации - партнера и продуктов и услуг, использующихся организацией - партнером компании:
1. Вы и Ваша компания
Например: Ваша должность; сфера Вашей деятельности; основная сфера деятельности Вашей компании;
2. Использование Вами услуг нашей компании
Например:
- В течение какого времени Вы пользуетесь услугами нашей компании?
- Как бы Вы оценили свой уровень с точки зрения использования услуг нашей компании?
- Сравните как Вы пользуетесь услугами нашей компании сейчас и год назад?
3. Продукты нашей компании
- Какими продуктами нашей компании Вы пользуетесь?
- Пожалуйста, дайте оценку продуктов (по каждому продукту отдельно) нашей компании по следующим критериям: общая оценка качества по продуктам; другие критерии;
Например:
- Как бы Вы оценили в целом качество продуктов нашей компании?
- Считаете ли Вы, что с нашей компанией легко сотрудничать?
- Считаете ли Вы, что наша компания предлагает технологически прогрессивные продукты?
- Считаете ли Вы, что спектр продуктов нашей компании достаточно широк, чтобы удовлетворить потребности Вашей организации?
- Достаточно ли хорошо наша компания понимает Ваши потребности и удовлетворяет их?
- Как бы Вы оценили соответствие стоимости продуктов нашей компании их качеству?
Например:
- Сколько раз в течение последних 12 месяцев с Вами связывался наш торговый представитель?
- Пожалуйста, дайте Вашу оценку работе торговых представителей по следующим критериям: общая оценка работы торговых представителей; легкость выхода на торговых представителей; доброжелательность и готовность к сотрудничеству; время реагирования; понимание Ваших требований; информирование о новых продуктах и изменениях; и другие…
6. Обучение
Например:
- Проходили ли Вы обучение в нашей компании в течение последних 12 месяцев?
- Пожалуйста, дайте Вашу оценку обучению по следующим критериям: общая оценка обучения; время, затраченное на обучение; качество обучения; компетентность обучающего (знание продукта); компетентность обучающего (знание рынка); доброжелательность и готовность к сотрудничеству обучающего персонала;
7. Сопровождение (поддержка)
Например:
- Обращаетесь ли Вы с вопросами о наших продуктах?
- Дайте Вашу оценку поддержке по следующим критериям: общая оценка ответов на вопросы о продуктах; легкость выхода на персонал; часы обслуживания; доброжелательность и готовность к сотрудничеству; и другие……
8. Счета и документооборот
Например:
Пожалуйста, дайте Вашу оценку работе Администрации продаж по следующим критериям: общая оценка работы Администрации продаж; скорость обработки заказов; Аккуратность в работе с документами; Возможность обращения к конкретному человеку; Скорость решения вопросов; Доброжелательность и готовность к сотрудничеству; Легко ли разобраться в наших счетах;
Данные сводятся в следующую таблицу:
Таблица 1
Анализ анкет с использованием программного обеспечения
Statistica Neural Networks
Код вопроса |
Прогоны данных через систему |
Процент рекомендаций по исключению вопроса |
|||||||||
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
||
БЛОК I |
|||||||||||
БЛОК II |
В табл. 1 по горизонтали приводятся данные 10 прогонов, полученные в результате анализа с использованием программного обеспечения. Проценты оценены по четырех балльной системе (от 1 до 4 в порядке увеличения информативности и значимости вопроса). Единица свидетельствует о малой информационной насыщенности вопроса и рекомендации системы исключить вопрос из перечня. Конечный столбец - процент таких рекомендаций из общего числа; по вертикали - комбинации вопросов, которые дают приблизительно одинаковый объем информации, при этом повышается эффективность опроса за счет исключения лишних вопросов, по которым информация уже получена по другим вопросам, а, следовательно, облегчается процесс заполнения анкет респондентами и улучшается качество заполнения анкет. Нижний абзац по каждому блоку - ошибка каждого прогона, которая возникает при исключении блока вопросов для получения приблизительно равного объема информации.
Таким образом, какая же комбинация вопросов будет оптимальной с точки зрения полученного объема информации и минимальной ошибки? И как логически проверить правильность проделанной работы?
Для ответа на первый вопрос проанализируем изменение среднеквадратической ошибки при поэтапном исключении наименее важных вопросов в соответствии с их процентным значением рекомендации системы об исключении. При этом напомним, что возрастание значения процента свидетельствует о снижении значимости вопроса и 100% говорит о ненасыщенности вопроса информацией и нецелесообразности его сохранения в анкете.
Таблица 2
Анализ среднеквадратической ошибки при исключении вопросов из анкеты
варианты |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
БЛОК I |
|||||||||
Было вопросов до исключения |
90 |
90 |
90 |
90 |
90 |
90 |
90 |
90 |
90 |
Исключено вопросов |
4 |
9 |
9 |
16 |
16 |
18 |
6 |
5 |
3 |
исключены вопросы, % которых в табл. 1 свыше: |
90 |
80 |
70 |
60 |
50 |
40 |
30 |
20 |
10 |
Осталось вопросов |
86 |
77 |
68 |
52 |
36 |
18 |
12 |
7 |
4 |
Среднеквадратическая ошибка |
0,034 |
0,102 |
0,183 |
0,261 |
0,396 |
0,601 |
0,749 |
0,873 |
0,940 |
БЛОК II |
|||||||||
Было вопросов до исключения |
86 |
86 |
86 |
86 |
86 |
86 |
86 |
86 |
86 |
Исключено вопросов |
1 |
1 |
10 |
12 |
14 |
17 |
19 |
6 |
3 |
исключены вопросы, % которых в табл. 1 свыше: |
90 |
80 |
70 |
60 |
50 |
40 |
30 |
20 |
10 |
Осталось вопросов |
85 |
84 |
74 |
62 |
48 |
31 |
12 |
6 |
3 |
Среднеквадратическая ошибка |
0,001 |
0,003 |
0,071 |
0,188 |
0,378 |
0,671 |
0,839 |
0,932 |
0,971 |
Рис. 2. Ошибка вариантов ( для блока I)
Рис. 3. Ошибка вариантов (для блока II).
Таким образом, для каждого блока вопросов может быть выбран оптимальный вариант: для блока 1 оптимальным вариантом является вариант 4 с ошибкой 0,261, до этого варианта график ошибки имеет пологий вид - на этом участке потеря информации при исключении вопросов незначительна, после же варианта 5 характер графика меняется - кривая приобретает вид крутого подъема, при исключении каждого вопроса происходит значительная потеря важной информации, которая может быть получена только по этому вопросу. При выборе данного варианта из 90 вопросов по этому блоку остается 52 вопроса, уровень значимости - до 60%; возможны также варианты 3 и 5. Для блока 2 оптимальным вариантом является вариант 4 (возможны варианты 3 и 5). Но для этого блока характерен иной вид кривой ошибки - она резче меняет характер движения, что говорит о более разнородной (разноплановой) собираемой информации. Произведя подобный анализ, можно получить готовые варианты сочетания вопросов анкеты по блокам.
Для самопроверки при принятии окончательного решения по исключению или оставлению вопроса в анкете, в самой анкете должен существовать встроенный алгоритм проверки, а именно блоки вопросов:
- Что для Вас, как клиента нашей компании, является наиболее важным?
- Как Вы оцениваете качество услуг, оказываемых нашей компанией, по сравнению с услугами других компаний (прямых конкурентов)?
Эти блоки определяют значимость и необходимость детализации вопросов в анкете, во-первых, и сферу совершенствования работы компании по отдельным областям деятельности, во-вторых. Так, например, если клиенты компании особо подчеркивают значимость какого-либо фактора (допустим, более 95% клиентов оценили какой-либо фактор как важный и очень важный), а 35% клиентов считают, что наша компания в сравнении с прямыми конкурентами работает по этому фактору также или хуже, ситуация тревожная для руководителей компании и по основным блокам вопросов (первому и второму) должны быть оставлены вопросы - индикаторы оценки работы компании для отслеживания динамики по этому критерию. А для текущего момента это направление совершенствования работы с клиентами с целью улучшения их отношения к функционированию компании в целом, и по данному критерию, в частности.
В анкете желательно также предусмотреть совмещение этих блоков вопросов. Это позволит проводить ежегодно полномасштабный SWOT-анализ компании (анализ сильных и слабых сторон компании в работе с клиентами, возможностей и угроз), выявлять устойчивые конкурентные преимущества и отслеживать их изменения в динамике для разработки и корректировки текущей корпоративной стратегии работы компании с ее клиентами.
Сравнительный анализ этих двух блоков вопросов может выглядеть следующим образом (табл.3):
Таблица 3
Наиболее важные для клиентов нашей компании факторы в сравнении с конкурентами:
Что для Вас, как клиента нашей компании, является наиболее важным |
Сравните качество услуг нашей компании с услугами наших конкурентов |
|||
Очень важно, важно |
Относительно важно, не важно |
Намного лучше, лучше |
Также, Хуже, намного хуже |
|
1 |
2 |
3 |
4 |
5 |
Фактор 1 |
96% |
4% |
63% |
37% |
Фактор 2 |
96% |
4% |
66% |
34% |
Сопоставление значений второго и пятого столбца дают направления совершенствования работы компании с клиентами. Так, если 94-96% клиентов оценивают какой - либо критерий (фактор) как важный (и очень важный), но в то же время, 30-50% клиентов в графе "Сравнение нашей компании с другими аналогичными" по этому критерию ставят оценку "Также" или "Хуже, намного хуже" - это сигнал для компании, поскольку если клиент не видит по наиболее важным для него критериям у компании конкурентных преимуществ, то он может легко поменять поставщика товаров (или услуг).
Отношение к услугам и продуктам компании конкретных групп клиентов было определено в процессе проведенной нами сегментации (кластеризации анкет), что в дальнейшем позволит компании уточнить стратегию работы с каждой группой клиентов.
При проведении сегментации, нами использовался "альтернативный" подход к сегментации с использованием нейронных сетей, а именно алгоритма Кохонена (построение топографических карт). Такие топографические карты дают наглядное представление о структуре данных в многомерном входном пространстве, геометрию которого мы не в состоянии представить себе иным способом. Визуализация многомерной информации является главным направлением применения карт Кохонена.
Рис. 4. Карты Кохонена
Собрав воедино карты всех интересующих нас признаков, можно получить "топографический атлас", дающий интегральное представление о структуре многомерных данных.
В результате анализа данных опроса клиентов произведена сегментация клиентов компании, выявлены общие и отличительные черты полученных сегментов клиентов компании.
Основным критерием проведенной сегментации явилось отношение каждого сегмента к уровню оказываемых компанией услуг. Из выявленных семи кластеров (от 0 до 6):
- Кластеры 2 и 3 отличались устойчивой положительной оценкой уровня различных предоставляемых услуг и уровня их качества (оценка уровня качества продукта, оценка работы торговых представителей компании, общей компетенции сотрудников, сопровождение продукта, службы поддержки и т.д.);
- В кластерах 4 и 5 преобладают отрицательные, негативные оценки уровня различных предоставляемых услуг;
- Кластеры 0, 1 и 6 характеризовались, в основном, нейтральной оценкой уровня услуг.
Соответственно, для разных сегментов должны быть разработаны различные стратегии работы с клиентами:
- для 2 и 3 - поддерживающая стратегия, обеспечивающая сохранение сложившихся отношений и предпочтений.
- Для кластеров 4 и 5 - требуется усиление внимания компании на работу по негативно оцениваемым вопросам для исправления ситуации. Это наиболее проблемные, "болевые" точки компании. Эти кластеры в случае продолжения работы с ними по принципу "как есть", то есть без значительных изменений, могут быть потеряны для компании, очень велика вероятность перехода клиентов из этих кластеров к конкурентам нашей компании. Список клиентов этих сегментов приведен в приложении 2.
- Для кластеров 0,1 и 6 - совершенствование работы для повышения оценки.
Применение нейротехнологий в разработке и совершенствовании анкет для изучения мнений и предпочтений клиентов компаний, обработке результатов произведенных опросов, а также кластеризации (сегментации) клиентов компании по такому сложному в классическом маркетинге критерию, как отношение к уровню оказываемых организацией услуг, наглядно демонстрирует значительный потенциал использования систем искусственного интеллекта в маркетинге. Полученные результаты и разработанные методики позволят компании более эффективно разрабатывать корпоративные маркетинговые стратегии по работе с клиентами что приведет в будущем к сохранению и расширению клиентской сети, усовершенствованию работы компании с каждой группой клиентов, а значит, повысить степень удовлетворения клиентов уровнем предоставляемых услуг.
Используемая литература:
- С.А.Шумский, А.В. Яровой, О.Л.Зорин, (1999) “Ассоциативный поиск текстовой информации”, Нейроинформатика-99. МИФИ, 1999;
- Широков Ф.В. (1998). “От Менделя до шины VME”, Мир компьютерной автоматизации, №1, 18-26;