Бизнес-эффекты
- уменьшение оттока клиентов за счет превентивных мер
- автоматизация процесса работы с большими данными
- возможность планировать стратегию на основе аналитических данных
Применение
- ритейл
- финансы, страхование
- телеком
- все виды услуг
- продукты, распространяемые по подписке
Проблема “оттока” клиентов стоит остро перед различными поставщиками регулярных услуг, так как привлечение нового клиента, как правило, стоит дороже, чем удержание существующего. Чтобы предсказать потенциальную проблему и предпринять меры по удержанию клиентов можно использовать методы машинного обучения и анализа больших данных.
Решение
Основная проблема, с которой столкнулась команда в процессе работы- наличие большого количества разрозненных таблиц с данными о клиентах, которые необходимо было привести к общему знаменателю, чтобы создать единую базу для последующей аналитики. Далее необходимо было преобразовать исходные “сырые” данные в значимые интегральные показатели, влияющие на вероятность “оттока” абонентов в следующем месяце. Это позволило систематизировать имеющуюся информацию и создать математическую модель, которая будет самостоятельно выявлять появление рисков.
Для выбора наиболее перспективного решения задачи и настройки параметров классификатора проводились обучение и характеризация различных моделей классификатора (KNN, Decision Tree, SVM, Random Forest Classifier, Naive Bayes, Logistic Regression).
Для последующих обучения и валидации ML-модели был подготовлен и сбалансирован специальный набор данных, позволяющий добиться максимальной точности предсказания.
Для выбора наиболее перспективного решения задачи и настройки параметров классификатора проводились обучение и характеризация различных моделей классификатора (KNN, Decision Tree, SVM, Random Forest Classifier, Naive Bayes, Logistic Regression).
Для последующих обучения и валидации ML-модели был подготовлен и сбалансирован специальный набор данных, позволяющий добиться максимальной точности предсказания.
Результат работы
Достигнутая точность классификатора — 75% точность (precision) выявления абонентов склонных к оттоку в следующем месяце.
Дальнейшее развитие разработанной системы предсказания оттока будет состоять в добавлении новых значимых данных об абоненте и переобучении системы с учетом новых данных. В данный момент используются только данные из базы платежной системы, но не учитываются данные по обращениям клиентов в службу поддержки, наличие аварий на линии абонента и др.
Дальнейшее развитие разработанной системы предсказания оттока будет состоять в добавлении новых значимых данных об абоненте и переобучении системы с учетом новых данных. В данный момент используются только данные из базы платежной системы, но не учитываются данные по обращениям клиентов в службу поддержки, наличие аварий на линии абонента и др.


