Персонализация предложений на основе поведенческих паттернов: кейс-разбор внедрения AI-рекомендаций в e-commerce
Компания с 80 000 активных пользователей в каталоге запустила новый блок рекомендаций — и через три месяца получила падение среднего чека на 12%. Причина оказалась не в алгоритме, а в том, что персонализация предложений строилась на истории покупок, а не на поведенческих паттернах сессии…
Почему классическая персонализация по истории покупок перестала работать
Большинство движков рекомендаций, установленных три-четыре года назад, работают по одной логике: пользователь купил X — покажи ему Y из той же категории или «похожие товары». Это коллаборативная фильтрация в чистом виде, и она исчерпала себя в высококонкурентных нишах. Проблема в том, что история покупок описывает прошлое намерение, а не текущее. Человек, который купил велосипед в апреле, в октябре ищет зимнюю куртку — и блок «вам также понравится» с велоаксессуарами только раздражает.
Поведенческий паттерн сессии — принципиально другой сигнал. Он отвечает на вопрос: что пользователь делает прямо сейчас? Сколько времени провёл на карточке товара, какие фильтры применял, с какого устройства зашёл, в какое время суток — всё это в совокупности формирует контекст намерения с точностью, недостижимой для исторических данных. Именно переход от «кто этот пользователь» к «что он хочет в этот момент» и есть суть современной персонализации предложений.
Этап 1. Аудит сигналов: что собирать и зачем
Перед тем как обучать модель, необходимо провести инвентаризацию доступных поведенческих сигналов. На практике компании недооценивают половину из них. Вот минимальный набор, который даёт результат: глубина скролла на карточке товара, время на странице (с учётом активности курсора, а не просто таймера), последовательность просматриваемых категорий за сессию, брошенная корзина с конкретными позициями, применённые фильтры цены и характеристик, источник трафика и UTM-метки.
На этом этапе важно разделить сигналы по силе намерения. Сильные: добавление в корзину, сравнение товаров, повторный заход на карточку. Слабые: первичный просмотр категории, случайный клик. Типичная ошибка — взвешивать все события одинаково. В нашем кейсе после аудита выяснилось, что клиент собирал 14 типов событий, но в модель передавал только 3. После включения сигнала «повторный просмотр карточки в той же сессии» точность рекомендаций выросла на 18% ещё до переобучения модели.
Ориентировочные трудозатраты этапа: 2–3 недели для команды из аналитика данных и backend-разработчика. Результат — документированная карта событий с приоритетами и техническое задание на доработку трекинга.
Этап 2. Архитектура модели: гибридный подход вместо одного алгоритма
Один из главных выводов, к которым приходят команды после первых экспериментов: ни одна модель не работает одинаково хорошо на всём каталоге. Новые пользователи без истории, лояльные покупатели с богатым профилем и гости из рекламы — это три разных задачи. Гибридная архитектура решает их параллельно: контентная фильтрация для новых пользователей, коллаборативная для повторных, сессионная нейронная сеть (session-based neural network) для всех в режиме реального времени.
Сессионная модель — ключевой элемент для персонализации предложений по паттернам. Архитектура на основе трансформеров (аналог attention-механизма, применённого к последовательности событий сессии) позволяет предсказывать следующее намерение пользователя с учётом порядка действий, а не просто их набора. Проще говоря: если пользователь сначала смотрел бюджетные варианты, потом перешёл к премиальным — модель видит этот «сдвиг» и адаптирует выдачу.
В рамках описываемого кейса переход на гибридную архитектуру занял около 6 недель разработки (команда из 2 ML-инженеров). Инфраструктурно потребовалось добавить потоковую обработку событий — Apache Kafka или аналог — чтобы модель получала сигналы с задержкой не более 2–3 секунд.
Этап 3. A/B-тест и метрики: на что смотреть, чтобы не обмануть себя
Здесь кроется главная ловушка продуктовых экспериментов с рекомендациями. Самая распространённая ошибка — измерять CTR блока рекомендаций как основную метрику. Высокий CTR при низкой конверсии в покупку означает, что алгоритм хорошо привлекает внимание, но показывает нерелевантное. В нашем кейсе стартовый CTR у новой модели был на 8% ниже контрольной группы — но конверсия в заказ оказалась выше на 23%, а средний чек — на 17%. Это и был тот результат, ради которого всё затевалось.
Правильный набор метрик для оценки персонализации предложений: конверсия в покупку из блока рекомендаций, средний чек пользователей, взаимодействовавших с блоком, доля повторных покупок в 30-дневном окне, время до покупки (сокращение цикла принятия решения). Дополнительно — метрика разнообразия рекомендаций (coverage): если модель показывает одни и те же 5% каталога всем пользователям, это сигнал переобучения.
Минимальный срок A/B-теста для статистической значимости при 80 000 активных пользователей — 3 недели. Разбивайте аудиторию не по случайному ID, а по когортам с учётом частоты визитов: иначе «тяжёлые» пользователи исказят результаты контрольной группы.
Результаты и масштабирование: что получилось в цифрах
После полного цикла внедрения (аудит сигналов → разработка гибридной модели → A/B-тест → продуктовый релиз) итоговые ориентиры по проекту выглядели следующим образом: рост конверсии из блока рекомендаций — плюс 28–35%, увеличение среднего чека — плюс 15–20%, снижение bounce rate на карточках товара — минус 11%. Эти цифры реалистичны для среднего e-commerce при корректно выстроенной архитектуре; результаты в нишах с коротким циклом принятия решений (FMCG, цифровые товары) могут быть выше.
Важный момент масштабирования: персонализация предложений не заканчивается на блоке «похожие товары». Следующий шаг — перенос логики в email-триггеры, push-уведомления и динамические баннеры на главной. В каждом канале сессионный контекст работает по-разному, и модели нужно дообучать отдельно. Это не удваивает, но заметно увеличивает объём работ — закладывайте это в роадмап заранее.