Как автоматизировать клиентский сервис с помощью ИИ: разбор кейса по этапам
Компания из сферы B2B-логистики обрабатывала 1 200 входящих обращений в сутки: запросы по статусам доставки, претензии, уточнение условий договора. Семь операторов работали в две смены, средняя скорость первого ответа — 18 минут, уровень удовлетворённости клиентов (CSAT) держался на отметке 61%…
Этап 1. Аудит точек контакта и классификация обращений
Прежде чем писать техническое задание, команда провела двухнедельный аудит: выгрузила все тикеты за 90 дней и разбила их по типам. Оказалось, что 67% обращений укладывались в восемь повторяющихся сценариев — от «где мой груз» до «пришлите закрывающие документы». Именно эти сценарии стали первым кандидатом на автоматизацию. Оставшиеся 33% — нестандартные претензии и переговорные вопросы — решили оставить операторам.
Результат этапа: карта обращений с приоритетами, оценка потенциального охвата автоматизации (в данном случае — до 65% объёма), список данных, к которым ИИ-агент должен иметь доступ (TMS, CRM, база договоров). Без этого шага компании часто автоматизируют не то, что даёт реальную разгрузку, а то, что проще технически. Это главная ошибка на старте.
Ориентировочные затраты этапа: 2–3 недели, внутренняя команда + аналитик на подряде, от 80 000 до 150 000 рублей.
Этап 2. Выбор архитектуры: RAG-агент вместо классического чат-бота
Классические чат-боты на сценарных деревьях не подошли: слишком много вариаций в формулировках клиентов, плюс база знаний постоянно обновлялась. Компания выбрала архитектуру RAG (Retrieval-Augmented Generation): языковая модель в связке с векторным поиском по внутренней документации. Агент в реальном времени «вытягивает» нужный фрагмент из базы знаний и формирует ответ, не галлюцинируя и не выходя за рамки актуальной информации.
Критически важным оказался не выбор конкретной LLM, а качество подготовки корпуса данных. Регламенты поддержки, шаблоны ответов, FAQ — всё это нужно было привести в структурированный вид. На это ушло три недели работы контент-менеджера и технического писателя. Плохо подготовленная база знаний = плохие ответы агента, какую бы модель вы ни использовали.
Параллельно настроили интеграцию с TMS через API: агент умеет в реальном времени запрашивать статус отправления по номеру накладной и отвечать клиенту конкретными данными, а не шаблоном «уточните у менеджера». Именно этот функционал впоследствии закрыл 38% всех входящих обращений автономно.
Этап 3. Пилот на 20% трафика и сбор обратной связи
Агент запустили в режиме «мягкого старта»: первые четыре недели он обрабатывал только каждое пятое входящее обращение в чате на сайте. Операторы видели диалог в реальном времени и могли перехватить его в любой момент. Это дало двойной эффект: снизило риск негативного клиентского опыта и позволило накопить разметку — какие ответы агента операторы подтвердили, а где вмешались и почему.
За четыре недели пилота собрали 1 800 диалогов с разметкой. Точность агента на типовых сценариях — 84% с первой попытки. Ещё 11% случаев агент корректно эскалировал на оператора. Только 5% составили откровенные «промахи» — неверный ответ или уход в петлю переспрашивания. Эти случаи разобрали отдельно и дообучили модель на них.
Ориентировочный срок этапа: 4–6 недель. Именно пилот, а не сразу полный запуск, позволяет избежать репутационных потерь и получить данные для тонкой настройки.
Этап 4. Полный запуск и операционная модель «человек + ИИ»
После пилота агента вывели на 100% входящего чат-трафика. Параллельно пересмотрели роль операторов: теперь они не отвечают на типовые вопросы, а работают с эскалациями, сложными претензиями и VIP-клиентами. Это потребовало короткого переобучения — два дня воркшопов по работе с интерфейсом мониторинга диалогов и новыми KPI.
Новая операционная модель предполагает, что оператор видит все диалоги агента в реальном времени и может в один клик взять разговор на себя. Никакого «чёрного ящика»: каждый ответ агента логируется с указанием источника из базы знаний. Это важно и для качества, и для соответствия внутренним регламентам.
Через два месяца полного запуска компания зафиксировала: среднее время первого ответа — 38 секунд (было 18 минут), CSAT вырос с 61% до 78%, количество операторов в смену сократилось с 7 до 4 без увольнений — двух перевели в отдел продаж, одного — в аналитику клиентского опыта. Экономия на фонде оплаты труда с учётом стоимости внедрения окупилась за 7 месяцев.
Что важно учесть, прежде чем начать: три системных вывода
Первое: внедрение искусственного интеллекта в бизнес-процессы клиентского сервиса не начинается с выбора инструмента. Оно начинается с данных — их наличия, качества и структуры. Если внутренняя документация хаотична, а CRM не интегрирована с остальными системами, ИИ-агент воспроизведёт этот хаос в масштабе.
Второе: метрики успеха нужно зафиксировать до старта, а не после. В данном кейсе это были: время первого ответа, CSAT, доля автономно закрытых обращений и процент корректных эскалаций. Без базовых измерений невозможно доказать ни ценность проекта руководству, ни найти точки для улучшения.
Третье: сопротивление команды — реальный риск. Операторы воспринимают ИИ как угрозу занятости. В описанном кейсе этот вопрос закрыли заранее: провели встречу с командой, объяснили новую операционную модель и показали, какие задачи переходят к людям, а не уходят «в машину». Прозрачность коммуникации внутри компании — такой же элемент успешного внедрения, как и техническое решение.