Сергей
Путченко

руководитель группы развития бизнеса облачной платформы Voximplant
© ComNews
16.03.2023

2022 год стал переломным для речевых сервисов: их внедрили практически все крупнейшие бренды, а западные потребители начали пользоваться ими в два раза чаще, чем в 2021 году. В 2023 году, согласно прогнозам, рост продолжится. Голосовым управлением оснащены практически все гаджеты, а также элементы умного дома и системы управления автомобилем.

Клиенты все еще не очень охотно идут на контакт с роботами по телефону, но, если он понимает их достаточно хорошо и помогает решить проблему, готовы изменить мнение. Однако это не значит, что нужно сломя голову внедрять речевые технологии во всех колл-центрах, чтобы не отставать от конкурентов. О том, как избежать ошибок при внедрении роботов, рассказывает Сергей Путченко, руководитель группы развития бизнеса облачной платформы Voximplant.

Робот не умеет строить диалоги не по шаблону

В 2018 Google презентовал обновленную версию голосового ассистента под названием Duplex. Его задача - звонить от лица клиентов, которые хотят забронировать столик в ресторане или прием у специалиста, дозвониться до оператора колл-центра или подтвердить заказ в интернет-магазине.

На презентации Duplex общался совсем как настоящий сотрудник. Но когда журналисты решили протестировать сервис самостоятельно, выяснилось, что продукт сырой: при малейшем отклонении от стандартного диалога он терялся и тут же переключал разговор на человека. При этом разработчики сделали акцент на том, что их продукт максимально приближен к человеческому диалогу - так, что собеседнику не нужно приспосабливаться и строить свою речь как-то иначе. На деле же первые собеседники Duplex отметили, что им было бы проще сразу понимать, что перед ними голосовой робот, а не человек, чтобы формулировать ответы как можно точнее.

Вывод: чтобы голосовой робот мог с точностью воспроизвести человеческий диалог, вам понадобятся огромные ресурсы для разработки и обучения модели. В этом помогут технологии машинного обучения и распознавания естественной речи (NLU) - они позволяют обучать голосовых ассистентов прямо в процессе диалога с клиентом. Тогда робот будет сопоставлять фразы с теми, на которых его обучали, и подбирать самые подходящие по контексту или тематике. Например, при бронировании отеля или подтверждении заказа.

При этом не стоит увлекаться игрой в живого человека: клиентам важнее, чтобы их задачу решили как можно быстрее, и для этого они готовы формулировать свои фразы точнее, чтобы робот наверняка их понял.

Робот хамит и пугает пользователей

Голосовой сервис банка "Тинькофф" по имени Олег известен неформальным общением. Это в полной мере отражает стиль коммуникации компании: простой, дружелюбный, без лишних терминов и канцеляризмов. Однако иногда такой подход может сыграть злую шутку - как это и произошло в одном из диалогов "Олега" с клиенткой. Когда женщина пожаловалась, что не может зайти в приложение по отпечатку пальца, чат-бот ответил: "Пальцы бы вам отрезать". После того как историю предали огласке, сотрудники банка извинились за якобы "своеобразный юмор" их виртуального сотрудника.

Вывод: если вы хотите, чтобы голосовые сервисы были как можно человечнее, недостаточно просто обучить их на датасетах из реальных диалогов. Нужно тщательно проверять содержимое сценариев и вовремя вычищать оттуда грубые фразы и нецензурную лексику. Возможно, для этого придется пожертвовать нестандартным юмором и просторечными оборотами, которые так важны для tone of voice компании. Но лучше пусть ваш робот кажется слишком формальным, чем наоборот, зато максимально точно отвечает на вопросы пользователей и решает их задачи. Иногда даже один такой инцидент может оставить заметное пятно на репутации.

Робот слишком "механический"

Вдохновившись опытом крупнейших компаний, языковая онлайн-школа Skyeng также решила внедрить голосового робота. Он должен был звонить тем, кто записался на бесплатный пробный урок, чтобы подтвердить их присутствие. Это позволило бы разгрузить преподавателей, которые занимались обзвоном до этого.

Первый робот был слишком примитивным по лексикону и сценариям диалогов, а также обладал неприятным механическим голосом. В результате конверсия звонков упала: люди просто не хотели общаться с роботом, а опции переключить на живого оператора не предусмотрели.

Вывод: хотя клиентам не так важно, чтобы робот напоминал живого человека с максимальной точностью, но и звучание голоса, а также построение фраз все же имеют значение. И даже более того: с недавних пор компании отмечают тренд на персонализированные голоса, которые позволяли бы клиентам сразу узнавать, с роботом какого бренда или сервиса они общаются.

Чтобы решить проблему, можно пойти двумя путями: синтезировать голос с помощью живого человека или создать свой собственный. Второй вариант более затратный, зато дает возможность подобрать максимально точные интонации и сгладить переходы между словами, чтобы они звучали максимально естественно.

Робот звучит как человек, но путается в речи

У следующий версии голосового ассистента Skyeng был голос живого человека - реальной сотрудницы компании, а набор фраз - гораздо обширнее. В этот раз люди не бросали трубку сразу же, но и до уроков дело почти не доходило: ведь робот общался только заранее записанными фразами. На следующем этапе от живого голоса отказались и сделали упор на расширение сценариев диалога. Постепенно добавляли все больше вариантов, чтобы робот мог продолжить диалог при самых разных вариантах ответов - включая нестандартные. Но возникла новая проблема: робот не всегда распознавал ответ клиента, чтобы подтвердить урок и назначить дату.

Вывод: вместо того чтобы сделать голос робота максимально похожим на человеческий или обогатить его словарный запас, лучше сделать фокус на сценарии диалога и точности распознавания. Если такой возможности нет, лучше продумать, как добиться от каждого диалога необходимого результата. Иногда с этим лучше справится банальный ввод цифр в голосовом меню, а не продвинутые речевые технологии.

Робот не справляется с работой из-за технических сложностей

Голосовой ассистент "Николай", которого внедрили для приема звонков в МФЦ в Новосибирской области, стал одной из самых обсуждаемых разработок на службе у госорганов. Действительно, робот способен обрабатывать миллионы звонков и строить осмысленный диалог. Однако вскоре обнаружилось сразу несколько проблем. Во-первых, в период пандемии, когда десятки тысяч новосибирцев пытались записаться через "Николая" в поликлинику, им часто не удавалось даже дозвониться. В других случаях робот почему-то записывал несуществующий адрес пациента, который пытался вызвать врача на дом. В-третьих - не смог найти свободную дату для записи.

Вывод: даже самый хорошо обученный искусственный интеллект не поможет, если вы не продумали всю техническую сторону. Это касается и пропускной способности колл-центра, и синхронизации с CRM в режиме онлайн и многих других тонкостей. Здесь важно еще на этапе запуска убедиться, что у робота есть бесперебойный онлайн-доступ ко всем необходимым базам данных и он знает, что делать, если где-то произошел сбой. После каждого сбоя важно обновлять сценарии с учетом новых ошибок и уязвимостей. Это особенно важно, если речь идет о медицинских услугах или технических проблемах, которые необходимо решать максимально быстро 24/7.