Быстрее, выше, умнее: о продвинутых технологиях чат-ботов
Кузьминов руководитель практики разработки программного обеспечения компании iFellow
Чат-боты на основе технологий искусственного интеллекта сегодня пока не так популярны, как программные роботы, работающие по более простому сценарию. Однако уже через два-три года ситуация может кардинально измениться, и решения так называемого "разговорного ИИ" станут более доступными и востребованными в разных сегментах бизнеса. Руководитель практики разработки программного обеспечения компании iFellow Андрей Кузьминов разбирает перспективные платформы и инструменты, лежащие в основе создания чат-ботов.
В повседневной жизни мы чаще всего сталкиваемся с виртуальными ассистентами, функционирующими по заранее прописанному четкому сценарию: это могут быть определенные ключевые слова в сообщении пользователя или выбор из нескольких вариантов ответа, посредством которых программа переходит на следующий шаг диалога. На рынке известно множество платформ, специализирующихся на создании таких чат-ботов для разных бизнес-задач.
Однако наиболее интересными для нас как разработчиков, а также для потенциальных пользователей являются решения, построенные на технологиях искусственного интеллекта и, в частности, нейросетей. В этом случае виртуальный ассистент может уже не только разговаривать с клиентом "по скриптам", но и поддерживать более широкий спектр тем, и даже самообучаться в процессе каждого диалога. Согласно отчету Gartner "6 Trends on the Gartner Hype Cycle for the Digital Workplace", рынок разговорного ИИ должен выйти на плато продуктивности к 2025-30 годам.
Аналитики компании Just AI в исследовании "Рынок разговорного ИИ в России 2020-2025" делятся прогнозами по объему рынка в нашей стране: согласно их данным, в 2020 году он составлял всего 44 млн рублей, а к 2025 году достигнет 561 млн долларов при динамике роста от 38% до 81%. Примечательно, что к этому времени половина всего российского рынка займут специализированные интеллектуальные бизнес-системы, в том числе для организаций SMB.
Именно поэтому мы рекомендуем даже тем компаниям, которые уже пользуются сценарными чат-ботами, активно следить за возможностями обучаемых моделей, за рынком разговорного ИИ в целом, а также за развитием отдельных входящих в него категорий платформ и инструментов. Это позволит заказчикам быстро трансформировать сервисы и передать чат-ботам наибольшее количество актуальных задач, когда эти технологии окажутся более доступными.
Что это за инструменты и зачем они нужны – поговорим ниже.
Разработка без кодирования
Различные инструменты-конструкторы No Code и Low Code уже применяются для создания простых чат-ботов: такой инструмент, как правило, реализован в виде визуального редактора, в котором пользователь создаёт алгоритм робота, перетаскивая соответствующие элементы из панели инструментов. В результате логика работы чат-бота становится представленной в виде графа. Чтобы такой бот научился делать что-то новое, требуется реализовывать отдельные ветки его поведения.
В процессе разработки чат-бота на основе нейросети существенная часть времени уйдет на обучение модели,но использование инструментов No Code и Low Code для построения сценариев ее работы также останется применимым.
Инструменты и фреймворки для разработчиков
Для создания собственного чат-бота команде разработки потребуются наборы инструментов (SDK), различные библиотеки, модели и хабы, алгоритмы. Кроме того, программу, вероятно, придется интегрировать в несколько внешних систем и организовать его взаимодействие с другими виртуальными помощниками.
Специализированный фреймворк чат-ботов, включающий в себя SDK и среду разработки, позволит команде сократить объем ручной работы при разработке и тестировании ботов. Хотя, в отличие от платформы-конструктора, этот инструмент все-таки более трудоемок и требует знаний программирования.
Чтобы чат-бот мог общаться с несколькими системами, предоставляя пользователю единый интерфейс, разработчикам необходимо применение универсальных языков программирования и библиотек. Отдельно потребуется разработать и саму архитектуру приложения бота, т.к. чат-боты в большинстве случаев предполагают высокую отзывчивость на команды нескольких пользователей.
Для чат-ботов, предоставляющих круглосуточный сервис, используют методы обеспечения высокой доступности информационных систем.
Диалог на естественном языке
Платформы NLP (Natural Language Processing), NLU (Natural Language Understanding) и DM (Dialog Management) – это большой набор технологий аналитики естественного языка, необходимый для интеллектуальных чат-ботов или специализированных интеллектуальных модулей. С их помощью виртуальный помощник может, например, не просто зафиксировать обращение клиента в техподдержку, а разобраться в нескольких абзацах текста, где описана проблема – даже если пользователь не конкретизировал запрос.
Чат-бот распознает форму запроса, разбирает имеющуюся информацию на составляющие и выдает корректный ответ, справочные сведения или обеспечивает маршрутизацию клиента по профильным специалистам поддержки. За это отвечает диалог-менеджмент системы.
Отдельную популярность получили генеративные сети на примере ChatGPT. Они самостоятельно создают текст по описанию и подсказкам пользователя на естественном языке, что позволяет обобщить ответ на запрос с использованием большой базы текстов, которые были использованы при обучении.
Обработка разных форматов данных
Поиск и извлечение данных и машинный перевод – еще две важные технологии, использующиеся чат-ботами для оптического распознавания символов и обработки файлов.
Пользователь может отправить файл со своего устройства или сделать фотографию, которую затем обработает бот на серверной стороне в рамках сценария. Серверная обработка позволяет применить самые точные библиотеки оптического распознавания, например Tesseract.
Благодаря им виртуальный ассистент имеет возможность, например, дополнительной доработки файлов для нужд определенной системы, с которой взаимодействует. Таким образом чат-боты оказываются неразрывно связанными с технологиями выхода в диалоговые интерфейсы.
Область применения высоких технологий в чат-ботах
Перечисленные выше инструменты могут быть использованы для всего спектра решений и сервисов, в которых в принципе возможно применение чат-ботов:
- кастом-ассистенты (голосовые помощники),
- решения клиентской поддержки,
- государственные и муниципальные службы,
- контакт-центры,
- интеграторы,
- CRM-системы.
Данные технологии могут быть задействованы во всех форматах коммуникаций: в том числе, в мессенджерах, веб-чатах и "умных" устройствах. Потенциал их применения зависит главным образом от готовности бизнеса приобретать, настраивать и эксплуатировать подобные решения, наращивать соответствующие компетенции в штате или пользоваться услугами аутсорсинговых команд.
Стоит отметить, что в России мы наблюдаем достаточно динамичное развитие технологического стека для разработки чат-ботов – особенно в области речевых технологий. Появляется больше компаний-заказчиков, которые готовы отдать часть бизнес-процессов интеллектуальным чат-ботам. Разработки решений NLP и NLU, а также платформ Low Code и No Code получают сегодня серьезный прирост инвестиций и как результат – становятся более доступными. Всё это позволяет прогнозировать, что к 2025 году мы придем к более широкому использованию передовых технологий для сборки чат-ботов.