Роботы заговорили в полный голос
Компания Just AI, специализирующаяся на технологиях разговорного искусственного интеллекта, машинного обучения и понимания естественного языка, провела исследование и спрогнозировала развитие рынка разговорного ИИ до 2025 года. Аналитика охватывает инструменты и платформы разговорного ИИ — технологии для синтеза и распознавания речи, клонирования голосов, речевой биометрии, голосовой активации, платформы для понимания и генерации естественного языка, средства визуальной разработки диалоговых сценариев в голосовых или текстовых каналах, платформы для анализа речи, а также решения для исходящих обзвонов и в сфере кастомных голосовых ассистентов для бизнеса, навыков для умных устройств и метаассистентов (Алиса, Маруся и пр.), входящую телефонию и умный IVR, разработку чат-ботов на заказ.
Объем российского рынка в 2020 году составил $44 млн или $76 млн с учетом госзаказов. Прибавляет индустрия 46-93% от года к году, общий рост с 2015 года составил 1288%. По прогнозам Just AI, к концу 2021 году объем рынка достигнет $80 млн или $120 млн с учетом госзаказов. В ближайшие пять лет индустрия сохранит динамику роста от 38% до 81% и в 2025 году выйдет на объем $561 млн (без учета госзаказов).
В структуре выручки группы компаний ЦРТ в 1 млрд руб. в год более 80% занимает доход от государственных контрактов. Just AI c объемом выручки в 500 млн руб. фокусируется на сегментах NLP/NLU/DM-платформ, No-code/Low-code конструкторов и кастомных голосовых ассистентов. В группе компаний с выручкой в 200 млн. руб. в год представлены Yandex.Cloud (речевые технологии), 3iTech (решения для госсектора, речевые технологии и платформы речевой аналитики) и АТС Аэро (решения для госсектора, исходящие телефонные коммуникации).
Наибольшими сегментами на рынке в 2020 году были речевые технологии (синтез и распознавание речи, клонирование голосов, речевая биометрия, голосовая активация) и NLP-платформы (обработка естественного языка). Быстрее всего в 2020 году росли решения для бизнеса и NLP-платформы.
По прогнозам Just AI, через пять лет половину всего российского рынка займут таргетированные на определенные бизнес-задачи и отрасли разговорные ИИ-решения, такие как голосовой поиск по каталогу для ритейла, виртуальные ассистенты для ЖКХ, чат-боты для отелей. Они будут ежегодно прибавлять 100-120%, интерес к ним уже проявляют медицина, HoReCa, e-commerce, туризм, индустрия красоты и др.
Запросы на NLP-платформы со стороны крупного бизнеса продолжат расти еще несколько лет. Это будет происходить за счет включения новых отраслей и расширения сферы применения обработки естественного языка. Визуальные конструкторы для разработки ботов с увеличением интереса со стороны SMB-компаний начнут активно расти и специализироваться под узкие задачи и предоставление готовых шаблонов и инструментов. Рост сегмента кастомных ассистентов, решений для клиентской поддержки, навыков для ассистентов, входящего IVR, решений для рекрутинга и HR будет ускоряться вместе с появлением новых разработчиков и вовлечением новых категорий клиентов из SMB, а дополнительным стимулом станет увеличение рынка ассистентов и умных колонок.
Исходящие телефонные коммуникации продолжат бурно расти до 2022 года. Далее стоит ожидать введения правового регулирования, направленного на борьбу против спама, и широкого распространения технологий защиты от спама, что приведет к падению рынка. После адаптации к новым ограничениям будет возможен рост сегмента, возможно, в новых сферах и отраслях. Речевую аналитику в ближайшие годы ждет умеренный рост, который может замедлиться с развитием NLP-технологий и отказом контакт-центров от штата сотрудников. Речевые технологии переживают рост потребления, но с увеличением доступности моделей и датасетов и появлением новых игроков и инхаус-разработок столкнутся с существенным ценовым давлением.
"На рынке разговорного ИИ в России работают более 100 компаний, многие из них растут на 200-400% в год. Далеко не всегда они конкурируют между собой: значительная часть игроков специализируется на отдельных отраслях, типах заказчиков и технологиях и может доминировать в своих сегментах, даже имея небольшую долю на рынке в целом", — говорит управляющий директор Just AI Кирилл Петров.
Кирилл Петров, отвечая на вопрос, какие факторы оказывают наибольшее влияние на рынок решений разговорного ИИ, отмечает в первую очередь сегмент enterprise. "Крупные клиенты экспериментируют с технологиями: у них есть ресурсы, чтобы купить инфраструктуру, платформы и построить целые команды. Как видно на схеме Gartner, для крупного бизнеса риски внедрения разговорных ИИ-технологий уже минимальны, а выгоды высоки. NLP/NLU, виртуальные ассистенты, боты находятся в фазе активных пилотов в крупных корпорациях с выручкой более $1 млрд.
По прогнозам Кирилла Петрова, в ближайшие пять лет рынок сохранит динамику роста от 38% до 81% и в 2025 году выйдет на объем $561 млн. При этом количество умных устройств на руках у населения (умные колонки, умные экраны) от Яндекса, Сбера и Mail.Ru к 2025 году превысит 20 млн шт., что существенно увеличит спрос на создание навыков и приложений с использованием технологий разговорного ИИ.
Кирилл Петров объясняет, что рынок разговорного ИИ, например, в США сформировался раньше, чем в России, поэтому в определенных моментах мы находимся в догоняющей позиции. "Сравните: умными колонками пользуются 90 млн американцев, в России насчитывается более 1 млн умных колонок и экранов. Зарубежная аудитория больше привыкла к умным устройствам, уже появляются интересные проекты социальной направленности, например, Canary Speech для людей с расстройствами речевого поведения. С другой стороны, у нас есть интересные тенденции, которых нет в других странах. На российском рынке представлено большое количество кастомных голосовых ассистентов, сильно развиты в направлении разговорного ИИ FinTech и банки. Операторы верхнеуровневых ассистентов (Яндекс с Алисой, Сбер с семейством Салют, Mail.Ru с Марусей) создают целые экосистемы для разработчиков. Примечательно, что умными колонками от Amazon и Google в России можно пользоваться только на английском языке", - подчеркивает Кирилл Петров.
Кирилл Петров объясняет, что индустрию разговорного ИИ в России представляют более 100 компаний, многие из них растут на 200-400% в год. "Играя на одном поле, компании далеко не всегда конкурируют между собой — многие специализируются на отдельных отраслях, типах заказчиков и технологиях, и, даже имея небольшую долю на рынке в целом, могут доминировать в своих сегментах. В речевых технологиях (ASR/TTS/Biometry) наибольший объем рынка приходится на ЦРТ, Yandex.Cloud, Тинькофф, ASM Решения, 3iTech. В области платформ речевой аналитики лидируют Speech Analytics, CallScoring, 3iTech, также сюда вошли Тинькофф и Ростелеком. В сегменте no-code / low-code конструкторов наиболее заметными игроками на текущий момент являются Just AI и Botmother, в сегменте NLP/NLU/DM-платформ — Just AI, Наносемантика, ЦРТ, в исходящих телефонных коммуникациях — Neuro.net и Zvonobot. Если говорить о рынке голосовых ассистентов и умных колонок, то самые крупные игроки — это Яндекс, Сбер и Mail.Ru", - сообщает Кирилл Петров.
Генеральный директор 3iTech Алексей Любимов объясняет, что последние несколько лет речевые технологии росли стремительно, и объем рынка увеличился на несколько порядков. По его оценке, речевая аналитика сегодня стала технологическим стандартом, многие компании пробуют голосовых помощников, активно применяются NLP/NLU/DM-платформы. "Бизнес молодых компаний, занимающихся разработкой и инсталляциями решений на основе речевых технологий, очень быстро растет. Их доходы год от года увеличиваются в несколько раз. Один из признаков бурного роста рынка – дефицит специалистов, основные игроки переманивают друг у друга даже молодых разработчиков. И такой рост продолжится в ближайшие 2-3 года. Понятно, что реальный объем рынка посчитать очень сложно, так как часто речевые технологии поставляются в составе комплексных решений. Однако, нам кажется, что оценки аналитиков сдержанные, и рынок речевых технологий заметно больше. Так, только сегмент речевой аналитики по итогам 2020 годы достиг двух миллиардов рублей. Доходы многих компаний – это сотни миллионов рублей, а некоторых и несколько миллиардов", - говорит Алексей Любимов.
По мнению Алексея Любимова сегодня сегментация рынка очень условна. "Так, мы поставляем речевую аналитику, которая построена на Big Data-платформе, собственном движке распознавания речи (ASR) и технологии NLP. С помощью речевого ИИ заказчики решают очень широкий круг задач, от контроля качества работы сотрудников до обогащения данных. Сегодня мы видим, как стремительно растет спрос на платформы поиска и извлечения данных, активно внедряются голосовые ассистенты и боты, совершенствуются голосовые интерфейсы. Вместе с тем постоянно появляются новые направления, например, только зарождается рынок виртуальных инфлюенсеров. Корпоративный рынок присматривается к специализированным системам голосового поиска по каталогам и архивам. В ближайшие годы нас ждет много технологических новинок, построенных на речевых технологиях", - сообщает Алексей Любимов.
По словам Алексея Любимова, прежде всего на рынок будет влиять экономическая ситуация, от того, как будет чувствовать себя рынок, будет зависеть интерес компаний к новым технологиям. "Немаловажный фактор – продолжающаяся цифровая трансформация во многих отраслях: банки и ритейл сегодня крупнейшие потребители речевых технологий. Запустили процесс перехода на новые технологии крупнейшие логистические компании, девелоперы, страховые компании. Сейчас к "голосу" присматриваются HoReCa, медицина, туризм. И, конечно, меняется потребитель, люди становятся более требовательными, поэтому качество обслуживания – критически значимый фактор, а речевые технологии – эффективный инструмент повышения уровня сервисов", - утверждает Алексей Любимов.