Речевой бум
По данным BSS, росту голосового направления во многом способствовала ситуация в экономике, вызванная распространением коронавируса. "Эпидемия коронавирусной инфекции, охватившая мир, привела к введению беспрецедентных мер, в том числе ограничивающих передвижение и офлайн-взаимодействие. Это стимулировало внедрение решений, основанных на речевых технологиях, - голосовых и текстовых роботов, которые способны оперативно и корректно обрабатывать запросы граждан и предоставлять соответствующие сервисы", - говорится в сообщении BSS.
Эксперты рынка голосовых сервисов уверены, что бум развития и внедрения речевых технологий продолжится и в 2021 г. "Очевидно, что в сегменте клиентской поддержки они будут также востребованы, как и в 2020 г. И бизнес, и государственный сектор ощутили те выгоды, которые дают голосовые помощники и чат-боты в деле повышения качества обслуживания клиентов и сбора обратной связи и статистики, сокращения расходов на операторов контакт-центров, экономии бюджета, увеличения скорости и объемов обслуживания", - сказано в сообщении BSS.
Как отмечает директор практики инновационных технологий Лиги цифровой экономики Владимир Бахов, быстрое развитие и совершенствование ИИ позволяет говорить об уверенном продолжении роста рынка голосовых технологий в 2021 г. "Прежде всего появляется возможность реализовать более сложные сценарии. При этом внедрение голосовых роботов становится дешевле, а это значит, что и небольшие компании смогут позволить себе внедрение ИИ: встраивание голосовых помощников в продукты и использование их для внешних коммуникаций", - сказал он.
По оценкам опрошенных экспертов, пока голосовые решения составляют лишь небольшую часть от всего объема российского рынка ИИ - около 10% и примерно $22 млн.
"Интерес к голосовым решениям, базирующимся на ИИ, проявляют ретейл, медицина на фоне COVID-19 и колл-центры. Здесь все логично - это первоочередные потребители ИИ. Рынок, имея базу статистических данных различного типа, будет развиваться в сторону синхронизации мультимедиа, голосовой и видеоаналитики", - поделился мнением директор Центра сетевых решений "Инфосистемы Джет" Сергей Андронов.
По словам директора департамента инфраструктурных решений и сервиса компании Oberon Сергея Сидорова, популярность и востребованность подобных сервисов продолжит расти. "Ведь все понимают, что наиболее удобный для человека способ коммуникации - это живая речь. Рынок речевых технологий стабильно растет, появляются новые решения, в том числе на базе ИИ. По итогам пандемии мы отмечаем, что активно идут проекты по модернизации уже используемых заказчиками голосовых решений. Мы наблюдаем повышенный интерес к внедрению новых систем и технологий, который, на наш взгляд, должен конвертироваться в заключенные контракты и новые проекты в горизонте двух ближайших лет", - сказал Сергей Сидоров.
COVID-19, изоляция, тренды бесконтактности и удаленного взаимодействия безусловно спровоцировали рост направления речевых технологий, голосовых сервисов. "Особо востребованными стали продукты и решения на основе искусственного интеллекта, машинного обучения: диджитал-ассистенты, чат-боты, цифровые аватары, голосовая и лицевая биометрия. Ключевую динамику роста ЦРТ в прошлом году продемонстрировали направления интеллектуальных диалоговых роботов, речевой аналитики, лицевой биометрии, - рассказал генеральный директор Центра речевых технологий (ЦРТ) Дмитрий Дырмовский. - Выручка только по одному из направлений центра - аналитике диалоговых коммуникаций, работа над качеством клиентского сервиса, выросла в 2020 г. относительно 2019 г. на 48%. Объем продаж по проектам внедрения продуктов ЦРТ для улучшения клиентского сервиса в банках и финансовых институтах вырос на 76%, в транспортной отрасли - в восемь раз, а в сферах строительства и электроэнергетики - более чем в 10 раз". По прогнозам ЦРТ, спрос на такие решения в этом году в финтехе, телекоме и здравоохранении сохранится.
По мнению Дмитрия Дырмовского, среди технологических трендов распознавания речи - прежде всего миграция технологии из колл-центров в открытые пространства, в офисы и улицы. "Будет возрастать запрос на задачу распознавания речевого коктейля: перебивания, наложения речи, сложные акустические условия, спонтанная речь нескольких дикторов. Будут набирать популярность виртуальные помощники и аватары. Все больше бизнесов уходит в онлайн, больше услуг потребляется дистанционно, это ускорит и увеличит количество внедрений роботизированных помощников, в перспективе пяти лет текстовые и голосовые роботы будут у большинства компаний. Преимущества будут у роботов, которые смогут вести диалог на естественном языке, что повлечет развитие технологий синтеза речи. Синтез речи станет неотличим от голоса реального человека - и в особенностях произношения, и, что самое главное, в эмоциях. Будут совершенствовать механизмы управления голосом: дыхание, интонация ударения. Появится возможность создавать полноценные голоса на малом количестве данных", - перечисляет гендиректор ЦРТ.
В целом укрепится тренд финансового сектора - омниканальная аналитика и клиентоцентричность. Дмитрий Дырмовский уверен, что крупные предприятия, банки уже располагают огромным количеством клиентских данных, анализ которых позволит создавать уникальный персональный опыт при обращении клиента по разным каналам связи.
"Говорить о каком-то взрывном росте пока сложно, но однозначно голосовые и речевые технологии развиваются весьма уверенно. Они становятся доступными, их начинают активно внедрять и использовать, - рассказывает руководитель направления роботизации и заказной разработки Softline Станислав Маслов. - На рынке появилось большое количество решений, которые конкурируют друг с другом в части использования ИИ. Производители ПО такого класса уделяют большое внимание инструментам low-code-моделирования диалогов, что позволяет компаниям сократить стоимость внедрения и самостоятельно поддерживать решения. На первый план выходят инструменты распознавания намерений и обработки естественного языка, где основной акцент делается на имитацию максимально живого общения: возможность перебивать бота, накладывать различные фоновые звуки, например имитацию работы колл-центра. Многие компании стремятся создать сценарии диалога, учитывая специфику и сферу деятельности клиента. Если раньше их делали с нуля, то сегодня при внедрении подобных решений разработчики предлагают набор готовых универсальных сценариев общения робота с человеком".
Специалист Softline считает, что в этом году рынок голосовых решений на базе искусственного интеллекта продолжит расти, так как зрелость их возрастает, а стоимость внедрения снижается.
Руководитель Big Data интегратора "Техносерв" Денис Рыбченко говорит, что 2020 г. действительно характеризовался бурным развитием технологий, которые обеспечивают онлайн-формат взаимодействия клиента и поставщика услуги. "Мы видим высокий спрос на голосовые решения со стороны компаний сферы госуслуг, когда сочетаются требования в необходимости налаживания удаленных сервисов и возможности самой компании инвестировать в высокотехнологичные решения. Отдельно стоит выделить крупнейшие банки страны, которые уже доверяют критичные операции, например блокировки и перевыпуск карт, своим голосовым ассистентам, решающим данные задачи на высоком уровне", - сказал Денис Рыбченко.
Объем рынка технологий обработки естественного языка в прошлом году исследователи Frost & Sallivan оценили в $12,4 млрд. К 2022 г., по их прогнозам, рынок должен удвоиться, а к 2024 г. - достичь объема в $43,5 млрд. "В России речевые технологии активно развивают все строители собственных ИТ-экосистем, поскольку не хотят оказаться зависимы от бигтеха, который тоже давно этим занялся, - наблюдает аналитик инвестиционной группы "Финам" Леонид Делицын. - Все понимают: у кого в руках интеллектуальный ассистент, тот и распоряжается кошельком". В 2018 г. российский рынок голосовых технологий оценивали в 3 млрд руб. "Если воспользоваться оценками темпов прироста, которые Frost & Sallivan вычислили для прошлых лет, то рынок должен был бы вырасти в 2,5 раза и составить по итогам прошлого года 7,5 млрд руб. По итогам 2024 г. он может дорасти до 20 млрд руб.", - добавил эксперт.
По мнению аналитика "Фридом Финанса" Евгения Миронюка, дать точные оценки российского сегмента очень сложно, так как рынок включает в себя множество направлений, а уровень развития голосовых технологий в разных компаниях сильно отличается. Наиболее перспективными направлениями опрошенные эксперты называли самообучающихся виртуальных помощников и голосовую биометрию с идентификацией и верификацией говорящего.