МАРИЯ ПЕТРОВА
© ComNews
04.10.2011


01.09_2

Компания Cisco планирует открыть центр разработок в иннограде Сколково. У центра будет одна задача: разработка технологии распознавания речи и видео с целью синхронного перевода на любой язык и последующей возможности контекстного поиска по аудио- и видеофайлам. Система будет распознавать спикеров в лицо, обещает Cisco. Для разработки технологии компания планирует первоначально набрать в штат 30 инженеров.

Об этом репортеру ComNews рассказал старший директор Cisco, куратор глобальных инкубационных проектов компании Кристофер Томпсон. "В ближайшее время Cisco собирается стать резидентом Сколково и зарегистрировать для этого специальное юридическое лицо, чтобы открыть в нем свой центр разработок. Этот центр будет заниматься одной конкретной задачей, а именно - разработкой технологии распознавания видео и речи с целью синхронного перевода с любого языка на любой и последующей возможности контекстного поиска по видеофайлам как по теме, так и по спикеру. При этом система должна уметь узнавать спикеров в лицо. Перевод будет осуществляться как субтитрами, так и голосом", - сказал Кристофер Томпсон в беседе с ComNews. По его словам, в Сколково компания будет создавать новый тип инновационного центра, который впоследствии компания может воссоздать и в других странах.

"Я пока не могу давать комментарий относительно технологии, которую мы будем развивать в Сколково, - она еще не разработана, - уточнил репортеру ComNews Кристофер Томпсон. - Могу только сказать, что мы намерены создавать технологии и приложения для наших заказчиков из числа корпоративных клиентов и операторов связи во всем мире. В связи с этим мы хотим сотрудничать и с российскими специалистами в области математики и лингвистики. Видео находит применение во многих областях бизнеса. Технология, которую мы намерены разрабатывать в Сколково, скорее всего, будет входить в один комплект с другими видеоприложениями Cisco, включая Cisco TelePresence".

"Через несколько недель мы представим наш проект на проектную экспертизу в фонд "Сколково". Ответ мы надеемся получить в конце осени или начале зимы. Если все пойдет так, как запланировано, наши специалисты смогут начать работу летом 2012 г. Этот проект финансируется исключительно подразделением Emerging Business Group компании Cisco. Оно отвечает за выявление и развитие новых видов бизнеса, а также за весь ассортимент видеотехнологий Cisco", - сообщил репортеру ComNews Кристофер Томпсон. Также Cisco собирается оказывать и консультационные услуги по типу бизнес-инкубатора.

"ООО "Центр речевых технологий" (ЦРТ) имеет значительный опыт в разработке и применении технологии распознавания речи, - рассказала в беседе с ComNews руководитель группы маркетинговых коммуникаций ЦРТ Анна Белаш. - Данные технологии легли в основу целого ряда продуктов компании: VoiceNavigator - программный комплекс для построения систем голосового самообслуживания в контакт-центрах; VoiceNavigator Office Suite - система корпоративной голосовой маршрутизации вызовов; VoiceNavigator Web - система навигации по веб-сайтам с помощью голоса. Наиболее востребовано применение технологий распознавания речи в бизнес-процессах операторов связи, контакт-центрах". По словам Анны Белаш, у компании есть разработки и в области поиска по ключевым словам в аудиопотоке, они используются, в основном, для контроля работы операторов контакт-центров. "Технология поиска по видеофайлам реализована в рамках системы установления личности по фотографическому изображению. Система позволяет идентифицировать личность человека, попавшего в объектив камеры, установленной, к примеру, в местах массового скопления людей - на вокзалах, в метро, крупных торговых центрах и пр., - в том случае, если его фотоизображение есть в базе. Зачастую такие системы используются с целью обнаружения и поимки преступников", - заключила в беседе с репортером ComNews Анна Белаш.

Как ранее сообщал ComNews, в сентябре 2010 г. два крупнейших поисковика русскоязычной части Интернета - "Яндекс" и Google - запустили голосовой поиск. Сервис распознает речь и помогает искать информацию в сети по "надиктованным" запросам. У "Яндекса" речь трансформируется в текстовый запрос, который и обрабатывается поисковиком. Разработка сервиса началась в конце 2009 г., технологию распознавания речи предоставила петербургская компания "Центр речевых технологий" (ЦРТ). У Google на английском языке такой сервис действует с 2008 г., а сейчас работает также на европейских языках, китайском и японском (см. новость ComNews от 20 сентября 2010 г.).

Пресс-служба компании Google не смогла вчера предоставить комментариев о своих разработках в сфере распознавания речи.