© ComNews
08.11.2018

Центр исследования больших данных НИТУ "МИСиС" запускает платформу анализа больших данных IRELA. По словам создателей, платформа обладает уникальным для российского рынка мультиязычным поиском. Платформа Data Science может встраиваться в ИТ-ландшафт организаций из любых сфер за счет разделения платформы на модули.

Руководитель проекта IRELA Григорий Губарев рассказал корреспонденту ComNews, что IRELA развивается в рамках Центра исследований больших данных НИТУ "МИСиС", нацеленного на создание наукоемких конкурентоспособных продуктов в сфере анализа данных. "Среди задач этого подразделения вуза - трансфер результатов научных исследований в программные решения, за реализацию которых отвечает команда инженеров компании Naumen", - добавил он.

Проект основан на аналитических решениях, созданных экспертами Центра по заказу компаний из нефтегазовой, аэрокосмической, строительной и научно-образовательной отраслей. Григорий Губарев рассказал, что созданию коммерческого продукта предшествовало постепенное накопление экспертного опыта в сфере анализа данных. "Компания Naumen уже более пяти лет разрабатывает решения Data Science, внедряя созданные технологии в рамках проектов с крупными коммерческими и государственными заказчиками. Эти наработки легли в основу платформы IRELA и были дополнены новыми функциями, основанными на последних научных разработках в сфере анализа данных, машинного обучения и обработки естественного языка", - говорит Григорий Губарев.

Пресс-служба НИТУ "МИСиС" сообщила, что платформа имеет широкий спектр применения и опирается на передовые научные достижения в области Data Science. "В отличие от других подобных решений на рынке, ориентированных на конкретную область, IRELA предоставляет набор инструментов, которые встраиваются в существующий ИТ-ландшафт организации. Конкурентные преимущества платформа получает благодаря ее разделению на независимые функциональные части - модули. Каждый из них - готовое решение, которое можно устанавливать отдельно или в комплекте с другими", - рассказал представитель пресс-службы НИТУ "МИСиС".

Григорий Губарев уверен, что платформа будет полезна в разных отраслях - нефтегазовой, аэрокосмической, строительной, образовательной, а также в сфере госуправления. "Но мы хотим, чтобы решения Data Science стали доступнее и для средних компаний, поэтому наша платформа состоит из девяти почти независимых функциональных модулей, каждый из которых можно устанавливать отдельно или в комплекте с другими. Мы собрали сильную команду экспертов по Data Science, умеющих разрабатывать решения в сфере анализа данных и обладающих опытом внедрения созданных технологий в рамках проектов с коммерческими и государственными заказчиками, среди которых министерства и корпорации, - комментирует Григорий Губарев. - IRELA обладает функцией мультиязычного поиска, аналогов которому пока нет на российском рынке".

Пресс-служба НИТУ "МИСиС" сообщает, что технология мультиязычного поиска - собственная разработка команды, и объясняет, каким образом работает платформа: "Модуль мультиязычности находит в коллекции документы на любых языках, исключая необходимость перевода и связанные с ним ошибки. Он сокращает время поиска для пользователей, не владеющих нужными иностранными языками, и увеличивает шанс найти наиболее подходящий по смыслу документ. Модуль актуален для глобальных компаний и многонациональных коллективов, работающих с зарубежными контрагентами. За счет технологий обработки больших данных и машинного обучения платформа IRELA автоматизирует работу с большим потоком информации - упрощает поиск по многоязычной базе данных, классифицирует входящие документы, ускоряет принятие стандартных решений, подсказывает приоритеты в работе с обращениями, облегчает анализ отчетов".

Отметим, что Центр исследования больших данных НИТУ "МИСиС" и Naumen создали в октябре текущего года. Цель создания центра - проведение опережающих научных исследований в области Data Science.

Директор Центра исследования больших данных НИТУ "МИСиС" Лев Голицын отметил, что центр занимается актуальными направлениями анализа информации, машинного обучения и обработки естественного языка, и платформа IRELA - первый важный проект подразделения. "Созданная платформа включает наши передовые достижения, полученные за счет симбиоза решенных бизнес-кейсов и научных задач", - сказал он.

Григорий Губарев говорит, что в перспективе - научные исследования и разработка программных решений по многим актуальным направлениям Data Science, таким как автоматическая обработка естественного языка, разведочный информационный поиск, кросс-язычный поиск данных, мультимодальное тематическое моделирование, языковое моделирование, векторное представление сущностей, вопросно-ответные системы, системы поддержки принятия решений. "Кроме того, мы разрабатываем образовательные курсы и лекции по теме науки о данных, планируются семинары и конференции", - поделился он планами.