НИТУ "МИСиС" проанализирует большие данные
Центр исследования больших данных НИТУ "МИСиС" запускает платформу анализа больших данных IRELA. По словам создателей, платформа обладает уникальным для российского рынка мультиязычным поиском. Платформа Data Science может встраиваться в ИТ-ландшафт организаций из любых сфер за счет разделения платформы на модули.
Руководитель проекта IRELA Григорий Губарев рассказал корреспонденту ComNews, что IRELA развивается в рамках Центра исследований больших данных НИТУ "МИСиС", нацеленного на создание наукоемких конкурентоспособных продуктов в сфере анализа данных. "Среди задач этого подразделения вуза - трансфер результатов научных исследований в программные решения, за реализацию которых отвечает команда инженеров компании Naumen", - добавил он.
Проект основан на аналитических решениях, созданных экспертами Центра по заказу компаний из нефтегазовой, аэрокосмической, строительной и научно-образовательной отраслей. Григорий Губарев рассказал, что созданию коммерческого продукта предшествовало постепенное накопление экспертного опыта в сфере анализа данных. "Компания Naumen уже более пяти лет разрабатывает решения Data Science, внедряя созданные технологии в рамках проектов с крупными коммерческими и государственными заказчиками. Эти наработки легли в основу платформы IRELA и были дополнены новыми функциями, основанными на последних научных разработках в сфере анализа данных, машинного обучения и обработки естественного языка", - говорит Григорий Губарев.
Пресс-служба НИТУ "МИСиС" сообщила, что платформа имеет широкий спектр применения и опирается на передовые научные достижения в области Data Science. "В отличие от других подобных решений на рынке, ориентированных на конкретную область, IRELA предоставляет набор инструментов, которые встраиваются в существующий ИТ-ландшафт организации. Конкурентные преимущества платформа получает благодаря ее разделению на независимые функциональные части - модули. Каждый из них - готовое решение, которое можно устанавливать отдельно или в комплекте с другими", - рассказал представитель пресс-службы НИТУ "МИСиС".
Григорий Губарев уверен, что платформа будет полезна в разных отраслях - нефтегазовой, аэрокосмической, строительной, образовательной, а также в сфере госуправления. "Но мы хотим, чтобы решения Data Science стали доступнее и для средних компаний, поэтому наша платформа состоит из девяти почти независимых функциональных модулей, каждый из которых можно устанавливать отдельно или в комплекте с другими. Мы собрали сильную команду экспертов по Data Science, умеющих разрабатывать решения в сфере анализа данных и обладающих опытом внедрения созданных технологий в рамках проектов с коммерческими и государственными заказчиками, среди которых министерства и корпорации, - комментирует Григорий Губарев. - IRELA обладает функцией мультиязычного поиска, аналогов которому пока нет на российском рынке".
Пресс-служба НИТУ "МИСиС" сообщает, что технология мультиязычного поиска - собственная разработка команды, и объясняет, каким образом работает платформа: "Модуль мультиязычности находит в коллекции документы на любых языках, исключая необходимость перевода и связанные с ним ошибки. Он сокращает время поиска для пользователей, не владеющих нужными иностранными языками, и увеличивает шанс найти наиболее подходящий по смыслу документ. Модуль актуален для глобальных компаний и многонациональных коллективов, работающих с зарубежными контрагентами. За счет технологий обработки больших данных и машинного обучения платформа IRELA автоматизирует работу с большим потоком информации - упрощает поиск по многоязычной базе данных, классифицирует входящие документы, ускоряет принятие стандартных решений, подсказывает приоритеты в работе с обращениями, облегчает анализ отчетов".
Отметим, что Центр исследования больших данных НИТУ "МИСиС" и Naumen создали в октябре текущего года. Цель создания центра - проведение опережающих научных исследований в области Data Science.
Директор Центра исследования больших данных НИТУ "МИСиС" Лев Голицын отметил, что центр занимается актуальными направлениями анализа информации, машинного обучения и обработки естественного языка, и платформа IRELA - первый важный проект подразделения. "Созданная платформа включает наши передовые достижения, полученные за счет симбиоза решенных бизнес-кейсов и научных задач", - сказал он.
Григорий Губарев говорит, что в перспективе - научные исследования и разработка программных решений по многим актуальным направлениям Data Science, таким как автоматическая обработка естественного языка, разведочный информационный поиск, кросс-язычный поиск данных, мультимодальное тематическое моделирование, языковое моделирование, векторное представление сущностей, вопросно-ответные системы, системы поддержки принятия решений. "Кроме того, мы разрабатываем образовательные курсы и лекции по теме науки о данных, планируются семинары и конференции", - поделился он планами.