© ComNews
13.11.2017

На международной конференции ПАО "Сбербанк" по анализу данных, машинному обучению и искусственному интеллекту (ИИ) Sberbank Data Science Day подведены итоги Sberbank Data Science Contest - соревнования, где участники показывали умение решать задачи разной степени сложности в области машинного обучения. Общий призовой фонд конкурса составил 2 млн руб.

Первый заместитель председателя правления Сбербанка Лев Хасис на открытии Sberbank Data Science Day 11 ноября объявил темой мероприятия системы искусственного интеллекта, которые смогут распознавать естественную речь и преобразовывать ее в текст.

В этом году участникам Sberbank Data Science Contest для победы предлагалось продемонстрировать свои программные решения, предназначенные для того, чтобы решить две задачи разной степени сложности из области машинного обучения - определение релевантности вопроса (задача А) и построение вопрос-ответной системы (задача В). В этом году в Sberbank Data Science Contest приняли участие представители 21 страны. Участники предложили более 5,5 тыс. решений по простой и 1348 по сложной задаче. Объем полученных решений в боевом режиме составил 10 Тбайт. Как отметил Лев Хасис, лучшие решения не уступают решениям уровня соревнований, которые проводятся Стэнфордским университетом.

Руководитель академии технологии данных Корпоративного университета и управляющий подразделения Chief Data Scientist Сбербанка Андрей Черток сообщил, что идея была в том, чтобы собрать размеченную выборку русскоязычных текстов на свободную и банковскую тематику - так называемый русскоязычный аналог SQuAD (Stanford Question Answering Dataset), с целью обучения диалоговых агентов.

В задаче А участникам необходимо было построить алгоритм, определяющий релевантность поставленных вопросов к параграфу текста. Для решения этой задачи нужно было не только понимать, относится ли вопрос к параграфу, но и насколько корректно он поставлен. В задаче А приняли участие 290 участников, было отправлено 5,5 тыс. решений. Победителем в задаче А стал Александр Желубенков. Он получил 200 тыс руб.

В ходе решения задачи B участники строили систему ответов на вопросы. Алгоритмам предстояло научиться понимать человеческий язык, о чем вопрос и как правильно ответить на него. Эта сложная задача была сделана по мотивам исследовательской задачи SQuAD, но в этот раз с данными на русском языке.

"Задача состояла в построении вопросно-ответной системы. Мы создали русскоязычный Dataset, чтобы тренировать такие системы", - отметил Андрей Черток. В задаче B приняли участие 120 участников, было отправлено 1348 решений. Приз жюри в задаче B и награду в 250 тыс. руб. получил Евгений Иванов.

Победителем всей задачи был назван Дмитрий Умеренков, который получил главный приз от Сбербанка в 1 млн руб. и предложение о работе от старшего вице-президента Сбербанка Александра Ведяхина.

Победитель назвал Dataset полезным и выразил надежду на то, что он будет использоваться в дальнейшем. Тему с машинным обучением он начал изучать в феврале этого года (прослушал курс и начал учить Python), а задачей распознавания текста начал заниматься в конце сентября. По словам победителя, хотя задача B сложнее, чем задача A, но как ни парадоксально, занять первое место в задаче B существенно проще, чем в задаче A. "Для того чтобы решить задачу А, нужно обладать знаниями, которые накапливались три-четыре года", - пояснил он. По его словам, нужно изучить достаточно большой объем знаний для того, чтобы соревноваться с теми, кто работает давно в этой области.

"Что касается задачи B, то все решения, которые в ней используются, это все наработки нынешнего года. Чтобы влиться в эту проблемную область, нужно существенно меньше времени. Она может быть сложнее, но она физически меньше", - сказал Дмитрий Умеренков.

Лев Хасис сообщил, что Сбербанк проводит подобное мероприятие уже во второй раз. В прошлом году Сбербанк сфокусировался на теме, касающейся поведения клиентов на базе анализа карточных транзакций. Он добавил, что в прошлом году в мероприятии приняли участие представители трех стран. На Data Science Contest был зарегистрирован 3181 участник, и 1000 участников - на Data Science Day.

Победителем в прошлом году стал Дмитрий Афанасьев. Он был назван лучшим по итогам решений трех задач: определение пола клиента, суммарных трат и прогноз следующей траты на основе обезличенных транзакционных данных. В номинации Challengе победили Владимир Суворов и Алексей Дурнев (SD Data). Они предложили бизнес-решение по поиску подозрительных транзакций и признаков использования карт в мошеннических операциях (XGBoost, k-means). Старший вице-президент Сбербанка Александр Ведяхин добавил, что в данный момент они продолжают сотрудничать со Сбербанком при разработке системы тестирования как в рамках проекта iPavlov, так и просто в банке.

Александр Ведяхин перечислил приоритетные направления развития искусственного интеллекта. Сюда он отнес автоматизацию процессов, работу сверхинтеллектульных виртуальных помощников, креативные системы ИИ, расширение конвергенции, открытые площадки для обучения, автоматизацию процессов принятия решений, надежность и контроль ИИ, системы прогнозирования и симбиотические решения, предполагающие взаимодействие человека и робота.

Одним из вызовов современных ИИ-систем Александр Ведяхин назвал отсутствие интуиции: чем больше человек живет, тем больше у него накапливается житейского опыта, и он может быть обобщен в каких-то внутренних невербальных сигналах, чего не может делать робот. Ко второму вызову Александр Ведяхин отнес проблему unknown unknowns (проблему "черных лебедей"). Третий вызов, как отметил старший вице-президент Сбербанка, это blindspots. У ИИ нет саморефлексии, в то время как человек быстро реагирует на окружение и понимает свои "слепые пятна", в отличие от ИИ. Еще одним вызовом стали трудности мышления категориями здравого смысла.

Александр Ведяхин также коснулся возможностей, которые дает искусственный интеллект. Сюда он отнес сокращение затрат, оптимизацию и автоматизацию процессов, рост объемов и эффективность продаж, сокращение времени принятия решений.

По словам Александра Ведяхина, Сбербанк двигается в сторону data-driven company и компании, которая поддерживается ИИ. Банк в своей работе может столкнуться с рядом вызовов, среди которых он назвал данные и технологии. Сбербанк также видит вызов в релевантном организационном процессе, обучении и подготовке персонала и коллаборации между подразделениями. Александр Ведяхин добавил, что без Data Science завтрашнего дня не будет.

"Будучи одной из крупнейших системообразующих корпораций в России, мы являемся драйвером искусственного интеллекта", - отметил Александр Ведяхин. Он объяснил, что Сбербанк организует подобное мероприятие для развития Data Science в РФ, обмена полезными знаниями и опытом, поиска лучших специалистов и крутых решений и коллаборации.

Как подчеркнул Александр Ведяхин, Сбербанк работает с вузами. Например, банк софинансировал проект Московского физико-технического института (МФТИ) iPavlov, который является разговорным ИИ.

Заведующий лабораторией нейронных систем и глубокого обучения МФТИ Михаил Бурцев рассказал, что проект iPavlov начался летом этого года. Предполагается, что ИИ сможет вести диалог с человеком - отвечать на вопросы. Алгоритм обучается на больших массивах документов и текстовых записей диалогов между людьми. Целью проекта, по словам Михаила Бурцева, являются исследования в области ИИ, разработка открытой библиотеки для создания диалоговых систем, создание платформы диалоговых сервисов. Наработки МФТИ могут помочь Сбербанку при создании чатботов в рамках своих бизнес-процессов и продуктов.

Михаил Бурцев отметил, что с точки зрения МФТИ - это хороший проект, поскольку позволяет укрепить ту школу искусственного интеллекта, которая складывается в МФТИ, и вывести институт в лидеры исследований по ИИ в России и мире. Кроме того, исследователи, с одной стороны, получают от работы новые модели в данной области, с другой - инструменты для того, чтобы прототипировать и исследовать модели в области ИИ и диалоговых систем.

В сентябре 2017 г. в Корпоративном университете Сбербанка проводились соревнования по алгоритмам принятия решений (первое в России соревнование по игровым стратегиям на примере техасского холдем-покера). В онлайн-этапе приняли участие 160 участников, было отправлено 3527 решений, а сыграно более 50 тыс. игр. В финале хакатона (офлайн-этап) приняли участие 92 человека, или 38 команд, было отправлено 422 решения.

"Мы организовали битву покерботов, где за одним столом сидели одновременно девять ботов, каждый из которых производил все действия, которые могут делать обычные игроки в покер, включая блеф. И чемпионы среди ботов в конце выиграли у людей. Это были не профессионалы топ-уровня, а хорошо играющие любители, так называемые профессионалы мелких ставок", - пояснил Александр Ведяхин. В декабре poker table планируется привезти и показать на NIPS (Conference on Neural Information Processing Systems).

Другие компании тоже не обходят стороной тему искусственного интеллекта. Напомним, что в апреле банк ВТБ24 внедрил в свой ИТ-ландшафт искусственный интеллект. Банк построил единую комплексную систему мониторинга (КСМ) критичных бизнес-процессов и ИТ-инфраструктуры.

ПАО "ВымпелКом" (бренд "Билайн") запустило в апреле чат-бот на основе искусственного интеллекта для автоматизированного обслуживания клиентов. Другой оператор "большой четверки" - ПАО "МегаФон" планирует запустить подобное решение к концу 2017 г. ООО "Т2 Мобайл" (бренд Tele2) пока рассматривает возможность запуска аналогичного сервиса.

ПАО "Мобильные ТелеСистемы" (МТС) в сентябре создало новое направление, которое будет отвечать за развитие продуктов на базе искусственного интеллекта (AI) и интеграцию технологий AI в существующие и разрабатываемые продукты компании.