В ходе прошедшего форума Russian Internet Week (RIW 20/21) эксперты рассказали об успехах искусственного интеллекта (ИИ), дали прогнозы на будущее, отметили существующие препятствия для развития ИИ.


Константин
Скурат
© ComNews
14.12.2021

Руководитель комитета по искусственному интеллекту АРПП "Отечественный софт", генеральный директор "Наносемантика" Станислав Ашманов представил доклад "Искусственный интеллект: успехи 2021 г. и прогнозы на 2022-2023 гг.".

"В открытом русскоязычном интернете на данный момент нет перечня результатов по ИИ. На английском их вдоволь, я постарался выступить "фильтром" и скомпоновать основные тренды. Разберу четыре основные темы - наука, кадры, практические проекты, политика", - дал вводную Станислав Ашманов, отметив из основных успехов ИИ анализ огромных объемов текста, а также, что ИИ берет не качеством, а количеством.

Докладчик начал с трендов в науке. Он отметил, что за последние два года появились нейросети типа "трансформер", умеющие генерировать текст, который сложно отличить от написанного человеком (GPT-3) - похоже, что это главный тренд в 2022-2023 гг.; впечатляющие результаты в биологии и медицине (анализ белков, РНК, ДНК); поиск лекарств, предсказание результата химических реакций; Reinforcement Learning (обучение с подкреплением) продвигается за счет игр (AlphaGo), пока применений нет, снижаются требования к GPU.

"Также показало хорошие результаты в этом году обучение на малом количестве примеров за счет предобученных моделей; моделей, обученных на неразмеченных данных; псевдоразметки. И даже обучение без примеров. Кроме них - мультимодальные модели (текст + аудио + изображение), многоязыковые модели (для текстов и распознавания), генеративные сети (GPT, дипфейки с наложением лиц, генерируются даже веб-сайты и код, но сложные математические задачи пока не даются)", - продолжил Станислав Ашманов.

Из остальных трендов он отметил, что NLP-модели побеждают человека в новых задачах (SuperGlue). Однако большие NLP-модели создаются только корпорациями и крупными институтами, так как требуют много GNU. Отмечается неравномерность данных для медицины (только определенные расы, возраста и т.д.), да и в медразработках ИИ заявления об эффективности преувеличены. Для 26% новых статей код выкладывают на Open Source. Падает количество статей, повышается количество автоматически сгенерированных статей и патентов для повышения цитируемости (особенно в Китае и США).

"Самый больной вопрос - кадры. Сейчас кадры утекают в крупные корпорации на большую зарплату, приходится брать студентов второго-четвертого курсов на работу, они забрасывают учебу, и мы знаем, что через два года они уйдут в тот же Сбербанк. Данная ситуация повсеместна - в США, Европе, Китае все понимают, что основное "бутылочное горлышко" - не вычислительные мощности и регуляторные барьеры, а кадры, которых дико не хватает. И из-за этого ИИ чрезвычайно дорого разрабатывать. Зарплаты за два года выросли в полтора-два раза. Людей из других сфер затягивает в ИИ", - отметил Станислав Ашманов, добавив, что в следующем году зарплаты могут вырасти еще в полтора раза.

Основные кадровые тренды: бурный рост в Бразилии и Индии; ИИ - мужская тема (лишь 15% статей - с соавторами-женщинами); Китай вышел на первое место по статьям в наиболее рецензируемых журналах, при этом PhD в нем выпускают в два раза больше, чем в США, и 84% из них остаются работать дома, в основном в Huawei (но стоит быть осторожными с этими показателями, так как их любят завышать). Остальные тренды: корпорации делают лаборатории и совместные статьи в основном с крупными университетами; исследования по ИИ требуют мощностей, корпорации их дают, но крупные ЦОДы - в крупных университетах; "утечка мозгов" - из науки кадры перетекают в корпорации (Google/DeepMind, Amazon, Microsoft), по несколько десятков крупных ученых в год; В России ИИ только стартовал, пока нет результатов, запланированы действия для улучшения ситуации с кадрами; 88% авторов статей получали финансирование от корпораций.

"Говоря о практических результатах, темы, которые привлекали внимание в 2021 г., - поиск новых лекарств, лучшее назначение лечения с помощью ИИ. В медицине - неструктурированные, "шумные" данные. Факт: искусственный интеллект - уже не наука, а скорее ремесло. Во многом стало понятно, как решать задачи, появились стандартные пути решения. Большие ожидания на следующие два года: предприятия будут внедрять технологии безопасности - поведение человека со станком, с конвейерной лентой и т.д. Помимо этого, большие результаты в животноводческой среде. Важно: компании стали фокусироваться на данных, а не на самих моделях", - перешел к практическим результатам Игорь Ашманов.

Кроме того, важной проблемой спикер назвал нехватку чипов, из-за чего США и Европа хотят занизить зависимость от производителей чипов в Китае. Остальные тренды практических проектов: кибербезопасность на базе ИИ; важность платформ для работы с данными (MLflow, Databricks); беспилотный транспорт, а также железо для него (лидары); Китай - абсолютный лидер по умным городам (но США близко).

"Apple позволила себе автоматически анализировать данные на смартфонах пользователей. Похоже, это будет общее правило - все, что на смартфоне, может быть проанализировано ИИ. И если что-то не так, о тебе сообщат или, в лучшем случае, контент будет удален. В мире уже существует 182 "единорога" - компании, которые за короткий срок вышли на капитализацию $1 млрд, их суммарные показатели - $1,3 трлн. Раунды увеличиваются - стартапы матереют. В основном инвестируют в стартапы, разрабатывающие ПО для крупных корпораций, а также в направление финтеха, транспорта, здоровья", - замечает Станислав Ашманов.

Из политических трендов Станислав Ашманов отмечает, что 73% из 524 опрошенных в США ученых - против военных применений ИИ, а также "нетолерантность" ИИ, который может допустить "некорректные" высказывания по поводу расы или пола. В России эта проблема не стоит. Однако Израиль использует рои дронов, контролируемые ИИ; в США активно ведутся разработки военного ИИ, ЕС недалеко от них по данным показателям. Появился новый термин - AI Alaingment (корректное встраивание ИИ в нашу жизнь). В ЕС регулирует искусственный интеллект The AI Act, в России принят Кодекс этики ИИ, присоединение добровольное. Важно, чтобы правила были приняты внутри корпораций, но, по прогнозу спикера, в 2022 г. на этот счет ничего толком не изменится.

"Из других политических и общественных трендов - в ЮАР выдан патент за авторством ИИ (метод соединения контейнеров для пищи). Прорывные проекты по ИИ финансируются DARPA - вкладываются десятки миллиардов долларов в исследования, которые могут и не принести результата, финансы даются на три-пять лет. Корпорации работают с военными (Microsoft, Google), идет гонка вооружений", - заключил Станислав Ашманов.

Далее гендиректор "Нейросемантика" перешел к прогнозам на 2022-2023 гг. На его взгляд, основными стали предположения, что "трансформеры" станут главным инструментом для компьютерного зрения; коммодизация дорогих технологий (распознавание лиц, речи и т.д.); проникновение ИИ в промышленность; разработка ИИ - это ремесло, как разработка мобильного приложения; AIOps важнее AI; больше внимания данным, а не алгоритмам; разработчики ИИ продолжат дорожать; этика ИИ в 2022 г. в России никак не будет учитываться; крепкий рост использования речевых технологий - подешевели распознавание речи, чат-боты, синтез речи, и их внедряют не только в колл-центры. В заключение он отметил, что прорывные научные результаты - не в России, и, по его мнению, "в ближайшие пару лет ничего не изменится, будем использовать чужие архитектуры, датасеты, фреймворки и пользоваться разработками Facebook и Google".

Другие прогнозы из выступления Станислава Ашманова - отток кадров из маленьких корпораций в большие и из РФ в США продолжится; технология нейропроцессоров будет буксовать; платформы "без разработчиков" - NoCode и LowCode; самообучаемые алгоритмы AutoML; продолжится разработка утилит, помогающих сотрудникам (в том числе RPA); военные применения ИИ участятся; AI и IoT наконец-то заработают вместе; прорывы - в биологии и медицине; AI будет взаимодействовать с метавселенными. Отдельно он отмечает, что станут дешевы и доступны для мошенников дипфейки, а генеративный контент распространится постепенно (пример - ИИ может написать рассказ в духе Пелевина), станет очень широко генерироваться, и "мы взвоем от количества контента".

"Радует, что наконец-то технология развивается, но пока еще зависит от человека, который имеет возможность "нажать кнопочку" и запустить процесс. Стоит напрягаться, когда не нужно нажимать на кнопочку - само будет происходить", - прокомментировал этот доклад модератор дискуссии руководитель проектного направления РАЭК Дмитрий Захарченко.

Технология ИИ - стратегически важное для нашей страны и перспективное для общества направление. В этом году в портфеле платформы "Россия - страна возможностей" появился новый проект - серия хакатонов и лекций по ИИ, который реализуется в рамках федерального проекта "Искусственный интеллект". Цели - поиск, развитие и поддержка молодых перспективных специалистов, желающих создавать продукт и сервисы с использованием ИИ, повышение уровня обеспечения рынка ИИ квалифицированными кадрами, формирование и развитие сообщества ИИ, популяризация данной тематики.

"Мы провели в этом году уже более 10 мероприятий из серии "хакатоны и лекции по ИИ" в городах России. Несмотря на то что проект молод, более 1000 участников из более чем 30 регионов страны объединились вокруг него - большой отклик. Помимо хакатонов, проходили лекции по ИИ с целью привлечь максимальное внимание к этой теме. Одна из особенностей проекта - участники хакатона решают реальные прикладные задачи государства и бизнеса. Результаты разработки используются для дальнейшего практического применения. 10 хакатонов успешно состоялись, показали свою востребованность, ценность. Кроме того, они задали высокую планку для последующих 106 мероприятий, которые планируется реализовать в ближайшие три года. Главная цель проекта - утоление кадрового голода, мы хотели помочь талантливым специалистам из регионов проявить себя. Продемонстрировать свои силы, повысить интерес среди молодежи к ИТ-профессиям в целом и к ИИ в частности. Наши участники после каждого хакатона получали предложения о работе и приглашения на стажировки - самый главный эффект от проведения конкурса. На следующий год мы запланировали сразу 36 хакатонов по ИИ, среди которых 25 региональных, восемь окружных и три международных", - сказал заместитель генерального директора президентской платформы "Россия - страна возможностей" (РСВ) Алексей Агафонов.

Директор РАЭК Сергей Плуготаренко сказал, что проект масштабный и интересный, он позволяет не столько прощупать то, какие задачи могут быть поставлены и решены при помощи ИИ, но и по всей России можно составить ландшафт заинтересованных групп населения, у которых, во-первых , есть сообщества (или могут организоваться, например, на базе вузов, ключевых компаний), во-вторых, отношение местных властей к тому, что технологии развиваются и могут решать определенные задачи, в-третьих, как федеральные органы власти могут ставить задачи.

"Федеральные органы должны уметь обрабатывать и предоставлять данные, чтобы на их основе решать поставленные ими задачи. 10 тестовых хакатонов этого года показали, что в принципе все есть: понимание, федеральный проект, органы госвласти, которые умеют собирать, упаковывать и обезличивать данные и предоставлять их разработчикам, решающим задачи. А также умеют с ними взаимодействовать в рамках 48-часового хакатона, что непросто, оценивать и выбирать лучших", - отметил Сергей Плуготаренко.

Он рассказал, что берется город, постановщик задачи, команда РСВ работает с задачей, обозначается боль, которую надо решить, создается датасет, на основании которого нужно обучать системы решению задач, далее формируются команды на платформе, собирают и решают задачи за 48 часов, плотно взаимодействуя с кейсодержателем, экспертами, трекерами и др. Из примеров Сергей Плуготаренко выделил "ИИ для оценки образовательных программ" (Нижний Новгород), "Качественная еда для всех" (Калининград), "Прогнозирование развития природных катастроф" (Ставрополь), "Антикоррупционная экспертиза нормативно-правовых актов" (Великий Новгород), "ИИ на страже водных биологических ресурсов" (Ростов-на-Дону), "Поиск надежных благотворительных организаций" (Пермь), лекции по ИИ от МТС, "Яндекса", Intel, Huawei, агрохолдинга "Степь" и др. Спикер отметил, что на данный момент отработано 14 кейсов в 10 городах, более 1000 участников. В следующем году планируется разобрать более 50 кейсов и задействовать 7500 специалистов ИИ.

Начальник отдела специальных проектов ДИТ Москвы Елизавета Терентьева представила доклад "ИИ в умном городе", в котором рассказала, какие технологии ИИ уже используются и какие будут использованы в 2022 г.

"Цифровая Москва сегодня - это 618,6 тыс. занятых в столичных компаниях ИКТ-специалистов по итогам 2020 г., это около 70% ИТ-отрасли России. Также в городе доля ИКТ составляет 6% от ВРП, объем отрасли составил 4,4 трлн руб. (из них ИТ - 1,4 трлн; интернет - 1,47 трлн; связь - 1,53 трлн). Каждая пятая вакансия на рынке труда Москвы открыта для специалистов в области информационных технологий и связи. 31 Гб мобильного интернет-трафика потребляет одно домохозяйство в Москве, причем стоимость 1Гб - 74 руб. Средняя зарплата опытных программистов с учетом премий и налогов составила 223 тыс. руб. в месяц в 2020 г., что на 11% больше, чем в 2019 г. 14% студентов обучались по ИТ-программам в 2020/2021 учебном году", - привела статистические данные Елизавета Терентьева.

Она также сказала, что в Москве ежегодно реализуется более 100 проектов в сфере цифровой трансформации, как известные населению (электронная медкарта, электронный дневник школьника), так и направленные на внутреннюю цифровизацию. И отметила цифровой сервис mos.ru - "городскую экосистему", которой пользуются 14,4 млн жителей, им предоставляется более 380 цифровых услуг и сервисов, приводятся данные, что в 50 млн визитов в месяц за 2020 г., что на уровне мировых мегаполисов.

"Искусственный интеллект - драйвер развития экономики и государства. Цель - удобнее, комфортнее и безопаснее делать жизнь горожан. Сегодня в Москве внедряется более 70 решений на основе ИИ в сферах цифровых технологий и инноваций, экономики, безопасности, здравоохранения и образования, транспорта, ЖКХ, строительства. Очевидный пример - робот в общегородском контакт-центре, который ищет ответ в базе и отвечает, за январь-октябрь 2021 г. им обработано более 21 млн звонков, из которых 11 млн - без привлечения оператора. Принципиальная позиция Москвы - технологии помогают оптимизировать работу и освобождать ресурс экспертов для взаимодействия с людьми и решения более сложных задач" - добавила Елизавета Терентьева.

Новости из связанных рубрик