Уже в текущем году на российском рынке могут появиться решения, использующие разработки в сфере генеративного искусственного интеллекта в области ИБ. Это новое направление, развитие которого обусловлено активным запросом на высокоавтоматизированные системы как следствие кадрового голода.
© ComNews
16.01.2023

Наиболее известной системой, использующей большие языковые модели (LLM в английской аббревиатуре) является ChatGPT, появившийся 30 ноября 2022 года. Данный инструмент выдавал тексты, которые даже эксперты не всегда отличали от тех, что написаны человеком. В частности, по результатам, полученным инструктором по пульмонологии и экстренной медпомощи в Feinberg School of Medicine Северо-западного университета (Эванстон, Иллинойс, США) Кэтрин Гао, 32% рефератов статей, сгенерированных ChatGPT, прошли проверку рецензентов научных журналов. А целый ряд учебных заведений даже срочно изменил процедуры контроля знаний студентов, отказавшись от эссе и сочинений.

Практически сразу после появления ChatGPT начали использовать киберпреступники. Согласно данным исследования Check Point Research, данный инструмент уже применяется для написания программ на Python, Java и макроязыке приложений из MS Office, направленных на кражу данных, вымогательство и рассылку вредоносного кода.

Шумихой вокруг модного сервиса пытались воспользоваться также и авторы сомнительных мобильных приложений. "В App Store много приложений, представляющих собой платную оболочку для ChatGPT, которые заставляют вас поверить, что вы платите за доступ к этой платформе", - предупреждал основатель и генеральный директор Bloomtech Остин Оллред. Ситуация в Google Play еще хуже: многие приложения требуют оплаты, но не обладают заявленной функциональностью.

По мнению бизнес-консультанта Positive Technologies Алексея Лукацкого, ChatGPT может быть очень опасным инструментом в руках авторов фишинговых рассылок и сайтов, поскольку правдоподобность текстов станет выше. Однако эксперт озвучил прогноз, что ChatGPT может стать очень полезным инструментом для создания высокоавтоматизированных систем: "Мы ожидаем автоматизации рутинных задач за счет использования специализированного ПО, например систем класса SOAR, или отдельных модулей и функций в существующем ПО, например решений SIEM, NDR или WAF, позволяющих решить большинство задач ИБ силами существующих специалистов, а также благодаря использованию уникальных средств защиты, основанных на применении технологий machine learning и способных предотвращать хакерские атаки силами буквально одного-двух экспертов ИБ".

Также, по мнению Алексея Лукацкого, системы LLM можно будет использовать для написания разного рода документации, в частности политик ИБ, с чем дела традиционно обстоят очень плохо. "Я попробовал дать ChatGPT задание написать мне разные политики ИБ. Ну что я могу сказать: не идеально, конечно, есть куда развиваться. Но в первом приближении есть основа, которую можно улучшать уже человеку. Но как база - вполне. А уж если систему обучить на большом объеме текстов политик и стандартов, то можно получить очень достойный инструмент генерации документов ИБ", - так описывает результат своих экспериментов с ChatGPT Алексей Лукацкий. Также данный инструмент показал неплохие результаты при поиске потенциальных уязвимостей в коде. Но при работе с текстами на русском языке ChatGPT иногда ошибается, обычно проблемы возникают с согласованием слов в предложениях. Также много ошибок при использовании терминов, в том числе и в ИБ.

"Сервисы на основе ИИ и нейросетей однозначно способны ускорить разработку, потому что любой язык программирования балансирует между удобством чтения кода разработчиком и компактностью написания. Даже для самого простого действия, например вывода фразы на экран, надо написать как минимум полтора десятка символов. Поэтому любые средства на базе ИИ, которые понимают, что нужно дописать, серьезно сокращают рутинные процессы разработки, ускоряют написание кода и ценятся программистами, - уверен директор департамента разработки ПО "Рексофт" Николай Сокорнов. - Но есть и риски. Как это ни парадоксально, но такие инструменты скорее увеличат порог вхождения в профессию. Любые средства автоматизации программирования уменьшают количество рутинных задач. Вместе с этим сокращается потребность компаний в начинающих разработчиках, ведь в любой профессии обучение строится от простого к сложному. Новичкам чаще всего поручают именно рутинные задачи - написать по образцу 10 раз сходный кусок кода. Инструменты на базе ИИ исключают потребность в таких действиях, а значит, компаниям будут на входе нужны разработчики более продвинутого уровня, которые знают не только синтаксис языка, но и то, как строится приложение или из каких компонентов оно состоит, какие библиотеки существуют и т.п. Кроме того, разработчик должен будет уметь проверить, правильную ли конструкцию дописал ИИ".

ML/AI архитектор Softline Digital Дмитрий Зборошенко считает, что на данной стадии развития LLM-системы пока еще плохо подходят для промышленного применения: "Большинство современных языковых моделей, в том числе ChatGPT, мультиязычны, могут работать с русским языком. Однако есть существенные ограничения - грубо говоря, фреймворк она не напишет. Важный нюанс, что сеть способна генерировать связный текст, фрагменты кода, однако ее каждый раз нужно проверять на достоверность: условно код может выглядеть правдоподобно, но не будет выполняться, текст будет связным и непротиворечивым, но не отражать фактического положения дел. Для промышленного использования генеративные сети пока плохо подходят, так как каждый результат необходимо проверять".

Генеральный директор ИИ-компании iPavlov Лоран Агобян считает, что программистов заменить такие системы не смогут, да и не в этом их цель: "Однако они превратят ИТ-индустрию в гораздо более креативную среду и создадут огромные новые рынки. Системы типа ChatGPT нуждаются в существенных доработках для обработки текстов на других языках, в частности русском. Чем сложнее язык, тем больше требуется "дообучение" системы, что в конечном итоге сводиться к большим финансовым инвестициям. Ясно, что в XXI веке развиваться будут экономики тех стран, которые сделают гигантские вложения в создание предобученных NLP-моделей для своих языков. Современные цифровые ассистенты, созданные на базе таких систем, как ChatGPT, способны многократно увеличить объем продаж, внутреннюю производственную эффективность, уровень и культуру массового обслуживания любой крупной корпорации, что напрямую увеличивает ВВП страны. Мы видим это в ежедневной работе с нашими индустриальными заказчиками, при внедрении наших цифровых ассистентов и ботов в самые различные сектора экономики - от здравоохранения до госуслуг. На наш взгляд, инвестирование в подобные системы должно стать национальным приоритетом".

Эксперт в области ИИ Axenix AI Дмитрий Назаренко обращает внимание, что программирование, несмотря на требуемый объем технических знаний для успешного освоения, во многом творческая профессия. Учитывая, что нейросети пока умеют только генерировать решения, в той или иной мере являющиеся комбинациями уже поданных на вход данных, а не создавать что-то действительно новое, - опасность быть замененными грозит только программистам, чей предел - рутинные проекты малого размера и сложности. Однако для генерирования разного рода скриптов использование инструментов LLM весьма и весьма перспективно, но пока под контролем живых программистов.

Независимый эксперт в области ИТ и телекома Вадим Плесский высказал серьезный скептицизм в отношении качества работы ChatGPT и его аналогов: "Для любой системы, использующей ИИ, важно количество и качество датасетов, на котором проходит обучение. Создатели ChatGPT утверждают, что они обучали систему с использованием Wikipedia. А объем и качество русскоязычных статей в Wikipedia серьезно уступают англоязычным, и они отстают по времени. В результате с большой вероятностью можно утверждать, что сгенерированный системой (той же ChatGPT) текст на русском языке будем более "бедным" по сравнению с текстами на английском.

Утверждать, что системы с ИИ заменят программистов, неверно. Любой проект по разработке программного комплекса предполагает детальное изучение предметной области, составление технического задания, разбивку общего ТЗ на подзадачи и выбор инструментов для реализации. Когда (если) все было сделано, дальнейшую реализацию - с постановкой узкопрофильной задачи и ее решением с помощью заранее выбранных инструментов - можно автоматизировать, в том числе с использованием инструментов ИИ. Но если кто-то из заказчиков надеется, что появятся системы на основе ИИ и реализуют все их "хотелки", причем разработчикам и подрядчикам платить не придется, то это утопия".

Генеральный директор Alphabet Сундар Пичаи и глава отдела искусственного интеллекта Google Джефф Дин заявили, что Google не будет запускать продукт, подобный ChatGPT, из-за репутационного риска, связанного с этой технологией на данной стадии ее развития. При этом у корпорации большие планы на 2023 г. по развитию LLM-продуктов.

Новости из связанных рубрик