Разработчики ИИ прорвались к госданным
"Уже в I квартале следующего года необходимо внести в парламент проект закона, который позволит открыть доступ разработчиков нейросетей к большим данным, в том числе к государственным массивам этих данных, которые являются настоящей питательной средой для развития технологий искусственного интеллекта по целому ряду направлений", - сказал глава государства.
Кроме того, президент поручил как можно быстрее принять необходимые для этого нормативно-правовые акты. "Прошу правительство оперативно внести в парламент проекты законов, которые позволяют вводить экспериментальные правовые режимы для использования технологий ИИ в отдельных отраслях экономики и социальной сферы", - сказал он.
Ассоциация больших данных (АБД) поддерживает обе инициативы Владимира Путина. "Что касается экспериментальных правовых режимов в сфере ИИ и больших данных, после принятия законов потребуется провести тестирование различных подходов в области анонимизации данных - это первостепенная задача в данном направлении. Также АБД давно ведет диалог с представителями различных ведомств по вопросам доступа к государственным данным", - рассказал корреспонденту ComNews исполнительный директор Ассоциации больших данных Алексей Нейман.
В октябре 2020 г. АБД направила в правительство письмо с предложением разработать дорожную карту по развитию электронного взаимодействия между государством и бизнесом, предусмотрев мероприятия по обеспечению доступа к государственным информационным системам, ресурсам и реестрам на новом уровне качества, на основе SLA. "Такое взаимодействие позволит бизнесу обеспечивать доступ клиентов к государственным услугам и данным через свои экосистемы без предоставления ими справок и других документов", - говорит Алексей Нейман.
В качестве примеров потребностей бизнеса в государственных данных исполнительный директор АБД упомянул создание удобных для граждан сервисов навигации, для чего необходимы актуальные сведения о дорогах и дорожных знаках (организации дорожного движения) из государственных систем. Сервис для малого и среднего бизнеса по выбору оптимальной локации для торговой точки, наряду с данными картографических сервисов или сведениями о профиле потребителей, требует также данных Росреестра о категории стоимости недвижимости, данных операторов фискальных данных (транзакции в рознице) и других дата-сетов.
Генеральный директор BellSoft Александр Белокрылов уверен: пришло время, когда компании, которые в последние годы вели исследования и разработки в области искусственного интеллекта, готовы развивать ИИ-инструменты в промышленном масштабе. Для стандартизации доступа к большим данным государства он предлагает создать консорциум: "Мы занимаемся развитием прогрессивных технологий, но, чтобы они были безопасны, необходим стандарт. Поэтому, прежде чем дать доступ к большим государственным данным, нужно разработать регламент и систему, где все участники процесса будут иметь возможность ее проверять, контролировать и развивать. Организационно необходим консорциум, совместно с государством и бизнесом определяющий стандарт доступа к данным, его соблюдение и развитие, в который войдут как представители государственных органов, так и разработчики".
Заместитель генерального директора по работе с национальными проектами компании Softline Андрей Шолохов выделяет три класса больших данных в государственных информационных системах, которые могут применяться независимыми разработчиками. "Прежде всего, это универсальные данные - данные в широко распространенных форматах, например, видеопоток или изображения, которые разные группы заинтересованных лиц могут использовать с различными целями. Например, недавно обозначенный интерес страховых компаний к записям видеокамер, доступ к которым может помочь в проведении быстрых расследований инцидентов с автомобилями. Во-вторых, индустриальные данные, которые содержатся в специализированных реляционных форматах и могут быть интересны игрокам из ограниченного круга индустрий. Например, обезличенные данные по запросам в различные фонды и к государственным инструментам поддержки теоретически позволят уточнить скоринговые модели банков или страховых компаний. И в-третьих, ведомственные данные, которые могут быть полезны исключительно для нужд ведомства, владельца информационной системы. Примером является проходящий прямо сейчас конкурс Счетной палаты, где представлен ряд задач, интересных для ряда ведомств. В его рамках Счетная палата оценивает проекты нескольких команд для определения лучшего подхода в решении задач машинного обучения", - рассказал Андрей Шолохов.
Он отметил, что государственные структуры уже предоставляют данные, правда, пока только для научных целей. "Этим занимается Центр перспективных управленческих решений в партнерстве со Счетной палатой через цифровую платформу "Инфраструктура научно-исследовательских данных" (ИНИД), которая позволяет исследователям оптимизировать процесс работы с данными российских ведомств. Предоставление разных типов данных - универсальных, индустриальных, ведомственных - независимым разработчикам имеет разный экономический эффект. Государству стоит это отразить в запланированных законах, в том числе и в привязке к ожиданиям от внедрения технологий ИИ", - пояснил Андрей Шолохов.
Заместитель генерального директора ГК "Программный Продукт" (российский разработчик ПО) Георгий Лагода напомнил, что ИИ как технология представляет собой набор различных субтехнологий. "Нейросети, машинное обучение, компьютерное зрение, предиктивная аналитика применимы во всех отраслях экономики, включая транспортный сектор, здравоохранение, экологию, ЖКХ и энергетику, образование и т.д. Также технологии ИИ могут применяться в объектах критической информационной инфраструктуры. Наборы государственных данных, к которым могут получить доступ разработчики, разнообразны и зависят от отрасли, для которой разрабатываются решения. Естественно полагать, что законы о доступе к таким данным должны учитывать федеральные законы о защите персональных данных (152-ФЗ) и о критической информационной инфраструктуре (187-ФЗ). Предоставление такого доступа не должно нарушать безопасность данных, которые прописаны в требованиях ФСТЭК, если речь идет о персональных данных или конфиденциальной информации, а доступ к ним необходимо предоставлять с использованием средств криптографической защиты информации, прошедших сертификацию в ФСБ", - прокомментировал Георгий Лагода.
Заместитель генерального директора по развитию и взаимодействию с резидентами АО ОЭЗ "Иннополис" Вадим Галеев считает, что необходимо начать с разработки правил и подходов, общих методов государственного API - интерфейса, по которому будет происходить обмен данными. "Чтобы обогащение данными происходило качественно, нужно проанализировать всю их таксономию, которая есть сейчас у государственных органов. Ведь мы прекрасно знаем, что в разных ведомствах одни и те же данные могут быть записаны по-разному. Произведя эту работу, связав имеющиеся информационные системы ведомств и открыв их для разработчиков, мы сможем достичь цифрового превосходства в сервисах", - объяснил Вадим Галеев.