Синтетические данные станут основным материалом для обучения ИИ к 2028 г.
Партнер Группы компаний "Б1" Сергей Салов на визионерском вечере Ассоциации больших данных (АБД) рассказал о драйверах роста рынка больших данных в перспективе до 2028 г., опираясь на данные Gartner. Согласно прогнозу аналитиков, больших данных будет больше - объем данных генерируется и обрабатывается с ежегодным приростом в 20%.
"Основным источником роста больших данных станут, прежде всего, синтетические данные. Они станут основным топливом для создания технологий искусственного интеллекта. Доля синтетических данных в общем объеме данных, используемых для обучения ИИ, составит 60% к 2028 г.", - рассказал Сергей Салов.
По его словам, другим важным источником новых данных станут датчики, которые работают на основе интернета вещей: доля полученных оттуда данных вырастет до 27% к 2028 г.
"Облачные технологии станут все более критичными с точки зрения как хранения и работы с данными, так и их генерации. Около 70% глобальных компаний будут использовать облачные технологии для работы с большими данными, и около 37% всех данных будут генерироваться и обрабатываться в облаках. Это рост с 20,5% в 2023 г. до 37% к 2028 г.", - рассказал Сергей Салов.
По его словам, главный тренд заключается в том, что основным источником новых данных будут не люди с их персональными данными (ПД), а бизнес и государство: доля данных, генерируемых ими, составит более 80%, а темпы роста объема этих данных будут в три раза выше, чем данных, генерируемых населением.
Основатель компании Privacy Advocates Алексей Мунтян, рассуждая о будущем персональных данных в России, отметил, что персональные данные будут обрабатывать и хранить только имеющие соответствующие компетенции компании, чтобы количество утечек уменьшилось: "В ближайшие годы мы столкнемся с концентраций ПД - это могут быть отдельные организации, ассоциации, конгломераты. Им будет доверять государство хранить данные и обрабатывать персональные и иные категории данных в тех сценариях и с тем уровнем коммерциализации, которые эти компании захотят. Всем остальным игрокам государство, скорее всего, будет снижать возможность обрабатывать ПД".
По словам Алексея Мунтяна, государству будет выгодна такая централизация еще потому, что проще запросить данные не у семи миллионов операторов ПД, а всего лишь у нескольких крупных компаний.
Президент Ассоциации больших данных Анна Серебрякова, подводя итоги пятилетней работы ассоциации и намечая планы, отметила, что одним из направлений работы АБД может стать создание биржи синтетических данных на уровне стран БРИКС.
https://www.comnews.ru/content/236174/2024-11-14/2024-w46/1013/slozhnos…