Рынок больших данных увеличится вдвое
Об этом, открывая пленарное заседание на First Russian Data Forum, сообщил генеральный директор АНО "Цифровая экономика" Сергей Плуготаренко. По его словам, данные - это не только про ИИ, а еще и технологии, регуляторика, вопросы безопасности и технологического суверенитета. "Этой весной мы инициировали разработку концепции Центра технологического лидерства, целью которого является обеспечение поддержки отечественных технологий, лидеров и решений через развитие импортозамещения и цифровых технологий, аналитику рынка, международные кооперации, содействие в маркетинге, продвижении и тиражировании", - отметил Сергей Плуготаренко.
Председатель ИТ-комитета в Госдуме Александр Хинштейн отметил, что в работе с большими данными для государства важна безопасность использования данных пользователей, а для законодательного закрепления необходимо договориться о понятийном аппарате: "В законодательной базе в принципе не существует понятия больших данных. Необходимо договориться, что такое обезличенные данные, обогащение данных и большие массивы данных".
Руководитель стратегического комитета Ассоциации больших данных Мария Поликанова рассказала, что данные уже являются активом, на котором компании зарабатывают. "Мы предполагаем, что развитие будет идти в том направлении, чтобы данные стали активами не только компаний, но и государства, и граждан. Настало время, когда данные становятся национальной ценностью и требуют особого отношения. Мы верим, что объем рынка отечественного программного обеспечения в компаниях составит 85% или даже больше. Это позволит достичь определенной психологической независимости. И наконец будет создано около 32 тыс. высококвалифицированных новых рабочих мест. Для достижения такого состояния рынка нужно решить еще несколько задач. Если говорить об экономике, то нужно масштабировать наработки, которые есть в отраслях, соблюдать интересы государства, бизнеса и общества", - подытожила Мария Поликанова.
Руководитель департамента развития и методологии цифровой трансформации ПАО "Интер РАО" Василий Пушкин сообщил о проблеме со стандартизацией обмена данными между объектами в электроэнергетике: "Два вызова, с которыми мы столкнулись, - это импортозамещение и критическая инфраструктура. Последние несколько месяцев мы думали, как большие данные могут повлиять на электроэнергетику. Отрасль использует их в различных сегментах. Но внедрение систем сбора данных является серьезным ограничивающим фактором. Чтобы оснастить всех пользователей приборами учета стоимостью 6000 руб. и получать в режиме онлайн данные с них, придется потратить триллионы. Одномоментно это сделать нельзя. Программа растянута до 2035 г., и планомерная работа даст эффект".
Большие данные проникают во многие индустрии. Но не все из них к этому готовы. Руководитель аналитических сервисов PREDICT Роман Стятюгин рассказал о модели, которая может подойти практически любой сфере: "Тема ценности данных очень важна, потому что мы говорим про алгоритмы и технологии. Но с моей точки зрения, важен способ доставки этой ценности. Понятно, что есть интернет-компании, ретейл, финансовый сектор. Эти индустрии используют данные давно, они занимаются машинным обучением. Но в ряде других индустрий - промышленности, строительстве, транспорте все только начинается. Мы подумали, где можно применить знания и умения, чтобы сделать продукты для других индустрий, где данные могли бы приносить ценность. Наиболее подходящими вариантами оказались сферы строительства, ЖКХ, развития территорий. У них есть определенные нормативы, но работают они не всегда оптимально, особенно если составляешь проект под конкретную аудиторию, которая проживает на той или иной территории".
Роман Стятюгин привел пример: "Давайте рассмотрим один из кейсов застройщиков, который существует на рынке. Например, квартирография. Для застройщика это стандартный бизнес-процесс, когда анализируется локация, выбирается класс жилья, квартирность домов, определяется метраж. Стоимость оптимизируют под сроки продажи и выручку. Это нормальный аналитический бизнес-процесс. Но надо подумать, какие источники данных могут такую задачу решить: построить модели и сделать из этого продукт. Даже если алгоритм квартирографии и существует, то непонятно, куда его можно отдать. В какую инфраструктуру он ляжет, чтобы начать на стороне застройщика приносить пользу? Поэтому очень важно сделать некий продукт, простой для понимания, как воткнуть вилку в розетку. Мы же не думаем, как электричество бежит по проводам. Мы вставляем вилку в розетку и решаем свою бизнес-задачу. Для того чтобы раскрывать ценность данных, нам нужно доводить ситуацию до "коробочного" продукта, где эта задача легко решается. Здесь целый ансамбль моделей. Одна определяет класс жилья, другая - ценообразование. Бизнесу нужен очень понятный способ использования результатов работы. Тогда им будет интересно и они купят. Мы поняли, что в индустриях, которые только распробовали этот вкус, правильнее доводить ситуацию до уровня полноценного продукта, где представлены данные, их можно настраивать, смотреть, насколько модель может играть в плюс или минус. Мне кажется, что именно такой подход к раскрытию ценности данных для индустрий, которые только начинают, будет очень востребованным".