Российский бизнес не готов открывать данные
Директор по информационным технологиям "EdgeЦентр" Сергей Липов уверен: несмотря на то что в некоторых кругах возможно наблюдать усталость от темы "открытых данных", интерес к этой теме продолжает расти. "Возможности, которые предоставляют открытые данные, становятся все более очевидными в контексте цифровизации экономики и общества. Открытые данные позволяют аналитикам и исследователям получать более глубокое понимание различных процессов и тенденций, что в свою очередь способствует принятию обоснованных решений и формированию стратегий", - пояснил Сергей Липов.
Генеральный директор АНО "Информационная культура" Иван Бегтин обратил внимание, что открытые данные, как большое движение в мире, становятся не только темой в себе, но и частью государственной и научной политики в части открытой науки (open access), доступности данных для бизнеса наряду с другими практиками обмена данными (data sharing), прозрачности и открытости государства (open government), причем инновации, основанные на данных, такие как искусственный интеллект (ИИ) и большие языковые модели (LLM), существенно усиливают данные тенденции.
Директор практики "Стратегия трансформации" "Рексофт Консалтинг" Алексей Богомолов назвал открытые данные базой для развития перспективных технологических решений, в частности, нейросетей и машинного обучения: "Наиболее развитые экономики мира ведут целенаправленную государственную политику по открытию данных крупнейшими игроками рынка и государственными структурами. В России пока это направление находится в зачаточном состоянии, так как предстоит переломить тенденцию по закрытию данных ключевыми отраслевыми игроками. Приведу пример на добывающей отрасли. Сегодня есть огромный интерес компаний к любой открытой информации по нефтегазовым активам, сравнению результата потенциальных инвестиций и результатов хозяйственной деятельности с аналогичными объектами по всему миру, ремонту оборудования, стартующих проектах, потенциальных M&A в профильной сфере и пр. Эта информация востребована для детального анализа различных аспектов хозяйственной деятельности предприятия и подготовки принятия управленческих решений. Продукты компаний, которые исторически развивали направление аналитики в данной области, более недоступны российским предприятиям. Аналогичная ситуация есть и в других отраслях. Проработка вопроса открытых данных на государственном уровне точно подтолкнет качественное развитие экономики".
"Проекты в области открытых данных имеют свою специфику, которая заключается в необходимости обработки больших объемов информации, ее структуризации и анализе. Это требует использования специализированных технологий и инструментов, таких как машинное обучение, искусственный интеллект, большие данные и др. Это также подразумевает необходимость наличия определенных навыков и знаний у команды, работающей над проектом, - считает Сергей Липов. - Сложность и стоимость проектов в области открытых данных могут сильно варьироваться. Они зависят от многих факторов, включая объем и сложность обрабатываемых данных, используемые технологии, цели проекта, требования к качеству и актуальности данных и многое другое. Некоторые проекты в этой области могут быть типизированы, но большинство из них требует индивидуального подхода и уникальных решений".
По оценке Ивана Бегтина, плюс открытых данных в том, что проекты в этой области относительно просты и недороги, но требуют системного подхода и желания, а не больших денег: "Относительно типизации, опять же, в мире существует большое количество открытых и бесплатных инструментов с открытым кодом, таких как CKAN, DKAN, JKAN, Dataverse, с помощью которых создавать как минимум каталоги данных несложно. Простой пример - недавно созданный в Армении портал открытых данных Open Data Armenia на базе CKAN (data.opendata.am). Чтобы создать его, нашей команде не потребовалось ни много времени, ни много денег, просто желание".
К примерам знаковых проектов руководитель АНО "Информационная культура" относит порталы открытых данных ООН (data.un.org), Всемирного банка (data.worldbank.org), которые используются повсеместно, а также портал Hugging Face, где разработчики выкладывают данные и ИИ-модели на их основе. В России, по мнению Ивана Бегтина, негосударственным проектом является проект "Госзатраты" (clearspending.ru), где собираются и раскрываются данные по государственным закупкам и предоставляются открытые данные большого объема, а из российских госорганов только ФНС России и Минкультуры РФ можно привести как примеры органов власти, раскрывающих много данных.
Сергей Липов считает, что проект "ВЦИОМ-Навигатор", который анонсировал 21 декабря 2023 г. генеральный директор ВЦИОМ Валерий Федоров на пресс-конференции, посвященной подведению итогов года, вполне может стать знаковым для России, поскольку он предполагает создание объективной и полной картины общественного мнения на основе большого объема данных.
Основным модулем "ВЦИОМ-Навигатор" являются постоянно пополняемые базы данных опросов, начиная с 1992 г. Целевой аудиторией данного сервиса его авторы видят экспертов-практиков, представителей госорганов, СМИ, а также всех, кто интересуется социальными процессами и общественным мнением. В 2024 г. их дополнят тематические подборки, а также данные экзитполов и электоральные прогнозы разных лет.
"Оценка открытых данных - один из критериев при составлении проводимого Счетной палатой рейтинга открытости органов власти. В докладе за 2023 г. уровень открытости Роскомнадзора определен как высокий, - сообщила ComNews пресс-служба Роскомнадзора. - Роскомнадзор размещает на корпоративном сайте 26 наборов открытых данных. Преимущественно это сведения из реестров, которые ведет ведомство по различным направлениям деятельности. Статистика просмотров и загрузок говорит об их востребованности. За 30 дней открытые данные Роскомнадзора просмотрели 26 тыс. раз, загрузили 14 тыс. раз".