Большой взгляд на большие данные

В октябре 2018 года операционный директор "МегаФона" Анна Серебряникова стала президентом созданной тогда же Ассоциации участников рынка больших данных, а два месяца спустя она оставила пост в сотовой компании. В интервью главному редактору ИГ ComNews Леониду Конику Анна Серебряникова рассказала о причинах ухода из "МегаФона", о новой работе в USM Holdings Ltd. (контролирующий акционер ПАО "МегаФон") и задачах ассоциации, а также объяснила, почему не нужно давать юридического определения большим данным.
- Когда именно вы покинули пост операционного директора "МегаФона" и почему?
- Я работала в этой компании с 2006 года, прошла там большой путь и ушла из нее 21 декабря 2018 года в связи с тем, что меня пригласили в USM Holdings на пост заместителя генерального директора по развитию цифровых проектов и GR, а также выдвинули от холдинга в совет директоров "МегаФона". В совет директоров не включают менеджеров – соответственно, и по формальным причинам мне нужно было быстро принять решение о переходе. Что касается должности операционного директора в "МегаФоне", то переход на уровень группы USM мне видится логичным: в группе я продолжаю фокусироваться на проектах в сфере цифровой экономики, и нужный эффект достигается в сотрудничестве с "МегаФоном". Сколько я ни пыталась перестать быть юристом, мне это до конца не удается. Отчасти это помогло создать Ассоциацию участников рынка больших данных – как ответ рынка на попытки не лучшим образом отрегулировать перспективные технологические направления.
- Кто предложил вам войти в совет директоров "МегаФона" от USM Holdings?
- Иван Яковлевич Стрешинский. Он руководит компанией USM Management, и такие решения не могут приниматься без него.
- Какие задачи поставил USM Holdings перед вами как членом совета директоров "МегаФона"?
- Для меня развитие цифровых сервисов и участие "МегаФона" в создании рынка цифровых продуктов по-прежнему остается фокусом. Также я продолжаю возглавлять рабочую группу "Информационная инфраструктура" в АНО "Цифровая экономика" – там решается много операторских вопросов, и отстаивание интересов бизнес-сообщества (и в частности, "МегаФона") является одной из моих основных задач. Кроме того, в работе обсуждается множество других важных вопросов, таких как 5G, IoT, меры стимулирования развития этих рынков, импортозамещение.
- Не возникает ли конфликта интересов: с одной стороны, вы представляете "МегаФон", а с другой – возглавляете рабочую группу, которая является надкорпоративным органом?
- Все рабочие группы в АНО "Цифровая экономика" возглавляют представители бизнеса. И это не конфликт: напротив, со стороны государства был запрос – привлечь людей из бизнеса, чтобы они давали объективную оценку происходящему. Да, нам не очень нравится, когда в тех или иных проектах происходят изменения в пользу единственного поставщика. Мы всегда выступаем за рыночные механизмы, и хорошо, что у нас появилась возможность доносить свою позицию до руководства страны.
- Ассоциацию в октябре 2018 года учредили "МегаФон", Mail.Ru Group, oneFactor, Тинькофф Банк, "Яндекс" и Сбербанк. Но уже тогда вы говорили, что она открыта к приему новых членов и интерес к вступлению проявили Газпромбанк и "Ростелеком". Какие компании с тех пор вступили в ассоциацию или подали заявки на вступление?
- Газпромбанк вступил в ассоциацию еще в январе 2019 года, в марте это сделали "Ростелеком" и группа QIWI. Мы ведем переговоры с рядом других потенциальных участников. Организация открыта для новых членов – компаний-операторов больших данных из всех отраслей экономики. Но надо понимать, что участие в ассоциации требует от ее членов вовлеченности, человеческих и финансовых ресурсов. У нас есть обширная повестка, по которой активно работают представители всех членов ассоциации, есть и существенный ежегодный взнос.
- На что вы планируете расходовать членские взносы?
- У нас есть целый ряд задач, которые требуют в том числе финансовых ресурсов. Одна из них – разработка стратегии развития рынка данных с привлечением консультантов. С ее помощью мы хотим показать, почему для эффективного роста рынка нужна возможность свободно тестировать новые бизнес-модели, нужно дать "прорасти" саморегулированию и сохранить акцент на стимулировании государством развития сотрудничества в сфере больших данных и искусственного интеллекта. Мы видим, что рост в этом сегменте идет, и весьма существенный. Важно его не остановить, а поддержать. В разработке стратегии мы будем опираться на международный опыт и российские реалии.
Второе большое направление, которое мы запускаем и которое требует финансирования, – создание "песочницы" для стартапов. Вы наверняка в курсе дискуссии по "открытым данным" и позиции "Сколково", считающего, что данные нужно давать всем. (Летом 2018 года "Сколково" и компания Double Data предложили разрешить бизнесу использовать без согласия пользователей "открытые данные" – то есть любую легально попавшую в Интернет информацию о них, – прим. "Стандарта"). Нас эта позиция беспокоит – как владельцев баз данных и гарантов защиты персональных данных наших клиентов. Для того чтобы ответить на запрос стартапов, мы хотим создать специальную среду, в которой они смогут тестировать бизнес-модели. Мы видим свою роль в стимулировании развития инноваций, но так, чтобы это не нарушало законные интересы граждан.
Перед нами также стоит задача по выработке технологических и этических форматов взаимодействия для обмена данными между участниками рынка и обогащения этих данных. Ассоциация совместно с Институтом развития Интернета уже приступила к созданию этического кодекса использования данных, который станет обязательным для членов ассоциации, а позже, мы надеемся, и для всех участников рынка.
Кроме того, для нас важна просветительская работа. Обществу важно понимать, какие выгоды можно получить от поддержки деятельности в области аналитики больших данных. Ведь в конечном счете все, что мы делаем, направлено на улучшение опыта наших клиентов.
- Когда можно ожидать появления стратегии развития рынка данных?
- В начале апреля мы определимся с выбором консультанта (мы выбираем из числа мировых лидеров, имеющих глобальную экспертизу, но представленных на российском рынке), и три-четыре месяца уйдет на саму работу. Таким образом, документ будет готов к концу лета. Результаты работы будут обязательно раскрыты бизнес-сообществу, государству и обществу.
- Ассоциация больших данных зарегистрирована по адресу Москва, Оружейный переулок, дом 41, где находится головной офис "МегаФона". Значит ли это, что "МегаФон" играет в ассоциации первую скрипку?
- Во-первых, прецедента, когда технологические лидеры, крупнейшие российские компании без какого-либо давления решили создать ассоциацию, не было – это случилось в первый раз. Отчасти я считаю это достижением своей команды: мы эту идею вынашивали года два. Адрес "МегаФона" – технический вопрос: идея задумывалась в стенах этой компании. Возможно, со временем мы изменим адрес – это непринципиально. Адрес влияет только на то, где получать корреспонденцию и на обслуживании какой налоговой инспекции находиться.
- В ИТ-сфере большими данными традиционно называются полуструктурированные и неструктурированные массивы данных. Как это понятие трактует возглавляемая вами ассоциация?
- Согласно общепринятой терминологии, базы больших данных – это массивы, отвечающие таким критериям, как Volume, Variety, Velocity, то есть важны объем, разнообразие и невозможность обработки в ручном режиме. Однако юридического определения для больших данных не существует нигде в мире, что неслучайно: это сложный объект правоотношений и его нельзя однозначно определить через гражданско-правовые понятия. Большие данные можно только отделить от других специальных форматов. Например, "большие данные – это массив данных, которые не являются персональными".
- А массив – это сколько? Помнится, в мультфильме "38 попугаев" Слоненок спрашивал у Удава: "Три ореха – это куча или не куча?"
- Важен не объем массива. Важно, чтобы он позволял делать верные выводы. Если у вас хорошая выборка, то это и будут большие данные, вне зависимости от количества записей – будь их тысяча, миллион или сто миллионов. Наша задача как ассоциации заключается в том, чтобы доступных массивов, пригодных для аналитики, стало как можно больше. Это будет способствовать развитию рынка.
- В стратегии развития рынка данных тоже не будет их определения?
- На мой взгляд, не нужно давать определения. Ведь можно не давать легального определения дождя – само явление от этого никак не изменится. Суперпозитивизм в праве – "давайте все определим, а если нет, то этого не существует" – это весьма своеобразный подход, который кажется простым, но в мире он не доминирует. Приведу пример: в РФ у гражданина есть право быть забытым, то есть удалить о себе всю информацию из поисковой выдачи в Интернете, если там содержатся порочащие его данные. Закон об этом есть только в России, а весь остальной мир живет в рамках договоренностей: есть общественный договор, есть обычаи делового оборота. В постоянно меняющемся мире не нужно давать определения всему – иначе мы получим бесконечное наслоение неприменимых норм.
Легальное определение понятия "большие данные" зависит, в частности, от результатов дискуссии о соотношении понятий "данные" и "информация". И в этом сложность. При этом в стратегии ассоциации мы планируем изложить подходы к тому, как можно работать с большими данными, каков текущий уровень зрелости рынка и перспективы его развития, какие шаги нужно сделать для его уверенного роста. В этом контексте важно определить права владельцев баз данных, то, каким образом должно происходить управление правами доступа к этим базам, и как обеспечить безопасность работы с данными.
- Через 10 дней после регистрации ассоциации, 20 ноября 2018 года вице-премьер Максим Акимов на "Транспортной неделе" заявил, что "монополизация рынка данных – это основной барьер для развития цифровой экономики в России". Состав учредителей ассоциации (крупные корпорации) и их количество вроде бы подтверждают опасения вице-премьера. Считаете ли вы монополизацию рынка больших данных вредной или полезной?
- Риски монополизации рынка требуют постоянного внимания со стороны государства. Однако в России большое количество локальных игроков, и ни у одного из них нет монопольного положения. Но также важно не создать монополию государства в области больших данных. Безусловно, есть информация, которая может находиться только во владении государства, но также есть данные, которые могут и должны быть доступны рыночным игрокам. Например, можно организовать отдельные базы данных, ГИС или цифровой профиль с системой доступа и открытым API с различными правами (как платными, так и бесплатными).
Возможно, кто-то думает, что мы собрались в ассоциацию, чтобы закрыть периметр и никому больше не дать доступ к данным. Но это, конечно же, не так: большие данные собирает огромное количество участников рынка.
Создание ассоциации не ведет к монополизации чего-либо. Более того, мы видим рыночную потребность в том, чтобы обогащать данные друг друга без передачи исходной информации. И чем больше будет участников этого процесса, тем более качественные данные у нас будут. Сейчас это находится в "серой" зоне, но хорошо бы легализовать обогащение данных. Тогда возможность доступа к данным и аналитике на их основе будет у большего количества участников информационного оборота. Это придаст импульс развитию рынка.
- Смогут ли получить доступ к таким данным все желающие, или только те, кто сдает исходные данные в "общий котел"?
- "Общий котел" вовсе не обязателен. Нет ни технической, ни бизнес-необходимости соединять базы данных. Достаточно научиться их обогащать. А доступ к данным должны иметь все, кто соблюдает выработанные правила. Рынка сырых данных пока нет и, скорее всего, не возникнет, ведь продаются результаты анализа. И если у кого-то есть запрос на получение аналитики, то все будут счастливы предоставить данные на определенных коммерческих условиях, поскольку компании несут затраты на то, чтобы собирать, хранить, обрабатывать, структурировать и анализировать данные.
- Основой для обработки больших данных являются цифровые платформы. В последние пару лет их пытаются создавать крупные компании в различных секторах экономики, целые отрасли, правительства разных уровней и транснациональные корпорации. Какую роль цифровым платформам отводите вы? Кто, на ваш взгляд, должен их создавать?
- Цифровые платформы нужны, и чем их больше, тем лучше. Это инновационная область, поэтому чем больше в ней будет различных экспериментов, тем быстрее будет идти прогресс. Я не вижу необходимости создавать одну платформу, например, для нефтегазовой отрасли, или для металлургов. Если компании в рамках индустрии захотят обмениваться данными – они это сделают и без обязательной единой платформы. Каждое крупное предприятие думает о том, чтобы оцифровать свою деятельность. Кто-то продвинулся больше, кто-то меньше, но чем больше платформ и чем выше конкуренция между ними – тем лучше. И чем больше конвергентности между платформами – тем лучше: проприетарность будет тормозить развитие.
- Есть ли у ассоциации планы разрабатывать стандарты, или к ним такое же отношение, как к определениям?
- Стандарты – это более технологическая и прикладная вещь, поэтому я думаю, что мы к этому придем, но позже. Сначала нужно решить верхнеуровневые задачи. Параллельно, как я уже упоминала, мы разрабатываем этический кодекс использования больших данных: у ассоциации есть задача улучшить имидж больших данных в экономике, чтобы их использование было прозрачным для общества и государства. Транспарентность рождает доверие.
