Павел Токарев, директор по технологиям и инновациям "Инферит Клаудмастер"
Павел
Токарев

директор по технологиям и инновациям "Инферит Клаудмастер"
© ComNews
23.10.2023

Сегодня гиперскейлеры и облачные провайдеры играют ключевую роль в изменении способов доступа и использования технологий для компаний любого размера. О значении гиперскейлеров, их уникальных характеристиках и демократизации технологий, которую они обеспечивают, рассказывает директор по технологиям и инновациям "Инферит Клаудмастер" Павел Токарев.

Понятие "гиперскейлеров"

В понятие "гиперскейлеры" часто включают компании разного типа. В широком смысле под гиперскейлерами понимают компании, обладающие гипер-масштабируемыми центрами обработки данных; в этом случае к гиперскейлерам относят в том числе Apple. В более узком смысле — это только компании, предоставляющие внешним клиентам инфраструктуру как сервис (IaaS), способную масштабироваться по запросу практически без ограничений, а также высоко-масштабируемые сервисы (PaaS и SaaS), построенные на такой инфраструктуре. В этом смысле гиперскейлерами являются только Amazon Web Services (AWS), Microsoft Azure и Google Cloud Platform; нередко к этой группе также относят китайский Alibaba Cloud, построенный "по образу и подобию AWS", а также Oracle Cloud Infrastructure и IBM Cloud.

Гиперскейлеры получили свое название благодаря способности масштабировать (scale) размер предоставляемого клиенту сервиса — например, виртуального сервера (машины) — во много раз за считанные минуты. Масштабируемость сервисов — способность многих провайдеров, но у гиперскейлеров она выведена на совсем иной уровень: речь идет о десятках тысяч реальных серверов, обеспечивающих работу миллионов виртуальных машин, управляемых баз данных, облачных хранилищ и т.д.. Именно масштабы, доступные любому пользователю, отличают их от других провайдеров. Поэтому другим, даже технологически схожим, провайдерам сложно получить звание гиперскейлера. Ключевое слово в определении гиперскейлера — "гипер".

Демократизация технологий

Демократизация технологий, которой способствуют гиперскейлеры, в первую очередь связана с фундаментальной концепцией гибкости использования ресурсов. При использовании Облака компания может получить доступ к почти любому объему необходимых ресурсов, причем с возможностью в любой момент скорректировать этот объем. При этом компания несет затраты только в объеме реального использования ресурсов, что позволяет существенно экономить, когда вычислительные мощности тех или иных характеристик нужны лишь в очень ограниченный период времени. Если проекту сегодня нужны пара небольших серверов, нет необходимости покупать дорогое "железо" с амортизацией 3–5 лет: "завтра" можно взять в аренду у гиперскейлера еще пару серверов — или сразу 10, и даже 100 — всего за пару минут.

Кроме того, гиперскейлеры не только имеют практически неограниченный запас вычислительных и других мощностей — они работают над совершенствованием собственного оборудования, самостоятельно разрабатывая процессоры, свитчи и другие компоненты, которые позволяют с еще большей эффективностью предоставлять услуги облачных вычислений. "Обычные" провайдеры не могут позволить себе такого. В результате самый "обычный" пользователь, введя данные банковской карты, может в считанные минуты получить доступ к современным вычислительным мощностям для реализации практически любой задачи.

Другим примером того, как облачные провайдеры, особенно гиперскейлеры, делают передовые технологии более доступными, является стэк ПО, предоставляемых на базе их серверов. Каждый гиперскейлер предоставляет около 200 различных сервисов, отличающихся набором сконфигурированного ПО и уровнем абстракции. В случае базовой инфраструктуры-как-сервис (IaaS) в "комплекте" с виртуальным сервером гиперскейлеры поставляют предварительно сконфигурированные проверенные образы самых разных операционных систем, фактически избавляя пользователей от необходимости заниматься установкой и поддержкой ОС. IaaS пока — самый популярный тип сервисов. Более высокий уровень абстракции — платформенные сервисы (PaaS), где гиперскейлеры берут на себя ответственность также по управлению специализированного ПО — например, СУБД — и сопутствующего middleware. И вот уже клиенту на выбор доступны последние версии любимых баз данных без необходимости управлять не только ОС, но и стэком, обеспечивающим работу БД. Апофеоз абстракции — "ПО как услуга" или SaaS, где единственной заботой клиента являются его данные: например, в случае с сервисами машинного обучения (ML), достаточно передать запись голоса уже обученной модели распознавания речи гиперскейлера, чтобы на выходе получить текст или его перевод. Стоимость такого сервиса определяется исключительно объемом переданных данных (PAYG-модель или оплата по потреблению).

Разумеется, есть возможность и тренировать собственные модели, используя современные machine learning frameworks, и управляемую гиперскейлером среду для работы с ними. Гиперскейлеры также активно включились в гонку за лидерство в области больших языковых моделей (LLM): каждый из "большой тройки" предоставляет своим пользователям доступ к одной из топовых моделей.

Преимущества для бизнеса и обратная сторона удобства

Гиперскейлеры и облачные провайдеры играют важную роль в развитии и доступности технологий. Они предлагают мощную инфраструктуру и программный стек для широкого спектра задач, устраняя необходимость в обширных внутренних ресурсах. Ключевыми преимуществами гиперскейлеров являются непревзойденная масштабируемость, широкий спектр сервисов и оплата по потреблению с высокой детальностью тарификации. Компании могут быстро изменять объем ресурсов или выбирать более мощные альтернативы, не неся издержек переключения. Они получают, с одной стороны, мощную инфраструктуру с дорогими процессорами (GPU, ИИ-ускорители), а с одной стороны, современный софтверный стек, вплоть до моделей машинного обучения. В Облаке легко подобрать ресурсы в том объеме и с теми характеристиками, которые позволят компании решить текущие задачи. Такая гибкость избавляет от необходимости перерасхода при закупке собственного оборудования и необходимости содержать обширные команды по управлению инфраструктурой, такие как DevOps или системные администраторы. Однако экономия часто реализуется только в теории, и об этом — ниже.

В реальности сервисы гиперскейлеров и облачных провайдеров являются экономически более выгодными по сравнению с собственными ЦОДами только в двух случаях: когда специализированные ресурсы нужны на короткий срок и когда загрузка мощностей не стабильна и слабо-предсказуема. Первая ситуация характерна для начинающих компаний с небольшими потребностями в инфраструктуре, которые еще не верифицировали свою бизнес-модель и много экспериментируют. Классический пример — стартапы, которые и обеспечили успешный старт гиперскейлеров. Для таких компаний использование только гиперскейлеров для закрытия всех своих потребностей в инфраструктуре будет экономически оправдано в течение достаточно длительного начального периода.

Во втором случае — это крупные компании, бизнес-модель которых предусматривает пиковые нагрузки на инфраструктуру, но их величину, однако, сложно прогнозировать — например, e-commerce-проекты в период "черных пятниц", которые выигрывают от возможности быстро масштабировать инфраструктуру в Облаке.

Средним и крупным компаниям с устоявшейся бизнес-моделью сложно рекомендовать использовать только услуги облачных провайдеров: если ориентироваться на прибыль AWS, такие компании, по сути, переплачивают около 30% за аренду облачных серверов и их обслуживание. При этом, если верить компаниям, которые переносят существенную долю мощностей в собственные ЦОДы, посыл об экономии на поддержке инфраструктуры при использовании сервисов гиперскейлеров тоже оказывается ложным: чтобы поддерживать сервисы провайдера, им требуется примерно столько же сотрудников, сколько для поддержки собственных серверов со всем необходимым ПО.

Переосмысление ландшафта безопасности и суверенитет данных

Хотя провайдеры облачных вычислений берут на себя ответственности за безопасность инфраструктуры, компаниям следует четко понимать, где заканчивается ответственность провайдеров и начинается их собственная. АWS, например, ставят такое разграничение во главу угла своей так называемой Модели совместной ответственности: AWS отвечает за "безопасность облака", в то время как "безопасность в облаке" — это ответственность клиента. Пользователи, таким образом, должны хорошо понимать свою ответственность за правильность конфигурирования сервисов, шифрование, защиту данных и настройки доступа. При этом уровень ответственность клиента определяется используемым сервисом; выбор сервиса определяет объем работ по настройке, которые должен выполнить клиент в рамках своих обязанностей по обеспечению безопасности.

Суверенитет данных, определяющий, где и как обрабатываются и хранятся данные, имеет решающее значение для многих компаний. "Облако" — всего лишь термин, данные в конечном итоге всегда "лежат" на физических серверах. Провайдеры облачных вычислений, в том числе и гиперскейлеры, прозрачны в отношении географии хранения данных и дают возможность пользователям выбирать, где физически будут находиться их данные, будь то облачное хранилище или облачные вычисления. Гиперскейлеры также подчеркивают высокий уровень защиты их физических серверов от несанкционированного доступа и широкие возможности шифрования данных клиентов на всех стадиях их обработки. Если компания выбирает крупного глобального провайдера с местным присутствием, то можно с высокой уверенностью говорить, что она выполнит требования местных регуляторов с точки зрения суверенитета данных своих клиентов и их безопасности — при условии, конечно, что компания выбрала "свой" регион для хранения и обработки данных и обеспечила защиту данных, правильно сконфигурировав используемые сервисы и настроив шифрование.

В целом же стоит отметить, что сейчас не только в России, но и во всем мире наблюдается тренд на отказ от глобальных провайдеров в пользу частичного использования локальных провайдеров.

Гиперскейлеры и облачные инновации изменили технологический ландшафт, сделав современные технологии и вычислительные ресурсы доступными для компаний любого масштаба. Демократизация технологий в сочетании с масштабируемостью, экономичностью и возможностями AI/ML позволяет компаниям быстро расти в постоянно развивающемся цифровом мире. Однако при переходе к облачным технологиям компаниям необходимо помнить, что Облако не всегда будет для них дешевле собственных ЦОДов, а ответственность за безопасность их облачной инфраструктуры и суверенитета их данных все еще во многом на их стороне.