Ядерные данные
В дни технологической конференции Oracle OpenWorld 2018 (Сан-Франциско, США) представители департамента Европейской организации по ядерным исследованиям (Conseil Europeen pour la Recherche Nucleaire, CERN) и корпорации Oracle рассказали о том, как справляться с объемами данных, а также о сотрудничестве в рамках проекта OpenLab.
Помимо исследований в области физики, CERN развивает компьютерные технологии. В частности, в стенах крупнейшей в мире лаборатории физики высоких энергий были созданы первые в мире web-сервер, сайт и браузер. В конце 1990-х годов CERN стал одним из центров развития сетевой технологии распределенных вычислений GRID. Востребованность данной технологии повысилась в связи с необходимостью хранить и обрабатывать огромные массивы данных, возникшие в результате запуска в 2008 году большого адронного коллайдера (Large Hadron Collider, LHC).
"Каждый эксперимент порождает огромные объемы данных, которые необходимо хранить и анализировать. Так в 2018 году мы ожидаем появления от 50 до 70 Пбайт данных", - рассказал руководитель службы баз данных ИТ-департамента Европейской организации по ядерным исследованиям CERN Эрик Гранчер. По его словам, для обработки и хранения такого объема информации организация использует 15 тыс. серверов, 230 тыс. платформами для взаимодействия с базами данных, 90 тыс. дисковых накопителей (общим объемом 280 Пбайт) и 30 тыс. ленточных (общим объемом 400 Пбайт). Распределенная система компьютерных вычислений адронного коллайдера насчитывает 170 узлов в 42 странах. Руководитель службы баз данных отметил, что и без того высокие требования к производительности данной инфраструктуры в ближайшее время будут только расти.
Для работы CERN нужен был надежный технологический партнер, которым стала корпорация Oracle. Директор по стратегическим коммуникациям в Oracle Аарон Рикадела напомнил, что сотрудничество Oracle с CERN началось более 30 лет назад, когда организация начала использовать решения вендора для управления базами данных. По состоянию на 2018 год CERN применяет широкую линейку решений Oracle, включая облачные. Программные продукты вендора стали базой системы контроля ускорителя, а также используются для хранения и обработки данных.
Эрик Гранчер подчеркнул, что CERN разделяет данные, полученные в результате исследований (физические) – они храниться на физических накопителях (лентовых и дисковых), и телеметрические показатели, которые передаются в базы данных. Свыше 50 тыс. сенсоров и других измерительных устройств собирают данные о функционировании элементов ускорительного комплекса. Вопросы обеспечения безопасности этой информации, а также ее хранения и восстановления являются критическими для организации.
Представитель CERN отметил, что возможности аварийного восстановления данных в облаке оказывает мощный экономический эффект для обеспечения безопасности данных и непрерывности процессов центра.
CERN является не только заказчиком решений Oracle. В рамках партнерства организации с ведущими зарубежными вендорами, получившим название OpenLab, разрабатывается высокопроизводительная облачная инфраструктура, позволяющая хранить и анализировать огромное количество операционных данных. В результате этого сотрудничества CERN более эффективно управляет инфраструктурой, используемой для исследования происхождения Вселенной. Oracle, в свою очередь, применяет идеи и опыт, полученные в рамках сотрудничества, для предоставления клиентам перспективных и эффективных облачных сервисов. CERN OpenLab является нейтральной научной средой, в которой предприятия могут эффективно взаимодействовать, а также тестировать решения в одной из самых сложных и сложных технологических средах.
В своем выступлении Эрик Гранчер напомнил также, что основными задачами CERN на сегодняшний день являются: фундаментальные исследования; развитие технологий (включая компьютерные); образование (организация тесно сотрудничает с университетами по всему миру); развитие международного сотрудничества в области научных исследований.