CS-CERN-NA-134-0812-ES

Caso práctico técnico
CERN: Organización europea de
investigación nuclear
CERN ayuda a los físicos a descifrar los secretos del
universo ejecutando operaciones críticas mediante bases
de datos Oracle y el almacenamiento de NetApp.
Los datos nos llevan al conocimiento y al descubrimiento
Los físicos de CERN se esfuerzan por ampliar nuestra compresión general del
mundo, superando los límites del conocimiento para desvelar los secretos del
universo. Motivados por la curiosidad y la búsqueda del conocimiento puro, la
comunidad de científicos de CERN investiga en el campo de la física de
partículas con un método basado en la observación de datos para buscar pistas
y descubrimientos sobre el funcionamiento del universo.
Esto no significa que la investigación de CERN no tenga una aplicación práctica
y, en muchos casos, revolucionaria, en el día a día. En 1989, por ejemplo,
Tim Berners‑Lee, un científico de CERN, inventó la Red informática mundial o
«World Wide Web», concebida y desarrollada para responder a las demandas de
uso compartido automático de información en la comunidad internacional de
físicos de altas energías. CERN también fue la cuna de las pantallas táctiles
capacitativas, inventadas en 1973 por Bent Stumpe y otros colegas. El primer
uso de estas pantallas fue en la sala de control del acelerador Súper Sincrotrón
de Protones de CERN. Estas innovaciones (o innovaciones derivadas) han
transformado la comunicación actual.
El trabajo en CERN
Además de buscar respuesta a preguntas sobre el universo, la comunidad de
CERN trabaja para:
• Fomentar la colaboración global, acercando a las naciones a través de la
ciencia.
• Educar proporcionando formación avanzada a los profesionales y despertando
interés en los físicos de la siguiente generación de científicos.
• Superar las fronteras de la tecnología mediante la cooperación con el sector
para desarrollar nuevas tecnologías.
Los negocios basados en NetApp
llegan más lejos, más rápido.
Investigando los componentes básicos del universo
CERN cuenta con algunas de las instalaciones tecnológicamente más avanzadas
del mundo para investigar los componentes básicos del universo. Estas
instalaciones incluyen aceleradores de partículas y máquinas especializadas para
probar la existencia de diferentes formas de materia. Las investigaciones que se
realizan en las instalaciones de CERN se clasifican en tres áreas principales de
estudio:
• El origen de la materia. Esta área comprende las investigaciones relacionadas
con la búsqueda de la partícula de Higgs, una partícula hipotética y elemental
predicha en el modelo estándar de la física de partículas. La partícula de Higgs
pertenece a una clase de partículas conocidas como bosones y está
considerada como la clave para explicar por qué las partículas tienen masa.
• Materia oscura. Las galaxias se comportan como si tuvieran más masa de la
que se puede observar. Hay teorías que sugieren que todas las partículas del
modelo estándar tienen una partícula asociada. Estas partículas, denominadas
partículas supersimétricas, podrían ser la materia oscura que no se puede ver.
• El Big Bang. ¿Qué sucedió inmediatamente después del origen del universo?
Partiendo de la teoría de que el universo contenía una mezcla caliente y densa
de quarks y gluones (llamada plasma de quarks-gluones), los científicos
quieren recrear unas condiciones similares para analizar las propiedades de
esa mezcla.
El Gran Colisionador de Hadrones
En el complejo CERN hay una serie de aceleradores de partículas y cada uno
puede alcanzar energías incrementalmente más altas. La última adquisición del
complejo es el Gran Colisionador de Hadrones (GCH), el acelerador de partículas
más grande y potente del mundo. En el Centro de Control de CERN, cerca de
Ginebra, Suiza, se encuentran todos los controles del acelerador, sus servicios e
infraestructura técnica.
«Nuestro mayor reto es
manejar el volumen de
datos y la velocidad a la
que crecen»
Frédéric Hemmer
Responsable, Departamento de Tecnología de
CERN
El GCH, que comenzó a funcionar en 2008 y se encuentra aproximadamente a
100 metros de profundidad, forma un círculo de 27 kilómetros que cruza la
frontera entre Francia y Suiza. El anillo está compuesto por imanes
superconductores con una serie de estructuras acelerantes que impulsan la
energía de las partículas. Dentro del GCH, en direcciones opuestas y en tubos
separados, los haces hadrones se mueven guiados por el campo magnético que
generan los imanes superconductores. Estos imanes se preenfrían con nitrógeno
líquido y, a continuación, se rellenan con helio líquido para alcanzar una
temperatura inferior a la del espacio exterior de aproximadamente -271 °C. En el
anillo se fuerza la colisión de los haces en puntos que coinciden con la ubicación
de los detectores de partículas del GCH. Los proyectos de colaboración
internacional (en la actualidad se realizan cuatro grandes experimentos diferentes,
cada uno con su detector de partículas específico) se dedican a estudiar las
colisiones del GCH y las propiedades de la materia que se produce en estas
colisiones.
El GCH crea 600 millones de colisiones por segundo y produce 1 millón de
gigabytes de datos sin procesar por segundo. El software convierte esos datos
sin procesar en objetos de datos legibles para poder analizar el evento
posteriormente. Los experimentos que se realizan actualmente producen más de
20 PB de datos nuevos anualmente, lo que ayuda a los científicos de CERN a
avanzar en el conocimiento y responder a las preguntas sobre las leyes
fundamentales de la naturaleza.
Función del departamento de tecnologías de la información
El departamento de tecnologías de la información de CERN gestiona la
infraestructura de soporte tecnológico para una plantilla de aproximadamente
2500 personas y una comunidad internacional de investigación de más de 10 000
científicos y estudiantes de 608 universidades y 113 nacionalidades. Algunas de
las responsabilidades del personal científico y técnico de CERN son diseñar,
establecer y garantizar el correcto funcionamiento de los aceleradores de
partículas, así como preparar, ejecutar, analizar e interpretar los datos obtenidos
con los experimentos científicos.
2
El departamento proporciona acceso a una amplia gama de servicios
tecnológicos y datos a una comunidad científica exigente que engloba a casi la
mitad de los físicos de partículas del mundo. «Nos ponen siempre al límite»,
afirma Frédéric Hemmer, Responsable del Departamento de Tecnología de
CERN. «Pero responder a los retos de nuestros usuarios forma parte del desafío
diario de CERN. Adaptamos constantemente nuestra tecnología, incluso
semanalmente, para facilitar la colaboración y la comunicación, y para manejar la
creciente cantidad de datos generados en los experimentos y la velocidad con
que los recibimos».
Equilibrio de las demandas de rendimiento, escalabilidad y fiabilidad con
las limitaciones presupuestarias
Los grandes experimentos científicos que se realizan en CERN presentan retos
igualmente grandes en cuanto a gestión de datos. El departamento de
tecnología tiene que anticiparse a las necesidades de los ingeniosos usuarios
que realizan unos experimentos cuyos requisitos son muchas veces
imprevisibles. Para estar a la altura, Hemmer y su equipo tienen que innovar y
ofrecer soluciones tecnológicas de forma rápida y eficiente que fortalezcan a la
comunidad de investigación de CERN. El departamento de tecnología de CERN
ofrece esta funcionalidad al tiempo que afronta el reto universal de proporcionar
más servicios con recursos económicos limitados y un número igual o menor de
centros de datos y recursos administrativos. En su elección de los elementos
básicos de la pila de tecnología de la infraestructura tecnológica, CERN tiene
que equilibrar continuamente las demandas técnicas de rendimiento, fiabilidad y
escalabilidad con las constantes restricciones económicas.
En el equipo del departamento de tecnología, la sección de servicios de base de
datos se responsabiliza de la base de datos principal y las tecnologías de
almacenamiento asociadas. CERN comenzó a utilizar bases de datos y
herramientas Oracle en 1982. En la actualidad, la tecnología Oracle se usa en
toda la organización y tiene una papel central en los sistemas de control de los
aceleradores, las aplicaciones de ingeniería y administración y los experimentos
del GCH. La tecnología Oracle ofrece las funcionalidades requeridas, con alta
disponibilidad, escalabilidad y rendimiento, así como completas herramientas de
distribución de datos, protección y capacidad de gestión.
En cuanto al almacenamiento de datos, los requisitos esenciales son la
capacidad de gestión, la disponibilidad y la escalabilidad para responder a los
rápidos cambios en los requisitos e incluso a los requisitos imprevistos. Por
ejemplo, los pesados iones de plomo provocan colisiones especialmente
complicadas que pueden generar datos a una velocidad de entrada totalmente
diferente de la estimada. En una ocasión, la velocidad de entrada de datos llegó
a ser cinco veces superior a lo previsto. Hemmer añade: «Los datos pueden
llegar a nuestros centros de cómputo a velocidades de hasta 6 GB por segundo,
lo que equivale al contenido de dos DVD cada tres segundos. Nuestro trabajo
consiste en garantizar que esos datos se puedan leer y que estarán disponibles
en todo momento para nuestra comunidad de físicos. Los datos son la base de
todo lo que hacemos. Nuestro mayor reto es manejar el volumen de datos y la
velocidad a la que crecen».
Ofreciendo una infraestructura de datos ágil inteligente, inmortal e infinita
El equipo de Hemmer debe crear una infraestructura de datos que pueda:
1) ofrecer un impacto rápido mediante una gestión de datos inteligente; 2)
ofrecer una disponibilidad de datos «inmortal», con actualizaciones no
disruptivas para aprovechar los avances tecnológicos sin provocar tiempos de
inactividad en los instrumentos de CERN y en las actividades científicas que se
ejecutan las 24 horas del día, todos los días del año; y 3) proporcionar un
escalado casi infinito que permitirá aumentar el rendimiento y la capacidad de
almacenamiento a la par que crecen los requisitos de investigación y las bases
de datos de CERN.
En 2007, tras un proceso de licitación pública, CERN seleccionó la tecnología de
NetApp® para la base de datos de registro del GCH, que utiliza una base de
datos Oracle con tecnología Real Application Clusters (RAC). Desde entonces,
CERN ha unificado toda su infraestructura Oracle en NetApp y hoy en día
3
almacena el 99% de los datos Oracle en soluciones de NetApp. La rentabilidad
del coste de la gama básica de NetApp con rendimiento y capacidad escalables
linealmente permitió a CERN ampliar su almacenamiento a medida que las
demandas de las investigaciones lo reclaman.
Eric Grancher, experto en arquitectura de servicios de base de datos del
departamento de tecnología de CERN, afirma que NetApp ofrece
funcionalidades clave en el entorno Oracle: «La certificación de NetApp con
Oracle RAC sobre NFS es un activo. NetApp también ofrece diferentes
funcionalidades, como compatibilidad con 10 Gigabit Ethernet [10 GbE], copias
Snapshot y clonado de bajo impacto, la posibilidad de ofrecer el rendimiento y la
capacidad requeridos a un precio asequible (utilizando el almacenamiento
inteligente Flash Cache de NetApp con discos SATA de alta capacidad),
compatibilidad con archivos grandes (hasta 16 TB) y, más recientemente, Data
ONTAP® en Modo Cluster para una movilidad de datos más eficiente. Nos gusta
mucho Data ONTAP Modo Cluster, ya que nos permite mover datos (para
equilibrar la carga, para mover datos de menor uso o inactivos a unidades de
menor coste o para realizar actualizaciones tecnológicas) sin tener que detener
las aplicaciones».
Oracle y NetApp en la organización
Hoy en día se ejecutan casi 100 bases de datos Oracle en el almacenamiento de
NetApp. El departamento de tecnología de CERN ofrece servicios Oracle para:
• Operaciones de control y registro del GCH
• Experimentos online
• Experimentos offline
• Administración, incluyendo servicios de gestión de nóminas
• Servicios de ingeniería
Grancher hace hincapié en la extrema importancia de las bases de datos Oracle
de CERN que se ejecutan en NetApp: «Nuestro entorno Oracle en la
infraestructura de NetApp soporta tanto las operaciones científicas como las
empresariales de CERN. CERN confía en las bases de datos Oracle para
mantener el GCH en funcionamiento y para garantizar la disponibilidad de
nuestras bases de datos administrativas. Si estos sistemas se detuviesen, el
problema afectaría a cientos de personas. Una de las decisiones clave que
tomamos al crear una infraestructura de alta fiabilidad fue la de poner en
funcionamiento un almacenamiento de confianza, sencillo de gestionar y de
ampliar mediante la adición de capas. Nos ocupamos de nuestro
almacenamiento y contamos con él para proporcionar un servicio estable en el
que crear servicios de base de datos y aplicaciones».
Flujos
Flujos
Bases de datos online
de experimentos
Grupo de tecnología/
bases de datos
Bases de datos offline
de experimentos
Datos
CASTOR (CERN Advanced
STORage Manager)
Datos sin formato
Middleware
Aceleradores ACC
Centros de nivel 1
Experimentos del
GCH
Operaciones de
LHC
Bases de datos de
administración,
tecnología e ingeniería
Figura 1) GCH de CERN y operaciones de experimentos.
4
Respondiendo a los retos técnicos de un entorno inmenso
Los servicios de infraestructura del departamento de tecnología de CERN deben
estar disponibles de forma continua y deben tener una altísima capacidad de
escalado para seguir el ritmo del increíble crecimiento de datos.
En CERN la ciencia nunca duerme: el GCH siempre está en funcionamiento
Cualquier problema en la recepción o gestión de los datos puede provocar que
el sistema se detenga y, con él, los haces de partículas del GCH. Las potentes
herramientas que supervisan y controlan el GCH utilizan las bases de datos
Oracle que se ejecutan en una infraestructura de datos de NetApp.
• Base de datos de control (ACCCON). Esta base de datos almacena los
ajustes y controles del acelerador. Los operadores de CERN supervisan el
acelerador todos los días de la semana, las 24 horas del día, e introducen los
cambios de configuración necesarios en la base de datos utilizando las
pantallas de la sala de control. Si esta base de datos dejase de estar
disponible aunque solo fuese por unos minutos, los operadores no podrían
controlar el acelerador y tendrían que desechar el haz, es decir, desviarlo a
enormes bloques de grafito para atenuar su energía y así proteger el GCH,
que tiene un coste de varios miles de millones de dólares. Si se produjeran
temperaturas fuera del rango admisible se podrían dañar los imanes y cada
uno de ellos cuesta más de 1 000 000 de dólares. Además, las complicadas
tareas de reparación podrían obligar a detener las operaciones durante
semanas o meses.
• Base de datos de registro (ACCLOG). Esta base de datos registra entradas
de cientos de sensores en el GCH y mantiene a largo plazo los registros del
estado de miles de imanes y todas las partes móviles, incluidos los
colimatores que protegen los haces desechando las partículas desprendidas.
Esta base de datos Oracle de CERN crece a un ritmo vertiginoso, y tiene un
inmenso tamaño con 4,1 billones de filas de datos (126 TB) en la actualidad.
Además, dado que contiene datos de calibración, es esencial para mantener
el GCH en funcionamiento.
Buscando una aguja en 20 millones de pajares
Otro reto clave para ofrecer acceso a los almacenes masivos de datos de
experimentos de CERN consiste en garantizar que las bases de datos de índices
Oracle tendrán suficiente rendimiento. Las bases de datos Oracle que se
ejecutan en NetApp gestionan los metadatos que siguen y permiten acceder a
datos de investigación sin procesar almacenados en archivos planos en el
sistema de gestión del almacenamiento jerárquico CERN Advanced STORage
manager (CASTOR). Las redes de discos genéricos CASTOR y los silos de cintas
proporcionan en la actualidad 40 PB de capacidad. Cada año que el GCH
permanezca en funcionamiento, los 4 detectores gigantes que observan los
billones de colisiones de partículas elementales acumularán más de 10 millones
de gigabytes de datos, el equivalente al contenido de aproximadamente 20
millones de CD-ROM. Con el nivel de registro actual, los experimentos físicos de
CERN generarán más de 20 PB de datos nuevos anualmente que las bases de
datos Oracle deberán gestionar . Los avances de CERN en el análisis de big
data ayudan a los investigadores a obtener rapidamente el máximo valor de
estos enormes conjuntos de datos y, en última instancia, tendrán aplicación en
el sector empresarial, ayudando a mejorar los resultados empresariales mediante
análisis predictivos.
5
Mantener el ritmo
El departamento de tecnología de CERN también debe hacer que los sistemas
de almacenamiento y las bases de datos sigan el ritmo del asombroso
crecimiento de datos. Hoy en día NetApp proporciona, en el conjunto de CERN,
901 TB de capacidad para bases de datos Oracle y el personal de bases de
datos de CERN prevé que los requisitos de capacidad crecerán rápidamente. Se
prevé que las bases de datos de los aceleradores crecerán en 50 TB al año. Este
rápido crecimiento demanda una escalabilidad y eficiencias sin precedentes en
las bases de datos de CERN y la pila de tecnología de almacenamiento.
Tecnologías clave para equilibrar los entornos Oracle
Grancher afirma que la puesta en funcionamiento de bases de datos Oracle en
NetApp permite que el equipo de servicios de base de datos equilibre los
requisitos de eficiencia con la estabilidad, el rendimiento y la escalabilidad
necesarias. Especifica las funcionalidades más importantes:
• 10 GbE ofrece una ruta de crecimiento conocida para un mayor ancho de
banda, junto con las eficiencias de costes de una tecnología habitual muy
extendida. El aprovechamiento de 10 GbE también permitió a CERN usar los
mismos switches y conexiones de red que sirven al resto del laboratorio. Por
ello, el departamento de tecnología de CERN puede reducir los costes
delegando la administración en el equipo de redes, que ya cuenta con
personal para ofrecer gestión y soporte los siete días de la semana, las 24
horas del día.
• Oracle Direct NFS (dNFS) permite utilizar varias rutas de almacenamiento.
Esta tecnología mejora la escalabilidad y dado que no depende del sistema
operativo de los servidores suele doblar el rendimiento de los NFS
tradicionales. Igualmente importante es que dNFS hace que Oracle sobre NFS
pase de ser sencillo a extremadamente sencillo (el personal del departamento
de tecnología de CERN no tiene que preocuparse por cómo configurar NFS,
porque Oracle genera solicitudes NFS directamente desde la base de datos).
• SATA con el software Flash Cache de NetApp permite disfrutar de un
rendimiento comparable al de las unidades FC por un precio mucho más
económico. Una solución FC tendría un precio prohibitivo con los requisitos de
rendimiento y los niveles de crecimiento de CERN.
• El software FlexClone® de NetApp permite crear de forma eficiente copias
editables temporales. CERN necesitaba copias Snapshot™ con gestión
eficiente del espacio y copias editables de bases de datos de gran tamaño,
pero también necesitaba asegurarse de que los procesos de replicación no
afectaban al rendimiento. En la licitación de CERN se especificaba el impacto
máximo que podría tener la creación de un número determinado de copias
Snapshot en cargas de trabajo concretas.
6
• Data ONTAP 8 en Modo Cluster de NetApp permite mantener el rendimiento
máximo de las aplicaciones y la eficiencia del almacenamiento agregando
almacenamiento y moviendo datos sin interrumpir las operaciones en curso.
En el ámbito de CERN no se puede detener ninguna aplicación, por lo que la
infraestructura debe proporcionar disponibilidad continua con actualizaciones
y otras operaciones administrativas no disruptivas. Grancher afirma que el
Modo Cluster funciona especialmente bien con Oracle sobre NFS para
proporcionar a CERN la agilidad que necesita.
Cómo participó NetApp en el avance del espíritu investigador de CERN
Hemmer sugiere que las puestas en funcionamiento de tecnología con más éxito
se producen cuando se cuenta con una sólida alianza. «Contamos con que
nuestros proveedores sean innovadores y proactivos y que nos ayuden a
mejorar nuestra rentabilidad de costes y a usar nuestros recursos».
Grancher da un ejemplo: «Con el rápido crecimiento de la base de datos de
registro del GCH (crece 50 TB al año), necesitábamos una alternativa a nuestra
costosa solución FC. El cambio a SATA habría resuelto nuestros problemas de
capacidad y costes, pero habríamos tenido problemas de rendimiento. NetApp
nos recomendó utilizar Flash Cache, que nos permite mantener también el
rendimiento».
Bases de datos
RAC Oracle
Interconexión de
almacenamiento
Sistemas de almacenamiento
FAS de NetApp
Bandejas de discos
Figura 2) Infraestructura de almacenamiento basada en NAS de CERN
Mejora de la base de datos 11g Oracle
Como miembro desde 2005 de la red Oak Table de científicos Oracle, Grancher
comprende y resalta la importancia de implementar una base de
almacenamiento capaz de mejorar los entornos de base de datos. NetApp
ofrece una plataforma única e integrada para una infraestructura de datos ágil
que es:
• Inteligente. La sencillez de gestión ayuda al equipo del departamento de
tecnología de CERN a ofrecer con mayor rapidez la infraestructura necesaria
para realizar investigaciones. Por ejemplo, CERN utiliza volúmenes virtuales
FlexVol® de NetApp para simplificar el aprovisionamiento y lograr eficiencias
con volúmenes aprovisionados mediante thin provisioning. El software de
gestión OnCommand® de NetApp también permite aprovechar la
automatización, que reduce los errores humanos. Según palabras de
Grancher: «Oracle sobre NFS con el almacenamiento de NetApp ha
simplificado la forma en que accedemos a los datos y cómo los gestionamos.
Con el tiempo que ahorra nuestro equipo de bases de datos, podemos ofrecer
más servicios a más usuarios. NetApp tiene herramientas inteligentes y
nosotros sabemos aprovecharlas».
7
Grancher afirma que la virtualización de servidores de Oracle VM en NFS es
«sencilla, extensible y estable». En colaboración con Oracle, NetApp
desarrolló el complemento Storage Connect para Oracle VM 3.0. Este
complemento simplifica y centraliza la gestión de entornos de aplicaciones y
bases de datos Oracle mediante la integración de funcionalidades del
almacenamiento avanzadas de NetApp (como la deduplicación y thin
provisioning, por ejemplo) con Oracle VM 3.0.
«CERN nunca ha sufrido
tiempos de inactividad en las
unidades SATA. Al cambiar de
FC SAN a SATA NAS,
mantuvimos exactamente el
mismo nivel de fiabilidad»
Eric Grancher
Experto en arquitectura de servicios de
base de datos
CERN
La tecnología de NetApp también permite mejorar la eficiencia de la
protección de datos y la capacidad de recuperación. En concreto, con NetApp
CERN puede proteger los datos al tiempo que evita su duplicación, ofrece
conjuntos de datos de uso múltiple sin copiarlos y elimina las copias de datos
duplicadas. «Sin la tecnología SnapRestore® de NetApp», afirma Grancher,
«necesitaríamos semanas para recuperar solo una base de datos Oracle de
varios terabytes. Con NetApp, el tamaño de la base de datos es irrelevante.
Podemos copiar una base de datos de 1 o 10 terabyte en segundos y
restaurarla en minutos u horas. Antes necesitábamos 28 días para restaurar
una base de datos Oracle de 100 TB. Ahora solo tardamos 15 minutos.
Además, en combinación con Real Application Testing de Oracle, la tecnología
SnapRestore nos permite reproducir rápidamente una carga de trabajo para
realizar pruebas».
• Inmortal. La estabilidad del almacenamiento es un gran activo, principalmente
para la estabilidad de las cargas de trabajo de las bases de datos de CERN.
La tecnología RAID-DP® de NetApp, los componentes redundantes, las
configuraciones de controladoras en parejas de alta disponibilidad y las
funcionalidades más recientes de Data ONTAP Modo Cluster ayudan a CERN
a crear una base de almacenamiento sin tiempos de inactividad ni pérdida de
datos.
Grancher resalta que, gracias a la tecnología de NetApp, las soluciones de
base de datos Oracle de CERN pueden evolucionar sin sufrir tiempos de
inactividad: «CERN nunca ha sufrido tiempos de inactividad en las unidades
SATA. Al cambiar de FC SAN a SATA NAS, mantuvimos exactamente el mismo
nivel de fiabilidad. Desde que se puso en funcionamiento originalmente el
almacenamiento de NetApp en 2007, CERN no ha perdido ningún bloque de
datos en NetApp. No podemos expresar en su justa medida la importancia
que esto tiene. Si no funcionan las bases de datos de CERN, tampoco lo hace
el acelerador, ni los experimentos de física».
• Infinita. Gracias a NetApp, el departamento de tecnología de CERN puede
ofrecer un rendimiento asequible. Cuando los requisitos de capacidad de las
bases de datos Oracle de gran tamaño hicieron que el almacenamiento
basado en FC dejase de ser una opción viable desde el punto de vista
económico, CERN pudo combinar unidades SATA más asequibles con Flash
Cache de NetApp. De este modo ofreció la capacidad que necesitaba sin
sacrificar el rendimiento. Según Grancher: «Usando Flash Cache con SATA
estamos obteniendo 35 000 IOPS sobre Ethernet; esto equivale a 250 discos.
Si una gran parte de la carga de trabajo se puede almacenar en la memoria
caché, el tiempo de respuesta puede bajar a unos pocos milisegundos, en
lugar de los 10–15 milisegundos que serían necesarios si solo se utilizase
SATA. También contamos con la flexibilidad de poder especificar qué
almacenamos en la memoria caché (por ejemplo, no almacenamos en caché
los registros de acciones de rehacer archivos). A su vez, la memoria caché se
adapta automáticamente a las cargas de trabajo. De este modo ahorramos
tiempo y minimizamos la posibilidad de error».
Con la velocidad y volumen del crecimiento de datos de CERN, disponer de
almacenamiento escalable y de rendimiento es fundamental. Grancher añade:
«CERN se parece mucho a cualquier organización que gestione un entorno
OLTP o de big data. Nuestra infraestructura tecnológica tiene que ser
adaptable, fiable, escalable y eficiente. Además, nuestro personal tiene que
ser proactivo en la integración de tecnologías y tiene que hacer un uso
efectivo de los limitados recursos, incluso mientras lidiamos con el
crecimiento masivo de datos. Desde el asequible precio de la gama básica a
la expansión del almacenamiento puntual, NetApp nos ha permitido aumentar
nuestra infraestructura de almacenamiento al ritmo de nuestros requisitos de
datos e investigación, que no paran de crecer».
8
Las tecnologías de eficiencia del almacenamiento también ayudan a CERN a
aplicar su estrategia de datos «conservar para siempre». Según Hemmer:
«Cuando los datos llegan a nuestro centro informático, tenemos que
almacenarlos de forma indefinida. Los investigadores pueden querer acceder
a los datos años después de su adquisición, por lo que nunca desechamos
ningún dato».
Una base fiable y ampliable para la investigación
Grancher comenta el gran impacto de la infraestructura Oracle en NetApp: «Lo
mejor para nuestro equipo de servicios de base de datos es poder crear algo
estable, una arquitectura satisfactoria en términos de resultados y que no es una
solución puntual, sino una base flexible para el crecimiento. Nuestros clientes (la
comunidad global de científicos de CERN, estudiantes y personal) pueden
confiar en esta infraestructura para ofrecer acceso a datos seguro, facilitar la
colaboración sin dificultades y garantizar servicios de respuesta».
Aprovechamiento del
almacenamiento:
75%
Personal: aumento del 15%
en las bases de datos sin
agregar más personal.
Espacio físico para
tecnología: dos veces menos
espacio, energía y refrigeración
(SATA frente a SAS)
Hemmer añade: «Hemos recibido varias felicitaciones espontáneas de nuestros
científicos por la forma en que nuestra infraestructura informática ha contribuido
a distribuir los resultados de los experimentos de física. Al ofrecerles las
herramientas y el acceso a los datos que necesitan en sus investigaciones,
ayudamos a los físicos a descubrir importantes hallazgos y hacer los grandes
descubrimientos que tendrán un impacto más allá de los límites de nuestra
organización».
9
Acerca de CERN
La Organización Europea para la Investigación Nuclear (CERN) es uno de los
mayores y más respetados centros de investigación científica del mundo. Se
dedica a la física de partículas y estudia la composición y el funcionamiento del
universo. En CERN se utilizan los instrumentos científicos más grandes y
complejos del mundo para estudiar los constituyentes básicos de la materia: las
partículas elementales. A través del estudio de lo que sucede cuando estas
partículas chocan, se obtiene información sobre las leyes de la naturaleza.
Fundado en 1954, el laboratorio de CERN se encuentra en la frontera francosuiza, cerca de Ginebra (Suiza). Fue uno de los primeros proyectos conjuntos en
Europa y a día de hoy cuenta ya con 20 estados miembros. www.cern.ch
Acerca de NetApp
NetApp crea innovadoras soluciones de almacenamiento y gestión de datos que
aceleran los avances de su negocio y proporcionan una excelente rentabilidad.
Descubra nuestra pasión por ayudar a las empresas de todo el mundo a llegar
más lejos, más rápido en www.netapp.es.
Go further, faster
®
Productos y tecnologías clave
NetApp
Oracle
• Sistemas de almacenamiento FAS
• Base de datos 11g Oracle
Enterprise Edition con tecnología
Real Application Clusters u
opciones de partición
• Bandejas de discos DS4243
• SATA de 3 TB, SATA de 2 TB
• Memoria Flash Cache de 512 GB
• Data ONTAP 8
• FlexVol
• FlexClone
• Oracle Direct NFS
• Oracle Streams
• Oracle VM
• Tecnología Snapshot
Otras
• SnapRestore
• Switches 10 Gb/s Ethernet HP
ProCurve
• Software OnCommand
• Thin provisioning
• Agregados de gran tamaño
• NVRAM
• NFS/CIFS
• Sistema de cinta IBM Tivoli TSM y
biblioteca TDPO
• Servidores de múltiples
proveedores, todos equipados
con 10 Gb Ethernet
© 2012 NetApp, Inc. Todos los derechos reservados. Queda prohibida la reproducción de cualquier parte de este documento sin la previa
autorización por escrito de NetApp, Inc. Las especificaciones están sujetas a modificaciones sin previo aviso. NetApp, el logotipo de NetApp,
Go further, faster, Data ONTAP, FlexClone, FlexVol, OnCommand, RAID-DP, SnapRestore y Snapshot son marcas o marcas registradas de
NetApp, Inc. en Estados Unidos y/o en otros países. El resto de marcas o productos son marcas o marcas registradas de sus respectivos
propietarios y deberán ser tratadas como tales. NA-143-0812-A4-esES
www.netapp.es