original in en Georges Tarbouriech
en to es Georges Tarbouriech
es to es Javier Palacios
Georges es un usuario viejo de Unix (comercial y gratuito). Utiliza Arkeia para almacenar una red muy heterogénea.
La administración de redes es un trabajo que consta de mil tareas. Una de ellas es el almacenamiento. La cantidad de datos va aumentando, particularmente hoy que tenemos discos duros muy gordos, aplicaciones de tamaño importante y muchos más usuarios. La estrategia de almacenamiento ha tenido que evolucionar hacia algo más sofisticado, si comparamos con lo que era hace diez años. En esa época era posible utilizar un streamer (lector de cintas) conectado a un servidor, usando para almacenar mandatos de como dump, cpio o find (-cpio es una opción de find). Esa es todavía una solución si el número de servidores, clientes o aplicaciones no se han visto multiplicados.
Si la red ha "crecido" tendrán que encontrar una solución mejor.
Y cuando decimos mejor, tendríamos que decir más rápida.
Hay que encontrar una buena manera de hacer este trabajo.
Si la red tiene muchos sistemas
operativos diferentes, vuelve a ser bastante difícil
encontrar la
"mejor". ¡Como de costumbre, la "mejor" tiene que ser buena, bonita y
barata! Siempre es un compromiso, y lo mejor para uno no lo es para otro.
Así, lo primero a considerar son las necesidades: software, hardware...
Hay muchos productos disponibles, pero la mayoría es software propietario y
muy caro (lo que es un eufemismo). Y no olvidemos
la parte hardware: por lo menos necesitan algun streamer o automáta.
Para acabar, tienen que saber qué máquina podrá desempeñar el papel de
servidor de almacenamiento.
Este servidor necesita un disco duro gordo, muchos recursos (memoria,
CPU) y puertos SCSI.
Tiene que ser capaz de administrar varios almacenamientos al mismo tiempo.
¿A donde ir desde aquí?
La elección de Arkeia
Muchas empresas importantes "ofrecen" soluciones de almacenamiento de redes como hemos mencionado antes. Arkeia ha sido seleccionado primero por su soporte de muchos SO. Los servidores de almacenamiento pueden ser: AIX 4.1, DEC Alpha Unix 4.0, HP-UX 10, IRIX 6.2 (y posteriores), Linux 2.* (x86), Solaris 2.5 (y posteriores) y NT 4.0 Server (Intel). Clientes de almacenamiento pueden ser los mismos que los servidores más otros tal como SCO v5 (Intel), BSD 3.0, 4.0, Novell 4.11, FreeBSD 2.2.6, Windows 95, 98, NT 4.0 Server (Alpha) y NT 4.0 Workstation (Intel). Esta lista no es exhaustiva y puede cambiar en todo momento. Consultar http://www.arkeia.com para tener más información. La mayoría de los servidores tienen un interfáz gráfico, basado en Xlib (librerías propietarias) para Unix, y en Java para los productos Microsoft.La segunda razón para elegir Arkeia fue el precio. No podemos dar ninguno porque depende de la red, del número y del tipo de servidores y clientes, si tienen automátas o no (en éste caso, tendrán que comprar una licencia para la librería que administra el automáta). Conectar con el site de Arkeia permite obtener un presupuesto según la configuración de la red. La razón final era la administración de los streamers. Arkeia puede administrar casi cualquier tipo de streamer: DAT. EXABYTE, QIC... Y como teníamos varios streamers QIC, éste era un problema menos.
¿A qué parece?
Como hemos visto antes, Arkeia utiliza una GUI en el servidor. Se entra en Arkeia con una ventana de login que permite el acceso a las ventanas específicas que administran el almacenamiento. Estas ventanas se pueden abrir desde un menú, un menú contextual o pinchando en iconos. Todo eso puede ser configurado según los propios gustos (fondos de pantallas predefinidos, colores preferidos). No hay mucho más que decir, puesto que todo es evidente y muy amigable. En Unix, el GUI funciona con casi todos los gestores de ventanas. En las cosas de Microsoft, tendrán que instalar la JVM (Java Virtual Machine) del mismo Microsoft antes de poder utilizar el GUI. Para concluir, el GUI es muy práctico, les guste su aparencia o no.
¿Cómo funciona?
Arkeia utiliza una technología de almacenamiento paralelo trás una red TCP/IP. Un servidor de almacenamiento administra los streamers y recoge los datos de los clientes usando multi-flujo. Funciona según el modelo cliente/servidor usando memoria repartida y cola de mensaje. IPC (Inter Process Communication) tiene que estar perfectamente configurado en el servidor de almacenamiento. El manual avanzado enseñará cómo refinar la configuración del servidor. La instalación es muy lógica: tienen que colocar el software servidor y cliente en el servidor de almacenamiento, y el software cliente en los clientes.¡Hasta ahí, todo va bien! En el servidor tienen que definir todo lo relacionado con streamers, conjuntos de pilotos (drivepacks), conjuntos de cintas (tape pools), cintas y conjuntos de almacenamiento (savepacks).
- Conjuntos de pilotos: la primera etapa del proceso de configuración.
(Definicion de dispositivos)
Seleccionando "Drives management" desde el menú "Devices", tienen que dar
un nombre al streamer, sus autorizaciones (leer, escribir, limpiar y
suprimir) y por supuesto su piloto. Eso depende del sistema: por ejemplo
/dev/rmt/1h en Solaris o /dev/rmt/tps1d2 en Irix o /dev/st0 en Linux.
Tienen que definir cada streamer y el piloto correspondiente.
Supongamos que tenemos cuatro streamers QIC conectados a un servidor O2
(Irix 6.5): El primero podría ser llamado QICuno con el piloto
/dev/rmt/tpd1d2, el segundo QICdos con el piloto /dev/rmt/tps1d3, etc.
El "1" después de "tps" es el número del controlador SCSI y el "2"
después de "d" es la ID del streamer. Por eso tendrán que conocer todo lo
que concierne ID SCSI, "daisy chains"... Si tienen un automáta, el proceso
de configuración es casi igual, y la documentación informa de todo
lo necesario.
- Conjuntos de pilotos (Drivepacks):
Desde el mismo menú, se selecciona "Drivepacks" y se crea un drivepack
correspondiente al streamer. Siguiendo con el ejemplo precedente, tienen
un streamer llamado QICuno. Pueden llamar el drivepack
QICuno Pack. Hagan lo mismo por cada streamer ya definido.
Ahora, cada drivepack tiene que corresponder a su streamer. Basta con seleccionar el streamer y el drivepack
correspondiente.
- Conjuntos de cintas (Tape pool):
Esta etapa permite crear tantos conjuntos como sea
necesario. Desde el menú "Tapes management", seleccionen
"Pools management". Pinchando en el icono "New"
y llenando el campo se crea un conjunto.
- Cintas:
Cada conjunto necesita contener una o más cintas. La ventana "Tapes in
pool" puede ser llamada con un doble-pinchando en el pool. Seleccionar
"New" abre la ventana "Create tape". Basta con llenar los campos. Por
cierto, hay una ayuda en linea muy práctica (una por cada ventana)
indicando qué hacer.
- Conjuntos de almacenamiento (Savepacks):
Por último, se necesita crear uno o más savepacks. Estos contienen el
árbol a almacenar por un cliente dado. Se puede circular por el árbol con
un navegador para seleccionar directorios o ficheros. Hay que repetir
la operación
por cada cliente y cada árbol que almacenar.
Ahora, están listos por un almacenamiento interactivo de varios clientes
al mismo tiempo.
Vamos a la cruda realidad.
Tenemos una red un poco rara con cuatro servidores que almacenar. El servidor de almacenamiento es un SGI O2, y los clientes son un servidor de aplicaciones Sun con Solaris 2.6, un servidor de communicaciones Linux con RH6.0, y dos servidores de aplicaciones bajo NT4.0 Server. Vamos a almacenar interactivamente las cuatro máquinas. Creamos los cuatro streamers: los llamamos QIC Sun, QIC Linux, QIC Pcsvr y QIC Pcdev. ¿Muy original, no? Ahora definimos los cuatro pilotos: QIC Sun en /dev/rmt/tps1d4, QIC Linux en /dev/rmt/tps1d5, QIC Pcsvr en /dev/rmt/tps1d3 y QIC Pcdev en /dev/rmt/tps1d2. Pueden ver que la originalidad va creciendo. Les damos todos los derechos: somos el administrador y trabajamos como root. Muy feo, ¿no? Después creamos los drivepacks correspondientes: Sun Pack, Linux Pack, Pcsvr Pack and Pcdev Pack, una vez más con mucha imaginación. Ahora, los conjuntos de cintas: como de costumbre, Sun Pool, Linux Pool, Pcsvr Pool and Pcdev Pool. Creamos un conjunto para cada pack. Eso es una elección personal. Podrían crear sólo un conjunto con cuatro cintas. Si el conjunto contiene varias cintas, Arkeia administra los streamers. Es decir, si no dan una prioridad a cada streamer, Arkeia selecciona lo que quiere almacenar y donde lo almacena. Es probablemente lo que menos me gusta. Por fin, definimos una cinta en cada conjunto: otra vez, Sun Tape, Linux Tape, Pcsvr Tape and Pcdev Tape. No se preocupen, eso se hace sólo una vez. Podrán usarlo todo cada vez que lo necesiten. Queremos un almacenamiento completo para cada servidor, y definimos los savepacks: Sun, Linux, Pcsvr and Pcdev serán los apellidos.
Arkeia esta correctamente instalado en los clientes. Así pueden ver cada máquina en el navegador. Para seleccionarlas, pinchen en la caja correspondiente. Ahora arrancamos el almacenamiento interactivo. Seleccionen el menú "Interactive backup". En la nueva ventana, elijan un savepack, un drivepack y un pool para cada servidor. En nuestro ejemplo, para almacenar el Sun, el savepack es Sun, el drivepack es Sun Pack y el pool es Sun Pool. Seleccionen un tipo de almacenamiento (total en el ejemplo, pero hubieramos podido decir incremental), la estrategia para la cinta (nueva cinta en éste caso, pero una alternativa sería completar una cinta) y utilizar email o no (como le de la gana). Pinchar en el icono de validación arranca el almacenamiento del Sun. Repiten esa etapa esa por cada servidor y ya está. Cuatro almacenamientos se hacen al mismo tiempo y pueden ir a tomar un café.
Unos 40 minutos más tarde ya acabó. Cosas importantes: la red es una categoría 5... pero en obras. Significa: los cables no son todos de cat 5, los hubs son 10 o 10/100Mb, sólo unas máquinas tienen verdaderas tarjetas de 100Mb... Sin embargo, hemos almacenado alrededor de 3Gb y unos 150000 ficheros en unos 40 minutos. En una verdadera red cat 5, eso hubiera sido por lo menos 3 veces más rápido. La velocidad depende de muchos elementos: red, ordenadores, streamers, tamaño de las cintas. Nuestro ejemplo es un caso particular y no refleja la fantástica velocidad que pueden alcanzar en ciertas configuraciones. Si la red es una verdadera cat 5, si tienen automátas, si utilizan DAT, si los ordenadores són muy rápidos... pueden esperar unos 70 Mb/min. En nuestro ejemplo, la media es alrededor de 25 Mb/min. Eso para cada almacenamiento. Considerando que están hechos al mismo tiempo da unos 100Mb/min.
No obstante, una manera interesante de entender la eficiencia de Arkeia es comparar con la estrategia precedente con el mismo hardware. Antes de utilizar Arkeia, los almacenamientos se hacían desde cada ordenador, con cada streamer conectado al puerto SCSI. Hablando de los mismos ordenadores y de los mismos streamers, el beneficio representa un 50%. Almacenamiento del Sun con su propio streamer: 1 hora; con Arkeia: 38 minutos. Almacenamiento de Pcdev con su propio streamer: más de 1 hora; con Arkeia: 32 minutos. Etc... No olvidemos almacenar el servidor de almacenamiento: ésta vez no usamos la red, y es un poco más lento (alrededor de 22Mb/min). Según Arkeia, con el hardware correcto, se puede almacenar 128 máquinas en 32 streamers en paralelo. No pude probar tal configuración... Donde trabajo somos muy pobres.
No se puede hablar de almacenamiento sin mencionar restauración. Podemos comentarla con una frase muy corta: es tan fácil y rápida como el almacenamiento. Usando el navegador pueden restaurar lo que quieran y donde quieran. Es decir, pueden restaurar en otros directorios o máquinas.
No hemos hablado de los almacenamientos periódicos. Obviamente, Arkeia es capaz de administrar almacenamientos programados para arrancar a una hora específica. Bajo Unix, usará cron y con los productos Microsoft será un servicio. Pueden definir intervalos diferentes para almacenamiento periódico: día, semana, mes... Es posible administrar tres niveles para cada almacenamiento. Por ejemplo, quieren programar un almacenamiento periódico para un mes. Nivel 1 corresponde a un almacenamiento mensual, nivel 2 es semanal y nivel 3 es diario. Eso quiere decir, el nivel 3 funcionará 6 veces a la semana, el nivel 2 lo hará 3 veces al mes, y el 1 sólo una vez. El resultado: necesitarán muchas cintas y tantos streamers como servidores que almacenar. A menos que enseñan al perro cómo cambiar las cintas de noche entre los almacenamientos... Aparte de eso, funciona como el almacenamiento interactivo. Hay mucho que decir sobre almacenamiento periódico, pero necesitaríamos un artículo entero. Podemos decir, es probablemente una de las caraterísticas más importante de Arkeia. Otro punto de interés concierne a los logs. Tienen logs para todo: cintas, streamers, almacenamientos... Eso emplea bastante espacio en el disco, pero es muy útil. Estos logs están muy bien organizados y dan mucha información. Arkeia los administra de una manera muy práctica archivandolos por mes.
La ventana de los logs disponibles
La ayuda en línea también merece ser mencionada. Pueden trabajar con Arkeia sin leer toda la documentación, salvo que quieran entrar en administración avanzada, por supuesto. La documentación está contenida en el CD-Rom del programa en formato PDF, permitiendo imprimirla fácilmente para crear sus propios manuales. Esta documentación contiene información importante sobre configuración específica de máquinas, seguridad, problemas, utilidades, librerías de automátas... Si necesitan más, hay una lista de correo dedicada a Arkeia.
Este artículo no puede ser exhaustivo. Habría muchas cosas
que decir sobre el software. Arkeia no ha intentado reinventar la rueda,
pero usa todo lo que permite mejorar el rendimiento. IPC es una de las
llaves. Otra vez, gracias a Unix. Tenemos que mencionar la versión
personal y shareware para Linux. Está dedicada a uso no comercial. Nada
impide que la prueban en su red privada. Es shareware, y debemos decir que
si mandan una contribución de 20$ o más, el 25% serán dado a Software in
the Public Interest. Otra cosa que mencionar: compré Arkeia en la División
Europea. La persona encargada sabe muy bien de qué habla y hace un trabajo
estupendo (hola Sandy). Esta empresa es la primera entre las numerosas con
que trabajo, que ha tratado todo el asunto por e-mail. Ni fax, ni correo
postal excepto para el paquete del software. ¡¡¡Y por fin, sólo mandando
TEXTO!!!
Totalmente fuera del asunto, pero estoy hasta las narices de todos estos
documentos Word o Excel circulando a través de Internet. Primero,
están llenos de macro viruses potenciales. Segundo, todo el mundo en esta
tierra NO es obligado a tener Word o Excel (¿Cómo trabajábamos antes?).
Tercero, un texto es 10 o 100 veces más pequeño que su equivalente
documento Word, y a una época en la cual el "bandwidth" en Internet es
cuando menos muy estrecho, el tamaño parece una cosa importante.
¡Perdón por la digresión esa! Ahora que voy a tener muchos amigos nuevos,
volvemos a Arkeia. Creo que Arkeia es una buena solución de almacenamiento
de redes. No me gusta todo, pero ésta gente trabaja muy duro para mejorar
el producto. Personalmente, me gustarían más funcionalidades en lo que
respecta a la administración de cintas, como la posibilidad de decidir
cuantas cintas quiero utilizar en una estrategia o la de escribir encima
del contenido de una cinta durante el almacenamiento. ¡En una palabra, me
gustaría ser el jefe! El precio también es un elemento importante a la
hora de elegir. Arkeia parece muy competitivo en este aspecto. Si buscan
este tipo de herramientas, no olviden probar ésta. Si ya conocen Arkeia
a través de alguna distribución Linux, pueden ir a
http://www.arkeia.com
para aprender más sobre el producto.
¡Vivimos una época tremenda!