Arkeia, una solución comercial y profesional de almacenamiento para redes

ArticleCategory: [Choose a category for your article]

Applications

AuthorImage:[Here we need a little image form you]

[Photo of the Author]

TranslationInfo:[Author and translation history]

original in en Georges Tarbouriech 

en to es Georges Tarbouriech

es to es Javier Palacios

AboutTheAuthor:[A small biography about the author]

Georges es un usuario viejo de Unix (comercial y gratuito). Utiliza Arkeia para almacenar una red muy heterogénea.

Abstract:[Here you write a little summary]

Arkeia 4.2.3-1 es la última versión de la solución de almacenamiento de redes de Knox Software (http://www.arkeia.com). También hay una versión personal y gratuita disponible con varias distribuciones de Linux. Probablemente piensen que un software comercial no tiene nada que hacer en LinuxFocus. Este producto está dedicado a los profesionales, y Linux es cada día más utilizado en asuntos profesionales. Entonces...

ArticleIllustration:[This is the title picture for your article]

[Illustration]

ArticleBody:[The article body]

Introducción

La administración de redes es un trabajo que consta de mil tareas. Una de ellas es el almacenamiento. La cantidad de datos va aumentando, particularmente hoy que tenemos discos duros muy gordos, aplicaciones de tamaño importante y muchos más usuarios. La estrategia de almacenamiento ha tenido que evolucionar hacia algo más sofisticado, si comparamos con lo que era hace diez años. En esa época era posible utilizar un streamer (lector de cintas) conectado a un servidor, usando para almacenar mandatos de como dump, cpio o find (-cpio es una opción de find). Esa es todavía una solución si el número de servidores, clientes o aplicaciones no se han visto multiplicados.

Si la red ha "crecido" tendrán que encontrar una solución mejor. Y cuando decimos mejor, tendríamos que decir más rápida. Hay que encontrar una buena manera de hacer este trabajo. Si la red tiene muchos sistemas operativos diferentes, vuelve a ser bastante difícil encontrar la "mejor". ¡Como de costumbre, la "mejor" tiene que ser buena, bonita y barata! Siempre es un compromiso, y lo mejor para uno no lo es para otro. Así, lo primero a considerar son las necesidades: software, hardware... Hay muchos productos disponibles, pero la mayoría es software propietario y muy caro (lo que es un eufemismo). Y no olvidemos la parte hardware: por lo menos necesitan algun streamer o automáta. Para acabar, tienen que saber qué máquina podrá desempeñar el papel de servidor de almacenamiento. Este servidor necesita un disco duro gordo, muchos recursos (memoria, CPU) y puertos SCSI. Tiene que ser capaz de administrar varios almacenamientos al mismo tiempo.
¿A donde ir desde aquí?

Presentación

La elección de Arkeia

Muchas empresas importantes "ofrecen" soluciones de almacenamiento de redes como hemos mencionado antes. Arkeia ha sido seleccionado primero por su soporte de muchos SO. Los servidores de almacenamiento pueden ser: AIX 4.1, DEC Alpha Unix 4.0, HP-UX 10, IRIX 6.2 (y posteriores), Linux 2.* (x86), Solaris 2.5 (y posteriores) y NT 4.0 Server (Intel). Clientes de almacenamiento pueden ser los mismos que los servidores más otros tal como SCO v5 (Intel), BSD 3.0, 4.0, Novell 4.11, FreeBSD 2.2.6, Windows 95, 98, NT 4.0 Server (Alpha) y NT 4.0 Workstation (Intel). Esta lista no es exhaustiva y puede cambiar en todo momento. Consultar http://www.arkeia.com para tener más información. La mayoría de los servidores tienen un interfáz gráfico, basado en Xlib (librerías propietarias) para Unix, y en Java para los productos Microsoft.

La segunda razón para elegir Arkeia fue el precio. No podemos dar ninguno porque depende de la red, del número y del tipo de servidores y clientes, si tienen automátas o no (en éste caso, tendrán que comprar una licencia para la librería que administra el automáta). Conectar con el site de Arkeia permite obtener un presupuesto según la configuración de la red. La razón final era la administración de los streamers. Arkeia puede administrar casi cualquier tipo de streamer: DAT. EXABYTE, QIC... Y como teníamos varios streamers QIC, éste era un problema menos.

¿A qué parece?

adm.jpg
La ventana principal

Como hemos visto antes, Arkeia utiliza una GUI en el servidor. Se entra en Arkeia con una ventana de login que permite el acceso a las ventanas específicas que administran el almacenamiento. Estas ventanas se pueden abrir desde un menú, un menú contextual o pinchando en iconos. Todo eso puede ser configurado según los propios gustos (fondos de pantallas predefinidos, colores preferidos). No hay mucho más que decir, puesto que todo es evidente y muy amigable. En Unix, el GUI funciona con casi todos los gestores de ventanas. En las cosas de Microsoft, tendrán que instalar la JVM (Java Virtual Machine) del mismo Microsoft antes de poder utilizar el GUI. Para concluir, el GUI es muy práctico, les guste su aparencia o no.

¿Cómo funciona?

Arkeia utiliza una technología de almacenamiento paralelo trás una red TCP/IP. Un servidor de almacenamiento administra los streamers y recoge los datos de los clientes usando multi-flujo. Funciona según el modelo cliente/servidor usando memoria repartida y cola de mensaje. IPC (Inter Process Communication) tiene que estar perfectamente configurado en el servidor de almacenamiento. El manual avanzado enseñará cómo refinar la configuración del servidor. La instalación es muy lógica: tienen que colocar el software servidor y cliente en el servidor de almacenamiento, y el software cliente en los clientes.¡Hasta ahí, todo va bien! En el servidor tienen que definir todo lo relacionado con streamers, conjuntos de pilotos (drivepacks), conjuntos de cintas (tape pools), cintas y conjuntos de almacenamiento (savepacks).

- Conjuntos de pilotos: la primera etapa del proceso de configuración. (Definicion de dispositivos)
Seleccionando "Drives management" desde el menú "Devices", tienen que dar un nombre al streamer, sus autorizaciones (leer, escribir, limpiar y suprimir) y por supuesto su piloto. Eso depende del sistema: por ejemplo /dev/rmt/1h en Solaris o /dev/rmt/tps1d2 en Irix o /dev/st0 en Linux. Tienen que definir cada streamer y el piloto correspondiente. Supongamos que tenemos cuatro streamers QIC conectados a un servidor O2 (Irix 6.5): El primero podría ser llamado QICuno con el piloto /dev/rmt/tpd1d2, el segundo QICdos con el piloto /dev/rmt/tps1d3, etc. El "1" después de "tps" es el número del controlador SCSI y el "2" después de "d" es la ID del streamer. Por eso tendrán que conocer todo lo que concierne ID SCSI, "daisy chains"... Si tienen un automáta, el proceso de configuración es casi igual, y la documentación informa de todo lo necesario.
- Conjuntos de pilotos (Drivepacks):
Desde el mismo menú, se selecciona "Drivepacks" y se crea un drivepack correspondiente al streamer. Siguiendo con el ejemplo precedente, tienen un streamer llamado QICuno. Pueden llamar el drivepack QICuno Pack. Hagan lo mismo por cada streamer ya definido. Ahora, cada drivepack tiene que corresponder a su streamer. Basta con seleccionar el streamer y el drivepack correspondiente.
- Conjuntos de cintas (Tape pool):
Esta etapa permite crear tantos conjuntos como sea necesario. Desde el menú "Tapes management", seleccionen "Pools management". Pinchando en el icono "New" y llenando el campo se crea un conjunto.
- Cintas:
Cada conjunto necesita contener una o más cintas. La ventana "Tapes in pool" puede ser llamada con un doble-pinchando en el pool. Seleccionar "New" abre la ventana "Create tape". Basta con llenar los campos. Por cierto, hay una ayuda en linea muy práctica (una por cada ventana) indicando qué hacer.
- Conjuntos de almacenamiento (Savepacks):
Por último, se necesita crear uno o más savepacks. Estos contienen el árbol a almacenar por un cliente dado. Se puede circular por el árbol con un navegador para seleccionar directorios o ficheros. Hay que repetir la operación por cada cliente y cada árbol que almacenar.

Ahora, están listos por un almacenamiento interactivo de varios clientes al mismo tiempo.
Vamos a la cruda realidad.

Un ejemplo real

Tenemos una red un poco rara con cuatro servidores que almacenar. El servidor de almacenamiento es un SGI O2, y los clientes son un servidor de aplicaciones Sun con Solaris 2.6, un servidor de communicaciones Linux con RH6.0, y dos servidores de aplicaciones bajo NT4.0 Server. Vamos a almacenar interactivamente las cuatro máquinas. Creamos los cuatro streamers: los llamamos QIC Sun, QIC Linux, QIC Pcsvr y QIC Pcdev. ¿Muy original, no? Ahora definimos los cuatro pilotos: QIC Sun en /dev/rmt/tps1d4, QIC Linux en /dev/rmt/tps1d5, QIC Pcsvr en /dev/rmt/tps1d3 y QIC Pcdev en /dev/rmt/tps1d2. Pueden ver que la originalidad va creciendo. Les damos todos los derechos: somos el administrador y trabajamos como root. Muy feo, ¿no? Después creamos los drivepacks correspondientes: Sun Pack, Linux Pack, Pcsvr Pack and Pcdev Pack, una vez más con mucha imaginación. Ahora, los conjuntos de cintas: como de costumbre, Sun Pool, Linux Pool, Pcsvr Pool and Pcdev Pool. Creamos un conjunto para cada pack. Eso es una elección personal. Podrían crear sólo un conjunto con cuatro cintas. Si el conjunto contiene varias cintas, Arkeia administra los streamers. Es decir, si no dan una prioridad a cada streamer, Arkeia selecciona lo que quiere almacenar y donde lo almacena. Es probablemente lo que menos me gusta. Por fin, definimos una cinta en cada conjunto: otra vez, Sun Tape, Linux Tape, Pcsvr Tape and Pcdev Tape. No se preocupen, eso se hace sólo una vez. Podrán usarlo todo cada vez que lo necesiten. Queremos un almacenamiento completo para cada servidor, y definimos los savepacks: Sun, Linux, Pcsvr and Pcdev serán los apellidos.

Arkeia esta correctamente instalado en los clientes. Así pueden ver cada máquina en el navegador. Para seleccionarlas, pinchen en la caja correspondiente. Ahora arrancamos el almacenamiento interactivo. Seleccionen el menú "Interactive backup". En la nueva ventana, elijan un savepack, un drivepack y un pool para cada servidor. En nuestro ejemplo, para almacenar el Sun, el savepack es Sun, el drivepack es Sun Pack y el pool es Sun Pool. Seleccionen un tipo de almacenamiento (total en el ejemplo, pero hubieramos podido decir incremental), la estrategia para la cinta (nueva cinta en éste caso, pero una alternativa sería completar una cinta) y utilizar email o no (como le de la gana). Pinchar en el icono de validación arranca el almacenamiento del Sun. Repiten esa etapa esa por cada servidor y ya está. Cuatro almacenamientos se hacen al mismo tiempo y pueden ir a tomar un café.

linux.jpg
La ventana de almacenamiento

Unos 40 minutos más tarde ya acabó. Cosas importantes: la red es una categoría 5... pero en obras. Significa: los cables no son todos de cat 5, los hubs son 10 o 10/100Mb, sólo unas máquinas tienen verdaderas tarjetas de 100Mb... Sin embargo, hemos almacenado alrededor de 3Gb y unos 150000 ficheros en unos 40 minutos. En una verdadera red cat 5, eso hubiera sido por lo menos 3 veces más rápido. La velocidad depende de muchos elementos: red, ordenadores, streamers, tamaño de las cintas. Nuestro ejemplo es un caso particular y no refleja la fantástica velocidad que pueden alcanzar en ciertas configuraciones. Si la red es una verdadera cat 5, si tienen automátas, si utilizan DAT, si los ordenadores són muy rápidos... pueden esperar unos 70 Mb/min. En nuestro ejemplo, la media es alrededor de 25 Mb/min. Eso para cada almacenamiento. Considerando que están hechos al mismo tiempo da unos 100Mb/min.

linuxlog.jpg pcdevlog.jpg pcsvrlog.jpg sunlog.jpg
Logs

No obstante, una manera interesante de entender la eficiencia de Arkeia es comparar con la estrategia precedente con el mismo hardware. Antes de utilizar Arkeia, los almacenamientos se hacían desde cada ordenador, con cada streamer conectado al puerto SCSI. Hablando de los mismos ordenadores y de los mismos streamers, el beneficio representa un 50%. Almacenamiento del Sun con su propio streamer: 1 hora; con Arkeia: 38 minutos. Almacenamiento de Pcdev con su propio streamer: más de 1 hora; con Arkeia: 32 minutos. Etc... No olvidemos almacenar el servidor de almacenamiento: ésta vez no usamos la red, y es un poco más lento (alrededor de 22Mb/min). Según Arkeia, con el hardware correcto, se puede almacenar 128 máquinas en 32 streamers en paralelo. No pude probar tal configuración... Donde trabajo somos muy pobres.

No se puede hablar de almacenamiento sin mencionar restauración. Podemos comentarla con una frase muy corta: es tan fácil y rápida como el almacenamiento. Usando el navegador pueden restaurar lo que quieran y donde quieran. Es decir, pueden restaurar en otros directorios o máquinas.

Más características

No hemos hablado de los almacenamientos periódicos. Obviamente, Arkeia es capaz de administrar almacenamientos programados para arrancar a una hora específica. Bajo Unix, usará cron y con los productos Microsoft será un servicio. Pueden definir intervalos diferentes para almacenamiento periódico: día, semana, mes... Es posible administrar tres niveles para cada almacenamiento. Por ejemplo, quieren programar un almacenamiento periódico para un mes. Nivel 1 corresponde a un almacenamiento mensual, nivel 2 es semanal y nivel 3 es diario. Eso quiere decir, el nivel 3 funcionará 6 veces a la semana, el nivel 2 lo hará 3 veces al mes, y el 1 sólo una vez. El resultado: necesitarán muchas cintas y tantos streamers como servidores que almacenar. A menos que enseñan al perro cómo cambiar las cintas de noche entre los almacenamientos... Aparte de eso, funciona como el almacenamiento interactivo. Hay mucho que decir sobre almacenamiento periódico, pero necesitaríamos un artículo entero. Podemos decir, es probablemente una de las caraterísticas más importante de Arkeia. Otro punto de interés concierne a los logs. Tienen logs para todo: cintas, streamers, almacenamientos... Eso emplea bastante espacio en el disco, pero es muy útil. Estos logs están muy bien organizados y dan mucha información. Arkeia los administra de una manera muy práctica archivandolos por mes.


avlog.jpg
La ventana de los logs disponibles

La ayuda en línea también merece ser mencionada. Pueden trabajar con Arkeia sin leer toda la documentación, salvo que quieran entrar en administración avanzada, por supuesto. La documentación está contenida en el CD-Rom del programa en formato PDF, permitiendo imprimirla fácilmente para crear sus propios manuales. Esta documentación contiene información importante sobre configuración específica de máquinas, seguridad, problemas, utilidades, librerías de automátas... Si necesitan más, hay una lista de correo dedicada a Arkeia.

¿Entonces qué?

Este artículo no puede ser exhaustivo. Habría muchas cosas que decir sobre el software. Arkeia no ha intentado reinventar la rueda, pero usa todo lo que permite mejorar el rendimiento. IPC es una de las llaves. Otra vez, gracias a Unix. Tenemos que mencionar la versión personal y shareware para Linux. Está dedicada a uso no comercial. Nada impide que la prueban en su red privada. Es shareware, y debemos decir que si mandan una contribución de 20$ o más, el 25% serán dado a Software in the Public Interest. Otra cosa que mencionar: compré Arkeia en la División Europea. La persona encargada sabe muy bien de qué habla y hace un trabajo estupendo (hola Sandy). Esta empresa es la primera entre las numerosas con que trabajo, que ha tratado todo el asunto por e-mail. Ni fax, ni correo postal excepto para el paquete del software. ¡¡¡Y por fin, sólo mandando TEXTO!!!
Totalmente fuera del asunto, pero estoy hasta las narices de todos estos documentos Word o Excel circulando a través de Internet. Primero, están llenos de macro viruses potenciales. Segundo, todo el mundo en esta tierra NO es obligado a tener Word o Excel (¿Cómo trabajábamos antes?). Tercero, un texto es 10 o 100 veces más pequeño que su equivalente documento Word, y a una época en la cual el "bandwidth" en Internet es cuando menos muy estrecho, el tamaño parece una cosa importante.
¡Perdón por la digresión esa! Ahora que voy a tener muchos amigos nuevos, volvemos a Arkeia. Creo que Arkeia es una buena solución de almacenamiento de redes. No me gusta todo, pero ésta gente trabaja muy duro para mejorar el producto. Personalmente, me gustarían más funcionalidades en lo que respecta a la administración de cintas, como la posibilidad de decidir cuantas cintas quiero utilizar en una estrategia o la de escribir encima del contenido de una cinta durante el almacenamiento. ¡En una palabra, me gustaría ser el jefe! El precio también es un elemento importante a la hora de elegir. Arkeia parece muy competitivo en este aspecto. Si buscan este tipo de herramientas, no olviden probar ésta. Si ya conocen Arkeia a través de alguna distribución Linux, pueden ir a http://www.arkeia.com para aprender más sobre el producto.
¡Vivimos una época tremenda!