Este recurso de aprendizaje es una lección creada originalmente como material didáctico del proyecto de aprendizaje Dirección y gestión de proyectos y sistemas informáticos.

Los sistemas de almacenamiento son elementos, dispositivos... capaces de almacenar información. Puesto que almacenan miles de datos con gran valor, una buena gestión de los mismos es esencial.

Introducción

editar
 
Disco duro

Según Sjaan Laan “dependiendo del tipo de organización, los datos crecen una media de entre 50% y 100% por año” de los cuales , estos datos se dividen en no estructurados (correos, audio, documentos de texto, etc ..) y estructurados (los almacenados).

Para almacenar estos datos se deben de elegir los sistemas de almacenamiento adecuados, dependiendo de tipo de datos y el volumen de estos.

Tipos de sistemas de Almacenamiento

editar

Los elementos para satisfacer las necesidades de almacenamiento, se pueden dividir en cuatro grandes grupos: Discos duros, Cintas magnéticas, NAS y SAN.

Discos Duros

editar

Dispositivo de almacenamiento de datos no volátil. Existen dos tipos: magnéticos (HD) y de estado sólido (SSD). Las diferencias principales entre ambos son la velocidad a la cual se accede a los datos, el tiempo de vida del dispositivo y el precio, los discos SSD son mucho más rápidos que los magnéticos, pero tienen un tiempo de vida menor y el precio por unidad de almacenamiento es mucho mayor.

Cintas Magnéticas

editar

Se basan en los mismos principios de lectura/grabación que las cintas utilizadas por los magnetófonos convencionales.

Del inglés Network Attached Storage. Recurso diseñado para ser conectado a la red, con el objetivo de proporcionar a los dispositivos que se encuentran en ella capacidad de almacenamiento. Proporciona soporte de copias de seguridad y cifrado de datos

Del inglés Storage Area Network. Se trata de una red dedicada, que conecta dispositivos de almacenamiento en red, con el objetivo de proporcionar al usuario un interfaz de almacenamiento unificado.

Gestión de Almacenamiento

editar

Principalmente, todas las compañías generan datos, incluyendo los provenientes de otros procesos, hay que guardarlos para poder acceder a ellos en cualquier momento (garantizando su integridad). Con gestión de almacenamiento, se define la infraestructura que se requiere para ello y la toma de decisiones para que sea efectivo. Es el proceso encargado de optimizar el uso de dispositivos de almacenamiento y proteger la integridad de los datos, independientemente del dispositivo en el cual residan. Los principales focos son: capacidad, rendimiento, fiabilidad y recuperabilidad.

Capacidad

editar

Consiste en proporcionar el suficiente almacenamiento a los encargados dentro de unos costes razonables. Se debe saber planificar la capacidad que nos hace falta actualmente y tener expectativas de cada cuanto tiempo vamos a tener que aumentar la capacidad.

Cabe destacar que el coste de almacenamiento cada vez es menor, aunque las necesidades de almacenamiento son mayores.

Rendimiento

editar

Hay que conseguir la mejor configuración para el rendimiento óptimo del sistema, que va a depender de los objetivos (mayor rendimiento, mayor uso de recursos). Hay que tener en cuenta diversos factores (CPU, la memoria principal) de los dispositivos que conforman la infraestructura y que dependiendo de los mismos, se van a producir diferencias significativas respecto a los requisitos de rendimiento.

Fiabilidad

editar

El almacenamiento y sus datos deben estar disponibles para cuando los clientes necesiten. A parte, el sistema no tiene que tender al fallo (proporcionar almacenamiento que tienda al fallo puede afectar a nuestra reputación). La evolución de la tecnología en el área de almacenamiento ha sido clave para con este punto, debido que a lo largo de la historia se ha ido aumentando la fiabilidad de los dispositivos utilizados para dicha tarea.

Para conseguir la fiablidad se puede utilizar la configuración RAID (Redundant Array of Independent Disks). RAID ofrece distintos niveles de configuración. Los niveles de configuración de RAID más usados son:

  • Raid 0 : Fragmentación de discos por razones de rendimiento
  • Raid 1: Duplicación de discos para redundancia total
  • Raid 0+1: Combinación de los dos anteriores (Fragmentación y duplicación)

RAID ofrece más niveles que constan de mecanismos para mejorar la tolerancia a fallos, mejorar el rendimiento...


Recuperabilidad

editar

Los datos pueden ser alterados, dañados, borrados resultar inaccesibles. Se deben tener mecanismos para poder recuperarlos. Y el método para recuperar los datos, va a depender del método con el que se realizó el backup. Las copias de seguridad ó backup pueden ser de los siguientes tipos:

  • Copia de seguridad física completa: Requieren la parada completa del sistema al cual se le quiera aplicar la copia de seguridad
  • Copia de seguridad física incremental: Requieren la parada completa del sistema al cual se le quiera aplicar la copia de seguridad, pero durante un menor lapso de tiempo.
  • Copia de seguridad física online: Las bases de datos pueden permanecer abiertas a los usuarios durante el proceso de copia de

seguridad y la recuperación se puede lograr de nuevo a la última transacción procesada.

  • Copia de seguridad lógica (exportado de archivos): Menos complicadas que las anteriores pero consumen más tiempo. Permiten

aplicaciones 24/7 y las bases de datos pueden permanecer online.

Conclusiones

editar

La inmensa mayoría de las empresas tienen necesidades de almacenamiento de información. Como no hay dos empresas iguales, es importante seleccionar el sistema de almacenamiento adecuado según las necesidades de la propia empresa. De esta manera los sistemas de almacenamiento se pueden dividir en Discos duros, Cintas magnéticas, NAS y SAN.

La gestión de almacenamiento es el proceso encargado de optimizar el uso de dispositivos de almacenamiento y proteger la integridad de los datos. Este proceso consta de 4 puntos principales:

  • Capacidad : Seleccionar el sistema de almacenamiento adecuado en función de las necesidades de la empresa
  • Rendimiento: Construir la configuración adecuada de la insfraestructura (CPU, Redes...) para conseguir obtener la información de los sistemas de almacenamiento en un tiempo razonable.
  • Fiabilidad: Conseguir que los datos siempre estén disponibles, por ejemplo con la configuración RAID.
  • Recuperabilidad: Poder recuperar datos perdidos, a través de copias de seguridad.

Hoy en día la información para las empresas constituye uno de sus activos más importantes, por lo que realizar una buena gestión de los sistemas de almacenamiento es clave.

Ejemplos

editar

Pongamos ejemplos de la gestión de almacenamiento en dos empresas distintas:

CASO A: Clínica veterinaria

   Para una clínica veterinaria, se necesitan almacenar las fichas y el historial clínico de sus clientes. 
   Puesto que la información es texto, no se necesita mucha capacidad de almacenamiento, por lo que un disco duro 
   de 500 GB, proporcionará almacenamiento de sobra. Por otro lado, para asegurar que los datos pueden ser 
   recuperados, podremos almacenar una copia del disco en la nube. Por último para asegurar la fiabilidad, 
   podremos tener otro disco duro para configurar un nivel RAID 0+1.

CASO B: Red social

   Para una red social, tipo Twitter o Facebook, es necesario gestionar una gran cantidad de información, 
   por lo que optaremos por el uso de servidores con gran capacidad de almacenamiento. Por otra parte, para 
   asegurar la recuperabilidad de la información se realizarán copias de la información en servidores dedicados 
   exclusivamente a esta tarea. Por último, para asegurar la fiabilidad se usará un sistema de almacenamiento 
   distribuido con replicación de la información, de manera que si uno de los servidores falla, la información 
   esté disponible en otro servidor.

Cuestionario de auto-evaluación

editar

Hablando de "Gestión del almacenamiento", ¿en qué consiste la recuperabilidad?

Obtener los datos almacenados en el sistema de información.
Poder recuperar datos 'perdidos' a través de copias de seguridad.
Poder acceder a los datos en todo momento.
Todas las anteriores son correctas.


Lecciones Relacionadas

editar
  1. Gestión de infraestructuras

Referencias

editar
  • Gestión de Infraestructuras Tecnológicas -- Pablo Cerro Cañizares -- Trabajo para la asignatura "Dirección y Gestión de Proyectos y Sistemas Informáticos" del Master de Ingeniería Informática de la Universidad Complutense de Madrid

Participantes activos

editar