MAIN MENU

Análisis de fiabilidad de un sistema de almacenamiento en clústeres

Este ejemplo se basa en el ejemplo que aparece en la figura 8 del artículo «Determinación de la disponibilidad y fiabilidad de las configuraciones de almacenamiento», de Santosh Shetty, agosto de 2002, publicado en de , en el sitio web de Dell.

Ejemplo

 

Considere un clúster de «alta disponibilidad» con un diagrama de bloques de fiabilidad (RBD), como se muestra a continuación.

image
Figura 1: Sistema de clúster de almacenamiento

Suponga las siguientes distribuciones de vida útil y parámetros para los componentes: (Tenga en cuenta que este ejemplo, a diferencia del artículo original, no prevé la reparación de los componentes averiados).

 

  • Servidor: Exponencial con media = 45 753 horas
  • Interruptor: Exponencial con media = 255 358 horas
  • HBA: Exponencial con media = 252 550 horas
  • Controlador: Exponencial con media = 68 961 horas

 

El objetivo del análisis es estudiar la fiabilidad del sistema.

Análisis

 

Paso 1: Cree el RBD del sistema en BlockSim y, a continuación, utilice la información proporcionada para configurar las definiciones de fiabilidad universal (URD) de cada bloque. Por ejemplo, la siguiente imagen muestra la ventana Propiedades del bloque de Server1. El recuadro muestra el asistente de modelos, que le permite definir el modelo de fallo del bloque. Los URD de los demás bloques se pueden configurar de manera similar.

image
Figura 2: Ventana Propiedades del bloque de Server1 y Asistente para modelos (recuadro)

Paso 2: Una vez configurados los URD, analice el diagrama y obtenga la ecuación de fiabilidad del sistema, como se muestra a continuación. En esta ecuación, cada R es la función de fiabilidad (1-cdf) del elemento. Por ejemplo, RServer2 es la función de fiabilidad del servidor 2.

image
Figura 3: Ecuación de fiabilidad del sistema del clúster de almacenamiento

Paso 3: Genere gráficos a nivel del sistema para obtener más información sobre el sistema. Los dos gráficos siguientes muestran la importancia de la fiabilidad de los componentes en t = 8544 h. Ambos gráficos (un gráfico de área y un gráfico de barras) ilustran el mismo concepto: cuanto mayor es la importancia del componente, mayor es su efecto en la fiabilidad del sistema.

image
Figura 4: Importancia de la fiabilidad estática - Gráfico de área de Tableau
image
Figura 5: Importancia de la fiabilidad estática - Gráfico de barras

Como puede ver, los servidores son el componente más crítico de esta configuración, mientras que los concentradores son los menos críticos.

 

Las siguientes imágenes muestran tramas adicionales.

image
Figura 6: Gráfico de RI en función del tiempo
image
Figura 7: Gráfico de fiabilidad de sistemas
image
Figura 8: Gráfico de tasa de fallos del sistema
image
Figura 9: Gráfico del sistema en pdf

Paso 4: Utilice la calculadora analítica rápida (QCP) de BlockSim para obtener algunos de los resultados de fiabilidad más solicitados. Por ejemplo, el MTTF (tiempo medio hasta el fallo) del sistema es de aproximadamente 42 135 horas, como se muestra a continuación.

image
Figura 10: QCP analítico