Análisis de fiabilidad de un sistema de almacenamiento en clústeres

Este ejemplo se basa en el ejemplo que aparece en la figura 8 del artículo «Determinación de la disponibilidad y fiabilidad de las configuraciones de almacenamiento», de Santosh Shetty, agosto de 2002, publicado en de , en el sitio web de Dell.

Descargar archivo 2023 download

Descargar ejemplo de 2022 download

Ejemplo

Considere un clúster de «alta disponibilidad» con un diagrama de bloques de fiabilidad (RBD), como se muestra a continuación.

Figura 1: Sistema de clúster de almacenamiento

Suponga las siguientes distribuciones de vida útil y parámetros para los componentes: (Tenga en cuenta que este ejemplo, a diferencia del artículo original, no prevé la reparación de los componentes averiados).

Servidor: Exponencial con media = 45 753 horas
Interruptor: Exponencial con media = 255 358 horas
HBA: Exponencial con media = 252 550 horas
Controlador: Exponencial con media = 68 961 horas

El objetivo del análisis es estudiar la fiabilidad del sistema.

Análisis

Paso 1: Cree el RBD del sistema en BlockSim y, a continuación, utilice la información proporcionada para configurar las definiciones de fiabilidad universal (URD) de cada bloque. Por ejemplo, la siguiente imagen muestra la ventana Propiedades del bloque de Server1. El recuadro muestra el asistente de modelos, que le permite definir el modelo de fallo del bloque. Los URD de los demás bloques se pueden configurar de manera similar.

Figura 2: Ventana Propiedades del bloque de Server1 y Asistente para modelos (recuadro)

Paso 2: Una vez configurados los URD, analice el diagrama y obtenga la ecuación de fiabilidad del sistema, como se muestra a continuación. En esta ecuación, cada R es la función de fiabilidad (1-cdf) del elemento. Por ejemplo, RServer2 es la función de fiabilidad del servidor 2.

Figura 3: Ecuación de fiabilidad del sistema del clúster de almacenamiento

Paso 3: Genere gráficos a nivel del sistema para obtener más información sobre el sistema. Los dos gráficos siguientes muestran la importancia de la fiabilidad de los componentes en t = 8544 h. Ambos gráficos (un gráfico de área y un gráfico de barras) ilustran el mismo concepto: cuanto mayor es la importancia del componente, mayor es su efecto en la fiabilidad del sistema.

Figura 4: Importancia de la fiabilidad estática - Gráfico de área de Tableau

Figura 5: Importancia de la fiabilidad estática - Gráfico de barras

Como puede ver, los servidores son el componente más crítico de esta configuración, mientras que los concentradores son los menos críticos.

Las siguientes imágenes muestran tramas adicionales.

Figura 6: Gráfico de RI en función del tiempo

Figura 7: Gráfico de fiabilidad de sistemas

Figura 8: Gráfico de tasa de fallos del sistema

Figura 9: Gráfico del sistema en pdf

Paso 4: Utilice la calculadora analítica rápida (QCP) de BlockSim para obtener algunos de los resultados de fiabilidad más solicitados. Por ejemplo, el MTTF (tiempo medio hasta el fallo) del sistema es de aproximadamente 42 135 horas, como se muestra a continuación.