Consultoría

Monitorizar es clave para evitar fallos masivos en los sistemas informáticos

En informática a la previsión de sucesos se la conoce como monitorización. Se trata de una solución de bajo coste que puede evitar desastres como los que se produjeron en junio en el sistema sanitario de Madrid, que sufrió fallos masivos.

pc, ordenadores

A principios de junio se produjeron fallos masivos en todo el sistema informático de más de 18 hospitales de Madrid y de todos los centros de atención primaria, que dejaron a decenas de miles de pacientes preocupados, haciendo colas, esperando sus historiales, sus citas y pendientes de la atención a su salud. El año pasado ocurrieron numerosos incidentes de este tipo en España y en otros países del mundo, de los cuales la prensa destacó a lo grande el caso de British Airways que dejó abandonadas en los pasillos a miles de personas también en uno de los mayores aeropuertos del mundo, inquietos por su viaje de trabajo o placer, durante tres días. ¿Cómo pueden repetirse este tipo de caídas cuando no es difícil prevenirlas? Algunos creen que son cosas de la tecnología, otros se preguntan para qué sirve tanta tecnología si en cualquier momento puede fallar y muchos se plantean si estos fallos no se pueden prevenir.

Es evidente que se puede prever y la solución es sencilla y no supone un coste adicional alto. Lo más caro es el tiempo de miles de personas y el coste de la reputación de un servicio público o de una empresa privada. Los datos privados relativos a la salud están recogidos como especialmente sensibles por las leyes de protección de datos, porque saben que, para todos nosotros en un momento dado, algo puede ser crucial para nuestras vidas.

La monitorización tecnológica sirve para que los ojos de aquellos que gestionan la infraestructura pública de tecnología sepan qué está pasando en todo momento. La tecnología pocas veces falla de repente o porque sí. Es cierto que hay personas que todavía creen en los duendes y en la magia, pero la informática siempre avisa cuando va a dar problemas, lo importante, como con un catarro, es cogerlo a tiempo, antes de que devenga en una neumonía.

En el sector privado existe desde hace años una fuerte inversión por la monitorización IT, ya que son conscientes de la obligación de dar al paciente un servicio en un tiempo razonable. No sólo para la generación de citas, informatización de informes médicos entre los laboratorios y los doctores de cabecera, sino también para las mismas salas de espera. No sólo hay que ser eficiente, hay que demostrarlo al paciente, que ha puesto sus vidas en manos de un sistema que no entiende.

Los sistemas informáticos de una compañía como British Airways no son un juguete. La única información filtrada a medios públicos hacía referencia a un fallo eléctrico. Seamos serios, hemos visto mucho cine y todos sabemos que a un sistema informático complejo no se le puede matar tirando del cable. Hace falta más que eso para tumbar una infraestructura millonaria y que habrá costado el esfuerzo de cientos de expertos.  Pero por más que uno busca en la red, no aparecen noticias acerca de un ataque malicioso ni nada similar. De hecho, sólo hay notas escuetas y calculadas al milímetro para no meter –aún más– la pata.

 

¿Qué ha ocurrido?

En ingeniería hay un principio para resolver problemas complejos: de todas las posibles respuestas, la más sencilla suele ser la correcta: la navaja de Occam.

En mayo de 2018, el vicepresidente y portavoz del Gobierno de la comunidad de Madrid, Pedro Rollán, tuvo que salir al paso de una caída del sistema informático SELENE que afectó a 18 hospitales y docenas de centros de salud en toda la CAM. Su explicación fue que el problema se debía a la saturación de un sistema balanceador y que para solventar el fallo fue redistribuida la información y la gestión a otros servidores de la red hospitalaria. Lo que no aclaró es por qué el sistema SELENE que se aplica en muchas otras autonomías no había fallado, y lo más importante, no aclaró qué medidas se van a tomar para que no vuelva suceder algo parecido. ¿Por qué? Porque no saben qué ocurrió, y por tanto, no pueden prevenirlo.

Lo peor de todo es que el sistema SELENE, desarrollado por una UTE de Siemens e Indra documenta en su funcional interno (al que se puede acceder con una consulta en Google) un sistema de balanceo como el que describe su responsable político. Esto viene a confirmar que efectivamente, cuando llueve, uno se moja. Hacía siglos, los pastores miraban al cielo e intuían si lloviese al día siguiente. Hoy día la meteorología ha avanzado mucho, es fascinante como el desarrollo de un sistema como SELENE deja a nuestros políticos en la tesitura de tener que salir a la palestra para levantar los hombros y decir que cuando llueve, nos mojamos.

En informática, a la previsión de sucesos se la conoce como monitorización. Desde los años 70 existen diferentes fórmulas, aplicaciones, algoritmos y software comercial para poder evitar problemas como estos. En España, centros de gestión privada disponen de este software para evitar semejantes bochornos, centros con presupuestos muy inferiores a los de la sanidad pública. La pregunta que hay que hacer es, ¿no será que a alguien le interesa más vender autobuses que procurar que éstos funcionen como deben?

 

La monitorización es necesaria

Una de las utilidades de la monitorización consiste en verificar que los sistemas de red no se sobrecargan, y advertir a los responsables cuando ven señales de ello. También sirve para verificar que las respuestas de los técnicos sean satisfactorias y en tiempo. La monitorización también sirve para saber si la infraestructura está al límite de su capacidad. La monitorización también es vital para medir los acuerdos de servicio con proveedores. La monitorización sirve para señalar dónde está el problema para que no vuelva a suceder y para que, si hay que salir a dar la cara, se puedan dar explicaciones válidas.

De nada sirve decir, como ha dicho Rollán que los sistemas se vieron superados por la demanda. Es como decir que no se frenó a tiempo, no sirve paliar los síntomas, hay que atajar las causas, y perdonen que diga esto siendo ingeniero hablando de un problema de la sanidad.

 

El autor de este artículo es Sancho Lerena, experto en control de sistemas y CEO de Ártica



Contenido Patrocinado

Fernando Rubio Román, CTO de Microsoft España. TECNOLOGÍA
Forma parte de nuestra comunidad

 

¿Te interesan nuestras conferencias?

 

 
Cobertura de nuestros encuentros
 
 
 
 
Lee aquí nuestra revista de canal

DealerWorld Digital