Tecnología MPP

Una cuestión de fuerza bruta

Si su base de datos está en torno a los 500 GB y sigue creciendo, es probable que deba usted considerar seriamente la posibilidad de instalar un sistema de proceso masivamente paralelo, MPP (Massively Parallel Processor), si no tiene ya uno. Los sistemas MPP son conjuntos o "arrays" de procesadores conectados mediante un enlace de alta velocidad, y que están "paralelizados" para funcionar actuando sobre partes distintas de un problema grande. La tecnología MPP está siendo utilizada hasta ahora en aplicaciones muy concretas, como los data warehouses o la consolidación de servidores, pero algunos consultores apuntan que en el futuro la tecnología de proceso paralelo masivo "híbrido" será utilizada en aplicaciones de carácter general. En el presente artículo se analizan las ventajas e inconvenientes que presentan las tecnologías de proceso paralelo masivo (MPP) y las de multiproceso simétrico (SMP).

En opinión de diversos analistas, el proceso MPP continúa siendo una de las mejores arquitecturas de servidor cuando se necesita tener la seguridad de que un sistema sea capaz de escalar hasta cualquier dimensión. Sin embargo, esos mismos analistas consideran que algunos cambios importantes que se están desarrollando en las arquitecturas de servidores darán una nueva forma al escenario del proceso con dichos servidores, amenazando el dominio de MPP sobre los grandes trabajos de proceso y creando nuevas opciones para los usuarios.

Analizaremos algunos de esos cambios y la forma en que pronostican una disminución en la importancia del proceso MPP puro y la aparición de sistemas híbridos que combinen las características MPP con las de los sistemas de multiproceso simétrico, SMP (Symmetrical Multiprocessing).

¿MPP O SMP?

¿Cuándo se necesita el proceso MPP? La consultora International Data Corporation (IDC), piensa que si uno tiene sus aplicaciones funcionando bajo proceso SMP, no necesita preocuparse de MPP. Por ejemplo, SMP es una mejor opción que MPP si se están ejecutando aplicaciones que requieren muchas consultas ad hoc, ya que los nodos SMP se comunican con mayor facilidad que los MPP. SMP podría ser también la opción a elegir si se están manejando sistemas de proceso de transacciones online (OLTP) y no se prevé que van a crecer mucho.

Con SMP se tiene la ventaja de una tecnología de mayor madurez, de que hay más software disponible para funcionar en ella, y de que es mucho más fácil de manejar. Pero si uno está manejando data marts o data warehouses que amenazan rebasar la capacidad en terabytes, habrá que considerar seriamente la posibilidad del proceso MPP.

La diferencia entre las arquitecturas MPP y SMP está en que cada nodo MPP tiene su propio sistema operativo y su propia memoria, lo cual permite a los nodos MPP procesar grandes volúmenes de datos, aunque con un esfuerzo extra sustancial. Los nodos SMP comparten un sistema operativo, memoria y almacenamiento comunes, de forma que las peticiones realizadas por las aplicaciones "saltan" entre los diversos nodos sin necesidad de ese esfuerzo adicional, lo que resulta más adecuado para aplicaciones comerciales como el proceso de transacciones.

La afinidad del proceso SMP con las aplicaciones comerciales es el motivo de que muchos vendedores y analistas del sector recomienden que los usuarios comerciales no utilicen MPP, sino que comiencen con SMP y agrupen estos sistemas SMP en clusters al ir aumentando sus requerimientos. Este es el motivo fundamental de las guerras entre estas dos arquitecturas; el multiproceso simétrico tiene ventajas evidentes porque es menos complejo, pero uno puede llegar a acumular sistemas SMP hasta que son demasiado grandes e inútiles.

¿Qué vendedor?

El proceso MPP podría ser la opción a elegir por algunos usuarios, así que algunos consultores aconsejan lo siguiente:

- Buscar vendedores que tengan experiencia en el sector específico en que uno se mueve.

- Prestar atención a los planes de servicio. Estos sistemas son complejos, así que hay que buscar vendedores que dispongan ya del personal adecuado y debidamente formado internamente, como IBM, NCR o Tandem. Aunque otros vendedores están preparando su personal, se enfrentan a largos períodos de aprendizaje.

- Conocer los puntos fuertes de los vendedores. Los vendedores tienen filosofías diversas sobre el proceso en paralelo y sobre los diversos niveles de experiencia MPP. Por ejemplo, según algunos analistas, IBM es el único vendedor que actúa tanto en el mercado comercial como en el científico.

IBM ha instalado varios sistemas MPP de 500 nodos en la comunidad científica, y se ha enfrentado a las complejidades de diseñar el software necesario para manejarlos. Esta es una ventaja que no tiene ningún otro vendedor, afirma la consultora Gartner Group.

El punto fuerte de NCR está en los datos antiguos ya existentes y en el almacenamiento de datos. Su base de datos Teradata está específicamente diseñada para trabajar con estos problemas.

La reputación de Tandem Computers está basada en su proceso ininterrumpido. Esta compañía tiene más de una década de experiencia en proceso MPP, y su base de datos NonStop SQL/MP es una potente aplicación de soporte de decisiones. Siemens Nixdorf, a través de su subsidiaria Pyramid Technology tiene instalados aproximadamente 70 sistemas MPP.

Hewlett-Packard anunció el año pasado su Enterprise Parallel Server, que es un híbrido que incluye varios servidores SMP agrupados para funcionar como una máquina MPP. En opinión de varios analistas, HP tiene un largo camino por recorrer, ya que ha empleado los tres últimos años en afirmar las ventajas de SMP frente a MPP, pero ofrece a sus clientes una excelente ruta de crecimiento.

Rendimiento

En el mercado comercial, el proceso paralelo masivo se utiliza principalmente en aplicaciones concretas "nicho" tales como el data warehouse y la consolidación de servidores, pero algunos vendedores esperan ampliar su conjunto de aplicaciones cambiando la arquitectura de "no compartir nada" de MPP a una arquitectura híbrida con recursos compartidos similares a SMP. "Para la mayoría de las cargas de trabajo en el mercado comercial, y en particular para los sistemas de gestión de bases de datos (SGBD), resultan convenientes los nodos de utilización compartida de recursos.

Evolucionar hacia unos recursos compartidos significa cambiar muchos procesadores 'más lentos' por menos procesadores 'más rápidos'. La consecuencia final, en opinión de diversos analistas, es una arquitectura global más rápida. IBM, NCR, Siemens Nixdorf/Pyramid y Digital ya tienen sistemas MPP configurados con nodos SMP.

Ahora, según la consultora Meta Group, entre las nuevas aplicaciones MPP hay servidores World Wide Web y Lotus Notes, junto con implementaciones R/3 de tamaño moderado.

Según la consultora Meta Group, los avances en los procesadores individuales en sistemas MPP seguirán probablemente durante algunos años la curva de la ley de Moore: en el sector informático se continuará duplicando cada 18 meses la cantidad de datos que pueden ser almacenados en un procesador de silicio.

Escalabilidad

La escalabilidad de las verdaderas arquitecturas MPP está muy por delante de la demanda de los usuarios en el mercado comercial, excepto en las compañías que manejan aplicaciones de un nivel extraordinariamente alto. La mayoría de los data warehouses están por debajo de un terabyte, así que no habrá a corto plazo mucha necesidad de mejoras en escalabilidad para el proceso MPP. Sin embargo, la escalabilidad de los sistemas híbridos ofrece frente a SMP una mejora que le permite afrontar ciertas aplicaciones que antes estaban reservadas para sistemas MPP estrictos.

Siempre habrá una necesidad de potencia como la que aporta el proceso paralelo masivo, pero el mercad

Contenido Patrocinado

Forma parte de nuestra comunidad

 

¿Te interesan nuestras conferencias?

 

 
Cobertura de nuestros encuentros
 
 
 
 
Lee aquí nuestra revista de canal

DealerWorld Digital