Este artículo se publicó originalmente en HELP NET SECURITYLa aceleración de la red GenAI requiere una optimización previa de la WAN Dado que los modelos de Gen AI utilizados para el procesamiento del lenguaje natural, la generación de imágenes y otras tareas complejas a menudo dependen de grandes conjuntos de datos que deben transmitirse entre ubicaciones distribuidas, incluidos los centros de datos y los dispositivos de borde, la optimización de la WAN es esencial para un despliegue sólido de las aplicaciones de GenAI a escala.
La optimización de la WAN puede potenciar significativamente la aceleración de la IA al mejorar la velocidad de transferencia de datos, reducir la latencia y optimizar el uso de los recursos de red, garantizando así tiempos de respuesta más rápidos. img

Figura 1: Optimización de la WAN que potencia la aceleración de la red GenAI

Reduzca la latencia: Las aplicaciones GenAI requieren un procesamiento de datos en tiempo real o casi real.
Reduzca el tiempo de transmisión de datos y disminuya la latencia mediante técnicas de optimización TCP y almacenamiento en caché.
Consiga acelerar las aplicaciones optimizando los protocolos para reducir la sobrecarga. Ejemplo: Un sistema de IA distribuida recopila datos de múltiples recursos, lo que garantiza una agregación y un procesamiento de datos más rápidos.Acelerar la transferencia de datos: Las transferencias de datos más rápidas son cruciales para las aplicaciones de IA que dependen de grandes conjuntos de datos, como los modelos de aprendizaje profundo, que deben mover grandes cantidades de datos entre el almacenamiento, las unidades de procesamiento y las herramientas de análisis.
La optimización de los protocolos permite que la transferencia de datos sea más eficiente.
Además, con la paralelización se maximiza el rendimiento dividiendo las transferencias de datos en flujos paralelos. Ejemplo: Entrenar modelos de IA utilizando datos de varias ubicaciones geográficas; la optimización de la WAN puede acelerar la transferencia de datos entre centros de datos, reduciendo el tiempo total de entrenamiento.Mejorar la eficiencia del ancho de banda: Las cargas de trabajo de IA consumen mucho ancho de banda debido al frecuente intercambio de grandes conjuntos de datos entre los componentes de la infraestructura de IA.
Con la compresión de datos, minimice el consumo de ancho de banda reduciendo el tamaño de los datos antes de su transmisión.
Habilite la deduplicación para eliminar las transferencias de datos redundantes mediante el envío de trozos de datos únicos. Ejemplo: La compresión y la deduplicación de datos pueden optimizar significativamente el tamaño de los datos que es necesario transferir durante la fase de entrenamiento de un modelo de IA (datos de entrenamiento del almacenamiento a los nodos de cálculo), acelerando así el proceso de entrenamiento.Aumentar la fiabilidad y la disponibilidad: Las aplicaciones de IA requieren a menudo un acceso a los datos constante y fiable.
Las interrupciones de la red o las pérdidas de paquetes pueden degradar el rendimiento de la IA o incluso provocar imprecisiones en los modelos.
Implemente la corrección de errores hacia delante para reducir el impacto de la pérdida de paquetes y garantizar la integridad de los datos.
Con la conmutación por error y el equilibrio de carga, distribuya el tráfico por varias rutas y proporcione capacidades de conmutación por error para mantener la conectividad durante los problemas de red. Ejemplo: Para los sistemas de negociación financiera impulsados por IA que dependen de la alimentación de datos en tiempo real, una mayor fiabilidad garantiza una entrada de datos continua y precisa, manteniendo la integridad de los algoritmos de negociación.Optimizar la utilización de los recursos: El uso eficiente de los recursos de la red puede reducir los costes operativos y mejorar el rendimiento general de los sistemas de IA al garantizar que los recursos informáticos no están parados mientras esperan los datos.
Con la conformación del tráfico y la calidad del servicio (QoS), priorizar el tráfico de datos críticos de la IA garantiza que las operaciones esenciales no se retrasen.
Implemente la supervisión y el análisis de la red para obtener información sobre el rendimiento de la red y los patrones de uso para optimizar la asignación de recursos. Ejemplo: En un servicio de IA basado en la nube en el que los recursos informáticos se aprovisionan bajo demanda, la optimización de la WAN garantiza que estos recursos se utilicen de forma eficaz, reduciendo los tiempos muertos y los costes operativos. La optimización de la WAN proporciona otros beneficios que podrían ayudar a acelerar las aplicaciones GenAI:

  • Mejora el rendimiento de las soluciones de computación de borde, que se utilizan cada vez más en la IA para procesar los datos más cerca de la fuente.
  • Mejora el acceso a los servicios de IA basados en la nube, garantizando una transferencia y un procesamiento eficaces de los datos entre los entornos locales y en la nube.
  • Permite un procesamiento remoto eficaz y el acceso a modelos y datos de IA centralizados, apoyando el desarrollo y la implantación de la IA distribuida.
  • Optimiza los recursos de red asignados dinámicamente para satisfacer las demandas cambiantes de las cargas de trabajo de la IA.
  • Admite la encriptación para proteger los datos durante el tránsito, algo fundamental para los intercambios seguros de datos de IA.
  • Reduce la carga de la infraestructura de red, prolongando su vida útil y reduciendo los costes de mantenimiento asociados a la ejecución de aplicaciones GenAI.

SASE unificado como servicio al rescate

El proceso de optimización de la WAN implica varios procedimientos críticos:

  • Una evaluación exhaustiva de la infraestructura de red existente y de las cargas de trabajo de la IA, para identificar los cuellos de botella y las áreas que requieren mejoras.
  • Aplicación de técnicas de compresión y deduplicación de datos, para reducir significativamente el volumen de datos transmitidos.
  • Integración de edge computing en la infraestructura WAN, para mejorar las capacidades de procesamiento de IA.

Al utilizar SASE unificado como servicio, las organizaciones pueden garantizar que las optimizaciones para las cargas de trabajo de IA se implementan de forma segura, combinando funciones de seguridad de red como pasarelas web seguras, cortafuegos y acceso a la red de confianza cero con capacidades WAN.
Unified SASE también permite el escalado dinámico, garantizando que las cargas de trabajo de IA puedan acceder a la potencia de procesamiento adecuada según sus necesidades.
La monitorización continua y la gestión adaptativa de la red mediante SASE unificado como servicio ayudan a mantener un rendimiento óptimo, abordar rápidamente cualquier problema emergente y ajustar la asignación de recursos en respuesta a las cambiantes demandas de cargas de trabajo de IA.
Este enfoque integral permite a las empresas maximizar el rendimiento de sus sistemas de IA al tiempo que mantienen una seguridad y un cumplimiento sólidos.

Conclusión

Con la optimización de la WAN, las organizaciones pueden ahorrar costes maximizando los recursos de red existentes y reduciendo la necesidad de costosas actualizaciones de la infraestructura.
En última instancia, esto favorece el crecimiento sostenible y el despliegue de tecnologías GenAI avanzadas.