本文最初发布于HELP NET SECURITY 由于用于自然语言处理、图像生成和其他复杂任务的GenAI 模型通常依赖于必须在分布式地点(包括数据中心和边缘设备)之间传输的大型数据集,因此广域网优化对于大规模稳健部署 GenAI 应用程序至关重要。
广域网优化可以提高数据传输速度、减少延迟并优化网络资源的使用,从而确保更快的响应时间,从而大大提高人工智能的加速度。
图 1:广域网优化为 GenAI 网络加速提供动力
减少延迟: GenAI 应用程序需要实时或接近实时的数据处理。
利用 TCP 优化和缓存技术缩短数据传输时间并降低延迟。
通过优化协议减少开销,实现应用加速。举例说明:分布式人工智能系统从多个资源收集数据,确保更快地汇总和处理数据:对于依赖大型数据集的人工智能应用(如深度学习模型)来说,更快的数据传输至关重要,因为这些应用必须在存储、处理单元和分析工具之间移动大量数据。
协议优化可以提高数据传输效率。
此外,并行化还能将数据传输分成并行流,从而最大限度地提高吞吐量。举例说明:使用来自不同地理位置的数据来训练人工智能模型;广域网优化可以加速数据中心之间的数据传输,缩短整体训练时间:由于人工智能基础设施各组件之间频繁交换大型数据集,因此人工智能工作负载是带宽密集型的。
通过数据压缩,可在传输前缩小数据大小,从而最大限度地减少带宽消耗。
启用重复数据删除功能,通过发送唯一的数据块来消除冗余数据传输。举例说明:数据压缩和重复数据删除可显著优化人工智能模型训练阶段(训练数据从存储到计算节点)所需传输的数据大小,从而加快训练过程:人工智能应用通常需要稳定可靠的数据访问。
网络中断或数据包丢失会降低人工智能性能,甚至导致模型不准确。
实施前向纠错可降低数据包丢失的影响并确保数据完整性。
通过故障切换和负载平衡,在多条路径上分配流量,并提供故障切换功能,以便在网络出现问题时保持连接。举例说明:对于依赖实时数据馈送的人工智能驱动型金融交易系统而言,增强的可靠性可确保持续、准确的数据输入,从而维护交易算法的完整性:通过确保计算资源在等待数据时不会闲置,有效利用网络资源可以降低运营成本,提高人工智能系统的整体性能。
通过流量整形和服务质量 (QoS),对关键的人工智能数据流量进行优先排序,确保基本操作不会延迟。
实施网络监控和分析,深入了解网络性能和使用模式,优化资源分配。 举例说明:在基于云的人工智能服务中,计算资源是按需调配的,优化广域网可确保这些资源得到有效利用,减少闲置时间和运营成本。 广域网优化还具有其他一些优势,有助于加速 GenAI 应用:
- 它增强了边缘计算解决方案的性能,这些解决方案越来越多地用于人工智能领域,以处理更接近源头的数据。
- 它改善了对基于云的人工智能服务的访问,确保了内部部署和云环境之间高效的数据传输和处理。
- 它可实现高效的远程处理并访问集中式人工智能模型和数据,支持分布式人工智能开发和部署。
- 它简化了动态分配的网络资源,以满足人工智能工作负载不断变化的需求。
- 它支持加密,以保护传输过程中的数据,这对安全的人工智能数据交换至关重要。
- 它减轻了网络基础设施的负荷,延长了其使用寿命,降低了与运行 GenAI 应用程序相关的维护成本。
统一的 SASE 作为一种服务提供救援
广域网优化过程涉及几个关键程序:
- 全面评估现有网络基础设施和人工智能工作负载,找出瓶颈和需要改进的地方。
- 采用数据压缩和重复数据删除技术,大幅减少传输的数据量。
- 将边缘计算集成到广域网基础设施中,以增强人工智能处理能力。
通过将统一SASE作为一项服务使用,企业可以确保安全地实施人工智能工作负载优化,将安全 Web 网关、防火墙和零信任网络访问等网络安全功能与广域网功能相结合。
统一 SASE 还能实现动态扩展,确保人工智能工作负载能根据需要访问足够的处理能力。
使用统一 SASE 作为服务对网络进行持续监控和自适应管理,有助于保持最佳性能,快速解决任何新出现的问题,并根据不断变化的人工智能工作负载需求调整资源分配。
这种全面的方法使企业能够最大限度地提高人工智能系统的性能,同时保持强大的安全性和合规性。
结论
通过广域网优化,企业可以最大限度地利用现有网络资源,减少对昂贵的基础设施升级的需求,从而实现成本节约。
这最终将支持先进 GenAI 技术的可持续增长和部署。