为CPU减负,智能网卡如何让数据中心性能起飞

Guanyi Wang

Jul 25, 2022 / 1 min read

从视频会议到医学研究,从加密货币挖矿到线上交易业务的普及,超快的数据传输和高效的数据处理成为了一系列现代化应用的支柱。这些应用都要依赖管理着数千台服务器和存储着高达PB级信息容量的超大规模数据中心。

以太网的速度已经达到每秒400/800Gbps,这在很大程度上是受到了超大规模数据中心的推动。但这么高的数据传输速度会让中央处理器(CPU)有点吃不消,智能网卡(SmartNIC)的出现。可以通过分流各种常规任务,将CPU释放出来专门负责核心应用的处理。

本文将针对以下几个问题与开发者们进行分享:

  • 智能网卡如何为未来的数字化世界提供支持
  • 新兴的数据中心基础设施发展趋势
  • 能够帮助开发者紧跟潮流的EDA和IP技术

什么是智能网卡?

随着网速从1G增加到10G,再到112G SerDes,以太网速度从25G增加到100G、200G、400G,再到现在的800G,超大规模数据中心的硬件架构在逐渐转变。

传统的数据中心架构中包含CPU、内存、存储和网络等组件,但CPU目前已经公认不再是运行基础设施功能的最佳位置了。如果要支持虚拟机监控程序、路由、负载平衡等功能,以及深度数据包检查、数据存储加密、解密等IO密集型安全功能,则需要大量的处理能力。

据估计,对于超大规模数据中心来说,大约有一半的CPU被用在了非创收型任务上。智能网卡可以承担大部分繁重的工作,将CPU解放出来,专注于创收的应用处理上。
智能网卡之所以智能是因为其可编程性和强大的硬件加速能力。智能网卡将有线网络和计算资源集中在一张卡上,具有自己的板载处理器、带有定制ASIC实现方案的加速器,或者FPGA和高速内存及IO。CPU无法以当今最高的线路速度支持数据包处理需求,因此以智能网卡的形式将负载转移到可编程硬件上是比较合适的做法。

未来的数据中心会是什么样子?

可能有开发者会问,智能网卡的正确组件组合究竟是什么?很负责任地说,真的没有一个放之四海而皆宜的办法。数据处理单元是智能网卡的核心,包含可编程计算、网络协议管理、安全和存储等组件。对于某些数据中心来说,可以仅配置几个处理器内核,它们主要用于虚拟机管理。而对于另外一些数据中心,运行一个完整的Linux操作系统实例就需要十几个处理器内核。展望未来,在网络流量持续增长的态势下,为了确保智能网卡始终能够提供良好服务,需要对数据中心基础设施发展过程中需要考量的因素进行考量:

  • 未来的智能网卡基础设施是分解式的,基于以下四种类型的die或者小芯片:CPU子系统、IO子系统、加速器ASIC或FPGA,以及可选的集成存储器,如高带宽内存(HBM)。分解式的die或者小芯片可以为实现功耗和面积目标提供支持,同时提供灵活性和产品模块化,来解决单个封装中的不同需求。
  • 在分解式die的方法中,组件之间的高速连接对于确保顺利快速的数据传输至关重要。高带宽、电源效率和低延迟是需要满足的关键标准。通用小芯片互连技术(UCIe)将成为解决之道。
  • 对于每台服务器中智能网卡的主要部署,硬件需要在一个开放标准的软件栈中无缝集成,并能运行一个开放的网络操作系统(NOS)。理想情况下,基础设施功能被部署为预构建的容器,其中API可以插入到软件堆栈的其它层中。

为满足不断增长的带宽需求,数据中心架构也在不断发展。考虑到智能网卡在数据流量平稳流动中的重要作用,其IP模块的可靠性、安全性和互操作性仍然是智能网卡的关键,在这方面,新思科技绝对是开发者们的最佳选择。新思科技在不同的工艺节点上都有最全面和最先进的IP组合,并拥有广泛的multi-die设计和验证解决方案。

  • die-to-die接口,包括112G XSR PHY和控制器
  • 用于网络应用的ARC处理器
  • 基础IP,包括具有标准和超低泄漏逻辑库的低延迟嵌入式内存
  • 内存接口,包括DDR和HBM PHY和控制器
  • 标准化安全IP,包括具有信任根的硬件安全模块、接口安全模块、加密和安全协议加速器
  • 加速器,如DSP
  • 缓存一致扩展,包括CCIX/CXL控制器、内联AES加密技术和PCI Express® PHY和控制器
  • 网络接口,包括以太网控制器和PHY,速度高达800G

在设计和验证方面,新思科技的技术能够加速multi-die设计的发展。新思科技的3DIC解决方案,包括架构规划、硅工程、3D系统开发、验证、测试、共封装光学技术、芯片的生命周期管理、签核、系统分析、IP。此外,新思科技的虚拟原型解决方案可以帮助开发者确定参数,比如处理器内核的正确组合和适合设计的加速器。我们还提供开发服务支持,协助SmartNIC设计以及IP的集成和验证。

为CPU减负

数字世界是围绕大量的复杂数据展开的。为了确保网络和云端的一系列交易快速无缝的正常运行,智能网卡可减轻CPU的负担,使其能够专注于核心应用处理。虽然NIC早在1980年代中期就出现了,但当今数字世界的智能化水平才真正让NIC成为超大规模数据中心不可或缺的组成部分。

Continue Reading