智能体时代CPU重回“C位”,性能需求有什么不同?

来源:爱集微 #英特尔# #CPU# #智能体#
530

当AI步入Agentic AI时代,数据中心对算力的诉求正加速回归CPU。日前英特尔举办“至强6+新品发布会暨数据中心创新日”,不仅推出至强 6+ 能效核处理器、E835以太网控制器等新品,以及QAT数据压缩引擎与IAA内存分析加速等存储技术,更围绕算力、存力、连接力、保障力四个维度,展示了英特尔至强6/6+处理器对智能体时代精准适配的优秀表现,将助力Agentic AI转化为触手可及的现实生产力。

英特尔展示“四力”性能优势

在算力层面,新发布的至强6+ 能效核处理器,搭载最高288颗能效核,拥有业界顶尖的核心密度,单颗处理器可稳定支撑超1000个智能体同步运行,单核可拆分调度3-4个智能体任务,完美适配智能体海量、高并发、轻量化的作业特征。同时,芯片内置AMX高级矩阵扩展技术,可高效完成AI数据预处理、向量数据库加速、KV Cache卸载等核心工作,弥补传统CPU AI算力短板,兼顾通用计算与智能体专属计算需求。

在存力层面,针对智能体长上下文、KV Cache海量存储的行业痛点,至强6/6+搭载了QAT数据压缩引擎与IAA内存分析加速两大核心技术。QAT引擎可实现KV Cache数据50%以上的压缩率,大幅节省高端SSD存储空间,解决显存、内存资源紧缺难题;IAA技术可对内存数据实时硬件压缩解压,显著降低内存占用,提升智能体沙箱启动速度与并发能力,有效降低整体TCO。

在连接力层面,英特尔配套推出E835以太网控制器,支持10GbE至200GbE多速率灵活端口配置,适配从边缘终端到超大规模数据中心的全场景部署。该方案可降低集群尾部延迟40%,依托标准以太网架构实现接近专用网络的低延时性能,摆脱厂商生态绑定,同时优化NVMe存储链路,延伸KV Cache存储边界,大幅提升数据传输与调度效率,适配智能体高频次、多维度的数据交互需求。

在保障力层面,至强6/6+构建了全维度企业级可靠与安全体系。芯片搭载6大类52项RAS可靠性技术,助力智算中心实现99.999%超高可用性,降低大规模智能体集群的宕机风险。同时,全新支持SM3/4国密算法,搭配TDX机密计算技术,打造硬件级可信执行环境,实现AI模型、用户数据全生命周期隔离保护,独创的TDX Connect可打通CPU与GPU安全加密通道,满足政企AI应用的合规安全需求。

本次活动上,英特尔还携手腾讯云、金山云、阿里云、云尖信息等生态伙伴共同展示。凭借四大核心能力的升级,至强6/6+已获得众多云厂商与基础设施服务用户的认可。

CPU需求“提升”趋势可见

随着Agentic AI的快速发展,智能体自主规划、工具调用、任务编排、持续迭代均需要CPU完成,CPU的核心调度能力正在凸显。在传统大模型训练与被动推理时代,AI算力高度依赖GPU,数据中心CPU与GPU算力配比在1:8、1:4之间。而当前这一比例正在改变,有市场数据显示,CPU与GPU比例已提升至1:2,且预判未来将趋近1:1。这一市场需求变化也引发行业的广泛关注。

对此,英特尔数据中心集团副总裁兼中国区总经理陈葆立在接受媒体访谈时表示,目前市场上的各种数据很多,但整体趋势是可见的,CPU的需求在大幅提升。这一点大多数人都能感受到,养了多少智能体、多少龙虾,每个工具与应用都会用到CPU,所以对CPU的需求趋势一定是增长的。至于算力配比未来是不是增长到1:1,现在AI的发展还处于早期阶段,还很难下定论,但从近几年观察到的现实情况来看,最基本的逻辑是当你要给AI更多任务的时候,绝大多数任务的执行者都是CPU。

腾讯云计算产品运营总监周驰认为,不应把算力配比看作是数据中心内部,或者是单台服务器内部的比例,而应该从全球业务的使用量来观察。此前AI应用多聚焦专业开发者场景,以高精尖的模型训练、重度推理任务为主,高度依赖GPU算力。而如今智能体实现全面破圈,覆盖企业办公、民生服务、行业调研、数据查询等海量轻量化、高并发、自动化场景,使用者从专业开发者延伸至全行业人群。这类海量琐碎的自动化作业,更依赖CPU的高效调度、高并发执行与持续运行能力。

智能体时代CPU性能差异凸显

Agentic AI的爆发,不仅会改变算力市场格局,对于CPU性能需求也在发生变化。云尖信息副总裁张欢军从用户角度分析指出,传统上CPU更侧重单核极致性能、固定算力的输出。智能体时代CPU核心诉求聚焦在高密度、高并发、强调度、高弹性四大维度。传统数据中心CPU主要服务于固定业务流程,任务场景单一、运行逻辑稳定。而智能体需要持续完成感知、规划、执行、迭代的闭环作业,海量智能体同时运行、频繁调用工具与数据库,对CPU的多任务调度能力、资源切分能力、长时间稳定运行能力提出极高要求。至强6+的288核超高密度设计,正是适配这一需求,可在有限硬件空间内承载最大化的智能体部署规模,大幅提升资源利用率。

陈葆立表示:“智能体时代,随着应用场景的变化,需求是非常多样化的。而且随着技术的演进,未来还会有更多不同的场景出现。”这也将倒逼CPU架构走向“大小核协同”的差异化布局。在智能体运行层面,海量轻量化的数字员工、自动化办公任务,适配至强6+能效核的高核数、高能效优势,以低成本、高并发完成基础任务调度;在任务执行层面,智能体调用数据库、SAP系统、复杂数据运算等重度负载,则依赖性能核的超强单核算力支撑。大小核协同的弹性架构,可覆盖智能体“轻量调度+重度执行”的全场景需求,这也是单一架构芯片无法实现的核心优势。

周驰认为,随着市场应用的不断发展,未来面向Agentic AI的CPU与传统CPU的差异化特征将持续凸显。传统CPU主要适配固定、标准化的企业IT业务;而智能体CPU将朝着极致弹性、全能力开放、软硬深度协同的方向迭代。随着AI代码生成、自动化运维等技术成熟,CPU的各类细分功能模块将被全面激活,彻底释放硬件底层潜力,实现算力资源的精细化拆分、弹性调度。

责编: 张轶群
来源:爱集微 #英特尔# #CPU# #智能体#
THE END

*此内容为集微网原创,著作权归集微网所有,爱集微,爱原创

关闭
加载

PDF 加载中...