日前,在元脑服务器第八代新品发布会上,中国信息通信研究院两化所主任王骏成表示,随着人工智能时代的到来,全球智能计算产业实现了快速的增长,围绕计算、存储、互联、软件等领域的系统化创新是算力产业升级的主要路径。要实现智算产业的提质升级,需要加强产业链体系化升级,加快算力产业生态建设,同时推进算力绿色化发展。
AI驱动计算产业规模稳步增长
算力作为数字经济时代新的生产力,对推动科技进步、行业数字化转型以及经济社会发展发挥着重要作用同时,也推动了算力规模的快速增长。据信通院测算,2023年全球计算设备算力规模为1397EFlops,我国计算设备算力规模达到435EFlops,全球占比三分之一,增速近50%。
算力规模保持高增长的原因,主要来自人工智能时代对智能算力需求的激增。从2003到2023年的二十年间,模型的算力需求增长百亿倍,远超摩尔定律。以 GPT 为代表的大模型突破性进展,激发了全球智能算力规模化发展的热潮,在Scaling Law的作用下,千卡集群成为千亿参数大模型训练标配。
得益于算力规模的高增长,全球计算产业同样保持稳步增长势头。我们可以看到,计算产业可以分为经典计算与非经典计算两种类型。其中,经典计算主要包括通用计算和智能计算,以AI服务器、AI芯片为代表的智能计算产业驱动计算产业规模稳步增长;非经典计算包括类脑、光计算、存算一体等前沿领域,目前仍处在早期发展的阶段,产业规模较小。
计算产业的发展既有技术革命带来的驱动力,同样离不开政策的保驾护航。近几年中国陆续出台了相关政策鼓励人工智能、算力基础设施及相关产业发展与创新,从顶层规划、设施建设、产业发展到管理规范等方方面面进行深远布局,引导包括人工智能在内的整个计算产业的高质量发展。
以系统化创新应对算力供给挑战
据信通院测算,在深度学习时代,全球智能算力占比不到10%;而在大模型时代,目前全球智能算力占比超过60%;随着通用人工智能时代的到来,全球智能算力占比将超过90%。
算力范式的变革驱动计算产业加快升级。算力系统不仅仅是芯片,而是围绕计算、存储、互联、软件等领域的系统化创新和体系化的升级。以大模型和大数据为代表的智能计算需求,驱动了计算、互联网络、内存技术、开发框架和软件栈的加速突破创新,带来全球算力结构的革命性变化。
在算力方面,微架构创新成为AI处理器的主要算力提升路线,随着制程升级对处理器性能提升的边际收益缩窄,先进封装技术逐渐成为推动算力芯片演进的关键途径,像Chiplet方案这样能降低芯片设计复杂度、大幅提高生产良率、降低制造成本的技术得到广泛应用。
未来,所有的计算设备都需具备AI的能力,而以CPU驱动的通用服务器将在AI应用中承担更加多元的计算角色,与GPU、FPGA、ASIC等加速器协同,形成异构计算系统,以更高效地处理AI任务,为云边端设备、行业智能化场景提供更有效率的智算服务。
在存储方面,高带宽存储HBM(High Bandwidth Memory)技术通过垂直堆叠DRAM芯片的方式,大大缩短了内存和处理器之间的通信距离,从而大幅提升数据传输带宽,相对传统内存具备可扩展大容量、低功耗、小体积等优势,能更好地满足聊天机器人、自动驾驶、智能语音识别、医疗影像分析等场景的AI大模型训练需求。
在网络方面,高速互联是大规模算力集群构建的基础,虽然节点内互联由于硬件解耦难度高、软件框架和通讯库难统一等挑战导致统一难度较大,但跨节点互联有望通过兼容以太网底层互联技术,建立统一标准体系。
在软件方面,软件栈作为底层芯片与系统集群间的关键桥梁,将推动软硬件进一步的精细化协同,大幅提升芯片计算效能和分布式计算效率。软件栈主要包括分布式计算框架、加速库、AI编译器的工具包,通过软件栈优化可降低芯片使用难度,提升人工智能在行业场景的应用性能。目前国内外厂商纷纷加强面向大模型的软件栈能力建设,通过软硬件深度协同构筑大模型计算生态护城河。
按当前大模型发展预期估计,智能算力供给缺口将长期存在,需要持续加强全链条系统化创新。目前,全球都面临从芯片、服务器、框架模型、到AI应用的适配挑战,这就需要我们解决多元算力兼容适配,生态碎片化的问题。针对多芯混合,算力系统要充分考虑多元芯片卡间、机器间、集群的互联互通,如何实现算力效能的最大化。还有超大规模算力集群的使用效率、稳定性等问题,也是算力系统效率提升要关注的重要创新方向。
加强开源开放,加速算力产业体系化、生态化、绿色化建设
智能时代,开源模型和开放计算激发了算力产业的创新活力。对于推动智能算力的体系化创新,我们需要加强开源开放,加速算力产业体系化、生态化、绿色化建设。
其一是加强产业链体系化升级,即从底层芯片、软件生态、整机应用、产业配套等方面加强全面布局,充分发挥超大规模市场优势,加强产业链上下游协同,以应用牵引强化技术产业生态构建,只有通过系统创新、全局优化拓展创新路径,以协同共生、开放共赢的生态加速创新落地,才能实现AI创新与AI应用协同发展。
其二,要加快算力产业生态建设,面向产品选型、模型适配、应用推广、生态聚集等需求,推动评估评测、适配验证、供需对接、资源聚合等主要工作,促进智能算力技术产业发展与生态建设,与行业共同促进智能算力技术产业发展与生态建设。
其三,坚持绿色低碳发展,全面提升算力设施能源利用效率和算力碳效水平。算力服务提供商不仅要关注算力单纯的能源消耗、算力输出水平,还要通过绿色采购、绿色设计、清洁生产、绿色包装和运输、绿色运营、回收处理等降低整个算力系统的碳排放。如在绿色设计环节采用高效的服务器和存储设备、先进的制冷和散热技术,强化从采购到回收整个过程的全生命周期碳足迹管理。(战钊)
(责任编辑:何欣)