2022-11-08
随着高性能算力的增长,对芯片、服务器、集群规模的性能需求持续增加,对算力密度、算力弹性和算力易用性也提出了更高的诉求。
2022云栖大会—中国云计算基础设施行业峰会以“从芯到系统的服务器算力创新”为主题,通过从产业与高校技术创新、芯片产业技术创新、阿里服务器技术创新等多个维度,整体呈现了芯片定制、chiplet优化、服务器架构创新、再到算力原生平台建设的这样一条技术探索路径。
登临科技联合创始人兼首席架构师王平受邀出席本次峰会,与来自阿里云、英伟达、英特尔、浙江大学、瀚博半导体等多个领域专家分享了对算力原生的看法以及对未来数据中心算力提升发展趋势的展望。
*2022云栖大会—中国云计算基础设施行业峰会
01
通用性与易用性
是算力原生的关键标准
算力原生旨在构建多样化算力生态,其标准的建立和生态良序发展,一方面有利于客户快速的使能新的AI硬件,享受更好的算力;另一方面可以帮助芯片新创公司产品更快产品商业化,促进AI各行业应用落地、发展,助力更多企业数字化转型。
王平表示:“由此可以看出算力原生,其标准的关键问题是让用户易用,让用户好用。作为AI算力硬件提供商,登临致力于打造创新的通用GPU产品,并通过自主研发创新架构来提升产品的易用性,和高能效,让用户可以在极短的时间内使能登临GPU产品,高效地处理AI计算,降低其整体产品迁移成本更快实现产品商业化,让计算更简单和普惠。
02
软硬协同
算力归一
在算力原生的算力归一上,王平看来:AI硬件如何使用不同制程架构、不同指令集、不同功能的硬件芯片,实际上就是算力统一的问题,即无论是 CPU,GPU还是DSA等不同种类的加速器都需要统一的标准下运行。这需要一个统一的、通用的、易用的隔离层,使用户可真正聚焦在算法的开发,而不用关心复杂的硬件适配和调优,让算法真正做到隔离硬件发挥最大价值。
对于此阿里云震旦平台提供的完善的静态编译和优化、模型压缩等优化功能,可充分发挥底层硬件算力和降低算法用户在硬件上的调优投入。此外,AI硬件本身的软件工具链也需要具备通用性与易用性,目前,登临自主打造了瀚铭(Hamming)软件工具链,该工具链支持国内外主流AI框架、操作系统、CPU、容器与虚拟机、及推理服务器,可帮助客户尽快把算法部署到实际业务上,并帮助云端与数据中心的客户更好地利用硬件资源。
“只要框架和我们的软件栈、工具链接起来,就可以发挥登临创新通用GPU—GPU+的片内异构的加速功能。”王平表示到。
03
共推算力原生
共建繁荣生态