(资料图片)

智通财经APP获悉,继上月发布“虚拟显存”技术引发行业对GPU资源灵活分配的关注后,范式智能近日再次发布GPU动态调度新进展——基于Kubernetes动态资源分配(DRA)的GPU动态调度能力,实现对GPU算力与显存的一体化精细调度。该技术不仅是对用户关于“算力能否像显存一样动态切分”疑问的深入回应,更标志着GPU资源管理从容量扩展迈向多维资源协同调度的新阶段。

随着Kubernetes v1.34的正式发布,其核心特性——动态资源分配(DRA)已稳定启用,标志着云原生资源调度进入更智能、更灵活的时代。

在这一背景下,范式智能基于长期在AI基础设施领域的积累,率先完成了HAMi-Core与DRA的深度适配,并推出GPU动态资源驱动(DRA Driver),让GPU像CPU一样被灵活共享与调度,推动云原生算力管理体系不断完善与升级,为人工智能算力管理带来新的可能。

让GPU更灵活 让算力更高效

在AI任务中,GPU是模型训练和推理的“引擎”,但长期以来,传统使用方式常导致GPU资源浪费:要么“使用不满”,要么“独占浪费”。

HAMi-Core结合DRA能力,实现了GPU的动态切分与多任务并行。简单来说,不同的任务可以同时使用同一块GPU,各自占用合适的算力与显存,就像多个应用共享CPU一样高效。

这带来了两大改变:

开源共建 释放更大的创新力

目前范式智能已将该演示项目开源至GitHub(Project-HAMi/k8s-dra-driver),并将与HAMi社区持续推进相关特性和生态建设,欢迎更多开发者和企业参与共建,共同推动 GPU 调度技术走向更智能、更开放的未来。

推荐内容