系统介绍
随着数字经济发展和数据量爆发式增长,众多研究和实际应用领域需要超级计算和智能计算相结合进行跨学科研究,异构算力调度系统可通过对包括CPU、GPU等多种算力的调度使得一定范围内算力需求和供给达到平衡,同时可高效利用计算资源。
功能方案
1)适配层:通过构建多种调度执行服务和能力接口,对接超算和智算的云管平台和计算节点,进行异构算力能力接入。
2)能力层:提供异构算力设施管理、混合调度、作业管理、异构算力观测等功能,实现异构资源的统一管理、智能调度、一体监控。
3)开发层:提供异构算力调度开放能力,包括作业中心、客户数据接口、算力查询能力、数据上传/下载能力、模型上传/下载能力、镜像部署能力等内容。
技术特点
1、云原生技术;
2、微服务:采用微服务架构设计,能够快速响应业务变化,确保系统的高可用性和可扩展性;
3、丰富的调度策略:支持负载均衡、资源限制、Gang调度、抢占调度、预留调度、回填调度等调度算法。
应用场景
针对政府、电信运营商、科研机构等各类有算力调度需求的企业,如为生物、新型材料行业的计算机模拟、数据分析、科学计算、AI训练和推理等计算场景提供多租户、多种作业任务管理、多资源池并网、多种异构算力统一管理和智能调度的完整解决方案。