快速发现、识别和替换异常算力节点,保障大模型训练任务高稳定性。
PAI灵骏智算服务,上线AI助手,结合PAI-AIMaster、PAI-EasyCKPT 能力,快速识别GPU、硬件、驱动等算力节点故障,全自动化处理,实现算力节点用户无感自愈,保障算力资源高可用。