本文中含有需要您注意的重要提示信息,忽略该信息可能对您的业务造成影响,请务必仔细阅读。
模型训练完成后,可以通过EAS(Elastic Algorithm Service)快速部署为在线推理服务或AI-Web应用。EAS支持异构资源,结合自动扩缩容、一键压测、灰度发布、实时监控等能力,以更低成本保障高并发场景下的服务稳定性与业务连续性。
EAS产品功能

计费说明
当您使用EAS部署服务,可能会涉及计算资源、系统盘和专属网关的使用和计费:
计算资源:包括公共资源、专属资源、灵骏智算资源。
系统盘(可选):提供免费额度(公共资源30G,专属资源200G),使用额外系统盘需单独计费。
专属网关(可选):部署默认使用共享网关(免费),如果您有安全隔离、访问控制、自定义域名等需求,可以付费购买专属网关,使用专属网关需手动设置。
关于计费模式,EAS提供以下2种计费模式。
按量付费:根据服务运行时长进行计费(非服务调用量)。适合不确定的、需求波动大的场景。
包年包月:先付费再使用,可以享受更优惠的价格。适合长期稳定的业务。
对于SDWebUI和ComfyUI,EAS提供了Serverless版本,服务部署完全免费,仅在服务调用时根据实际推理时长计费。
如果使用了弹性公网、 OSS、NAS 等其他阿里云服务,将产生归属于其他云服务的费用。
如果您想要体验EAS,可以考虑通过新用户免费试用或节省计划降低使用成本,详情请参见优惠使用。
更多请参见模型在线服务(EAS)计费说明。
使用流程
步骤1:准备工作
步骤2:部署服务
步骤3:调用与压测服务
步骤4:监控服务与服务扩缩容
步骤5:异步推理服务
对于文生图、视频处理等耗时较长的请求,建议启用异步推理。通过队列服务接收请求,处理完成后将结果写入输出队列,客户端异步查询结果,避免请求堆积丢失,提高了系统吞吐量。EAS支持根据队列积压程度自动扩缩容,智能调控实例数量。更多介绍请参见异步推理服务。
步骤6:服务更新
在推理服务列表中,单击目标服务操作列下的更新,可以更新服务版本。
服务更新过程中将暂时中断运行,可能导致依赖此服务的请求失败,请务必谨慎操作。
服务更新完成后,单击当前版本,查看版本信息或切换服务版本。
快速开始
场景案例
常见问题
Q:专属资源 vs 公共资源?
公共资源:适合对成本敏感、性能波动容忍度较高的开发测试或小规模业务。成本较低,但高峰期可能存在资源争用。
专属资源:适合对服务稳定性和性能有高要求的生产环境核心业务。物理隔离无抢占风险,弹性资源池特性允许在专属资源用满后,自动溢出到公共资源,兼顾成本与高峰期的业务稳定性。对于库存紧张的机型,需要通过专属资源锁定购买。
Q:EAS相比自建服务有什么优势?
EAS提供托管运维:自动处理资源调度、故障恢复和监控,提供标准化的弹性伸缩、灰度发布功能。开发者可专注模型开发,省去运维成本,加速上线。
Q:服务报错怎么办?
请参考EAS常见问题获取解决方案。
相关文档
EAS相关API,详情请参见API概览。