可运维性咨询服务内容说明
1.服务概述
本服务工作说明书(以下或简称“SOW”)列明由阿里云计算有限公司(以下简称”阿里云”,或“乙方”)为XXXX(以下简称“甲方”)实施“可运维性咨询项目”(以下简称”本项目”)所提供的专业设计和咨询服务内容。
本服务工作说明书(以下简称“SOW”)列明阿里云提供的服务目录、服务范围、分工界面、双方职责等,以此来约束双方服务行为。
本服务工作说明书是《XXX应用可运维性咨询服务项目合同》的附件,本工作说明书的具体实施,应依从《XXXX应用可运维性咨询服务项目合同》的条款和条件。
2.服务范围
本项目乙方服务包括以下内容:
基于阿里云SRE最佳实践帮助乙方全面评估云平台和应用运维成熟度,量身定制面向云时代的稳敏双态运维体系,提升应用系统整体可运维性!
可运维性咨询包括高可用性、可观测性、可弹性、安全性、稳定性、自动化能力、容灾能力和安全生产咨询。
本项目乙方服务不包括以下内容:
未明确认定为“范围内”的应用系统可运维性咨询;
未明确认定为“范围内”的云平台可运维性咨询;
云平台和应用系统优化项的实施改造工作;
第三方软件的安装、测试、故障诊断、优化等日常运维服务。
3.前提条件
客户应提前至少15个自然日申请该服务,以便于阿里云评估甲方需求实现可能性,确认是否承接该服务申请。
甲方应在项目开始时提供必要的办公条件包括办公桌、办公椅、洗手间、市电及插板、网线等;甲方提供的办公环境应不存在对人体有害的污染气体;室外环境需要提供可应对恶劣天气的防护条件,并保障乙方人员的人身安全。
本项目所有工作记录和文档以中文为工作语言,根据甲方需求提供。提交的电子文档为Microsoft Word、Microsoft PowerPoint、Microsoft Excel或Microsoft Project格式。
在项目过程中,采用甲乙双方同意的通讯方式,包括:钉钉、互联网、FAX、电子邮件、纸介质等。
甲方应在阿里云承接服务后,提供必要的调研时间、系统访问通道、权限、授权、协助配合阿里云开展咨询调研服务。
甲方授权阿里云针对云上资源和应用进行监控、巡检、分析。
4.服务内容
4.1高可用性评估
高可用架构。乙方专家团队通过对甲方应用系统和云平台的调研,评估系统在接入层、服务层、缓存、数据库、中间件、存储等链路组件在架构层面是否具备完善的高可用能力,选择并设计基于阿里云产品的高可用架构整体解决方案。
高可用防护。乙方专家团队通过对甲方应用系统和云平台的调研,评估系统动态限流、异常隔离、依赖降级、热点防控、功能开关等高可用防护能力建设情况,选择并设计基于阿里云产品的高可用防护整体解决方案。
故障演练。乙方专家团队通过对甲方应用系统和云平台的调研,评估系统是否具备故障演练和逃逸能力,并基于阿里巴巴多年业务的真实线上故障库的积累,通过模拟调用延迟、服务不可用、机器资源满载等,真实检验应用的高可用能力,同时考察相关人员对问题的应急能力,以及问题上报、处理流程是否合理,达到以战养战,锻炼人定位与解决问题的能力。
4.2可观测性评估
乙方专家团队通过对甲方应用系统和云平台的调研,评估系统在监控方面的完善度,并基于云上最佳实践,帮助甲方设计包括资源监控、应用监控、容器监控、业务监控、前端监控、小程序监控、APP监控、服务调用链追踪的端到端精细化的立体监控和报警体系,提高监控覆盖率和准确性,提高故障提前发现率,最大限度降低业务不可用时长。
4.3安全性评估
乙方专家团队通过对甲方应用系统和云平台的调研,评估系统安全防护能力,并基于云上最佳实践,帮助甲方设计包括账号安全、主机安全、网络安全、数据安全、业务安全的全域立体安全防护体系,打造零信任网络。
4.4稳定性评估
乙方专家团队通过对甲方应用系统和云平台的调研,评估系统稳定性现状,并基于阿里云SRE丰富的风险库和最佳实践,提前识别修复在架构和资源层面存在的不稳定因素,提高系统健壮性!
4.5可弹性评估
乙方专家团队通过对甲方应用系统和云平台的调研,评估系统弹性伸缩能力,并基于云上最佳实践,帮助甲方设计包括资源自动化弹性扩缩容、应用自动化弹性伸缩、数据库自动化弹性伸缩、容器自动化伸缩方案,让系统整体能够自动根据业务负载变化动态扩缩容资源,实现业务负载和资源成本的完美平衡!
4.6自动化评估
乙方专家团队通过对甲方应用系统和云平台的调研,评估系统自动化运维效率,并基于云上最佳实践,帮助甲方设计包括持续集成、持续部署、批量配置管理、周期定时运维管理、IT基础架构自动化编排方案,实现基础设施即代码(IaC),安全高效地配置和管理云基础架构和资源,提高运维效率,降低运维成本和风险。
4.7容灾能力评估
乙方专家团队通过对甲方应用系统和云平台的调研,评估系统容灾能力,并基于云上最佳实践,帮助甲方设计规划应用级同城/异地多活容灾架构,打造机房或地域级别的故障逃逸能力、流量调度能力,从宏观架构的高可用层面来保证系统的整体可用性
4.8安全生产评估
乙方专家团队通过对甲方运维制度、流程、规范、工具平台的调研,评估甲方安全生产能力,并基于阿里巴巴安全生产体系和文化,帮助甲方设计成熟的组织文化机制、业务连续性管理、异常事件处理、故障生命周期管理、客户客情/舆情管理、变更管理、活动保障、稳定性指标度量机制等8大安全生产体系,系统性提升业务连续性。
5.服务流程
流程说明:
流程 | 流程说明 | 完工标准 |
项目启动 | 确定项目目标和范围 明确咨询开展计划 召开项目启动会 | 双方确认《可运维性咨询启动报告》 |
调研报告 | 采用调查表、访谈、工具等方式获取目标应用系统的平台、配置、架构及关联等信息 | 双方确认《可运维性咨询调研报告》信息符合现状 |
评估报告 | 基于阿里云最佳实践和运维体系评估应用系统可运维性水平 | 乙方提交《可运维性咨询评估报告》并汇报,双方确认报告内容 |
改造方案 | 双方就可运维性的改造项、改造方案、改造优先级、改造步骤达成一致 | 乙方提交《可运维性咨询改造方案》并汇报,双方确认报告内容 |
项目验收 | 准备验收报告 | 乙方提交《项目验收报告》,甲方应在5个工作日内签署项目验收报告 |
6.项目里程碑
本项目主要里程碑有五个:
项目启动会议。阿里云提交《可运维性咨询启动报告》,客户负责召开项目启动会议,双方就项目咨询内容、评估方法和项目计划达成一致;
调研报告汇报。阿里云提交《可运维性咨询调研报告》,双方就调研报告内容达成一致,确认调研的应用系统设计、架构、运维方式等信息符合现状;
评估报告汇报。阿里云提交《可运维性咨询评估报告》,双方就咨询报告评估的运维能力成熟度、评估准确性、评估完整性达成一致。
改造方案汇报:阿里云提交《可运维性咨询改造方案》,双方就可运维性的改造项、改造方案、改造优先级、改造步骤达成一致;
项目验收:阿里云提交《项目验收报告》后,客户应在5个工作日内确认项目验收报告内容、签署验收意见。
【注】项目开始时间以《XXX应用可运维性咨询项目合同》签署时间为准。
工作内容 | 交付时间 |
项目启动会议 | T+3 |
可运维性调研报告 | T+10 |
可运维性评估汇报 | T+24 |
可运维性改造方案 | T+28 |
项目验收 | T+30 |
7.客户责任
客户须指派一位项目负责人协助阿里云顺利执行咨询服务。此负责人应负责双方之协调及管理(如阿里云需要进行业务系统的调研,客户的项目负责人应协调相关人员参与),负责审核、验收阿里云服务。
客户应在项目执行过程中按计划安排相关的业务人员参与项目的调研、会议、评审等工作,并向项目组提供符合业务的现状信息和预期目标。
客户应在项目执行过程中按计划安排相关的需求、设计、开发、运维、管控等技术人员,并向项目组提供准确恰当的技术现状信息和预期目标;
客户应在项目执行过程中按计划安排相关的主管/决策者参与主要会议和里程碑,及时了解项目的进展情况,并推动各类问题及时有效的解决。
客户应在项目执行过程中按计划协调其他各类资源的参与,并向项目组提供准确恰当的现状信息和预期目标。客户须指派一位负责人协助阿里云顺利执行运维服务。此负责人应负责双方对口协调工作,负责阿里云运维服务工作的审核与验收。
8.验收标准
工作验收标准满足以下条件即可启动项目验收:
阿里云向客户提交以下项目报告:
序号 | 文档名称 | |
1 | 验收 交付物 | 《XXX应用可运维性咨询启动报告》 |
2 | 《XXX应用可运维性咨询调研报告》 | |
3 | 《XXX应用可运维性咨询评估报告》 | |
4 | 《XXX应用可运维性咨询改造方案》 |
上述项目报告提交后,客户应在5个工作日内确认方案,如无异议,双方签署《项目验收报告》;
签署《项目验收报告》,视为项目验收完成。
9.完成标志
验收通过,签署《项目验收报告》,可运维性咨询工作结束。