本文介绍如何配置云盒计算资源,在满足业务需求的同时,有效降低成本,并提升硬件风险应对能力。
背景信息
云盒的硬件设计中,各类硬件设备的保障如下:
网络设备:采用双机冗余双上连设计,确保云盒内网络的高连续性,且不存在单点故障。
存储设备:可以确保在两台存储服务器同时宕机的情况下,数据的安全可靠。
计算设备:支持宕机迁移和热迁移能力,在有充足冗余资源的情况下,可以确保业务连续性。
本文主要介绍如何选择合适的计算SKU以满足业务需求,同时配置一定的冗余资源来确保业务连续性。
计算资源配置建议
云盒内的计算资源以标准的计算SKU的形式提供,SKU默认配置了不同实例规格族的组合。您可以根据业务需求,选择自身算力所对应的SKU。在选择计算SKU时,需要兼顾考虑成本和冗余算力配置。配置建议如下:
云盒支持的计算SKU请参见计算SKU规格说明。如果当前SKU无法满足您的业务需求,您也可以联系阿里云技术支持来为您定制SKU。
合适的SKU配置,可以有效降低成本
选择SKU时,需要根据业务需求的算力配置,来选择合适的算力配比。
例如:您的业务需要100台4 vCPU,8 GiB内存的ECS实例,共计需要400 vCPU,800 GiB内存的算力,由于所需ECS实例的vCPU和内存配比要求为1:2,此时可以选择最大实例规格为ecs.c6.26xlarge的SKU,该规格族的vCPU和内存配比为1:2,在满足需求的同时可以避免内存浪费。反之,如果选择最大实例规格为ecs.g6.26xlarge的SKU,由于该规格族的vCPU和内存配比1:4,则会出现内存浪费的情况。
根据业务需求选择SKU时,可能会需要多种不同配比的ECS实例,此时可以选择多种规格族混合的SKU,以减少资源浪费。
例如:您的业务分别需要100台4 vCPU,8 GiB内存的ECS实例和100台4 vCPU,16 GiB内存的ECS实例,则不能因为共计需要800 vCPU,2400 GiB内存的算力,而直接选择包含8个最大实例规格为ecs.g6.26xlarge(单个104 vCPU,384 GiB内存)的SKU。建议您根据两种规格的vCPU和内存配比,选择两种规格族混合的SKU,如同时包含最大实例规格为ecs.c6.26xlarge和ecs.g6.26xlarge的SKU。
冗余的算力配置,可以大幅提升硬件风险应对能力
云盒提供的IaaS层稳定性,依赖于云上提前预测硬件故障的算法能力,以及宕机迁移和热迁移能力。这些能力可以有效提升云盒IaaS层的故障和风险应对能力,但也需要一定的冗余资源,以便在硬件设备出现故障时及时迁移业务。
您可以参考以下两种方式来提高云盒IaaS层的冗余资源,以确保业务连续性。
根据业务需求选择SKU时,增加一定量的冗余资源。
由于这些冗余资源对于用户来说是可见资源,随时可以被用来创建ECS实例或其他云产品实例,因此该方式对于日常业务使用有一定的灵活性,但无法保证在硬件设备故障期间,一定存在可用的备机资源。
购买SLA增值服务包,为计算资源通过SLA保证。
SLA增值服务包会根据您当前的资源配置情况,自动选择合适的冗余资源。这些冗余资源对用户来说是不可见资源,可以在硬件故障期间立即启动,确保有可用的资源,以应对硬件故障风险,提升业务连续性。
云盒中的硬件设备出现故障时,业务会迁移到冗余资源上来确保业务连续性,同时阿里云会向您发送云盒维修事件通知,您需要授权同意阿里云上门更换并维修硬件设备。关于如何授权维修以及维修相关流程,请参见响应云盒维修事件和云盒故障服务器维修流程。