使用ASM构建分布式系统容错能力

因此构建一个具有容错能力的分布式系统非常重要。本文介绍如何通过ASM设置超时、重试、隔板和熔断机制构建分布式系统容错能力。背景信息 容错能力是指系统在部分故障期间,仍然能够继续运行的能力。创建一个可靠的弹性系统会对其中的所有...

使用ASM构建分布式系统容错能力

因此构建一个具有容错能力的分布式系统非常重要。本文介绍如何通过ASM设置超时、重试、隔板和熔断机制构建分布式系统容错能力。背景信息 容错能力是指系统在部分故障期间,仍然能够继续运行的能力。创建一个可靠的弹性系统会对其中的所有...

概述

但随着服务拆分,更多组件的引入,分布式系统的复杂度升高,异常风险也随之增加,为了解决局部异常不对整个系统造成影响,所以需要做系统容错容错是指系统能够在部分组件出现故障或错误的情况下,依然能够继续正常运行,并提供正确的输出...

自动快照概述

应用场景 自动快照策略可以在预设的时间点周期性地创建快照,保护文件系统数据,是系统安全性和容错率的重要保障。当您的数据库出现异常时,您可能来不及手动创建快照。这时您可以通过最近的自动快照来恢复数据库文件系统,降低损失。您也...

设计方案

在软件系统架构演进中不变的是系统的基本属性,包含存储、计算和网络,变的是存储、计算和网络的实现方式和规模,往大规模、高性能、高可靠、易扩展等方向迭代演进,所以对架构稳定性提出了更高的要求。系统可预见的稳定性风险包含软硬件...

内存诊断

诊断结果以图表的方式展示系统内存整体使用情况,将容器内的缓存和共享内存归属到具体的文件夹下,清晰展示系统内存使用情况,便于运维。本文介绍内存诊断的具体内容。内存诊断包括内存总览、内存分析和OOM分析,用于浏览节点及Pod内存使用...

操作系统迁移及升级

当操作系统因生命周期、第三方支持、开源计划演进等原因停止技术支持后,如果您的操作系统后续想得到维护和技术支持,需要将操作系统迁移或升级至稳定的软件版本。本文介绍如何通过ECS控制台迁移或升级操作系统。前提条件 确保阿里云账号...

操作系统迁移及升级

当操作系统因生命周期、第三方支持、开源计划演进等原因停止技术支持后,如果您的操作系统后续想得到维护和技术支持,需要将操作系统迁移或升级至稳定的软件版本。本文介绍如何通过ECS控制台迁移或升级操作系统。前提条件 确保阿里云账号...

JindoData概述

JindoData是阿里云开源大数据团队自研的数据湖存储加速套件,面向大数据和AI生态,为阿里云和业界主要数据湖存储系统提供全方位访问加速解决方案。JindoData套件基于统一架构和内核实现,主要包括JindoFS存储系统(原JindoFS Block模式)、...

实例启动/停止异常常见问题

正常关机:ECS正常关机中,但因为操作系统在做系统补丁修复,或者系统配置不高导致操作系统启动反应慢,所以关机时间比较长。异常关机:ECS关机有异常,比如关机时系统报错,并没有真正进入关机流程。解决方案 通过查看实例的屏幕截图,...

简介

使用 系统运维管理 SDK之前,您需要:了解并开通阿里云 系统运维管理,详情请参见 什么是系统运维管理。创建AccessKey。系统运维管理 支持以下主流语言的SDK包。语言 参考文档 Python 简介 Java 简介 Go 简介 C#简介 相关链接 阿里云开发者...

Windows系统挂载SMB协议文件系统

当您想在Windows系统中共享文件时,可以在服务器挂载支持SMB协议的NAS文件系统。本文介绍如何在阿里云Windows ECS实例中挂载SMB协议文件系统。前提条件 在创建NAS SMB协议文件系统的地域,已有可用的云服务器ECS(Windows)。具体操作,请...

性能测试技术指南

这些规范可以帮助PTS的用户更好地从技术上来规避系统上线后的风险、评估线上系统的真实能力、根据业务模型摸底线上能力以提前应对。适用范围 适用于所有需要性能测试的项目。对性能测试实施过程中非常重要、关键的相关技术进行分析,主要...

如何解决实例迁移后的宕机问题?

因Xen环境裁撤项目、ECS过保迁移、经典网络迁移到VPC等涉及虚拟化环境迁移需求,可能会导致一部分实例系统在迁移后出现kernel panic宕机、蓝屏、找不到引导设备(INACCESSIBLE_BOOT_DEVICE)等问题。本文主要为您介绍这些问题的解决方案。...

创建事件运维任务

事件名称 系统事件的名称,可多选,取值参见 云产品事件。地域 否 事件关联资源所在的阿里云地域,可多选。取值请参见 地域和可用区。事件等级 否 事件等级,可选值严重、警告、信息。事件详情匹配规则 否 Json格式,用来匹配系统事件的...

CentOS Linux停止维护后如何应对?

CentOS官方已计划停止维护CentOS Linux项目,阿里云上CentOS Linux公共镜像来源于CentOS官方,当CentOS Linux停止维护后,阿里云将会同时停止对该操作系统的支持。本文主要介绍CentOS Linux操作系统停止维护带来的影响,并针对影响提供应对...

保险行业

阿里金融云是一家拥有保险系统从渠道外围到核心,全系统上云、且监管合规的云服务提供商。对于保险行业阿里金融云针对不同子场景提供定制化解决方案。例如:电子保单方案、新开保险公司核心上云方案、寿险核心上云方案。电子保单方案 阿里...

HaaS EDU场景式应用整体介绍

2.1 首页系统信息屏 这是系统启动后的默认屏幕,包含了许多的知识点:OLED显示屏驱动与显示 系统版本获取 系统联网与IP地址获取 网络时间获取 Wi-Fi状态获取 蓝牙连接 电池电量获取 通过本案例的学习,能完整学习到AliOS Things操作系统...

修复实例操作系统无法启动问题的操作指南

实例健康诊断功能支持对实例无法启动问题进行自助诊断排查,您可以通过健康诊断了解实例无法启动的具体原因,并在挂载修复盘的情况下启动并登录实例,修复实例原来操作系统中导致无法启动的相关配置。您可以通过本文了解修复盘的操作说明,...

利用定时开关机节省成本

关于OOS更详细的介绍请查阅 什么是系统运维管理 OOS(CloudOps Orchestration Service)。场景简介 如果您的服务产品在每天都有特定的流量高峰期时间段,在此时间段内需要大量的实例维护服务。当过了每日的流量高峰期时间段后,此时保留...

扩容分区和文件系统(Linux)

ext*(例如ext2、ext3、ext4)文件系统 以扩容云盘分区/dev/vdb1 的 ext*文件系统为例,则运行如下命令:sudo resize2fs/dev/vdb1 说明 如果您扩容的是系统盘,命令中的/dev/vdb1 需要替换为/dev/vda1。以扩容裸设备/dev/vdc 的 ext*文件...

在批量执行命令中使用加密参数

通过 什么是系统运维管理 的参数仓库,可以更为方便的对参数进行集中管理。利用参数仓库的 加密参数,可以更安全的管理命令中的敏感信息。本文介绍如何在OOS批量执行命令时使用加密参数。前提条件 已开通密钥管理服务(KMS),请参见 什么...

产品优势

完备的鉴权和审计 您可以继续使用熟悉的资源访问管理和用户权限管理系统(RAM)来管理OOS,无论 系统运维管理 OOS(CloudOps Orchestration Service)自身的操作,还是通过 系统运维管理 OOS(CloudOps Orchestration Service)执行的对...

helloworld简单示例

SConstruct#Makefile=>Scon=>aostools 2.2 基本规范 solution统一以 aos_maintask 作为入口函数,从具体单板的C入口main函数开始,通过创建一个主任务来执行,即aos_maintask是系统主任务的入口函数:static void aos_main_task_entry(void)...

用参数仓库的加密参数批量修改实例密码

背景 参数仓库 系统运维管理 提供的一个可以在云端保存数据的功能,如有依赖使用云端数据的需求,使用参数仓库可以随时调用保存的数据、方便更新与维护。而且在参数仓库功能内部还提供了一种加密参数选项,如当您想批量修改ECS实例的...

挂载访问FAQ

目前仅支持Linux操作系统挂载NFS文件系统,Windows操作系统挂载SMB文件系统、Windows操作系统挂载NFS文件系统及Linux操作系统挂载SMB文件系统场景,请您登录ECS实例执行命令挂载。更多信息,请参见 Windows系统挂载SMB文件系统、Windows...

公共模板

如果您在控制台通过vnc能连接上实例,看到的页面大概是系统启动失败的提示信息。此时您可考虑执行该模板对损伤实例进行救治,救治流程主要是损伤的实例的系统盘将被挂载到新创建的临时实例上,接着在临时实例中会执行一段救治脚本,最后...

GxP欧盟附录11标准合规包

13.1 应报告和评估所有事件,而不仅仅是系统故障和数据错误。应确定重大事件的根本原因,并应成为纠正和预防行动的基础。使用云安全中心企业版 使用云安全中心企业版或者更高级别的版本,视为“合规”。1.1 风险管理应贯穿计算机化系统的...

挂载文件系统失败故障排查

当挂载文件系统失败后,优先推荐您通过自动脚本或排查思路定位问题。部分挂载操作的报错,自动检查脚本无法排查处理,NAS也提供了常见报错FAQ便于您查阅。本文介绍云服务器ECS挂载NAS文件系统时,挂载失败的排查方法与解决方案。...

什么是故障演练

最终故障节点增加到请求服务超时,估算系统容错红线,衡量系统容错能力。验证容器编排配置是否合理 通过模拟杀服务Pod、杀节点、增大Pod资源负载,观察系统服务可用性,验证副本配置、资源限制配置以及Pod下部署的容器是否合理。测试PaaS层...

HDFS概述

HDFS(Hadoop Distributed File System)是一种Hadoop分布式文件系统,具备高度容错特性,支持高吞吐量数据访问,可以在处理海量数据(TB或PB级别以上)的同时最大可能的降低成本。HDFS适用于大规模数据的分布式读写,特别是读多写少的场景...

四川农信

可扩展性强,处理效率高,容错能力强,总体拥有成本低,是分布式系统的重要特点,能够有效的解决传统架构的性能瓶颈,并满足金融级的高可靠性要求“竖井”现象,资源不共享,部署周期长,难以满足新业务快速上线的要求。快速响应能力受限 ...

演练场景说明

网络故障是系统运行过程中时常遇到的问题,所以需要提升系统在网络异常情况下的容错能力。Java 场景名称 特性 虚拟机场景 故障演练支持的虚拟机场景。代码逻辑场景 故障演练支持的代码逻辑场景。JVM注入动态脚本 向指定的Java方法注入一段...

典型客户案例

可扩展性强,处理效率高,容错能力强,总体拥有成本低,是分布式系统的重要特点,能够有效的解决传统架构的性能瓶颈,并满足金融级的高可靠性要求。快速响应能力受限 随着移动互联网快速普及,客户行为与喜好发生巨大变化,银行业务的发展...

创建文件系统

文件系统实例是运行 文件存储HDFS版 的实体。在使用 文件存储HDFS版 前,您需要先创建文件系统实例。前提条件 已开通 文件存储HDFS版 服务。具体操作,请参见 开通文件存储HDFS版服务。操作步骤 登录 文件存储HDFS版控制台。在顶部菜单栏...

自适应流控

系统支持自适应流控或手动设置系统规则,自适应流控是根据系统的CPU使用率自动动态地调整应用程序的入口流量;系统规则是从整体维度手动设置规则,对应用入口流量进行控制。目的都是为了让系统的入口流量和系统的负载达到一个平衡,保证...

系统安全防御最佳实践

系统安全是业务安全稳定运行的重要因素之一,随着网络安全对抗的愈演愈烈,规模化的自动化攻击、蠕虫、勒索、挖矿、APT等攻击形式逐渐增多,给系统的安全运行带来了很大的挑战。本文介绍云防火墙如何防御系统入侵。默认安装的系统存在以下...

如何正确处理DDL异常

各个DDL的容错策略可能不同,例如 CREATE TABLE 语句的容错策略是:自动尝试恢复,多次失败则自动取消。可以手动恢复或取消DDL任务。手动恢复:使用 CONTINUE DDL 语句可以恢复DDL任务。手动取消:使用 CANCEL DDL 语句可以取消DDL任务。...

自助建站方式汇总

搭建环境 阿里云云服务器ECS提供了多种镜像,您可以通过云市场镜像快速部署环境,也可以通过操作系统镜像创建服务器后手动搭建运维环境。搭建环境教程如下所示。部署LNMP环境 Nginx是一款小巧而高效的Web服务器软件,可帮您在Linux系统下...

系统防护

系统防护即从整体维度对应用入口流量进行控制,结合应用的Load、总体平均RT、入口QPS和线程数等几个维度的监控指标,让系统的入口流量和系统的负载达到一个平衡,让系统尽可能跑在最大吞吐量的同时保证系统整体的稳定性。背景信息 长期以来...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云消息队列 RocketMQ 版 负载均衡 文件存储 CPFS 云安全中心 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用