设计原则

IT系统的故障或灾难是不可避免的。如果没有数据容灾措施,数据中心或服务器发生故障或灾难时,数据的完整性、可恢复性和可用性都将受到严重影响;数据容灾可以保障企业业务的持续运行和数据的可靠性。在数据中心或服务器出现故障或灾难时,...

地址标准服务等级协议

2)因地址标准化故障导致的正常请求未能到达地址标准化服务器端的请求。1.4有效的总请求:客户某一阿里云账号下地址标准化服务器端接收到的所有请求视为有效的总请求,但不包括以下类型的请求:(1)未通过地址标准化服务身份验证和鉴权...

人保健康

业务挑战 面向互联网业务消费场景、高频的特征,需要 IT 系统具备应对海量高并发,横行扩展能力。传统集中式的 IT 架构无法满足业务对出单时间、新产品上线时间的要求,需要提升服务时效以及客户体验。解决方案 人保健康引入蚂蚁集团的...

基于云SSO实现多账号单点登录

此方案基于云SSO的产品能力,提供一种集中化管理企业多账号的身份权限的方式,简化了企业IT管理人员在身份配置上的复杂度,同时降低了因为身份管理不善导致的身份泄露、权限过大的风险。方案概述 当企业采用多账号的云上架构时,配置各个...

概述

任务调度 TS(Task Scheduler)提供分布式任务调度框架,实现任务的分布式处理,并能规范化、自动化、可视化和集中化对金融企业不同业务系统的任务进行统一的调度和全方位监控运维管理,达到所有任务有序、高效运行的目的,极大降低开发和...

应用场景

体系化故障闭环管理 应用场景 基于阿里多年base ITIL实践经验沉淀的故障管理体系,满足企业重大故障的流程化、在线化管理需求,持续提升业务连续性。能够解决 故障应急:支持故障全局应急通告,电话、短信、邮件、IM多种通知渠道,加快信息...

设计方案

在软件系统架构演进中不变的是系统的基本属性,包含存储、计算和网络,变的是存储、计算和网络的实现方式和规模,往大规模、高性能、高可靠、易扩展等方向迭代演进,所以对架构稳定性提出了更高的要求。系统可预见的稳定性风险包含软硬件...

故障演练

故障演练就是这个背景下诞生的,沉淀通用的故障场景,以可控成本在线上故障重放,以持续性的演练和回归方式的运营来暴露问题,不断验证和推动系统、工具、流程、人员能力的提升,从而提前发现并修复可避免的重大问题,或通过验证故障发现...

产品优势

视图计算产品采用云架构,既能支持不同协议设备监控视频快速上云,在云上对监控视频集中安全存储,全网跨地域视频分发播放,又拥有强大可弹性扩容的计算能力支持对接不同算法平台实现按需视频智能计算。大规模并发,安全高效 云高可靠...

故障演练常见问题

如果是手动推进节点,无论系统运行成功与否,都以用户的二次确认结果为准,如果用户允许继续流程,则当前活动是成功的。怎么算一个演练任务是否成功?只有当每个阶段的所有演练活动都运行成功了,才算演练任务成功。在什么情况下会执行恢复...

故障管理

故障等级定义的制定和录入 标准化故障等级定义制定的思路:依据业务属性先将业务划分为大的子类(业务整体技术架构层面)将每个子类业务里的核心模块和核心、非核心模块区分开来(功能层面)根据各功能模块的业务量级去适配不同的影响面...

初始云盘时,在CentOS 7系统mount本地盘时出现命令...

本文介绍初始云盘时,在CentOS 7系统 mount 本地盘时出现命令卡住现象的问题描述、问题原因和解决方案。问题描述 在CentOS 7系统使用ext4文件系统批量初始本地盘时,使用 mount 命令挂载本地盘时出现命令卡住的现象,然后使用 ps 命令...

GxP欧盟附录11标准合规包

业务背景 GxP欧盟附录11(GxP EU Annex 11)是欧盟对于计算机系统使用的规范性要求,主要针对在制药、生物技术和医疗器械领域中使用计算机化系统的企业和组织。他要求涵盖了计算机化系统的开发、验证、操作、维护和监测等方面,以确保...

实例的节点故障处理机制

本文档介绍云数据库MongoDB版实例的节点故障处理机制。单节点实例 由于单节点实例架构的特殊性,单节点实例仅拥有一个节点。当节点发生故障后,系统会对故障节点进行检查与修复。节点故障期间实例的相关服务不可用。说明 单节点实例适用于...

车行版一体机

数据由部署在物业一体机中的定制开发停车系统消费,并通过云边协同数据通道和云上应用进行数据交换 方案推荐 车行版(系统方案)采用保留原有系统的模式,将服务代理上云,方案适合于集中化弱管控的方式,这种方式可以将车场信息、车辆信息...

应用场景

通过微服务产品将传统金融业务系统拆分为模块、标准、松耦合、可插拔、可扩展的微服务架构,可缩短产品面世周期,快速上架,抢占市场先机,不仅可确保客户服务的效率,也降低了运营成本。传统应用微服务改造 通过微服务产品将传统金融...

如何管理故障

可对故障根因进行原因检查并结构录入,检查点包括:故障原因、最近活动、注入方式、恢复方式等;关联故障期间的故障变更,新增故障改进措施等操作。故障状态 处理中:处理中仍未恢复的故障;已恢复:故障对处理中的故障做 恢复 操作后是...

江西农信

抛弃传统集中式架构,江西农信采用消息 Mesh 技术实现业务系统平滑迁移上云。江西农信日前携手蚂蚁集团,使用最前沿的云原生技术,实现了传统业务系统集中式技术架构下移,并平滑迁移上云,为整体核心系统进行分布式架构升级和演进探索...

功能特性

风险场景 风险场景 是针对特定风险事件进行集中化处理的模块,风险场景中包含了处理风险事件所需要诊断决策树、应急预案、业务影响等信息。目前应急场景升级后,需要将风险场景和应急响应联动,所以需要添加更多属性。日常巡检 日常巡检 是...

应用场景

可视管理:在分布式系统中,面对爆发式增长的应用数量和服务器数量,提供图形集中式管理平台,简单易用,学习成本低。多数据中心异地多活 通过微服务产品可快速构建高可扩展、高性能的金融级分布式核心系统,拥有弹性扩容和异地多活...

什么是故障

包括根因检查点(如故障原因、最近活动、注入方式、恢复方式等)、故障变更检查、监控检查,并需要对每一个故障明确责任人及团队;故障改进:支持对故障制定明确的改进及验收措施、责任人及完成时间,确保每个深度复盘后的故障都能对业务...

保险行业

通过DNS、DTS等产品构建异地灾备环境(VPC1与VPC2),可实现异地灾备的系统架构,并满足系统快速灾备切换、保障业务连续性的可靠性要求。云上云下混合联通:通过各类网络解决方案,与云下IDC中的系统进行互访,与周边其他系统进行基于...

健康检查服务内容说明

3.2.2 弹性计算架构检查 阿里云专家团队通过调研、工具软件等方式收集客户云上IT系统的弹性计算架构方面的信息,包括但不限于云服务器(Elastic Compute Service,ECS)、函数计算、高性能计算、容器服务等弹性计算云产品的配置参数和运行...

金融云简介

阿里金融云的作用 阿里金融云服务以云计算为支撑,在杭州、上海、深圳和北京部有 金融云数据中心,帮助金融机构的IT系统整合入云,实现快速交付,降低业务启动门槛。同时,金融云通过标准的异地灾备、专线接入等增值服务,满足金融业务在...

组件中心

任务调度 提供分布式任务调度框架,实现任务的分布式处理,并能规范化、自动化、可视化和集中化地对金融企业不同业务系统的任务进行统一的调度和全方位的监控运维管理。消息队列 在蚂蚁集团关键链路中历经十年实战打磨,是一款具备高可靠、...

应用场景

本文主要介绍 API 网关在实际使用过程中有哪些应用场景,包括前后端分离场景、异构系统集成场景和混合云场景。前后端分离场景 统一接入标准 通过 API 网关向客户端提供统一协议的 API,允许 IT 团队选择最适合内部架构的技术栈。后端异构...

多账号配置统一合规审计

本方案旨在给企业的各中心管理团队提供一种面向多账号配置的合规管理方案,从上而下地实施统一的合规基线并强制管理,可中心地持续监测所有业务的合规状态。提升中心管理团队工作的可见性可控性,切实起到监管效力,规避潜在风险。方案...

故障复盘改进详情

名称 类型 示例值 描述 requestId String 4361a0e1-6747-4834-96ce-0c4840fd3811 Id of the request data Object data problemId String 231231 故障ID problemReason String 故障的原因 故障原因 recentActivity String 2 最近活动码表:...

功能特性

高可靠的轻量级配置中心 提供应用运行时动态修改配置的服务,并提供图形化的集中化管理界面。配置动态推送实时生效 支持按全量 IP 地址及指定 IP 地址进行配置推送,无需重启应用,并支持推送回滚。客户端信息管理 可查看客户端列表信息,...

概述

任务调度 SOFAStack 任务调度提供分布式任务调度框架,实现任务的分布式处理,并能规范化、自动化、可视化和集中化地对金融企业不同业务系统的任务进行统一调度和全方位监控运维管理,达到所有任务有序、高效运行的目的,极大降低开发和运...

功能特性

高可靠的轻量级配置中心 提供应用运行时动态修改配置的服务,并提供图形化的集中化管理界面。配置动态推送实时生效支持按全量 IP 地址及指定 IP 地址进行配置推送,无需重启应用,并支持推送回滚。客户端信息管理可查看客户端列表信息,...

什么是消息演练

随着应用规模的扩大,系统变得越来越复杂,不可避免地会走向分布式。各种中间组件会相继被引入系统,其中分布式消息服务更是系统中必不可少的一环。这些消息服务之前并没有在系统中实际经历过真实流量考验,其中某些隐患或缺陷很难被发现...

DataV数据可视服务协议

本服务协议是阿里云计算有限公司(简称“阿里云”)与您就DataV数据可视服务(简称DataV服务)的相关事项所订立的有效合约。您通过盖章、网络页面点击确认或以其它方式选择接受本服务协议,或实际使用阿里云提供的DataV服务,即表示您与...

故障复盘

故障复盘规范 故障复盘作为故障体系中的重要一环,整体复盘流程包括故障处理过程、改进分析、故障定责,基于包含标准的复盘SOP、对应预防action推荐、问责管理机制,全面地回溯线上故障的发生,产出故障复盘报告和改进措施,避免故障重复...

围绕混沌工程的平台实践

原则3在生产环境中运行实验 混沌工程推荐故障演练是在生产环境中进行,主要的原因有以下两点:系统的行为会根据环境和流量模式的变化,例如系统依赖的组件在测试环境和生产环境会有比较大的差异。系统的监控和人员的应急响应在测试环境和...

应用场景

研发流程标准 实现企业存量历史系统和影子IT的现代封装,互联互通,帮助企业IT系统架构平滑升级。在企业数字改造进程中,历史业务系统已不可维护但依然在运行,企业需要不停止现行业务,同时构建新的数字化系统,可使用低代码平台...

产品简介

一站式管理、多端协同,帮助企业实现更实时的数字管理、更快的故障响应、更短的故障恢复时长、更连续的业务运营体验。产品架构 功能概况 您可以在运维事件中心获得以下功能的入口:模块 能力概述 功能描述 服务 管理企业的各个服务...

基础术语

术语 说明 应用 泛指用于组成业务系统的应用,可以为单体应用也可以为基于分布式框架构成的微服务应用。应用拓扑 拓扑是对应用间调用关系和依赖关系的可视展示。SOFATracer SOFATracer 是一个用于分布式系统调用跟踪的组件,通过统一的 ...

性能监控最佳实践

而一体性能监控能够对多种关联的监控数据进行自动分析和处理,帮助IT运维人员快速定位故障原因,从而提高故障排查效率。提高监控可视程度:一体性能监控可以通过统一可视界面,综合展示不同类型的性能监控数据,使监控数据更加直观...

ECS系统事件汇总

根据实例规格的不同,支持的操作也不同,具体说明如下:d1、d1ne、d2s、d2c:支持在线隔离、离线隔离、在线维修、重新部署 d3c、d3s、d2c、i2、i2g、i2ne、i2gne、i3、i3g、i4、i4g、i4r、i4p:支持在线隔离、离线隔离、重新部署 i1:支持...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
DataV数据可视化 云服务器 ECS 物联网无线连接服务 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用