基本概念

领域模型 DDD方法论中的领域对象,通过对复杂业务的抽象,梳理出业务领域对象与对象关系,将高内聚低耦合以结构化的方式展现出来。例如,商品域中的商品类目、产品信息,交易域中的订单、退款单、物流单。数据模型 以结构化的方式设计并...

多活容灾术语表

区分各自独立、高内聚低耦合的多个业务,例如导购类型和交易类型等。多活实例 多活实例是业务类型的具体实例,用于进行租户粒度的管控配置和隔离。例如交易单元化测试环境和交易单元化正式环境。同城多活 分布在同城的多个站点同时对外提供...

数据模型架构规范

模型设计的基本原则 高内聚低耦合 一个逻辑和物理模型由哪些记录和字段组成,应该遵循最基本的软件设计方法论中的高内聚低耦合原则。主要从数据业务特性和访问特性两个角度来考虑:将业务相近或者相关的数据、粒度相同数据设计为一个...

管理微应用与服务

将业务分割为微应用和服务后,不仅实现了不同模块之间的低耦合高内聚,同时可以通过 mPaaS iOS 框架提供的框架上下文,进行微应用与服务的管理,包括微应用与微应用、服务与服务、微应用与服务之间的跳转和数据传递等。管理微应用 框架上...

保险行业

实体中心、控制中心、周边服务中心各自职责分明,相互演进,高内聚低耦合。横向团队对业务流程、场景具有专业化支持;纵向团队对特定的业务领域提供专业支持。IT系统服务中心与业务部门划分对齐,需求可控,发布影响受到控制。阿里金融云...

接入方式介绍

同时基于 Framework 的设计思想,将业务隔离成相对独立的模块,着力于追求模块之间的高內聚低耦合。参考 mPaaS 框架介绍 获取更多信息。您可以快速搭建一个基于 mPaaS 框架的全新应用,具体步骤参考 基于 mPaaS 框架创建一个应用。基于已...

应用场景

企业生产环境中,通过合理的微服务拆分,可以享受微服务带来的高内聚低耦合、高容错性的优势。在微服务上生产的过程,依托于阿里云产品提供的微服务治理能力。可以在不修改任何代码和配置的情况下,实现:全面消除变更过程中的风险 依托...

服务等级目标SLO概述

短时间高故障率和低故障率且持续时间较长的故障才能触发告警,避免不必要的告警分散运维人员的精力从而错过真正关键的问题。多窗口能够在计算一段时间的故障率时同时设置一个短时间窗口,当短时间窗口故障率低于阈值时结束告警。...

服务等级目标SLO概述

短时间高故障率和低故障率且持续时间较长的故障才能触发告警,避免不必要的告警分散运维人员的精力从而错过真正关键的问题。多窗口能够在计算一段时间的故障率时同时设置一个短时间窗口,当短时间窗口故障率低于阈值时结束告警。...

微服务治理概述

企业可以通过合理的微服务拆分,享受微服务带来的高内聚低耦合和高容错性。可具备的能力 在微服务上线的过程中,使用MSE微服务治理能力,您可以在无需改动代码和配置的情况下,使业务具备如下能力。低成本实现微服务敏捷开发 功能 使用...

附录:SOFAStack 产品目录

同时满足异地容灾、成本快速扩容的需求,能够解决传统集中式架构转型的困难,并通过打造大规模可用分布式系统架构,来支撑金融业务创新。SOFAStack 由四大领域模块组成:分布式中间件、运维管理(应用 PaaS)、阶运维保障、研发效能...

概览

由于单指标报警规则设置了固定的报警阈值,所以无法应对以上复杂场景,导致经常出现部分负载实例持续报警,而水位负载实例业务异常下达不到报警阈值或达到阈值后业务问题已持续半小时以上。因此,云监控为了更好地提升您的报警体验,...

如何管理事件

在 升级故障 弹窗填写 故障名称、选择 故障等级、选择 故障状态、选择 所属服务、选择 影响服务、填写 进展摘要、主要处理人、选择 应急协同组,点击 确定。如下图所示:字段描述 故障名称:事件 升级为 故障 后的 名称,限制 36个字符;...

查看ECS实例的操作记录

如果您在使用ECS实例的过程中遇到故障,可以通过查看ECS实例的操作记录识别可能的故障原因。背景信息 操作记录 以ECS实例为入口,对实例及其关联资源的所有操作进行操作审计,并且对操作记录的影响等级进行标注,在众多操作记录中高亮出...

查看运行分析

该指标协助您进行作业诊断,排查作业Task级别的故障原因。个 TM自JVM启动以来已加载的类总数(TM ClassLoader)TM自JVM启动以来已加载的类总数。JM所在的JVM创建后加载类的总数或卸载类的总数过大,会导致占用过大内存空间,从而影响作业...

故障管理

包括根因检查点(如故障原因、最近活动、注入方式、恢复方式等)、故障变更检查、监控检查,并需要对每一个故障明确责任人及团队;故障改进:支持对故障制定明确的改进及验收措施、责任人及完成时间,确保每个深度复盘后的故障都能对业务...

监控指标说明

该指标协助您进行作业诊断,排查作业Task级别的故障原因。次数 TM GC Time 每次TM GC时间。长时间GC会导致占用过大内存空间,从而影响作业性能。该指标协助您进行作业诊断,排查作业级别的故障原因。毫秒(ms)TM ClassLoader/...

流量回放和压测

此外,在数据库发生故障且无法定位原因时,可以利用克隆库复现故障场景,以便更好地定位故障原因。前提条件 源数据库支持:RDS MySQL PolarDB MySQL版 说明 不支持 PolarDB MySQL版 的 企业版 单节点 实例。PolarDB-X 2.0。目标数据库实例...

智能压测

此外,在数据库发生故障且无法定位原因时,可以利用克隆库复现故障场景,以便更好地定位故障原因。前提条件 源数据库支持:RDS MySQL PolarDB MySQL版 说明 不支持 PolarDB MySQL版 的 企业版 单节点 实例。PolarDB-X 2.0。目标数据库实例...

应用场景

在线业务弹性扩容 根据业务流量自动对业务进行扩容(基于Kubernetes HPA),无需人工干预,避免流量激增扩容不及时导致系统故障,以及平时大量闲置资源造成的浪费。在使用阿里云容器服务ACK场景下,支持将一个应用按比例部署到ECS或ECI上,...

为什么消费客户端频繁出现Rebalance?

可能原因 可能导致故障原因包括:v0.10.2之前版本的客户端:Consumer没有独立线程维持心跳,而是把心跳维持与poll接口耦合在一起。其结果就是,如果用户消费出现卡顿,就会导致Consumer心跳超时,引发Rebalance。v0.10.2及之后版本的客户...

网络资源

网络资源还需要提供带宽、延迟和稳定的网络连接,以确保节点之间的通信和数据传输的效率和可靠性。网络资源是流量入口和数据交互的基础设施,常见的网络资源风险点如下:网络带宽不足 指网络连接的带宽无法满足系统或应用程序的需求,...

EMR Kafka磁盘故障运维

当出现磁盘故障时,需要根据故障原因、故障影响程度、业务需求(是否接受数据丢失、是否允许服务较长时间不可用)、集群状态等综合考虑恢复采取的策略。如果业务优先保证服务可用,但允许丢失部分数据,则应考虑在可能会丢失数据的情况下,...

性能监控最佳实践

提高故障排查效率:当系统或应用出现故障时,传统的性能监控方案通常需要IT运维人员手动分析监控数据来确定故障原因,这样会浪费大量的时间和精力。而一体化性能监控能够对多种关联的监控数据进行自动分析和处理,帮助IT运维人员快速定位...

常见问题

Q:造成主节点负载原因是什么?A:造成主节点(主库)负载高的原因有直连主地址、主库接受读请求、存在大量的事务请求、主从复制延迟导致请求被路由到主库、只读节点异常导致读请求被路由到主库等。而主节点负载较原因可能是...

集群可用架构推荐配置

可用性(High Availability,HA)是指系统的设计能够确保服务可靠性和持续性的一种特性。容器服务 Kubernetes 版 基于Kubernetes架构提供了多种集群可用保障机制,以确保集群控制面、节点与节点池、工作负载、负载均衡等维度的可用,...

技术面临的挑战与革新

公有云厂商使用基于网络的块存储逐步代替了单机的本地存储,在这样的基础架构下计算和存储耦合的架构已经变得不透明不合理,此时存储计算分离的架构的优势体现了出来,存储计算分离,分布式存储系统使用密度,功耗的服务器来解决存储...

产品优势

同Flink,物联网平台无缝对接,生态丰富 开源产品,与云产品集成能力弱 存储成本 数据压缩 时序领域专用压缩,压缩率 通用压缩,压缩率 稳定性 数据读取 读写线程池分离,易于管理连接,读写稳定 读写耦合,容易造成连接数耗尽,读写...

常见问题

Q:造成主节点负载原因是什么?A:造成主节点(主库)负载高的原因有直连主地址、主库接受读请求、存在大量的事务请求、主从复制延迟导致请求被路由到主库、只读节点异常导致读请求被路由到主库等。而主节点负载较原因可能是...

常见问题

Q:造成主节点负载原因是什么?A:造成主节点(主库)负载高的原因有直连主地址、主库接受读请求、存在大量的事务请求、主从复制延迟导致请求被路由到主库、只读节点异常导致读请求被路由到主库等。而主节点负载较原因可能是...

诊断项与诊断结果说明

实例操作系统相关配置诊断(Linux)诊断项(控制台)描述 诊断范围及建议操作 总CPU使用率过 实例当前CPU的使用率已经超过80%(基于top命令返回的数据)。检查该实例的总CPU使用率。如果使用率过,请您定位使用较多CPU资源的进程并...

Pod诊断

容器智能运维平台 构建了基于专家经验的故障诊断系统,并基于海量数据训练了AI智能故障诊断模型。Pod诊断融合了基于专家经验和AI智能诊断两种诊断模式,进一步深入定位问题根因。Pod诊断包括诊断检查项和诊断根因。诊断检查项:包括Pod检查...

关键技术竞争力

传统应用无须改造即可互联互通,实现了分布式应用和传统应用体系融合,构建高可扩展、性能、成本、轻量无侵入的分布式系统。消息 Mesh:传统应用平滑上云 云原生 Mesh 技术让传统应用能够以零成本或成本的方式享受到分布式架构的技术...

Tair选型指南

选择容灾方案 图 3.Tair容灾架构演进 灾备方案 灾备级别 说明 单可用区高可用方案★主从节点部署在同一可用区中的不同机器上,当任一节点发生故障时,由可用HA(High Availability)系统自动执行故障切换,避免单点故障引起的服务中断。...

节点诊断

容器智能运维平台 构建了基于专家经验的故障诊断系统,并基于海量数据训练了AI智能故障诊断模型。基于专家经验和AI智能诊断两种诊断模式,节点诊断可以深入定位问题根因。节点诊断包括诊断检查项和诊断根因。诊断检查项:包括Node检查、...

云数据库Redis版产品选型必读

Tair内存型(兼容Redis 6.0)4 GB可用、不启用集群版 购买链接 开发测试 Redis 6.0经济版1 GB 购买链接 通用缓存 Redis 6.0标准版4 GB可用、不启用集群版 购买链接 性能并发场景(连接数大于20,000或QPS大于200,000)Redis 6.0标准版...

监控、诊断和故障排除

所以产生E2E延时、服务器延时可能的原因有两个:客户端应用程序响应慢 可用连接数或可用线程数有限 对于可用连接数问题,可以使用相关命令确定系统是否存在大量TIME_WAIT状态的连接。如果是,可以通过调整内核参数解决。对于可用线程数...

集群巡检项及解决方案

检查类型 预警风险 资源配额 ResourceQuotas VPCSLB配额紧张 SLB后端服务器配额紧张 SLB可监听数配额紧张 SLB实例数配额检查 资源水位 ResourceLevel SLB带宽使用率过 SLB最大连接数过 SLB新建连接速率过 SLB QPS过 集群Pod网段...

集群巡检项及解决方案

检查类型 预警风险 资源配额 ResourceQuotas VPCSLB配额紧张 SLB后端服务器配额紧张 SLB可监听数配额紧张 SLB实例数配额检查 资源水位 ResourceLevel SLB带宽使用率过 SLB最大连接数过 SLB新建连接速率过 SLB QPS过 集群Pod网段...

混沌工程缓存实战系列-Redis

Redis是一个开源性能的Key-Value存储系统,虽然Redis本身具备了非常高的可用性,但是在实际应用中也会随着系统业务的复杂性以及不合理的使用,而导致很多的问题。本文将讲述如何通过混沌工程来暴露可能存在的使用风险,提升缓存问题的...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库自治服务 云消息队列 RocketMQ 版 应用高可用服务 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用