附录:SOFAStack 产品目录

SOFAStack 源于自蚂蚁内部沉淀十多年的金融级分布式中间件技术体系,吸收了支付宝自创立以来在关键金融交易系统锤炼出来的架构实践。SOFAStack 所有的产品技术均经过蚂蚁集团自身严苛的金融场景验证,为金融交易技术保证风险安全的同时,...

产品简介

安全、稳定、高鲁棒性 服务稳定运行,并以在线工单等方式提供技术支持,具备完善的故障监控、自动告警、快速定位等一系列故障应急响应机制。基于阿里云的AccessKeyId和AccessKeySecret安全加密对,从访问接口上进行权限控制和隔离,保证...

专家成长计划技术培训课程

现场面授(特殊情况可调整为线上钉钉群直播)云上存储运维工程师专家培训(专项)1天 30人 本课程将全面介绍块存储、OSS、日志服务三大产品的常见问题的定位、排查和处理,使学习者深入故障处理和排查能力。本课程包含一定的实验动手操作,...

性能监控最佳实践

建设一体化性能监控平台 随着互联网技术的不断发展,企业的业务规模和复杂度也在不断增加。为了保证业务的稳定性和可靠性,企业需要对其系统进行全面的性能监控。而一体化性能监控就是一种集成了多种监控工具和技术的综合性监控方案,可以...

专家成长计划服务内容说明

30人 公共云-深入运维故障处理技术能力 阿里云弹性计算产品运维 8 基于海量云上的诊断排查实战经验,针对使用ECS产品场景,提供针对阿里云产品功能特性、架构设计、性能调优、疑难诊断等方面技术赋能,包括但不限于如下场景的综合技术项:1...

测试与验证

在 PTS 平台上,您可以用较低的人力和资源成本,构造出接近真实业务场景的复杂交互式流量,快速衡量系统的业务性能状况,为性能问题定位、容量配比、全链路压测的流量构造提供帮助,进而提升用户体验,促进业务发展,实现企业的商业价值。...

ACK集群概述

使用集群诊断:提供一键故障诊断能力,包括节点诊断、Pod诊断、Service诊断、Ingress诊断、内存诊断、网络诊断,可以辅助您定位集群中出现的问题。成本分析:支持可视化集群资源使用量及成本分布,以提升集群资源利用率。安全中心:支持...

故障演练

ADP提供基于线下交付经验设计的丰富故障演练场景,对基础设施、底座、中间件的常见故障场景进行覆盖,涵盖了集群级别的大规模故障以及节点、pod级别的资源故障。部分演练场景为破坏性场景(如机器重启、网卡损坏),可能导致环境状态异常、...

使用前须知

专属仪表盘 无 使用场景 故障定位 您可以根据访问日志快速定位和解决故障。例如,根据 status 字段查看全球加速应答报文的状态,排查访问请求未获得预期响应的原因。业务规划 您可以根据访问日志进行数据分析,提前规划业务规格。例如,...

功能特性

高可用管理平台 HAS 定位于 IT 技术风险防控。产品主要功能包括风险管理、日常巡检、故障诊断、应急预案、故障演练等。风险管理 风险管理 是高可用管理平台核心,是风险事件汇集、处置的中枢平台,具体如下。风险事件 风险事件汇集:负责将...

NAT网关故障排查指南

本文介绍NAT网关的常见故障及排查方案。流量不通类故障排查:ECS实例配置DNAT条目后无法被公网访问 VPC内新建交换机的ECS无法通过SNAT访问公网 VPC内存在多个NAT网关时,某交换机的ECS实例不能访问公网 访问流量异常类故障排查:客户端访问...

诊断网页加载过慢的问题

针对这类问题,ARMS前端监控的慢会话追踪功能提供页面静态资源加载的性能瀑布图,可深入定位页面资源加载情况,全方位地诊断故障根源,从而快速排除故障。问题描述 网页加载较慢是经常出现且前端非常关注的问题之一。定位、排查解决这类...

应用场景

Node.js 提供的精确到虚拟机级别的深度监控,能够如实的反应应用运行状态,通过配置报警规则,用户可以在发现系统出现故障(内存泄露或者 CPU 热点等)趋势时,通过诊断接口迅速定位故障点。Node.js 性能平台特别适合业务发展迅速、应用...

会话审计

管理员可通过审计会话定位故障及追溯故障根源。支持在线播放会话以及下载离线播放会话两种查看方式。审计用于审计运维人员对主机的访问操作日志,多角度记录运维人员的操作行为,作为事件追溯的保障和事故分析的依据。会话审计专注于事后...

SOFAMesh 服务网格总体经济影响报告

对于积累了大量技术资产的传统企业甚至是互联网企业而言,云原生平台的构建都是一个混合演进的发展过程。在应用架构、基础架构和部署架构等不同维度,异构环境均将以常态化的混合形态长期存在,而仅仅采用容器、Kubernetes(K8s)与微服务...

什么是用户体验监控

完整再现用户操作过程,从页面打开速度(测速)、请求服务调用(API)和故障分析(JS错误、网络错误等)稳定性(JS错误、崩溃、ANR 等)方面监测前端应用性能表现情况,并支持日志数据查询,帮助您快速跟踪定位故障原因,提升用户体验。...

功能概述

数据库发生故障后,无法在发生故障定位到原因,可以通过智能压测功能,在克隆库上复现故障场景,定位故障原因。功能架构 智能压测的功能架构如下图所示:源数据库:将要进行大促、将要业务变更或者已经发生故障,需要进行流量捕获的数据...

智能压测

此外,在数据库发生故障且无法定位原因时,可以利用克隆库复现故障场景,以便更好地定位故障原因。前提条件 源数据库支持:RDS MySQL PolarDB MySQL版 说明 不支持 PolarDB MySQL版 的 企业版 单节点 实例。PolarDB-X 2.0。目标数据库实例...

流量回放和压测

此外,在数据库发生故障且无法定位原因时,可以利用克隆库复现故障场景,以便更好地定位故障原因。前提条件 源数据库支持:RDS MySQL PolarDB MySQL版 说明 不支持 PolarDB MySQL版 的 企业版 单节点 实例。PolarDB-X 2.0。目标数据库实例...

诊断报告

诊断报告则从一个全局的视角抓住进程的瞬时状态,采集了堆栈,系统资源,平台信息等以协助故障定位。尤其是其中的 JavaScriptStack 可以协助精确定位长正则和死循环故障。各个分支开始支持的版本:2.x:v2.5.2 3.x:v3.11.8 4.x:v4.3.0 注意...

故障演练

常见故障类型都可以映射到这个故障模型中,模拟故障的演练系统及方案也可以基于该模型进行设计。在设计演练方案的过程中,可以考虑在模型中每个环节进行故障注入,验证故障应急方案。不同演练类型和目标 根据演练过程对线上业务的影响,...

什么是云网管

观测平台(Observation Platform)基础设施运行状态维护和管理,包含性能数据和告警数据,实现对各类监控对象的异常数据判定,网络故障的发现、分析、定位等维护管理。高效采集,分钟级故障定位发现。自定义采集方式和分析过程,兼容所有...

配置CLB访问日志

CLB结合阿里云日志服务提供的访问日志功能,可帮助您大幅提升日志数据分析、故障定位处理的效率。使用限制 仅CLB的七层负载均衡(HTTP/HTTPS监听)支持访问日志功能。前提条件 已创建CLB实例。具体操作,请参见 创建和管理CLB实例。已创建...

工作原理

日志服务提供下探分析功能,用于对多维时序进行自动化、智能化的根因定位。您可以根据根因定位的结果,判断是时序数据的哪些维度(单个维度和若干维度的组合)异常导致的问题,缩小问题排查范围。本文介绍下探分析的背景信息、功能、调度与...

什么是云拨测

故障定位与诊断:云拨测利用先进的Traceroute诊断技术,快速发现并定位网络故障,提供详细的故障报告和解决建议。实时告警与通知:云拨测提供实时告警功能,当业务出现异常时,会主动发送告警通知,快速响应并处理问题。数据可视化:通过...

DAS企业版介绍

快速定位引发故障的SQL,消除故障。支持导出数据库SQL模板和流量数据。流量回放和压测:提供智能压测功能,可以基于历史的业务场景和流量进行容量评估、回放压测、峰值压测等功能。具体操作请参见 流量回放和压测。自动SQL优化:相比传统的...

AIOps 解决方案专家服务内容说明

面对云上甚至多云的复杂业务系统,运维人员经常会遇到技术栈繁杂、配置告警耗时长、设置指标告警遗漏、告警风暴以及故障定位耗时等一系列运维问题,最终可能导致严重的资损。智能运维又称AIOps,即人工智能与运维相结合,可通过机器学习的...

列存索引技术架构介绍

本文介绍了列存索引的技术背景、简介以及技术架构等内容。技术背景 MySQL生态HTAP数据库解决方案 MySQL是一款主要面向OLTP型场景设计的开源数据库,开源社区的研发方向侧重于加强其事务处理能力。如提升单核性能、多核扩展性和增强集群能力...

诊断决策树

对于未知的故障,您可以依据运维经验,编排出常见的排查路径,辅助快速故障定位。新建诊断决策树 登录高可用管理控制台。在左侧导航栏上,单击 故障诊断>诊断决策树。单击 新建,在 创建诊断决策树 页面,配置诊断决策树信息,包括决策树...

什么是应用实时监控服务ARMS?

子产品 功能概述 常见场景 计费方式 应用监控 面向分布式架构,监控Java应用,支持查看应用拓扑、接口调用、异常事务、慢事务等。压测前后的性能调优。微服务改造后的全链路监控。应用运行情况的7×24小时监控和告警。产品计费(新版)前端...

关键技术竞争力

TRaaS 技术风险防控平台提供多元框架协议,采集监控、链路、日志等多样数据,并支持按业务场景进行多维聚合,以业务监控为核心建立业务连续性保障体系,通过监控下钻、链路分析、日志关联、故障决策树诊断,共同建立故障定位分析体系,覆盖...

应用容灾

“应用多活”是“应用容灾”技术的一种高级形态,指在同城或异地机房建立一套与本地生产系统部分或全部对应的生产系统,所有机房内的应用同时对外提供服务。当灾难发生时,多活系统可以分钟级内实现业务流量切换,用户甚至感受不到灾难发生...

错误码

本文档列出了 PolarDB-X 返回的常见错误码及解决方法。PXC-1305 ERR_UNKNOWN_SAVEPOINT PXC-1094 ERR_UNKNOWN_THREAD_ID PXC-4006 ERR_TABLE_NOT_EXIST PXC-4007 ERR_CANNOT_FETCH_TABLE_META PXC-4018 ERR_INVALID_DDL_PARAMS PXC-4100 ...

监控、诊断和故障排除

相对于传统应用程序,开发云端应用虽然降低了用户在基础设施搭建、运维等方面的成本,但却增大了监控、诊断和故障排查的难度。OSS存储服务为您提供了丰富的监控和日志信息,帮助您深刻洞察程序行为,及时发现并快速定位问题。本文主要描述...

畅捷通

日志服务帮助畅捷通运维开发团队解决了误报频繁、无法快速发现问题站点、无法快速定位异常的问题,实现了运维效率、运维成本、沟通成本等方面的改善。日志服务支撑了畅捷通所有云产品的健康稳定运行,在IT运维开发领域树立了一个标杆。公司...

一键诊断

在数据库出现故障时,您可以利用一键诊断功能,快速诊断选定时间段内数据库性能情况,直观地查看数据库性能情况的全貌,快速定位异常原因。前提条件 目标数据库引擎为:RDS MySQL MyBase MySQL 自建MySQL 目标数据库实例已经接入DAS,详情...

什么是Web应用防火墙

通过防护集群作用,避免单点故障和冗余。防护流量处理性能高。应用场景 适用于阿里云以及阿里云外所有用户,主要用于金融、电商、O2O、互联网+、游戏、政府、保险等行业各类网站的Web应用安全防护。说明 仅支持通过域名或实例方式接入WAF,...

什么是Web应用防火墙

通过防护集群作用,避免单点故障和冗余。防护流量处理性能高。应用场景 WAF适用于阿里云以及阿里云外所有用户,主要用于金融、电商、O2O、互联网+、游戏、政府、保险等行业各类网站的Web应用安全防护。说明 WAF仅支持通过域名方式进行防护...

应急响应服务

什么是应急响应服务 背景信息 安全管家的应急响应服务基于阿里巴巴多年的安全攻防实战技术能力和管理经验,参照国家信息安全事件响应处理相关标准,在发生安全事件后,按照预防、情报信息收集、遏制、根除、恢复流程,提供专业的7*24远程...

什么是应用监控

您无需修改代码,只需为应用安装一个探针,ARMS就能够对应用进行全方位监控,帮助您全面掌控应用运行状态,快速定位出错接口和慢接口,洞察性能瓶颈,重现调用参数,从而大幅提升线上问题诊断的效率。一键接入 ARMS应用监控通过探针技术,...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库备份 云备份 负载均衡 弹性公网IP 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用