查看ECS实例的操作记录

ECS实例及其关联资源的操作记录会保存90天,包括时间、地点和操作者等信息。当您遇到技术问题或故障时,可以通过查阅操作记录快速定位问题、评估影响范围,并进行责任认定。

说明

作记录功能的日志数据由操作审计(ActionTrail)提供,默认保留最近90天的数据。若您有需求保存更长时间段内的操作记录,可以考虑将操作日志投递到您自己的存储服务中,更多详情请参见创建单账号跟踪

操作步骤

  1. 访问ECS控制台-实例

  2. 在页面左侧顶部,选择目标资源所在的资源组和地域。

    地域

  3. 单击目标实例ID进入实例详情页,选择操作记录页签。

    默认会列出最近7ECS实例及其相关资源的所有操作记录。

    您可以按变更范围变更影响等级等过滤条件进一步筛查出关心的操作记录,支持的过滤条件如下表所示。

    名称

    描述

    变更范围

    影响ECS的操作,主要包括两大类:

    1. ECS实例的变更

      1. 实例配置变更:调整实例的硬件配置,如CPU核心数、内存大小、磁盘空间等。

      2. 实例状态变更:更改实例的状态,如从运行中切换到停止状态。

      3. 实例属性变更:修改实例的名称、描述、标签等信息。

      4. 实例计费变更:调整实例的计费模式,如从按量付费转变为包年包月。

      5. 实例创建或释放:创建:启动新的ECS实例,释放:终止不再需要的ECS实例。

      6. 实例启动和关闭:启动使停止状态的实例恢复运行,关闭暂停实例的运行。

      7. 系统内停止实例 - 节省停机模式:将实例置于节省停机模式,以减少不必要的费用。

    2. ECS关联资源的变更

      1. 创建或删除安全组:为实例或实例组创建新的安全组规则集合,删除不再需要的安全组。

      2. 安全组配置修改:修改安全组的规则,以允许或禁止某些类型的网络流量进入或离开实例。

      3. 关联安全组变更:更新与实例关联的安全组规则,调整实例的安全保护措施。

      4. 关联弹性网卡变更:对连接至实例的弹性网卡进行配置调整,如IP地址分配、子网设置等。

      5. 关联磁盘变更:调整与ECS实例相连的磁盘配置,如扩展磁盘空间或变更磁盘类型。

    读写类型

    操作的读写类型,目前仅支持写类型查询。

    时间范围

    支持查询过去90天内的变更记录,且起止日期的最大间隔为7天。

    变更影响等级

    不同的操作对ECS实例的影响等级不一样。变更影响等级包括:

    1. :这类操作可能会导致服务中断。例如,停止实例(StopInstance)、重启实例(RebootInstance)等操作。这些操作可能会影响您的业务运行,并且需要您提前做好数据备份和恢复策略。

    2. :这类操作通常不会导致服务中断,但在某些情况下可能会产生短暂的影响。例如,启动实例(StartInstance)等操作。在执行这些操作时,建议您关注实例的状态变化并及时处理可能出现的问题。

    3. :这类操作一般不会对业务造成影响。例如,创建云盘( CreateDisk)等操作。

    变更名称

    各资源的变更操作名称(即API名称)您可以在API概览中搜索查看对应的API说明。

    用户名

    执行变更操作的用户。

    关联资源ID

    变更操作对应的实例ID和实例名称,用以唯一标识与ECS实例相关联的资源。

  4. 在实例的操作记录页面,单击详情以查看实例及其关联资源的详细操作记录,您可以在管控事件结构定义中查阅详细描述。

案例介绍

某公司的IT部门正在使用阿里云的ECS实例来托管其关键业务应用。某天上午,公司的客户服务团队收到了大量关于网站响应非常慢的反馈。IT运维人员立即登录阿里云控制台进行问题排查。

1. 初步检查

IT运维人员首先过通云监控操作记录和阿里云的操作审计(ActionTrail)来获取最近对ECS实例的所有日志以及操作记录排查问题。

2222222222.png

2. 使用ECS操作记录

IT运维人员通过阿里云控制台进入了ECS操作记录页面,查看了过去几天内的所有相关操作记录,发现了一些变更等级高的异常操作。

11111.png

为了进一步详细定位问题通过查看ECS操作记录详情获取到了操作的详细信息,记录了“何时”、“何地”、“何种资源”、“被何人”执行了“何种操作”。

{
	"eventId": "11D139B3-BF38-5E16-B369-******",
	"eventVersion": 1,
	"responseElements": {
		"RequestId": "11D139B3-BF38-5E16-B369-******"
	},
	"eventSource": "ecs-cn-hangzhou-share.aliyuncs.com",
	"requestParameters": {
		"SourceRegionId": "cn-shanghai",
		"AcsProduct": "Ecs",
		"InstanceId": "i-uf******",
		"__referer__": "https://ecs.console.aliyun.com/server/region/cn-shanghai?instanceId=i-uf******&__refreshToken=1745474781230",
		"AcceptLanguage": "zh-CN",
		"ClientPort": 42079,
		"X-Acs-Client-Tls-Version": "TLSv1.3",
		"RegionId": "cn-shanghai",
		"InstanceType": "ecs.******",
		"X-Acs-Client-Tls-Cipher-Suite": "TLS_AES_256_GCM_SHA384"
	},
	"sourceIpAddress": "124.89.******",
	"userAgent": "ecs.console.aliyun.com",
	"eventRW": "Write",
	"eventType": [
		"spec",
		"instanceCost"
	],
	"referencedResources": {
		"ACS::ECS::Instance": [
			"i-uf******"
		]
	},
	"userIdentity": {
		"sessionContext": {
			"attributes": {
				"mfaAuthenticated": "false",
				"creationDate": "2025-04-24T06:06:54Z"
			}
		},
		"accountId": "5237******",
		"principalId": "523******",
		"type": "root-account",
		"userName": "ZhangSan"
	},
	"serviceName": "Ecs",
	"additionalEventData": {
		"CallerBid": "26888"
	},
	"apiVersion": "2014-05-26",
	"requestId": "11D139B3-BF38-5E16-B369-*******",
	"eventTime": "2025-04-24T06:06:54Z",
	"isGlobal": false,
	"acsRegion": "cn-shanghai",
	"eventName": "ModifyInstanceSpec",
	"resourceName": "i-uf*******",
	"userName": "root",
	"originEventType": "ConsoleOperation",
	"eventLevel": "high"
}
  • 何时eventTime表示操作时间。

  • 何地sourceIpAddress表示发起操作的IP地址。

  • 何种资源resourceName表示操作的资源。

  • 被何人accountIduserName表示操作者账户ID和名称。

  • 何种操作eventName表示执行操作名称。例如ModifyInstanceSpec操作表示对ECS实例规格进行了修改。

    说明

    操作名称(即API名称)您可以在API概览中搜索查看对应的API说明。

3. 分析操作记录

通过ECS操作记录,IT运维人员了解到这次配置调整是在前一天下午进行的。调整后没有立即发现问题,但随着时间推移,用户访问量增加,CPU使用率持续攀升至100%,最终导致线上业务受损。

4. 联系相关人员

IT运维人员联系了负责调整配置的工程师张三,询问具体的调整细节。张三回忆起在调整配置时,可能没有正确评估资源需求的变化,导致配置调整后性能不足。

5. 使用操作审计辅助分析

为了进一步确认和验证,IT运维人员还使用了阿里云的操作审计(ActionTrail)功能。操作审计提供了更详细的日志信息,包括API调用的具体参数和事件ID等。并且通过操作审计事件查询确认了没有对该账号下的其他实例进行修改。

image

6. 恢复并优化配置

根据ECS操作记录和操作审计提供的信息,IT运维人员决定恢复之前的配置设置,并根据当前的实际负载情况重新评估和调整资源配置。具体步骤如下:

  • 恢复配置:将ECS实例的CPU和内存配额手动恢复到之前的设置。

  • 监控性能:恢复配置后,持续监控ECS实例的性能,确保服务恢复正常。

  • 重新评估:重新评估资源需求,并制定一个更合理的资源配置方案。