如何收集操作系统宕机后的内核转储信息?

背景信息 阿里云技术支持人员可以通过在转储文件中找到对应的信息,从而分析操作系统宕机的原因,并同步给用户。说明 您也可以通过Windows平台的 WinDbg 工具和Linux平台的 crash 工具来检查操作系统内核的转储文件。Linux实例 远程连接ECS...

Windows系统实例的宕机问题排查

定位宕机原因 您可以通过以下方式,定位ECS实例发生宕机的具体原因。方式一:(推荐)通过自助诊断工具定位 登录 ECS管理控制台,左侧导航栏单击 自助问题排查。单击 实例问题排查 页签。选择 实例无法连接或启动异常>实例出现宕机,然后...

主机选项说明

开启会话备注 登录主机时需要写明登录主机的原因或目的才可登录,便于事后审计。开启历史会话审计 表示允许堡垒对运维会话内容进行审计,关闭后会产生会话记录,但没有具体内容。开启实时会话监控 表示管理员可以对主机进行实时监控,...

什么是AI分布式训练通信优化库AIACC-ACSpeed

优化方法 相比较传统的ring-allreduce算法,ACSpeed设计的hybrid-allreduce算法实现了单机和多机的分层训练,充分利用单机内部高速带宽同时降低多机之间低速网络的通信量,并且针对阿里云不同机型的网卡和GPU距离的拓扑特点,实现多种不同...

设置宕机自动迁移

为了降低物理故障对业务的影响,阿里云为您提供专有宿主机DDH宕机自动迁移的功能。本章节介绍在创建DDH后如何开启或者关闭宕机自动迁移。背景信息 宕机自动迁移开启后,当DDH因故障停机时,会自动迁移至健康的DDH。若您未开启宕机自动迁移...

堡垒无法连接ECS排查步骤

问题描述 堡垒机调用ECS失败 可能原因【可能原因一】堡垒机到ECS服务器的网路端口通信失败【可能原因二】堡垒机的相关配置影响【可能原因三】ECS 系统自身的相关策略影响 解决方案【可能原因一】堡垒机到ECS服务器的网路端口通信失败【解决...

什么是AI通信加速库Deepnccl

scatter等算法,Hybrid+算法支持单机和多机的分层通信,充分利用单机内部高速带宽的同时降低了多机之间的通信量,通信算子编译优化方案相比NCCL原生在性能上提升了50%以上。通信多流优化:通常情况下,因网络带宽没有被充分利用,会导致...

什么是Deepytorch Training(训练加速)

scatter等算法,Hybrid+算法支持单机和多机的分层通信,充分利用单机内部高速带宽的同时降低了多机之间的通信量,通信算子编译优化方案相比NCCL原生在性能上提升了50%以上。通信多流优化:通常情况下,因网络带宽没有被充分利用,会导致...

主备方案介绍

故障自动容错原理:单机宕机和集群宕机测试结果如下。以下是单机宕机吞吐对比图和单机宕机平均响应对比图。以下是集群宕机吞吐对比图和集群宕机平均响应对比图。主备容灾原理介绍 当云数据库HBase实例因不可预料的原因(例如设备故障、机房...

经典网络和专有网络互通

确保和经典网络ECS实例通信的交换机的网段在10.111.0.0/16内。192.168.0.0/16 该VPC中不存在目标网段为10.0.0.0/8的自定义路由条目。需要在经典网络ECS实例中增加192.168.0.0/16指向私网网卡的路由。您可以使用提供的脚本添加路由,下载 ...

系统设置

网络设置 启用网络通信:设置指令系统与授权主机之间的通信状态,启用网络通信服务。授权地址:设置网络通信后端服务地址。服务主机:设置网络通信后端服务主机。服务路径:网络通信后端服务路径。消息设置 启用消息通信:启动网络消息通信...

在经典网络中使用SSL-VPN

确保和经典网络ECS实例通信的交换机的网段在10.111.0.0/16内。192.168.0.0/16 该VPC中不存在目标网段为10.0.0.0/8的自定义路由条目。需要在经典网络ECS实例中增加192.168.0.0/16指向私网网卡的路由。您可以使用提供的脚本添加路由,下载 ...

单机旁挂动态路由上云

配置OSPF动态路由协议,建立智能接入网关设备和三层交换机的网络通信通道。在 设备管理 页签左侧区域,单击 路由管理。在 OSPF协议配置 区域,单击 编辑。在 配置OSPF路由协议 页面,输入规划好的IP地址信息,然后单击 确定。参数 说明 ...

云边通信组件Raven概述

为提升云边运维和监控能力,ACK Edge集群 引入了云边通信组件Raven。本文介绍Raven组件的基本概念、工作原理以及功能说明。云边协同架构的 跨地域网络通信 ACK Edge集群 采用中心云管理边缘IDC以及边缘设备的云边协同架构。分散在边缘侧的...

常见问题

否则说明事务云服务已宕机或者网络已中断。分布式事务 SDK 与事务云服务网络连接正常,但是通信失败,是什么原因?TCP 连接正常,说明事务云服务启动正常。分布式事务 SDK 与事务云服务通信返回失败消息,说明 SDK 发送给事务云服务的消息...

告警规则指标说明

JVM实例数 无 是 当前实时运行的Java虚拟机实例数量,常用于服务宕机告警配置。节点机发送的字节数 无 不是 节点机通过网络连接发送的数据量,其中包括应用程序发送的数据、系统消息和错误信息等。节点机发送的报文数 无 不是 节点机通过...

网络最大传输单元MTU

因此为了更好的性能,建议在MTU不匹配的通信场景下,通过 ModifyInstanceAttribute 接口关闭巨型帧,并重启ECS实例生效。ECS实例响应PMTUD机制依赖操作系统支持,要求操作系统支持且打开了PMTU响应(例如在Linux系统中,/proc/sys/...

DescribeDedicatedHosts-查询专有宿主机详细信息

ddh.g5 LockReason string 否 专有宿主机被锁定的原因。取值范围:financial:因欠费被锁定。security:因安全原因被锁定。financial PageNumber integer 否 响应信息的页码数。默认值:1。1 PageSize integer 否 响应信息的每页行数。最大...

在容器(Docker)中配置eRDMA

sudo docker run-net=host --device=/dev/infiniband/uverbs0 --device=/dev/infiniband/rdma_cm --ulimit memlock=-1 -t -i <IMAGE ID> /bin/bash其中:net=host :配置容器的通信模式为 host。容器内的应用程序可以直接使用主机的网络接口...

蓝牙设备端开发

设备端Breeze SDK Breeze协议规定了接入阿里云IoT生活物联网平台的BLE设备与移动端App之间的通信协议,为了方便用户实现更快速的接入,生活物联网设备端SDK提供了Breeze协议的代码实现:Breeze SDK,其结构框图如下所示。HAL层:Breeze SDK...

功能发布记录

全部 ACK Edge发布Kubernetes 1.26版本说明 云边通信方案升级 从v1.26起,ACK Edge集群 新增支持云边节点池维度的网络通信,相比于原有方案实现了高可用、弹性伸缩能力,提供云边容器级别监控运维。新方案中由Raven组件负责云边通信,可...

交换机开通IPv6

如果交换机有和其他专有网络的交换机或本地数据中心通信的需求,请确保交换机的网段和要通信的网段不冲突。交换机网段不能与所属VPC路由表中路由的目标网段范围相同或大于该范围。重要 交换机创建后,不能再修改网段。IPv6网段 交换机的IPv...

SDK相关FAQ

一键登录和本号码校验相关FAQ 问题概览 首次取号时,App网络通信正常,但号码认证一直失败的原因?checkEnvAvailable函数返回false?Android双卡手机一键登录过程中,使用哪张移动数据卡进行认证?若终端使用的是中国联通SIM卡的5G移动...

VPC开通IPv6

如果交换机有和其他VPC的交换机或本地数据中心通信的需求,请确保交换机的网段和要通信的网段不冲突。交换机网段不能与所属VPC路由表中路由的目标网段范围相同或大于该范围。重要 交换机创建后,不能再修改网段。IPv6网段 配置交换机的IPv6...

搭建IPv6专有网络

如果交换机有和其他VPC的交换机或本地数据中心通信的需求,请确保交换机的网段和要通信的网段不冲突。说明 交换机创建后,不能再修改网段。IPv6网段 配置交换机的IPv6网段。交换机的IPv6网段的掩码默认为/64,您可以输入十进制数字0~255,...

搭建IPv6专有网络

如果交换机有和其他VPC的交换机或本地数据中心通信的需求,请确保交换机的网段和要通信的网段不冲突。说明 交换机创建后,不能再修改网段。IPv6网段 配置交换机的IPv6网段。交换机的IPv6网段的掩码默认为/64,您可以输入十进制数字0~255,...

搭建IPv4专有网络

如果交换机有和其他VPC的交换机或本地数据中心通信的需求,请确保交换机的网段和要通信的网段不冲突。说明 交换机创建后,不能再修改网段。IPv6网段 为交换机开启IPv6网段并配置交换机的IPv6网段。说明 如果您的VPC已分配IPv6网段,则需要...

创建和管理交换机

如果交换机有和其他VPC的交换机或本地数据中心通信的需求,请确保交换机的网段和要通信的网段不冲突。说明 交换机创建成功后,不能再修改网段。IPv6网段 为交换机开启IPv6网段并配置交换机的IPv6网段。说明 如果您的VPC已分配IPv6网段,则...

M2M设备间通信

M2M(即Machine-to-Machine)是一种端对端通信技术。本章节以智能灯和手机App连接为例,分别使用规则引擎数据流转和Topic消息路由来实现M2M设备间通信,主要介绍如何基于物联网平台构建一个M2M设备间通信架构。智能灯与手机App的连接和通信...

创建和管理专有网络

如果交换机有和其他VPC的交换机或本地数据中心通信的需求,请确保交换机的网段和要通信的网段不冲突。说明 交换机创建后,不能再修改网段。IPv6网段 为交换机开启IPv6网段并配置交换机的IPv6网段。说明 如果您的VPC已分配IPv6网段,则需要...

支持IPv6专有网络下的资源访问IPv6互联网

如果交换机有和其他VPC的交换机或本地数据中心通信的需求,请确保交换机的网段和要通信的网段不冲突。说明 交换机创建后,不能再修改网段。IPv6网段 配置交换机的IPv6网段。交换机的IPv6网段的掩码默认为/64,您可以输入十进制数字0~255,...

准备工作

如果交换机有和其他专有网络的交换机或本地数据中心通信的需求,请确保交换机的网段和要通信的网段不冲突。说明 交换机创建后,不能再修改网段。可用IP数 显示可以使用的IP地址的数量。IPv6网段 交换机的IPv6网段。交换机的IPv6网段的掩码...

自有边缘主机接入实践

登录边缘主机,根据主机型号在主机上运行以下命令,安装连接通信的软件,使边缘主机能够接入物联网边缘计算并进行通信。命令中${new_sn} 需要替换为上一步中输入的主机序列号(SN)。主机型号 命令行 LE-C-BoxStd curl-s ...

查询网络通信距离(NCD)

使用NCD的原因 存在的问题 在特定物理网络拓扑下,不同GPU节点之间的通信时延和可能产生的跨多跳交换转发引发的哈希不均,都可能导致不同GPU节点之间的通信性能存在较大差异,进而进一步影响模型训练的吞吐差异。解决方法 如上图所示,...

创建和管理路由表

您可以在 已绑定交换机 页签,在 交换机 列单击交换机的ID,跳转到交换机详情页面,然后单击 路由管理 页签,在 已绑定路由表 处,查看该交换机绑定的路由表为自定义路由表。解绑交换机和路由表 在路由表详情页面,单击 已绑定交换机 页签...

子网路由

您可以在专有网络VPC(Virtual Private Cloud)内创建自定义路由表,并在自定义路由表中添加自定义路由条目,然后将自定义路由表绑定至交换机来控制该交换机的流量,方便您更灵活地进行网络管理,以上操作被称为子网路由。背景信息 完成...

路由表概述

一个交换机只能绑定一张路由表,交换机的路由策略由其关联的路由表管理。多个交换机可以绑定同一张路由表。交换机创建后,该交换机默认与系统路由表绑定。如果您需要将交换机绑定的自定义路由表更换成系统路由表,直接将自定义路由表与交换...

基于eRDMA增强型实例部署AI训练集群

主流AI框架底层通过多种不同的通信后端进行多或多卡通信,例如:MPI/Gloo后端多用于CPU的控制流通信。NCCL是由NVIDIA开源的GPU多多卡实现,旨在提供高效的大数据流通信。因此,它在性能优化方面具有得天独厚的优势,被广泛应用于主流AI...

产品优势

需自行发现宕机并完成迁移,迁移时服务会中断。稳定性无法保障。简单易用 一站式网络管理、实时管理覆盖区、无缝连接阿里云产品与物联网平台,用户搭建灵活简便。需要购买服务器搭建负载均衡分布式架构,需要花费大量人力物力开发“接入+...

通信消息相关问题

本文介绍设备与物联网平台和物联网平台与服务器端的通信相关问题和解决方法。类目 问题 上下行消息 设备重复收到消息,如何去重?设备使用MQTT协议接入物联网平台后,接收不到通信数据,怎么办?物联网平台发送消息比较慢,存在超时情况,...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
短信服务 运维安全中心(堡垒机) 云数据库 Redis 版 物联网无线连接服务 边缘网络加速 弹性公网IP
新人特惠 爆款特惠 最新活动 免费试用