Spark

原因和解决方法如下:原因1:Executor进程使用的内存超出限制。Spark Executor除了JVM本身使用的内存外,还包括堆外内存(Shuffle、Cache),以及Python UDF等使用的内存。容器使用的内存超过了容器允许使用内存的限制,导致Spark进程被...

离线调度

id age sex duration place ctr dt 0 49 1 9 0 0 20160919 1 17 1 3 1 1 20160919 2 44 0 4 0 0 20160919 3 14 1 9 1 0 20160919 4 44 1 5 4 0 20160919 5 10 1 9 3 1 20160919 6 42 1 7 3 0 20160919 7 51 1 3 1 1 20160919 8 18 0 3 3 0 ...

Windows系统实例的宕机问题排查

更多信息,请参见 常见宕机原因和解决方案。方式二:通过系统事件定位 登录 ECS管理控制台,左侧导航栏单击 事件。在左侧导航栏单击 非预期运维事件。单击发生宕机运维事件实例右侧的 诊断操作系统错误根因,诊断实例宕机原因。根据返回的...

SKEWJOIN HINT

说明 方法3直接指定值的处理效率比方法1和方法2(不指定值)高。实现原理 热值Key指出现次数很多的key值。例如下图中红色部分,a.c0=1 and a.c1=2 有10000行,a.c0=3 and a.c1=4 有9000行。在不加SkewJoin Hint的情况下,将表T0表T1进行...

SKEWJOIN HINT

说明 方法3直接指定值的处理效率比方法1和方法2(不指定值)高。实现原理 热值Key指出现次数很多的key值。例如下图中红色部分,a.c0=1 and a.c1=2 有10000行,a.c0=3 and a.c1=4 有9000行。在不加SkewJoin Hint的情况下,将表T0表T1进行...

常见报错

本文介绍常见的报错,以及产生报错的原因和解决方法。写入Elasticsearch异常:HTTP/1.1 413 Request Entity Too Large 报错原因 Elasticsearch中设置内容的最大容量参数为 http.max_content_length ,该参数的默认值是100 MB,而且不建议...

Linux系统实例的宕机问题排查

常见宕机原因和解决方案 实例宕机并产生日志“not syncing:Out of memory:system-wide panic_on_oom is enabled”问题描述 Linux操作系统的ECS实例在运行过程中宕机,产生了“not syncing:Out of memory:system-wide panic_on_oom is ...

常见报错

本文介绍配置任务任务运行时系统返回的报错信息(如重试信息或错误码)以及解决方法。说明 本文以正则表达式((.*)?的形式表示报错信息中的变量。若报错无法解决,您可以 通过钉钉(钉钉通讯客户端下载地址)进入到DTS客户交流钉钉群...

使用实例时镜像相关问题

具体的原因和解决方案,请参见 Ubuntu 18.04版本的ECS实例中启动安骑士进程后系统负载较高。FreeBSD镜像问题 FreeBSD系统如何打补丁编译内核?阿里云的FreeBSD公共镜像已为内核添加了补丁,已满足系列V及以上的实例规格族的启动需求。具体...

访问控制常见问题

配置限制访问CDN资源的用户时,如果遇到疑问请参考以下常见问题及处理建议。...远程鉴权服务器发生故障或宕机时,CDN与鉴权服务器之间的数据交互超时后,按照设置的 鉴权超时之后的动作 参数,选择是否放行鉴权超时的用户请求。

AD FS无影云电脑AD用户实现SSO

如果 无影云电脑 已经对接企业AD,您可以参考本文配置AD FS 无影云电脑 之间的SSO。配置SSO后,当终端用户使用AD账号登录 无影终端 时,在AD FS页面通过验证AD用户信息方可成功登录。准备工作 已完成企业AD和 无影云电脑 对接并创建企业...

主备双活

宕机测试 单机宕机吞吐对比 单机宕机平均响应对比 集群宕机吞吐对比 集群宕机平均响应对比 使用方法 准备 使用云HBase主备容灾方案参见 主备容灾。在高可用管理页面获取高可用链接地址高可用实例ID。客户端依赖版本。hbase1.X版本使用...

CentOS7实例随机性宕机问题

问题原因 CentOS7.57.6内核加入支持磁盘 mq-deadline elevator 的补丁,由于此补丁有Bug,会导致磁盘请求的 nr_phys_segments 有可能超过磁盘参数 max_segments 设置,virtio block 驱动代码检测到这个错误后,会主动触发内核异常。...

常见退信内容分析

提示信息 退信原因 解决方法 User not found/User unknown/No such user/Invalid User/No exist/Mailbox not found/invalid address(#5.5.0)指收件人不可用,或者收件人不存在而导致投递失败。请重新核实对方邮件地址的真实性。Dns,Host/...

驱逐及防护

当某节点因宕机或其他原因处于NotReady异常状态时,ACS将启动节点自愈流程,此时节点上的Pod将会被驱逐。节点升级:升级节点内核或其他模块时,可能需要触发节点重启操作,在节点重启前,ACS会先将节点上的所有Pod进行驱逐。资源调度运营:...

主备方案介绍

故障自动容错原理:单机宕机和集群宕机测试结果如下。以下是单机宕机吞吐对比图单机宕机平均响应对比图。以下是集群宕机吞吐对比图集群宕机平均响应对比图。主备容灾原理介绍 当云数据库HBase实例因不可预料的原因(例如设备故障、机房...

如何收集操作系统宕机后的内核转储信息?

背景信息 阿里云技术支持人员可以通过在转储文件中找到对应的信息,从而分析操作系统宕机原因,并同步给用户。说明 您也可以通过Windows平台的 WinDbg 工具Linux平台的 crash 工具来检查操作系统内核的转储文件。Linux实例 远程连接ECS...

网站耗资源(客户程序故障)常见问题

由于我们是对主机服务器进行实时监控的,出现问题后必须马上采取措施,否则将会导致服务器宕机,所以发出此通知信的同时,已将您的网站暂停,希望您能理解,因此给您带来的不便向您表示深深的歉意,谢谢您的支持与理解。云虚拟主机会因为...

Hologres SQL语句的常见问题

解决方法:提交工单排查Hologres实例宕机原因。报错:value too long for type character varying(256)问题原因:字段长度超过了VARCHAR类型的长度限制。解决方法:处理数据或将VARCHAR的长度设置得更长。报错:internal error:Write is ...

多场景最佳实践,立即探索无影的无限可能

软件开发场景 传统的办公电脑企业管理方法应对企业信息安全方面存在较多的安全风险。随着企业办公向开发外包或BYOD(Bring Your Own Device)等方向发展,保证开发环境在不同场景、不同终端下的安全性可靠性,防止核心数据丢失泄密...

诊断项与诊断结果说明

实例健康诊断功能是一种自助诊断方式,可以对实例的计算服务状态、存储服务状态、网络服务状态、实例配置管理实例操作系统内相关配置进行全方位的诊断,帮助您了解实例的健康情况,及时发现并解决常见的问题。本文介绍轻量应用服务器支持...

Alibaba Cloud Linux 2系统的ECS实例中...异常导致系统宕机

问题描述 在符合如下条件的Alibaba Cloud Linux 2实例中,系统运行时出现系统宕机问题。镜像:Alibaba Cloud Linux 2.1903 LTS 64位。内核:kernel-4.19.91-23.al7及之前的内核版本。系统宕机,且出现如下调用栈信息。[332.057218]watchdog...

Alibaba Cloud Linux 2系统的ECS实例中...异常导致系统宕机

问题描述 在符合如下条件的Alibaba Cloud Linux 2实例中,系统运行时出现系统宕机问题。镜像:Alibaba Cloud Linux 2.1903 LTS 64位。内核:kernel-4.19.91-23.al7及之前的内核版本。系统宕机,且出现如下调用栈信息。[332.057218]watchdog...

使用限制

受保护服务器不支持断电重启(包括但不限于ECS强制关机、ECS宕机等),断电重启会导致容灾复制失败。受保护服务器不支持磁盘缩容减盘操作,这些操作会导致容灾复制失败。Windows系统不支持磁盘扩容或加盘操作,这些操作会导致容灾复制...

云盒计算资源配置最佳实践

冗余的算力配置,可以大幅提升硬件风险应对能力 云盒提供的IaaS层稳定性,依赖于云上提前预测硬件故障的算法能力,以及宕机迁移热迁移能力。这些能力可以有效提升云盒IaaS层的故障风险应对能力,但也需要一定的冗余资源,以便在硬件...

阿里邮箱AD同步&认证

AD系统宕机则无法继续登录邮箱。阿里支持主备AD进行认证,避免一台机器宕机后无法继续登录邮箱。三、实现场景对比 支持的三类场景:只做同步不做认证、只做认证不做同步、既做同步又做认证。三类场景略有区别,且有需要特别注意的地方。...

DMS执行数据变更任务时发生“No operations allowed ...

主要有如下几种问题场景:实例宕机 会话连接被人为结束(会话被kill)会话连接超时,连接自动断开 解决方案 根据不同的问题场景,解决方法也不一致:实例宕机:若您是RDS实例:此问题一般在10分钟内会自动修复,请您在10分钟后重新执行任务...

Batch-批量调用API

00]id string 是 子请求 id,用于 request response 关联,不允许重复 93433894994ad2e1 method string 是 子请求的方法,支持:POST GET PUT DELETE HEAD POST url string 是 url 子请求的 api path 路径,支持:/file/get(获取文件...

诊断项与诊断结果说明

检查该实例的操作系统(Guest OS)内部是否存在内核Panic、OOM异常或内部宕机等故障。此类故障可能是由于实例配置不当或用户空间的程序配置不当导致的,您可以尝试通过重启实例进行恢复。实例虚拟化异常 实例在运行中出现崩溃或出现异常...

在Windows系统的ECS实例中安装AD域控制器的注意事项及...

问题原因 可能有以下几点原因导致:AD域控制器客户端的 TCP/IP NetBIOS Helper Remote Registry 服务没有启动。客户端与AD域控制器的DNS配置错误。客户端和AD域控制器的SID造成冲突。防火墙及安全软件进行了拦截。解决方案 请参考以下...

故障管理

故障管理是源于ITIL的一个概念,在IT企业或者互联网企业进行故障管理的目的是当生产环境出现重大宕机时尽快恢复正常的服务运营,将组件失败对业务所造成的负面影响降到最低,从而确保满足事先与业务客户之间所约定的服务级别的目标服务...

企业认证失败有哪些常见原因

概述 本文介绍企业认证时出现认证失败原因以及解决方法。详细信息 企业认证常见失败原因如下,可以根据具体的失败原因修改后重新上传资料认证:【营业执照】:1、截屏照片对电脑拍摄的证件照片均无效,提交的营业执照或组织机构代码证...

常见问题

否则说明事务云服务已宕机或者网络已中断。分布式事务 SDK 与事务云服务网络连接正常,但是通信失败,是什么原因?TCP 连接正常,说明事务云服务启动正常。分布式事务 SDK 与事务云服务通信返回失败消息,说明 SDK 发送给事务云服务的消息...

使用Azure AD进行角色SSO的示例

本文提供一个以Azure AD(Azure Active Directory)与阿里云进行角色SSO的示例,帮助用户理解企业IdP与阿里云进行SSO的端到端配置流程。背景信息 在本示例中,企业拥有一个阿里云账号(Account1一个Azure AD租户。在Azure AD租户中,您...

实例之间无法互相访问AD域或同时加入AD域怎么办?

本文介绍如何解决实例之间无法互相访问AD域,或者无法同时加入AD域的问题。问题描述 使用同一个Windows Server镜像创建几台ECS实例后,实例之间无法互相访问AD域,或者无法同时加入AD域。问题原因 使用同一个Windows Server镜像的几台实例...

SAP HANA Scale-Out 部署指南

SAP HANA Scale-Out 部署指南 概述 架构总览 资源规划 前期准备 阿里云账号 VPC ECS实例 ECS Metrics Collector的安装 文件存储NAS ECS宕机迁移 HANA安装 维护主机名 创建文件系统 准备OS以及安装包 安装SAP HANA 验证集群安装 版本管理 ...

Alibaba Cloud Linux 2系统的ECS实例中...系统宕机如何处理...

本文介绍如何解决Alibaba Cloud Linux 2系统的ECS实例中使用已释放的文件系统inode导致系统宕机问题。问题描述 在符合如下条件的Alibaba Cloud Linux 2实例中,系统运行时出现系统宕机问题。镜像:Alibaba Cloud Linux 2.1903 LTS 64位 ...

Alibaba Cloud Linux 2系统的ECS实例中...系统宕机如何处理...

本文介绍如何解决Alibaba Cloud Linux 2系统的ECS实例中使用已释放的文件系统inode导致系统宕机问题。问题描述 在符合如下条件的Alibaba Cloud Linux 2实例中,系统运行时出现系统宕机问题。镜像:Alibaba Cloud Linux 2.1903 LTS 64位 ...

ECS实例宕机并报错“Out of memory and no killable ...

如果您的ECS实例出现宕机,并且报错日志中存在 Out of memory and no killable processes 信息,则可以参考本文提供的方案解决问题。问题现象 ECS实例在运行过程中出现宕机,并且有类似于如下所示的调用栈:[28663.625353][pid]uid tgid ...

过载保护

本文介绍了过载保护功能的原理使用方法。背景 当用户做促销活动时,数据库主库的CPU资源容易负载过高,这时就需要对数据库进行变配(升级),但变配的过程中整个集群的请求可能都会路由到主节点,导致主节点CPU资源超负载甚至雪崩,从而...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
Web应用防火墙 云服务器 ECS DDoS防护 应用身份服务 (IDaaS) 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用