网络拓扑概述

网络拓扑图可以清晰地展示网络中资源的连接和关系,可视化网络结构,帮助您快速了解您的云上网络架构,进行网络配置验证、网络问题排查和云网络资源统一运维。...使用网络拓扑 使用专有网络拓扑 使用云企业网拓扑 使用负载均衡拓扑

观测组网与流量

更多信息 使用专有网络拓扑 使用云企业网拓扑 使用负载均衡拓扑 查看业务流量分布 您可以通过NIS流量分析功能来查看公网、跨域、混合云、同域跨VPC场景下的流量分布情况。本文以公网流量分析为例。开通NIS公网流量分析功能 首次使用公网...

开启网格拓扑提高可观测性

将 登录 Redirect URI 配置为网格拓扑的负载均衡CLB的IP访问地址(直接通过CLB访问网格拓扑)或者ASM网关的地址(使用ASM网关访问网格拓扑)。配置示例如下:如果通过CLB访问网格拓扑,且网格拓扑的负载均衡CLB的IP为 xxx.xxx.xxx.xxx,则 ...

开启网格拓扑提高可观测性

将 登录 Redirect URI 配置为网格拓扑的负载均衡CLB的IP访问地址(直接通过CLB访问网格拓扑)或者ASM网关的地址(使用ASM网关访问网格拓扑)。配置示例如下:如果通过CLB访问网格拓扑,且网格拓扑的负载均衡CLB的IP为 xxx.xxx.xxx.xxx,则 ...

查看应用的网格拓扑

如果您需要观测多个集群的流量拓扑,可以使用托管模式的网格拓扑功能。整个网格实例只需要部署一个网格拓扑服务,减少配置的工作量。具体操作,请参见 开启托管模式的网格拓扑。您可以对实例进行网格诊断,例如数据平面版本检查、服务端口...

使用跨 zone 网关

在任务拓扑中,您可以通过使用跨 zone 网关,将多个 zone 的节点任务添加到一个拓扑编排中,实现任务跨 zone 编排。说明 跨 zone 网关仅适用于开启了共享 LDC 功能的用户。操作步骤 创建拓扑子任务。创建两个或两个以上的简单或集群任务,...

资源调度概述

功能 描述 参考文档 Pod拓扑分布约束 您可以使用拓扑分布约束(Topology Spread Constraints)控制Pod 在集群内故障域之间的分布,有助于实现高可用或者节省成本。目前ACS支持可用区(Zone)拓扑域。可用区打散及亲和调度 Pod间亲和与反...

集群高可用架构推荐配置

关于如何在ACK集群中使用拓扑感知调度能力,例如使Pod在多个拓扑域中重试或将Pod调度到属于同一低延时部署集的ECS中,请参见 拓扑感知调度。虚拟节点高可用配置 您可以借助ACK虚拟节点将Pod快速地调度到弹性容器实例ECI上运行。使用ECI时,...

ack-koordinator(ack-slo-manager)

ack-koordinator是ACK支持差异化SLO(Service Level Objectives)能力的核心应用,在保证应用服务质量的同时,充分提升资源使用效率。本文介绍ack-koordinator组件的信息、使用说明和变更记录。前提条件 ack-koordinator仅支持1.18.0以上...

如何进行HLS打包

拓扑示意图:完整的场景示例使用拓扑结构,示例代码如下:{"Activities":{"package-node":{"Name":"package-node","Parameters":{"Output":"{\"Bucket\":\"processedmediafile\",\"Location\":\"oss-cn-hangzhou\",\"MasterPlayListName\":...

如何进行DASH打包

拓扑图示意:完整的场景示例用拓扑结构表示:{"Activities":{"act-package":{"Name":"act-package","Parameters":{"Output":"{\"Bucket\":\"outputbucketname\",\"Location\":\"oss-cn-hangzhou\",\"MasterPlayListName\":\"dashpackage/{...

使用限制

购买电口,线路接入类型必须是电路,请要求运营商用电路接入阿里云的专线端口。阿里机房不支持托管任何光电转换设备,施工方携带的任何光电设备无法安装到阿里机房。政策封网或阿里集团封网都将影响专线延时施工,若遇到阿里集团封网,请向...

什么是网络智能服务

快速了解网络架构 识别网络可达组网 统一运维网络资源 网络拓扑概述 使用专有网络拓扑 使用云企业网拓扑 使用负载均衡拓扑 基础设施性能 性能观测 提供阿里云内及互联网间的网络平均时延数据,为搭建服务时选择地域或可用区提供参考。...

GPU拓扑感知调度

Kubernetes对节点的GPU拓扑信息不感知,调度过程中对GPU的选择...关于GPU拓扑感知调度如何使用,请参见以下文档:GPU拓扑感知调度概述 安装GPU拓扑感知组件 Tensorflow分布式训练使用GPU拓扑感知调度 Pytorch分布式训练使用GPU拓扑感知调度

开启托管模式的网格拓扑

当您需要观测多个集群的流量拓扑,可以使用托管模式的网格拓扑功能。托管模式将网格拓扑服务以弹性容器实例(ECI)的方式部署,提高服务可靠性和易用性。整个网格实例只需要部署一个网格拓扑服务,减少配置的工作量。前提条件 已创建...

管理集群

ACK灵骏集群 的管理体验与 ACK集群Pro版 基本一致。您可以通过容器服务管理控制台来管理 ACK灵骏集群。集群管理项 说明 授权管理 与 ACK集群Pro...GPU拓扑感知调度概述 使用GPU拓扑感知调度(Tensorflow版)使用GPU拓扑感知调度(Pytorch版)

GPU拓扑感知调度概述

本文简要描述了GPU拓扑分布情况,以及GPU拓扑感知调度的优势。GPU拓扑分布 下图为NVLink连接8个Tesla V100的混合立体网络拓扑。...相关文档 安装GPU拓扑感知调度组件 使用GPU拓扑感知调度(Tensorflow版)使用GPU拓扑感知调度(Pytorch版)

拓扑任务版本

拓扑版本生命周期 生命周期示意图:状态 说明 可用操作 已发布 当前正在使用拓扑版本。处于“编辑中”或“已归档”状态的版本被发布后,会变更为“已发布”状态。只能有一个版本能处于“已发布”状态。查看 编辑中 新建或正在编辑中的...

CPU拓扑感知调度

本文介绍如何使用CPU拓扑感知调度。前提条件 您已创建ACK Pro版集群。具体步骤,请参见 创建ACK Pro版集群。重要 目前CPU拓扑感知调度仅支持ACK Pro托管版集群。如果您需要专有版集群,请 提交工单 申请白名单。在使用CPU拓扑感知调度前,...

CPU拓扑感知调度

该策略能够对计算密集性负载,有效避免进程的物理核心争及跨片内存访问,最大化利用碎片化CPU,在不改变硬件及虚拟机资源的前提下为密集计算型负载优化可用资源,进一步提升CPU使用率。关于CPU拓扑感知调度的实现原理,请参见 Practice ...

GPU调度概述

本文介绍调度GPU资源的不同方法,包括使用Kubernetes默认GPU调度、提升GPU资源使用率的共享GPU调度、以及加速任务执行的GPU拓扑感知调度。普通GPU调度 申请Kubernetes GPU集群后,通过运行TensorFlow的GPU实验环境,关于如何使用Kubernetes...

Pod 拓扑分布约束及Pod亲和与反亲和调度

也可以使用 Pod 拓扑分布约束控制 Pod 部署到不同的拓扑域,也一样可以实现高可用。因为 ACS 通过虚拟节点与 Kubernetes 实现无缝对接,ACS 限制了 Pod 拓扑分布约束(Pod Topology Spread Constraints)、Pod 间亲和与 Pod 间反亲和...

功能发布记录

全部 v1.18及以上 企业版、旗舰版 流量泳道概述 使用严格模式流量泳道实现全链路流量管理 使用宽松模式流量泳道实现全链路流量管理 发布网格拓扑2.0,支持以托管模式开启网格拓扑。相比于数据面Kubernetes集群内部署模式启用的网格拓扑,...

HDFS高可用相关命令(HaAdmin)介绍

对应的HDFS的部署拓扑结构,请参见 HDFS的部署拓扑使用限制 创建集群时,已开启服务高可用。查看所有NameNode的状态 执行 hdfs haadmin-getAllServiceState 命令,返回所有NameNode的高可状态。例如:su hdfs hdfs haadmin-...

容灾大屏

容灾架构拓扑使用指南 说明 容灾大屏仅展示当前多活实例对应的容灾架构。同城多活容灾 登录 AHAS控制台。在左侧导航栏,单击 多活实例。在 多活实例 页面,单击目标实例的 实例名称/ID 进入多活实例详情页面。在多活实例详情页面,选择 ...

使用GPU拓扑感知调度(Tensorflow版)

arena logs-f tensorflow-4-resnet50 预期输出:total images/sec:745.38 性能对比 基于以上4个测试例性能对比结果如下:基于对比图,可知经过GPU拓扑感知调度后,TensorFlow分布式训练的效果有了很大的提升。重要 本文提供的性能数据仅...

子设备认证与连接

步骤2:批量添加拓扑 关系 使用同步接口 aiot_gateway_batch_add_topo 添加拓扑关系,返回值为 STATE_SUCCESS 表示添加成功。子设备添加topo*/res=aiot_gateway_batch_add_topo(gateway_device,sub_device_meta,subdev_num);if(res>=STATE_...

使用GPU拓扑感知调度(Pytorch版)

313.0+-1.3 Total img/sec on 4 GPU(s):1251.8+-5.3 性能对比 基于如上4个测试例性能对比结果如下:基于上图性能对比,可知经过GPU拓扑感知调度后,PyTorch分布式训练的效果有了很大的提升。重要 本文提供的性能数据仅为理论值,GPU拓扑...

通过ack-co-scheduler组件实现协同调度

使用以下模板在Deployment中使用CPU拓扑感知调度。关于CPU拓扑感知调度的更多信息,请参见 CPU拓扑感知调度。apiVersion:apps/v1 kind:Deployment metadata:name:nginx-numa labels:app:nginx-numa spec:replicas:2 selector:matchLabels:...

动态修改Pod资源参数

对于正式的常规性运维操作,强烈建议您使用 CPU Burst性能优化策略、CPU拓扑感知调度、资源画像 等功能。修改内存限制参数 您可以通过Cgroup动态修改容器的内存限制,具体操作步骤如下。说明 修改内存限制参数的功能仅支持K8s 1.22及更早...

动态修改Pod资源参数

对于正式的常规性运维操作,强烈建议您使用 CPU Burst性能优化策略、CPU拓扑感知调度、资源画像 等功能。修改内存限制参数 您可以通过Cgroup动态修改容器的内存限制,具体操作步骤如下。说明 修改内存限制参数的功能仅支持K8s 1.22及更早...

授权概述

是 不涉及 不涉及 AliyunAHASReadOnlyAccess 当RAM用户或RAM角色需要使用集群拓扑功能。是 不涉及 不涉及 AliyunYundunSASReadOnlyAccess 当RAM用户或RAM角色需要查看指定集群的运行时安全监控。是 不涉及 不涉及 AliyunKMSReadOnlyAccess ...

为RAM用户或RAM角色授予系统权限策略

是 不涉及 不涉及 AliyunAHASReadOnlyAccess 当RAM用户或RAM角色需要使用集群拓扑功能。是 不涉及 不涉及 AliyunYundunSASReadOnlyAccess 当RAM用户或RAM角色需要查看指定集群的运行时安全监控。是 不涉及 不涉及 AliyunKMSReadOnlyAccess ...

历史功能发布记录(2023年)

ACK Serverless支持一键部署KServe组件,提供开箱即的模型服务,让您轻松构建自定义模型服务运行时。全部 部署KServe组件 基于KServe快速部署一个推理服务 ACK Serverless支持核心组件托管,简化K8s集群运维 在ACK Serverless Pro版集群...

授权概述

AliyunAHASReadOnlyAccess 当RAM用户或RAM角色需要使用集群拓扑功能。AliyunRAMFullAccess 当RAM用户或RAM角色需要负责阿里云账号内的全局授权管理。AliyunYundunSASReadOnlyAccess 当RAM用户或RAM角色需要查看指定集群的运行时安全监控。...

csi-plugin

使用说明 关于使用说明的更多信息,请参见 存储CSI。重要 csi-plugin组件在v1.22.8-8d3a569-aliyun及其以后的版本更新,均要求容器服务Kubernetes大于1.20版本。为提升集群稳定性,若您使用1.20及以上版本的集群,建议您将csi-plugin组件...

使用Prometheus配置报警规则的最佳实践

如果你的集群节点使用多核机型的服务器,推荐使用CPU拓扑感知调度,最大化利用碎片化CPU。更多信息,请参见 CPU拓扑感知调度。工作负载异常 Deployment可用副本状态异常 Critical kube_deployment_spec_replicas{}!kube_deployment_status_...

概述

拓扑任务是一种特殊的任务,是...在拓扑图中使用分片网关时,需要在分片网关的开始节点配置分片维度。拓扑任务执行过程中,会根据拓扑任务执行上下文获取对应的分片配置,动态生成需要执行的分片。使用方法,参见 使用分片网关。拓扑任务示例

并行网关

本文将快速引导您如何在拓扑任务中使用并行网关。操作步骤 创建拓扑子任务。创建两个或两个以上的简单或集群任务,以作为后续拓扑任务中的子流程。此处以简单任务为例,配置步骤请参见 创建调度任务。其中:调度类型:必须选择 事件触发。...

节点池服务拓扑管理

方式二:通过命令行配置Service流量拓扑 新建一个使用节点池拓扑域的Service,YAML样例如下。apiVersion:v1 kind:Service metadata:annotations:openyurt.io/topologyKeys:kubernetes.io/zone name:my-service-nodepool namespace:default ...
共有33条 < 1 2 3 4 ... 33 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
可观测链路 OpenTelemetry 版 高速通道 弹性公网IP 短信服务 人工智能平台 PAI 金融分布式架构
新人特惠 爆款特惠 最新活动 免费试用