基本对象概念

PolarDB兼容Oracle数据库还没有实现对面向对象的编程语言的某些功能的支持。本章仅介绍已实现的一些功能。概念 对象类型是对某一实例的描述或定义。对象类型的定义分为两部分:属性 – 描述对象实例的特定特点的字段。对于个人对象,属性...

mysqldump

当您需要备份或者迁移 云数据库SelectDB 中的数据时,通过mysqldump工具,可以将数据库的...使用mysqldump导出数据和表结构仅用于开发测试或者数据量很小的情况,请勿用于大数据量的生产环境。相关文档 mysqldump的详细信息请参见 mysqldump。

连接方式概述

ORM 框架 ORM 对象关系映射(Object Relational Mapping,简称 ORM),是一种程序技术,用于实现面向对象编程语言里不同类型系统的数据之间的转换。从效果上说,它其实是创建了一个可在编程语言里使用的"虚拟对象数据库。在连接 OceanBase ...

实现开发生产等多套环境隔离

使用DataWorks进行大数据开发时,支持对开发、测试、生产等环境进行隔离,当您联合使用了其他阿里云产品时,也可根据环境隔离诉求进行对应业务的环境设置与隔离,本文以DataWorks联合EMR、OSS等产品为例,为您介绍如何实现开发生产等多套...

概述

TPC-DS由TPC委员会制定发布,用于决策支持系统测试基准,主要用于衡量大数据产品的分析性能。TPC-DS查询共包含99个查询测试语句。更多信息,请参见 TPC-DS测试集。说明 本文的TPC-DS的实现基于TPC-DS的基准测试,并不能与已发布的TPC-DS...

Delta Lake概述

Delta Lake以数据为中心,围绕数据流走向(数据从流入数据湖、数据组织管理和数据查询到流出数据湖)推出了一系列功能特性,协助您搭配第三方上下游工具,搭建快捷、易用和安全的数据湖。背景信息 通常的数据湖方案是选取大数据存储引擎...

概述

利用数据库中的表数据进行大语言模型推理的场景。导入模型目前仅支持TensorFlow模型(输入为一维数组或句子),支持的输出类型为INTEGER、REAL或STRING。使用限制 仅支持在 PolarDB MySQL版 8.0.2版本的 企业版 集群中使用该功能。费用 仅...

表引擎

Approximate Nearest Neighbor Search Indexes 用于近似最近邻搜索的索引引擎,在规模数据集中高效地查找最接近给定查询点的数据点。Full-text Search using Inverted Indexes 使用倒排索引进行全文搜索,用于规模文本数据中进行全文...

产品简介

大数据专家服务 大数据专家服务(Bigdata Expert Service)是由阿里云大数据专家基于阿里云多年大数据架构、应用、运维、AI算法建模等最佳实践经验及方法论为用户提供全方位的大数据产品技术、咨询服务及售后专家服务运维保障,帮助用户...

应用场景

实时数据通道 1.1 接入多种异构数据并投递到下游多种大数据系统 通过数据总线,您可以实时接入APP、WEB、IoT和数据库等产生的异构数据,统一管理,并投递到下游的分析、归档等系统,构建清晰的数据流,让您更好的释放数据的价值。...

互联网、电商行业离线大数据分析

概述 电商网站的销售数据通过大数据进行分析后,可以在屏幕展示销售指标、客户指标、销售排名和订单地区分布等业务指标数据。DataV大屏支持可视化动态展示销售数据,触控大屏支持您自助查询数据,极地提高数据的可读性。应用场景 电商...

什么是DataWorks

DataWorks基于MaxCompute、Hologres、EMR、AnalyticDB、CDP等大数据引擎,为数据仓库、数据湖、湖仓一体等解决方案提供统一的全链路大数据开发治理平台。从2009年起,DataWorks不断沉淀阿里巴巴大数据建设方法论,支撑数据中台建设,同时与...

数据分析整体趋势

大数据数据库一体化:早期大数据技术以牺牲一定程度一致性为基础提供分布式能力,解决了传统单机数据库的扩展性不足问题,在MapReduce基础上提供了标准SQL接口,架构上也逐步采用了部分MPP数据库技术;另一方面,分布式数据库也快速发展...

受众与核心能力

产品定位 DataWorks致力于为数据开发者、数据分析师、数据资产管理者,打造一个具备开放自主开发与全栈数据研发能力的一站式、标准化、可视化、透明化的智能大数据全生命周期云研发平台。DataWorks赋予用户仅通过单一平台,即可实现数据...

概述

解决方案 T+1全量同步一键建仓是指通过DLA控制台配置数据源(RDS、PolarDB for MySQL、MongoDB数据源、ECS自建数据数据)和目标OSS数据仓库,系统按照您设定的数据同步时间自动、无缝的帮您把数据源中的数据同步到目标数据仓库OSS中,...

创建GreenPlum数据

通过创建GreenPlum数据源能够实现Dataphin读取GreenPlum的业务数据或向GreenPlum写入数据。本文为您介绍如何创建GreenPlum数据源。背景信息 Greenplum是一款大数据分析引擎,作用于分析、机器学习和AI等领域。其架构主要针对管理规模分析...

什么是Pulumi

它与Terraform的重要区别在于:您可以用熟悉的编程语言来编写声明式配置,而不需要额外学习厂商特定的模板语言来写配置。Pulumi是个可扩展的工具,通过 Provider 来支持新的基础架构。Pulumi提供了客户端,能够让您轻松定义、预览和部署云...

外部表概述

MaxCompute支持使用外部表功能查询和分析存储于OSS等外部存储系统的数据。该机制使得用户可以无需将数据导入到MaxCompute内部存储,直接对外部数据进行操作,从而提供了数据处理的灵活性和方便性。背景信息 MaxCompute SQL作为分布式数据...

数据分析概述

DataWorks提供的数据分析平台,可以流畅地进行数据处理、分析、加工及可视化操作。在数据分析板块中,您不仅可以在线洞察数据,还可以编辑和共享数据。本文为您介绍数据分析平台的优势、功能、权限等概要信息。产品优势 与本地数据分析相比...

集成组件库开发说明

输入组件 原数据的来源,您可根据您的业务数据类型选择对应的组件拖动到左侧的管道画布用于数据输入。各输入组件功能详情请参见:各组件配置详情。输入 组件不支持有上游节点。输入 下游节点可以是 转换、输出、流程。如果 输入 组件有多个...

数据迁移

本文为您介绍数据迁移的最佳实践,包含将其他业务平台的业务数据或日志数据迁移至MaxCompute,或将MaxCompute的数据迁移至其它业务平台。背景信息 传统关系型数据库不适合处理海量数据,如果您的数据存放在传统的关系型数据库且数据量庞大...

连接方式概述

ORM 框架 ORM 对象关系映射(Object Relational Mapping,简称 ORM),是一种程序技术,用于实现面向对象编程语言里不同类型系统的数据之间的转换。从效果上说,它其实是创建了一个可在编程语言里使用的"虚拟对象数据库。在连接 OceanBase ...

离线同步并发和限流之间的关系

限制和最佳实践:分布式执行模式下,配置较大任务并发度可能会对您的数据存储产生较大的访问压力,请评估数据存储的访问负载。如果您的独享资源组机器台数为1,不建议使用分布式执行模式,因为执行进程仍然分布在一台Worker节点上,无法...

准备数据

同步速率 设置同步速率可以保护读取端数据库,以避免抽取速度过大,给源库造成太大的压力。同步速率建议限流,结合源库的配置,请合理配置抽取速率。错误记录数 错误记录数,表示脏数据的最大容忍条数。确认当前节点的配置无误后,单击左上...

数据科学计算概述

背景信息 Python作为目前机器学习、AI模型开发的主流编程语言,提供了如NumPy、SciPy、Scikit-Learn、Matplotlib等丰富的科学计算、可视化库,用于数据科学和数据分析。同时支持TensorFlow、PyTorch、XGBoost、LightGBM等丰富的训练框架。...

Notebook开发编辑器

AnalyticDB MySQL 湖仓版(3.0)集群中的Notebook开发是 基于控制台的交互式数据分析开发平台,提供了作业编辑、数据分析、数据可视化等功能。Notebook开发 支持 Spark SQL和Python两种 编程语言编写Spark应 用程序。前提条件 已创建...

概述

SPL 是一种高效的过程式编程语言用于为 PolarDB PostgreSQL版(兼容Oracle)编写自定义存储过程、函数、触发器和包。SPL提供如下特性:完整的过程编程功能,以补充 SQL 语言。一种通用语言,用于为 PolarDB PostgreSQL版(兼容Oracle)...

API概览

我们已经为开发者封装了常见编程语言的SDK,开发者可通过 下载SDK 直接调用本产品OpenAPI而无需关心技术细节。如果现有SDK不能满足使用需求,可通过签名机制进行自签名对接。由于自签名细节非常复杂,需花费 5个工作日左右。因此建议加入...

术语表

编程思想是将数据的处理方式分为Map(映射)和Reduce(规约)。在正式执行Map前,需要将输入的数据进行分片。所谓分片,就是将输入数据切分为大小相等的数据块,每一块作为单个Map Worker的输入被处理,以便于多个Map Worker同时工作。每个...

API概览

我们已经为开发者封装了常见编程语言的SDK,开发者可通过 下载SDK 直接调用本产品OpenAPI而无需关心技术细节。如果现有SDK不能满足使用需求,可通过签名机制进行自签名对接。由于自签名细节非常复杂,需花费 5个工作日左右。因此建议加入...

Github公开事件数据

分析结果:使用最多的编程语言是 JavaScript,其次是 TypeScript 和 Python 等语言。查看过去5年(2018~2022)最受欢迎的十个编程语言项目 Query样例:SET odps.namespace.schema=TRUE;SELECT dws.repo_id AS repo_id,repos.name AS repo_...

API概览

我们已经为开发者封装了常见编程语言的SDK,开发者可通过 下载SDK 直接调用本产品OpenAPI而无需关心技术细节。如果现有SDK不能满足使用需求,可通过签名机制进行自签名对接。由于自签名细节非常复杂,需花费 5个工作日左右。因此建议加入...

ETL工作流快速体验

GitHub十大热门编程语言 DataWorks MaxCompute 函数计算 OSS 数据集成 数据开发 基础版 基于GitHub Archive公开数据集,通过DataWorks 数据集成 模块获取过去1小时GitHub中提交次数最多的代码语言数据,在DataStudio 数据开发 模块通过函数...

Github实时数据同步与分析

教程简介 本教程基于GitHub Archive公开数据集,通过DataWorks将GitHub中的项目、行为等20多种事件类型数据实时采集至Hologres进行分析,同时使用DataV内置模板,快速搭建实时可视化数据大屏,从开发者、项目、编程语言等多个维度了解...

条件表达式

重要 如果你的需求超过这些条件表达式的能力,你可能会希望用一种更富表现力的编程语言写一个服务器端函数。尽管 COALESCE、GREATEST 和 LEAST 在语法上类似于函数,但它们不是普通的函数,因此不能使用显式 VARIADIC 数组参数。CASE CASE ...

调用OpenAPI配置Redis企业版实例间单向或双向数据同步

选择SDK版本和编程语言。单击代码区域右上角的 按钮,复制代码。配置数据同步作业(单向)本示例中,源实例的数据库账号需具备读权限,目标实例的数据库账号需具备读写权限。说明 配置单向数据同步时,您也可以将自建Redis数据库或阿里云...

产品简介

数据源 提供数据的源点,会根据这些数据来构建私域知识库,用于后续的检索、知识问答 模型 规模预训练语言模型是指使用海量文本数据进行预训练的语言模型。它通过学习大量的语言知识和语境信息,能够生成高质量的文本或提供语义理解。...

名词解释

术语 宽表引擎 时序引擎 说明 DATABASE 〇 〇 Database(数据库)是一个结构化用于存储和管理相关数据的集合。TABLE 〇 〇 Table(表)是一种结构化的数据对象,用于存储和组织相关的数据记录。构建表时需要定义表的Schema结构,包括表...

产品系列

计算层支持标准接口的多语言编程计算引擎Spark。同时 湖仓版(3.0)提供离线业务与在线业务的计算资源物理隔离的能力,能实现计算资源和存储资源按需弹性扩容。适用场景包含离线处理场景(数据清洗、数据规整等预处理操作)、多源聚合...

Proxool 连接池连接 OceanBase 数据库示例程序

本文将介绍如何使用 Proxool 连接池、MySQL Connector/J 和 OceanBase 数据库构建一个应用程序,实现基本的数据库操作,包括创建表、插入、删除、更新和查询数据等。点击下载 proxool-mysql-client 示例工程 前提条件 您已安装 OceanBase ...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据传输服务 数据库备份 云数据库 RDS 云数据库 Redis 版 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用