通过本教程,您可以了解如何使用DataWorks和MaxCompute产品组合进行大数据开发和分析,并通过用户画像分析案例体验DataWorks在数据集成、数据开发和运维中心模块方面的相关能力。案例介绍 为了更好地制定企业经营策略,现需要从用户网站...
通过本教程,您可以了解如何使用DataWorks和MaxCompute产品组合进行大数据开发和分析,并通过用户画像分析案例体验DataWorks在数据集成、数据开发和运维中心模块方面的相关能力。案例介绍 为了更好地制定企业经营策略,现需要从用户网站...
通过本教程,您可以了解如何使用DataWorks和MaxCompute产品组合进行大数据开发和分析,并通过用户画像分析案例体验DataWorks在数据集成、数据开发和运维中心模块方面的相关能力。案例介绍 为了更好地制定企业经营策略,现需要从用户网站...
DataWorks 提供一站式大数据开发与治理平台,涵盖数据集成、开发、建模、分析、质量、服务、地图及开放能力,支持全链路数据处理与企业级数据中台建设。本文为您介绍DataWorks的核心功能特性。数据集成:全领域数据汇聚 DataWorks的数据...
DataWorks基于MaxCompute等引擎,提供统一的全链路大数据开发治理平台。本文为您介绍如何通过DataWorks使用MaxCompute服务。背景信息 DataWorks支持将计算引擎绑定至DataWorks的工作空间,绑定后您可以创建计算任务并进行周期调度。使用...
数据集成 MaxCompute可以通过数据集成功能加载不同数据源(例如MySQL数据库)的数据,也可以通过数据集成把MaxCompute的数据导出到各种业务数据库。数据集成功能已集成在DataWorks上,您可以直接在DataWorks上配置MaxCompute数据源并读写...
要求数据必须以 插入或覆写数据(INSERT INTO|INSERT OVERWRITE)的形式一次性写入,在写入完成后,如果需要再进一步追加数据,则需要将表中原有的数据全部读取,与新增数据 并集(UNION)之后再次写入,数据追加代价非常大,效率很低。...
数据源支持情况 数据集成目前支持40种以上的数据源类型(包括关系型数据库、非结构化存储、大数据存储、消息队列等),通过定义来源与去向数据源,并使用数据集成提供的数据抽取插件(Reader)、数据写入插件(Writer),实现任意结构化、...
功能概述 SQL查询 SQL查询是使用标准的SQL语句,来查询和分析存储在MaxCompute中的大数据,详情请参见 SQL查询(旧版)。您可以通过编写SQL语句,对有查询权限的数据源进行快速的数据查询与分析操作,详情请参见 SQL查询(旧版)。...
本文介绍模型查看器全量选择时各配置项的含义。图表样式 模型查看器是基于DataV团队自研WebGL可视化渲染引擎DataV.Vangogh的三维动画模型加载器。...禁止加载态 勾选复选框,在组件更新和预览数据看板时,将看不到组件初始化时的加载内容,去...
您可以借助Iceberg快速地在HDFS或者阿里云OSS上构建自己的数据湖存储服务,并借助开源大数据生态的Spark、Flink、Hive和Presto等计算引擎来实现数据湖的分析。核心能力 Apache Iceberg设计初衷是为了解决Hive数仓上云的问题,经过多年迭代...
AI Function是MaxCompute提供的一组面向AI业务场景的预定义函数,将复杂的AI推理操作封装为简洁的SQL或Python算子。用户无需编写底层模型调用代码,即可通过标准SQL或MaxFrame(分布式Python...使用MaxCompute远程模型自动生成电商选品描述。
数据集成的离线同步功能为您提供数据读取(Reader)和写入插件(Writer),方便您通过定义来源与去向数据源,并结合DataWorks调度参数使用,将源端数据库中全量或增量数据的同步至目标数据库中。本文为您介绍离线同步的相关能力。核心能力 ...
X-数据安全针对圈选的数据表,基于大模型进行语义分析,识别核心字段,并智能推荐对应的分类分级,您可对推荐的识别结果执行应用、弃用等操作。本文为您介绍如何使用X-数据安全。前提条件 已配置并开启X-数据安全,详情请参见 智能助手。...
DataWorks支持多种数据源类型,覆盖了主流数据库、大数据存储及消息队列等。为保障数据安全,标准模式的工作空间支持数据源环境隔离功能。您可以为开发环境和生产环境分别配置独立的数据源。开发环境数据源仅用于节点的开发与调试,而生产...
可选数据源类型详情请参见 Dataphin支持的数据源 中的 离线研发-数据库SQL 列。若启用模板,则数据源类型将与所选模板的数据源类型一致,且不可进行修改。数据源 选择SQL任务的数据源。若无可选数据源,可以单击+新建数据源 进行创建。若...
选择数据格式 在选中地图中的区域范围后,可自定义选择所需的范围数据格式内容,可选数据格式内容包括如下几种:JSON API:单击链接右侧的 图标,即可复制JSON数据的API链接。GeoJSON API:单击链接右侧的 图标,即可复制GeoJSON数据的API...
为方便您掌握实例中数据库的运行状态,PolarDB-X 1.0 提供了数据库监控查询功能。本文将介绍如何在 数据库监控 页查看 PolarDB-X 1.0 实例中单个数据库的各项性能监控数据。数据库监控指标表 监控指标 参数 说明 QPS qps PolarDB-X 1.0 ...
强大的交互能力:支持单元格高亮、排序、圈选、提示框(Tooltip)、数据导出以及通过拖拽调整行列尺寸等。条件格式:可根据数据值设置动态的条件样式,如改变背景色、文本样式或显示特定图标。数据格式化:内置对数值、货币、百分比、日期...
实时集成支持多种来源端数据源汇聚组合至目标端数据源,形成实时同步链路进行数据同步。本文为您介绍如何创建实时集成任务。前提条件 已完成数据源配置。您需要在配置实时集成任务前,配置好您需要集成的数据源,以便在配置实时集成任务...
Dataphin分析平台提供专注高效的SQL查询能力与丰富的数据可视化能力。本文为您介绍如何基于Dataphin分析平台新建SQL查询。操作步骤 在Dataphin首页,在顶部菜单栏选择 分析 SQL查询。在 SQL查询 列表中,单击 新建图标。在 新建SQL查询 ...
Dataphin分析平台提供专注高效的SQL查询能力与丰富的数据可视化能力。本文为您介绍如何基于Dataphin分析平台新建SQL查询。操作步骤 在Dataphin首页,在顶部菜单栏选择 分析 SQL查询。在 SQL查询 列表中,单击 新建图标。在 新建SQL查询 ...
Service Name 当前所选数据库的服务名称。数据库信息填写完成后,系统会自动进行测试连接,验证数据库是否能连通正常。连接成功后,单击 确定,完成数据源添加。后续步骤 获取原始数据后,可参见 组件数据源配置 进行组件数据的适配。常见...
资源类型:可选数据目录、数据库、数据表、数据列、函数。选择资源实体,可以进行模糊搜索,选中您想授权的数据目录、库、表、列、函数。进行 权限配置,对需授权的资源类型配置相应的数据权限和授权权限。单击 确定。说明 不同的资源类型...
将某个项目下、数据板块下或数据源下的表授权给另外一个项目、数据板块或数据源的用户或生产账号,或申请某张表下的字段权限,以实现数据互通。本文为您介绍如何批量授予或批量回收表权限。前提条件 需在 元数据中心 配置MySQL和Oracle数据...
将某个项目下、数据板块下或数据源下的表授权给另外一个项目、数据板块或数据源的用户或生产账号,或申请某张表下的字段权限,以实现数据互通。本文为您介绍如何批量授予或批量回收表权限。前提条件 需在 元数据中心 配置MySQL和Oracle数据...
通过即席查询您可以根据当前的业务情况自定义并执行查询语句和下载查询的数据。例如,当完成计算任务开发后,您可以通过即席查询验证计算任务是否符合预期。本文为您介绍如何新建即席查询并下载结果数据。前提条件 若您需下载即席查询的...
通过即席查询您可以根据当前的业务情况自定义并执行查询语句和下载查询的数据。例如,当完成计算任务开发后,您可以通过即席查询验证计算任务是否符合预期。本文为您介绍如何新建即席查询并下载结果数据。背景信息 即席查询任务使用您当前...
在 创建数据集 页面内,输入 数据集名称 信息,选择一种创建方式,可选 数据源导入 或 本地上传。数据源导入:选择 数据源导入 创建方式,可快速导入已添加完成的 适配数据源 中的数据表内容。本地上传:选择 本地上传 创建方式,可将本地...
配置数据映射 用于将所选数据源中的字段映射至组件对应的字段上,实现数据的实时匹配。单击 图标可配置字段样式。查看响应结果 用于实时展示组件所接入的数据。当组件数据源发生变化时,此处会对应展示最新数据。单击数据响应结果,可查看...
可选参数:BillingMode 否 无 可选参数:GlobalSecondaryIndexes 是 无 可选参数:LocalSecondaryIndexes 是 无 可选参数:ProvisionedThroughput 否 无 可选参数:SSESpecification 否 无 可选参数:StreamSpecification 是 ...
按需拷贝表/文件名、基于所选数据集创建SQL查询、二次编辑文件数据、删除数据集。重要 仅支持删除文件数据集,删除操作不可逆,请谨慎执行。仅支持对.XLSX、.CSV 类型的文件数据进行二次编辑,详情请参见 二次编辑文件数据。查看数据表详情...
全域数据表:根据数据源类型、数据源、DB/Schema筛选数据表,支持的数据源请参见 Dataphin支持的数据源,若数据源和Dataphin集群无法连通,则需要先进行元数据采集才能配置质量监控规则,支持的数据源请参见 创建及管理元数据采集任务。...
全域数据表:根据数据源类型、数据源、DB/Schema筛选数据表,支持的数据源请参见 Dataphin支持的数据源,若数据源和Dataphin集群无法连通,则需要先进行元数据采集才能配置质量监控规则,支持的数据源请参见 创建及管理元数据采集任务。...
本文将详细阐述如何将您已有的旧版数据湖集群(Hadoop),高效地迁移至数据湖集群(DataLake),以下分别简称“旧集群”和“新集群”。迁移过程将充分考虑旧集群的版本、元数据类型以及存储方式,并针对这些因素,提供适应新集群的迁移策略...
通过阿里云E-MapReduce(简称EMR),您可以轻松构建和运行Hadoop、Spark、Hive、Presto等开源大数据框架,以进行大规模数据处理和分析等操作。本文为您介绍在EMR on ECS上创建集群的操作步骤和相关配置,帮助您快速搭建和管理大数据集群。...
作为学院派关系型数据库管理系统的鼻祖,它的优点主要集中在对SQL规范的完整实现以及丰富多样的数据类型支持,包括JSON数据、IP数据和几何数据等,而大部分商业数据库都不支持这些数据类型。RDS PostgreSQL 阿里云数据库RDS PostgreSQL不仅...
数据源 单击 配置数据源,可在 设置数据源 面板中修改数据源类型和数据查询代码、预览数据源返回结果以及查看数据响应结果,详情请参见 组件数据源配置。数据过滤器 数据过滤器提供数据结构转换、筛选和一些简单的计算功能。单击 添加过滤...
数据源 单击 配置数据源,可在 设置数据源 面板中修改数据源类型和数据查询代码、预览数据源返回结果以及查看数据响应结果,详情请参见 配置资产数据。数据过滤器 数据过滤器提供数据结构转换、筛选和一些简单的计算功能。单击 添加过滤器...
数据源 单击 配置数据源,可在 设置数据源 面板中修改数据源类型和数据查询代码、预览数据源返回结果以及查看数据响应结果,详情请参见 组件数据源配置。数据过滤器 数据过滤器提供数据结构转换、筛选和一些简单的计算功能。单击 添加过滤...