大数据选品软件-大数据选品软件文档介绍内容-移动阿里云

使用旧版数据开发体验

通过本教程，您可以了解如何使用DataWorks和MaxCompute产品组合进行大数据开发和分析，并通过用户画像分析案例体验DataWorks在数据集成、数据开发和运维中心模块方面的相关能力。案例介绍为了更好地制定企业经营策略，现需要从用户网站...

使用新版数据开发体验

通过本教程，您可以了解如何使用DataWorks和MaxCompute产品组合进行大数据开发和分析，并通过用户画像分析案例体验DataWorks在数据集成、数据开发和运维中心模块方面的相关能力。案例介绍为了更好地制定企业经营策略，现需要从用户网站...

使用新版数据开发体验

通过本教程，您可以了解如何使用DataWorks和MaxCompute产品组合进行大数据开发和分析，并通过用户画像分析案例体验DataWorks在数据集成、数据开发和运维中心模块方面的相关能力。案例介绍为了更好地制定企业经营策略，现需要从用户网站...

功能特性

DataWorks 提供一站式大数据开发与治理平台，涵盖数据集成、开发、建模、分析、质量、服务、地图及开放能力，支持全链路数据处理与企业级数据中台建设。本文为您介绍DataWorks的核心功能特性。数据集成：全领域数据汇聚 DataWorks的数据...

使用DataWorks连接

DataWorks基于MaxCompute等引擎，提供统一的全链路大数据开发治理平台。本文为您介绍如何通过DataWorks使用MaxCompute服务。背景信息 DataWorks支持将计算引擎绑定至DataWorks的工作空间，绑定后您可以创建计算任务并进行周期调度。使用...

支持的云服务

数据集成 MaxCompute可以通过数据集成功能加载不同数据源（例如MySQL数据库）的数据，也可以通过数据集成把MaxCompute的数据导出到各种业务数据库。数据集成功能已集成在DataWorks上，您可以直接在DataWorks上配置MaxCompute数据源并读写...

Append Delta Table数据组织优化

要求数据必须以插入或覆写数据（INSERT INTO|INSERT OVERWRITE）的形式一次性写入，在写入完成后，如果需要再进一步追加数据，则需要将表中原有的数据全部读取，与新增数据并集（UNION）之后再次写入，数据追加代价非常大，效率很低。...

数据集成

数据源支持情况数据集成目前支持40种以上的数据源类型（包括关系型数据库、非结构化存储、大数据存储、消息队列等），通过定义来源与去向数据源，并使用数据集成提供的数据抽取插件（Reader）、数据写入插件（Writer），实现任意结构化、...

数据分析概述

功能概述 SQL查询 SQL查询是使用标准的SQL语句，来查询和分析存储在MaxCompute中的大数据，详情请参见 SQL查询（旧版）。您可以通过编写SQL语句，对有查询权限的数据源进行快速的数据查询与分析操作，详情请参见 SQL查询（旧版）。...

模型查看器

本文介绍模型查看器全量选择时各配置项的含义。图表样式模型查看器是基于DataV团队自研WebGL可视化渲染引擎DataV.Vangogh的三维动画模型加载器。...禁止加载态勾选复选框，在组件更新和预览数据看板时，将看不到组件初始化时的加载内容，去...

Iceberg

您可以借助Iceberg快速地在HDFS或者阿里云OSS上构建自己的数据湖存储服务，并借助开源大数据生态的Spark、Flink、Hive和Presto等计算引擎来实现数据湖的分析。核心能力 Apache Iceberg设计初衷是为了解决Hive数仓上云的问题，经过多年迭代...

MaxCompute AI Function介绍

AI Function是MaxCompute提供的一组面向AI业务场景的预定义函数，将复杂的AI推理操作封装为简洁的SQL或Python算子。用户无需编写底层模型调用代码，即可通过标准SQL或MaxFrame（分布式Python...使用MaxCompute远程模型自动生成电商选品描述。

单表离线同步任务

数据集成的离线同步功能为您提供数据读取（Reader）和写入插件（Writer），方便您通过定义来源与去向数据源，并结合DataWorks调度参数使用，将源端数据库中全量或增量数据的同步至目标数据库中。本文为您介绍离线同步的相关能力。核心能力 ...

X-数据安全

X-数据安全针对圈选的数据表，基于大模型进行语义分析，识别核心字段，并智能推荐对应的分类分级，您可对推荐的识别结果执行应用、弃用等操作。本文为您介绍如何使用X-数据安全。前提条件已配置并开启X-数据安全，详情请参见智能助手。...

数据源管理

DataWorks支持多种数据源类型，覆盖了主流数据库、大数据存储及消息队列等。为保障数据安全，标准模式的工作空间支持数据源环境隔离功能。您可以为开发环境和生产环境分别配置独立的数据源。开发环境数据源仅用于节点的开发与调试，而生产...

创建数据库SQL任务

可选数据源类型详情请参见 Dataphin支持的数据源中的离线研发-数据库SQL 列。若启用模板，则数据源类型将与所选模板的数据源类型一致，且不可进行修改。数据源选择SQL任务的数据源。若无可选数据源，可以单击+新建数据源进行创建。若...

范围选择器功能介绍

选择数据格式在选中地图中的区域范围后，可自定义选择所需的范围数据格式内容，可选数据格式内容包括如下几种：JSON API：单击链接右侧的图标，即可复制JSON数据的API链接。GeoJSON API：单击链接右侧的图标，即可复制GeoJSON数据的API...

数据库监控

为方便您掌握实例中数据库的运行状态，PolarDB-X 1.0 提供了数据库监控查询功能。本文将介绍如何在数据库监控页查看 PolarDB-X 1.0 实例中单个数据库的各项性能监控数据。数据库监控指标表监控指标参数说明 QPS qps PolarDB-X 1.0 ...

交叉透视表

强大的交互能力：支持单元格高亮、排序、圈选、提示框（Tooltip）、数据导出以及通过拖拽调整行列尺寸等。条件格式：可根据数据值设置动态的条件样式，如改变背景色、文本样式或显示特定图标。数据格式化：内置对数值、货币、百分比、日期...

创建实时集成任务

实时集成支持多种来源端数据源汇聚组合至目标端数据源，形成实时同步链路进行数据同步。本文为您介绍如何创建实时集成任务。前提条件已完成数据源配置。您需要在配置实时集成任务前，配置好您需要集成的数据源，以便在配置实时集成任务...

新建SQL查询

Dataphin分析平台提供专注高效的SQL查询能力与丰富的数据可视化能力。本文为您介绍如何基于Dataphin分析平台新建SQL查询。操作步骤在Dataphin首页，在顶部菜单栏选择分析 SQL查询。在 SQL查询列表中，单击新建图标。在新建SQL查询 ...

新建SQL查询

Dataphin分析平台提供专注高效的SQL查询能力与丰富的数据可视化能力。本文为您介绍如何基于Dataphin分析平台新建SQL查询。操作步骤在Dataphin首页，在顶部菜单栏选择分析 SQL查询。在 SQL查询列表中，单击新建图标。在新建SQL查询 ...

添加Oracle数据源

Service Name 当前所选数据库的服务名称。数据库信息填写完成后，系统会自动进行测试连接，验证数据库是否能连通正常。连接成功后，单击确定，完成数据源添加。后续步骤获取原始数据后，可参见组件数据源配置进行组件数据的适配。常见...

数据授权

资源类型：可选数据目录、数据库、数据表、数据列、函数。选择资源实体，可以进行模糊搜索，选中您想授权的数据目录、库、表、列、函数。进行权限配置，对需授权的资源类型配置相应的数据权限和授权权限。单击确定。说明不同的资源类型...

授权与回收表权限

将某个项目下、数据板块下或数据源下的表授权给另外一个项目、数据板块或数据源的用户或生产账号，或申请某张表下的字段权限，以实现数据互通。本文为您介绍如何批量授予或批量回收表权限。前提条件需在元数据中心配置MySQL和Oracle数据...

授权与回收表权限

将某个项目下、数据板块下或数据源下的表授权给另外一个项目、数据板块或数据源的用户或生产账号，或申请某张表下的字段权限，以实现数据互通。本文为您介绍如何批量授予或批量回收表权限。前提条件需在元数据中心配置MySQL和Oracle数据...

查询并下载数据

通过即席查询您可以根据当前的业务情况自定义并执行查询语句和下载查询的数据。例如，当完成计算任务开发后，您可以通过即席查询验证计算任务是否符合预期。本文为您介绍如何新建即席查询并下载结果数据。前提条件若您需下载即席查询的...

查询并下载数据

通过即席查询您可以根据当前的业务情况自定义并执行查询语句和下载查询的数据。例如，当完成计算任务开发后，您可以通过即席查询验证计算任务是否符合预期。本文为您介绍如何新建即席查询并下载结果数据。背景信息即席查询任务使用您当前...

数据集使用说明

在创建数据集页面内，输入数据集名称信息，选择一种创建方式，可选数据源导入或本地上传。数据源导入：选择数据源导入创建方式，可快速导入已添加完成的适配数据源中的数据表内容。本地上传：选择本地上传创建方式，可将本地...

开关

配置数据映射用于将所选数据源中的字段映射至组件对应的字段上，实现数据的实时匹配。单击图标可配置字段样式。查看响应结果用于实时展示组件所接入的数据。当组件数据源发生变化时，此处会对应展示最新数据。单击数据响应结果，可查看...

DynamoDB协议兼容版实例支持详情

可选参数：BillingMode 否无可选参数：GlobalSecondaryIndexes 是无可选参数：LocalSecondaryIndexes 是无可选参数：ProvisionedThroughput 否无可选参数：SSESpecification 否无可选参数：StreamSpecification 是 ...

使用数据集和变量

按需拷贝表/文件名、基于所选数据集创建SQL查询、二次编辑文件数据、删除数据集。重要仅支持删除文件数据集，删除操作不可逆，请谨慎执行。仅支持对.XLSX、.CSV 类型的文件数据进行二次编辑，详情请参见二次编辑文件数据。查看数据表详情...

批量创建质量规则

全域数据表：根据数据源类型、数据源、DB/Schema筛选数据表，支持的数据源请参见 Dataphin支持的数据源，若数据源和Dataphin集群无法连通，则需要先进行元数据采集才能配置质量监控规则，支持的数据源请参见创建及管理元数据采集任务。...

批量创建质量规则

全域数据表：根据数据源类型、数据源、DB/Schema筛选数据表，支持的数据源请参见 Dataphin支持的数据源，若数据源和Dataphin集群无法连通，则需要先进行元数据采集才能配置质量监控规则，支持的数据源请参见创建及管理元数据采集任务。...

Hadoop集群迁移至DataLake集群

本文将详细阐述如何将您已有的旧版数据湖集群（Hadoop），高效地迁移至数据湖集群（DataLake），以下分别简称“旧集群”和“新集群”。迁移过程将充分考虑旧集群的版本、元数据类型以及存储方式，并针对这些因素，提供适应新集群的迁移策略...

创建集群

通过阿里云E-MapReduce（简称EMR），您可以轻松构建和运行Hadoop、Spark、Hive、Presto等开源大数据框架，以进行大规模数据处理和分析等操作。本文为您介绍在EMR on ECS上创建集群的操作步骤和相关配置，帮助您快速搭建和管理大数据集群。...

快速入门

作为学院派关系型数据库管理系统的鼻祖，它的优点主要集中在对SQL规范的完整实现以及丰富多样的数据类型支持，包括JSON数据、IP数据和几何数据等，而大部分商业数据库都不支持这些数据类型。RDS PostgreSQL 阿里云数据库RDS PostgreSQL不仅...

雷达图

数据源单击配置数据源，可在设置数据源面板中修改数据源类型和数据查询代码、预览数据源返回结果以及查看数据响应结果，详情请参见组件数据源配置。数据过滤器数据过滤器提供数据结构转换、筛选和一些简单的计算功能。单击添加过滤...

雷达图

数据源单击配置数据源，可在设置数据源面板中修改数据源类型和数据查询代码、预览数据源返回结果以及查看数据响应结果，详情请参见配置资产数据。数据过滤器数据过滤器提供数据结构转换、筛选和一些简单的计算功能。单击添加过滤器...

基础折线图

数据源单击配置数据源，可在设置数据源面板中修改数据源类型和数据查询代码、预览数据源返回结果以及查看数据响应结果，详情请参见组件数据源配置。数据过滤器数据过滤器提供数据结构转换、筛选和一些简单的计算功能。单击添加过滤...